智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          AI高考大考:DeepSeek、訊飛星火領(lǐng)跑,數(shù)學(xué)能力誰(shuí)更強(qiáng)?

             發(fā)布時(shí)間:2025-06-08 18:06 作者:鐘景軒

          在2025年高考數(shù)學(xué)科目考試結(jié)束后,網(wǎng)絡(luò)上關(guān)于試卷難度的討論熱度不減。作為科技領(lǐng)域的觀察者,我們不禁好奇,對(duì)于當(dāng)前備受矚目的AI技術(shù)而言,這份數(shù)學(xué)試卷是否同樣具有挑戰(zhàn)性?為了回答這個(gè)問(wèn)題,我們組織了一場(chǎng)特別的“考試”,邀請(qǐng)了多家知名的大模型參與,模擬完成了一套高考數(shù)學(xué)試卷。

          本次“考試”中,我們挑選了以下幾家具有代表性的大模型作為“考生”:DeepSeek R1 0528、通義千問(wèn) Qwen3-235B-A22B、訊飛星火 X1-0420、豆包 Seed-Thinking-v1.5、文心 X1 Turbo、騰訊混元 Hunyuan T1 latest和GPT o3。由于網(wǎng)絡(luò)流傳的試題版本不一,我們通過(guò)多版本交叉驗(yàn)證和教師解題驗(yàn)證的方式,確保評(píng)測(cè)的準(zhǔn)確性,試卷總分為150分。

          我們特別邀請(qǐng)了一位擁有十年高中數(shù)學(xué)教研經(jīng)驗(yàn)的專(zhuān)家汪鵬老師,對(duì)大模型的答案進(jìn)行評(píng)分。考慮到部分模型在OCR識(shí)別方面的限制,我們采用了OCR轉(zhuǎn)寫(xiě)后輸入答題的方式進(jìn)行處理。

          接下來(lái),讓我們通過(guò)幾道典型題目,看看這些大模型的表現(xiàn)如何。

          首先是選擇題第一題,各家大模型均給出了正確答案,顯示出它們?cè)诨A(chǔ)題目上的穩(wěn)定表現(xiàn)。

          選擇題第五題是一道涉及函數(shù)的題目,所有大模型再次全部答對(duì),進(jìn)一步證明了它們?cè)趶?fù)雜題目上的解題能力。

          然而,在選擇題第八題中,豆包大模型和DeepSeek出現(xiàn)了錯(cuò)誤,而其他模型均給出了正確答案。這道題目涉及對(duì)數(shù)函數(shù),顯示出部分模型在處理特定數(shù)學(xué)知識(shí)點(diǎn)時(shí)的局限性。

          在解答題方面,我們以第16題為例,這是一道涉及數(shù)列和函數(shù)的題目。DeepSeek、通義千問(wèn)、訊飛星火和豆包大模型均給出了正確的解題過(guò)程和答案,而文心X1和騰訊混元?jiǎng)t出現(xiàn)了不同程度的錯(cuò)誤。

          最后,我們來(lái)看難度更高的第18題。訊飛星火、豆包大模型、DeepSeek、通義千問(wèn)和GPT o3均獲得了滿分,而文心X1則因答案錯(cuò)誤而失分。

          經(jīng)過(guò)綜合評(píng)分,DeepSeek以143分的成績(jī)位列榜首,訊飛星火以141分緊隨其后,GPT o3以138分獲得第三名。這次“考試”不僅展示了AI在數(shù)學(xué)領(lǐng)域的強(qiáng)大能力,也暴露了部分模型在實(shí)際應(yīng)用中的短板。

          DeepSeek作為最新版本的大模型,在思考推理和數(shù)學(xué)能力方面表現(xiàn)出色,但OCR識(shí)別效果不佳,且推理速度慢、資源消耗高。訊飛星火則憑借其較小的模型量級(jí)和高效的數(shù)學(xué)能力,在評(píng)測(cè)中取得了優(yōu)異成績(jī),顯示出其在教育領(lǐng)域的深厚積累。

          豆包和通義千問(wèn)等大模型也表現(xiàn)出色,與國(guó)際頂尖模型水平相當(dāng)。這次“考試”不僅是對(duì)AI數(shù)學(xué)能力的一次檢驗(yàn),更是對(duì)未來(lái)AI在教育領(lǐng)域深度應(yīng)用的一次探索。

           
           
          更多>同類(lèi)內(nèi)容
          全站最新
          熱門(mén)內(nèi)容
          本欄最新
           
          智快科技微信賬號(hào)
          微信群

          微信掃一掃
          加微信拉群
          電動(dòng)汽車(chē)群
          科技數(shù)碼群

          日韩中文字幕一在线| 日本精品久久久久护士| 国产亚洲美女精品久久久久狼| 国产精品青草久久久久福利99| 日韩精品一区二区三区在线观看 | 国产精品hd免费观看| 日韩精品视频免费在线观看| 亚洲精品无码日韩国产不卡?V| 国产精品蜜芽tv在线观看| 日韩精品中文字幕在线观看| 另类ts人妖精品影院| 视频久re精品在线观看| 婷婷99视频精品全部在线观看 | 国产精品爱搞视频网站| 亚洲国产精品成人久久蜜臀| 亚洲AV无码之日韩精品| 亚洲国产精品丝袜在线观看| 亚洲国产精品13p| 国产成人综合精品一区| 国产精品伦理久久久久久| 国产99精品一区二区三区免费 | 国产精品无码一区二区三区不卡| 99久久做夜夜爱天天做精品| 91精品乱码一区二区三区| 香蕉久久夜色精品国产尤物| 精品香蕉一区二区三区| 久9re热视频这里只有精品| 夜精品a一区二区三区| 国产精品国产三级国快看| 国产伦精品一区二区三区四区| 国产伦子系列麻豆精品| 亚洲AV日韩AV天堂久久| 精品日韩二区三区精品视频| 日韩美女18网站久久精品| 国产精品熟女福利久久AV| 久久久久久一区国产精品| 亚洲精品高清无码视频| 久久国产乱子伦精品免费看| 91一区二区在线观看精品| 99久久久精品免费观看国产| 精品国产这么小也不放过|