日前,字節跳動Seed團隊公布2025高考全科測試結果。該測試采用全國新一卷和山東省自主命題,豆包Seed1.6-Thinking模型的文科和理科成績分別達到683分和648分。在同期測試的國內外5款頂級模型中,豆包文科成績獲最高分,理科僅次于谷歌Gemini 2.5 Pro,后者成績為655分。
測試結果顯示,豆包的語文、英語、物理、歷史、地理、政治六門學科獲最高分,數學成績也超過140分;DeepSeek R1獲得數學最高分145分;Gemini 2.5 Pro以82分獲得化學最高分,并與OpenAI o3一起獲得生物最高分,成績為77分。
Seed團隊表示,首次測試時使用的網絡版考卷清晰度較低,各大模型在化學、生物兩門非常依賴圖像的考試中丟分較多。該團隊在獲得更高清版本的高考試題圖片后,采用圖文交織的方式對化學和生物重新進行測試,發現豆包模型在這兩科上能夠提升近30分,理科總成績可達到676分,驗證了全模態推理可以更大程度激發模型的潛力。
據悉,山東省高考為“3+3”形式,語數英為基礎學科,自選三門科目采用等級分數轉換成績。據山東當地資深高中老師分析,豆包賦分成績組合,最高可達690分左右,參照2025年山東地區一分一段表,排名約在前80位,有望考上清華、北大等頂尖學府。