近日,人工智能領(lǐng)域再度傳來重大進展,DeepSeek R1模型在5月28日悄然完成了小版本迭代,新版本被命名為DeepSeek-R1-0528。用戶只需通過官方渠道,無論是網(wǎng)站、App還是小程序,開啟“深度思考”功能,即可率先體驗這一升級后的智能服務(wù)。同時,API接口也已同步更新,保持原有調(diào)用方式不變,確保了用戶體驗的連貫性。
緊接著,5月29日晚間,深度求索官方詳細披露了DeepSeek-R1-0528版本的升級亮點。本次升級的核心在于深度思考能力的顯著增強。雖然依舊基于2024年12月發(fā)布的DeepSeek V3 Base模型,但通過加大后訓練過程中的算力投入,模型的思維深度和推理能力實現(xiàn)了質(zhì)的飛躍。在數(shù)學、編程及通用邏輯等多個關(guān)鍵測評中,DeepSeek-R1-0528的表現(xiàn)已躋身國內(nèi)頂尖行列,甚至逼近國際知名模型如o3和Gemini-2.5-Pro的水平。
具體而言,新版R1模型在復雜推理任務(wù)上的表現(xiàn)尤為突出。以AIME 2025測試為例,其準確率從舊版的70%大幅提升至87.5%。這一顯著進步得益于模型在推理過程中思維深度的增加,新版模型在解題時平均使用23K tokens,遠高于舊版的12K tokens,顯示出更為細致和深入的解題策略。
深度求索官方還通過蒸餾DeepSeek-R1-0528的思維鏈,訓練出了DeepSeek-R1-0528-Qwen3-8B模型。在數(shù)學測試AIME 2024中,該8B模型緊隨DeepSeek-R1-0528之后,表現(xiàn)優(yōu)于Qwen3-8B達10%,與Qwen3-235B相媲美。這一成果不僅對學術(shù)界推理模型的研究具有啟示意義,也為工業(yè)界小模型的開發(fā)提供了新的思路。
除了深度思考能力的增強,新版DeepSeek R1還在其他方面進行了優(yōu)化。針對“幻覺”問題,新版模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中,幻覺率降低了約45%至50%,提供了更為準確可靠的結(jié)果。在創(chuàng)意寫作方面,新版R1能夠生成篇幅更長、結(jié)構(gòu)更完整、風格更接近人類偏好的作品,覆蓋了議論文、小說、散文等多種文體。雖然目前不支持在深度思考過程中直接調(diào)用工具,但DeepSeek-R1-0528在Tau-Bench測評中的表現(xiàn)已與OpenAI o1-high相當。
騰訊官方也迅速響應(yīng),宣布旗下元寶、ima、搜狗輸入法、QQ瀏覽器等產(chǎn)品迎來升級,率先接入了DeepSeek R1-0528最新版。這些產(chǎn)品在推理能力、代碼生成、寫作表現(xiàn)、思考邏輯等方面均得到了顯著提升。用戶只需打開相應(yīng)產(chǎn)品,選擇DeepSeek模型R1深度思考功能,即可免費不限量體驗這一智能升級。騰訊表示,從模型開源到產(chǎn)品上線,整個過程不到一天時間,展現(xiàn)了其在人工智能領(lǐng)域的快速響應(yīng)和部署能力。