99re国产,国内精品久久久久影院色,久久久综合精品

DeepSeek R1小版本大升級，深度思考與工具調(diào)用能力全面飛躍！

發(fā)布時間：2025-05-31 00:26 來源：ITBEAR 作者：楊凌霄

近日，人工智能領(lǐng)域再度傳來重大進展，DeepSeek R1模型在5月28日悄然完成了小版本迭代，新版本被命名為DeepSeek-R1-0528。用戶只需通過官方渠道，無論是網(wǎng)站、App還是小程序，開啟“深度思考”功能，即可率先體驗這一升級后的智能服務(wù)。同時，API接口也已同步更新，保持原有調(diào)用方式不變，確保了用戶體驗的連貫性。

緊接著，5月29日晚間，深度求索官方詳細披露了DeepSeek-R1-0528版本的升級亮點。本次升級的核心在于深度思考能力的顯著增強。雖然依舊基于2024年12月發(fā)布的DeepSeek V3 Base模型，但通過加大后訓練過程中的算力投入，模型的思維深度和推理能力實現(xiàn)了質(zhì)的飛躍。在數(shù)學、編程及通用邏輯等多個關(guān)鍵測評中，DeepSeek-R1-0528的表現(xiàn)已躋身國內(nèi)頂尖行列，甚至逼近國際知名模型如o3和Gemini-2.5-Pro的水平。

具體而言，新版R1模型在復雜推理任務(wù)上的表現(xiàn)尤為突出。以AIME 2025測試為例，其準確率從舊版的70%大幅提升至87.5%。這一顯著進步得益于模型在推理過程中思維深度的增加，新版模型在解題時平均使用23K tokens，遠高于舊版的12K tokens，顯示出更為細致和深入的解題策略。

深度求索官方還通過蒸餾DeepSeek-R1-0528的思維鏈，訓練出了DeepSeek-R1-0528-Qwen3-8B模型。在數(shù)學測試AIME 2024中，該8B模型緊隨DeepSeek-R1-0528之后，表現(xiàn)優(yōu)于Qwen3-8B達10%，與Qwen3-235B相媲美。這一成果不僅對學術(shù)界推理模型的研究具有啟示意義，也為工業(yè)界小模型的開發(fā)提供了新的思路。

除了深度思考能力的增強，新版DeepSeek R1還在其他方面進行了優(yōu)化。針對“幻覺”問題，新版模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中，幻覺率降低了約45%至50%，提供了更為準確可靠的結(jié)果。在創(chuàng)意寫作方面，新版R1能夠生成篇幅更長、結(jié)構(gòu)更完整、風格更接近人類偏好的作品，覆蓋了議論文、小說、散文等多種文體。雖然目前不支持在深度思考過程中直接調(diào)用工具，但DeepSeek-R1-0528在Tau-Bench測評中的表現(xiàn)已與OpenAI o1-high相當。

騰訊官方也迅速響應(yīng)，宣布旗下元寶、ima、搜狗輸入法、QQ瀏覽器等產(chǎn)品迎來升級，率先接入了DeepSeek R1-0528最新版。這些產(chǎn)品在推理能力、代碼生成、寫作表現(xiàn)、思考邏輯等方面均得到了顯著提升。用戶只需打開相應(yīng)產(chǎn)品，選擇DeepSeek模型R1深度思考功能，即可免費不限量體驗這一智能升級。騰訊表示，從模型開源到產(chǎn)品上線，整個過程不到一天時間，展現(xiàn)了其在人工智能領(lǐng)域的快速響應(yīng)和部署能力。

更多>同類內(nèi)容