英偉達(dá)近日宣布,其最新推出的DeepSeek-R1模型,在AI推理領(lǐng)域樹(shù)立了新的標(biāo)桿。這款開(kāi)放模型以其卓越的推理能力,為用戶提供了前所未有的智能體驗(yàn)。
與傳統(tǒng)的AI模型不同,DeepSeek-R1并不直接給出答案,而是通過(guò)一系列復(fù)雜的推理過(guò)程,包括思路鏈、共識(shí)和搜索方法,來(lái)生成最佳答案。這一過(guò)程被稱為測(cè)試時(shí)間擴(kuò)展,而DeepSeek-R1正是這一擴(kuò)展定律的杰出代表。它充分展示了加速計(jì)算在AI推理中的關(guān)鍵作用。
由于能夠反復(fù)思考問(wèn)題,DeepSeek-R1模型在推理過(guò)程中會(huì)產(chǎn)生更多的輸出標(biāo)記,并延長(zhǎng)生成周期。這種特性使得模型的質(zhì)量不斷提高,為用戶提供了更高質(zhì)量的響應(yīng)。然而,要實(shí)現(xiàn)實(shí)時(shí)推理和更高質(zhì)量的響應(yīng),需要大量的測(cè)試時(shí)計(jì)算,這也對(duì)推理部署的規(guī)模提出了更高的要求。
DeepSeek-R1在邏輯推理、數(shù)學(xué)、編碼和語(yǔ)言理解等任務(wù)中表現(xiàn)出色,其準(zhǔn)確性遙遙領(lǐng)先。同時(shí),它還具備高推理效率,能夠在短時(shí)間內(nèi)完成復(fù)雜的推理任務(wù)。
為了讓開(kāi)發(fā)人員能夠安全地試驗(yàn)這些功能,并構(gòu)建自己的專用代理,英偉達(dá)將6710億參數(shù)的DeepSeek-R1模型作為NVIDIA NIM微服務(wù)預(yù)覽版在build.nvidia.com上提供。這一舉措將極大地促進(jìn)AI推理技術(shù)的發(fā)展和應(yīng)用。
據(jù)悉,DeepSeek-R1 NIM微服務(wù)在單個(gè)NVIDIA HGX H200系統(tǒng)上每秒可處理多達(dá)3,872個(gè)令牌,性能強(qiáng)勁。開(kāi)發(fā)人員可以通過(guò)應(yīng)用程序編程接口(API)進(jìn)行測(cè)試和試驗(yàn),這一接口預(yù)計(jì)很快將作為可下載的NIM微服務(wù)提供,成為NVIDIA AI Enterprise軟件平臺(tái)的一部分。
DeepSeek-R1 NIM微服務(wù)還支持行業(yè)標(biāo)準(zhǔn)API,簡(jiǎn)化了部署過(guò)程。企業(yè)可以在其首選的加速計(jì)算基礎(chǔ)設(shè)施上運(yùn)行NIM微服務(wù),以最大限度地提高安全性和數(shù)據(jù)隱私。通過(guò)使用NVIDIA AI Foundry和NVIDIA NeMo軟件,企業(yè)還可以為專門的AI代理創(chuàng)建定制的DeepSeek-R1 NIM微服務(wù)。
這一創(chuàng)新不僅推動(dòng)了AI推理技術(shù)的發(fā)展,也為開(kāi)發(fā)人員和企業(yè)提供了更加便捷、高效的AI解決方案。隨著DeepSeek-R1的廣泛應(yīng)用,我們有理由相信,未來(lái)的AI世界將更加智能、更加美好。