精品欧美一区二区三区,四虎成人免费,国产精品久久久久久久久鸭

英偉達(dá)發(fā)布DeepSeek R1推理模型，搭載NIM微服務(wù)引領(lǐng)AI新潮流

發(fā)布時(shí)間：2025-01-31 08:24 來(lái)源：ITBEAR 作者：顧雨柔

英偉達(dá)近日宣布，其最新推出的DeepSeek-R1模型，在AI推理領(lǐng)域樹(shù)立了新的標(biāo)桿。這款開(kāi)放模型以其卓越的推理能力，為用戶提供了前所未有的智能體驗(yàn)。

與傳統(tǒng)的AI模型不同，DeepSeek-R1并不直接給出答案，而是通過(guò)一系列復(fù)雜的推理過(guò)程，包括思路鏈、共識(shí)和搜索方法，來(lái)生成最佳答案。這一過(guò)程被稱為測(cè)試時(shí)間擴(kuò)展，而DeepSeek-R1正是這一擴(kuò)展定律的杰出代表。它充分展示了加速計(jì)算在AI推理中的關(guān)鍵作用。

由于能夠反復(fù)思考問(wèn)題，DeepSeek-R1模型在推理過(guò)程中會(huì)產(chǎn)生更多的輸出標(biāo)記，并延長(zhǎng)生成周期。這種特性使得模型的質(zhì)量不斷提高，為用戶提供了更高質(zhì)量的響應(yīng)。然而，要實(shí)現(xiàn)實(shí)時(shí)推理和更高質(zhì)量的響應(yīng)，需要大量的測(cè)試時(shí)計(jì)算，這也對(duì)推理部署的規(guī)模提出了更高的要求。

DeepSeek-R1在邏輯推理、數(shù)學(xué)、編碼和語(yǔ)言理解等任務(wù)中表現(xiàn)出色，其準(zhǔn)確性遙遙領(lǐng)先。同時(shí)，它還具備高推理效率，能夠在短時(shí)間內(nèi)完成復(fù)雜的推理任務(wù)。

為了讓開(kāi)發(fā)人員能夠安全地試驗(yàn)這些功能，并構(gòu)建自己的專用代理，英偉達(dá)將6710億參數(shù)的DeepSeek-R1模型作為NVIDIA NIM微服務(wù)預(yù)覽版在build.nvidia.com上提供。這一舉措將極大地促進(jìn)AI推理技術(shù)的發(fā)展和應(yīng)用。

據(jù)悉，DeepSeek-R1 NIM微服務(wù)在單個(gè)NVIDIA HGX H200系統(tǒng)上每秒可處理多達(dá)3,872個(gè)令牌，性能強(qiáng)勁。開(kāi)發(fā)人員可以通過(guò)應(yīng)用程序編程接口（API）進(jìn)行測(cè)試和試驗(yàn)，這一接口預(yù)計(jì)很快將作為可下載的NIM微服務(wù)提供，成為NVIDIA AI Enterprise軟件平臺(tái)的一部分。

DeepSeek-R1 NIM微服務(wù)還支持行業(yè)標(biāo)準(zhǔn)API，簡(jiǎn)化了部署過(guò)程。企業(yè)可以在其首選的加速計(jì)算基礎(chǔ)設(shè)施上運(yùn)行NIM微服務(wù)，以最大限度地提高安全性和數(shù)據(jù)隱私。通過(guò)使用NVIDIA AI Foundry和NVIDIA NeMo軟件，企業(yè)還可以為專門的AI代理創(chuàng)建定制的DeepSeek-R1 NIM微服務(wù)。

這一創(chuàng)新不僅推動(dòng)了AI推理技術(shù)的發(fā)展，也為開(kāi)發(fā)人員和企業(yè)提供了更加便捷、高效的AI解決方案。隨著DeepSeek-R1的廣泛應(yīng)用，我們有理由相信，未來(lái)的AI世界將更加智能、更加美好。

更多>同類內(nèi)容

英偉達(dá)發(fā)布DeepSeek R1推理模型，搭載NIM微服務(wù)引領(lǐng)AI新潮流

英偉達(dá)發(fā)布DeepSeek R1推理模型，搭載NIM微服務(wù)引領(lǐng)AI新潮流