智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          英偉達(dá)推出TensorRT-LLM新功能,首度支持OpenAI Chat API

             發(fā)布時(shí)間:2023-11-16 12:10

          【智快網(wǎng)】11月16日消息,微軟 Ignite 2023 大會(huì)今日盛大開幕,英偉達(dá)高管在會(huì)上宣布了TensorRT-LLM的最新更新,為其添加了對OpenAI Chat API的全新支持。

          在今年10月的一則報(bào)道中,我們曾披露英偉達(dá)發(fā)布了面向數(shù)據(jù)中心和Windows PC的TensorRT-LLM開源庫。該庫的最大亮點(diǎn)在于,當(dāng)Windows PC配備英偉達(dá)GeForce RTX GPU時(shí),TensorRT-LLM能夠?qū)LM在Windows PC上的運(yùn)行速度提升四倍。

          據(jù)智快網(wǎng)了解,英偉達(dá)在今天的Ignite 2023大會(huì)上,宣布了TensorRT-LLM的更新計(jì)劃,將為其加入OpenAI的Chat API支持,并加強(qiáng)DirectML功能,以提升Llama 2和Stable Diffusion等AI模型的性能。

          TensorRT-LLM的本地開發(fā)將通過英偉達(dá)的AI Workbench完成,開發(fā)者可以利用這一統(tǒng)一且易用的工具包,在PC或工作站上快速創(chuàng)建、測試和定制預(yù)訓(xùn)練的生成式AI模型和LLM。英偉達(dá)還為此推出了搶先體驗(yàn)注冊頁面。

          英偉達(dá)將于本月晚些時(shí)候發(fā)布TensorRT-LLM 0.6.0版本更新,預(yù)計(jì)推理性能將提高5倍,并且將支持Mistral 7B和Nemotron-3 8B等其他主流LLM。用戶可在8GB顯存以上的GeForce RTX 30系列和40系列GPU上運(yùn)行,同時(shí)一些便攜式Windows設(shè)備也能夠充分利用快速、準(zhǔn)確的本地LLM功能。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號(hào)
          微信群

          微信掃一掃
          加微信拉群
          電動(dòng)汽車群
          科技數(shù)碼群

          亚洲精品在线不卡| 亚洲国产精品自在在线观看 | 国产福利电影一区二区三区,日韩伦理电影在线福 | 9久久这里只有精品国产| 精品国内自产拍在线视频| 国产亚洲精品美女| 精品国产品香蕉在线观看| 一本色道久久88亚洲精品综合 | 一区二区三区精品视频| 日韩免费视频一区| jizz中国jizz欧洲/日韩在线| 国产大片91精品免费观看男同| 小呦精品导航网站| 欧美人妻少妇精品久久黑人| 2020亚洲男人天堂精品| 国产成人精品久久免费动漫| 91精品国产91热久久久久福利| 97精品视频在线观看| 99re热久久这里只有精品6| 无码人妻精品中文字幕| 久久99国产亚洲精品观看| 久久国产乱子免费精品| 亚洲∧v久久久无码精品| 久久久精品中文字幕麻豆发布| 久久精品亚洲视频| 久久久久久久久毛片精品| 久久精品国产亚洲av麻豆| 久久精品夜色国产亚洲av| 久久99精品久久久久久首页 | 国产精品爽爽V在线观看无码 | 国产精品视_精品国产免费| 狠狠入ady亚洲精品| 日本精品一区二区三区视频| 国产精品永久在线观看| 日韩精品视频在线观看免费 | 国产精品久线在线观看| 国产精品视频一区二区三区四| 日本精品中文字幕| 亚洲AV成人无码久久精品老人| 98精品国产高清在线看入口| 亚洲视频精品在线观看|