智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          Meta新推Llama 3.2量化版,1B/3B模型功耗再降低!

             發(fā)布時(shí)間:2024-10-27 15:15 作者:陸辰風(fēng)

          meta公司近日宣布,繼9月推出Llama 3.2的1B與3B模型后,他們于10月24日發(fā)布了這兩個(gè)模型的量化版本。通過量化,模型大小平均縮減了56%,RAM使用量降低了41%,并且模型運(yùn)行速度提升了2至4倍,功耗也有所下降,這使得模型更易于部署在移動(dòng)設(shè)備上。

          meta采用了兩種量化方法:量化感知訓(xùn)練(QAT)和后訓(xùn)練量化(SpinQuant)。前者注重模型的準(zhǔn)確性,后者則強(qiáng)調(diào)模型的可移植性。

          針對Llama 3.2的1B和3B模型,meta分別推出了兩款量化版本。這些量化模型相較于非量化的Llama BF16模型,速度更快,RAM占用更少,功耗更低,同時(shí)保持了與Llama BF16版本相近的精度。

          盡管量化后的模型支持的Token上下文有所減少,但meta的測試顯示,量化版本的基準(zhǔn)測試結(jié)果與原版相差無幾。

          meta已在一加12、三星S24+/S22及蘋果iOS設(shè)備等移動(dòng)平臺(tái)上測試了這些量化模型,并計(jì)劃未來通過神經(jīng)處理單元(NPU)進(jìn)一步提升模型性能。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號
          ITBear微信賬號

          微信掃一掃
          加微信拉群
          電動(dòng)汽車群
          科技數(shù)碼群

          国产一级精品高清一级毛片| 日韩欧美群交P内射捆绑| 91精品导航在线网址免费| 亚洲AV无码久久精品成人| 中文字幕一区二区三区日韩精品 | 亚洲精品无码精品mV在线观看| 国产乱码精品一区二区三| 亚洲一区二区精品视频| 西瓜精品国产自在现线| 高清在线亚洲精品国产二区| 日韩一区二区精品观看| 日韩精品在线播放| 亚洲国产精品无码久久青草| 亚洲精品综合久久| 国产内地精品毛片视频| 久久久久久青草大香综合精品| 久久久久九九精品影院| 精品无码国产污污污免费网站国产 | 亚洲国产精品一区二区久久| 久久99精品久久久久子伦小说| 无码精品久久久久久人妻中字 | 日韩字幕一中文在线综合| 中文字幕日韩wm二在线看| 日韩精品中文字幕视频一区| 日韩一区二区三区电影在线观看| 色婷婷久久久SWAG精品| 亚洲精品无码av天堂| 精品一久久香蕉国产线看播放 | 国产精品自在在线午夜蜜芽tv在线| 麻豆精品在线播放| 国产精品亚洲专区无码牛牛| 国产精品视频久久久久久 | 无码国产精品一区二区免费vr| 香蕉久久夜色精品国产小说| 777亚洲精品乱码久久久久久| 国产精品亚洲片夜色在线| 久久人午夜亚洲精品无码区| 精品伊人久久香线蕉| 日韩一区二区三区免费播放| 日韩黄色片在线观看| 国产精品成人国产乱一区|