智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          Meta新推Llama 3.2量化版,1B/3B模型功耗再降低!

             發(fā)布時間:2024-10-27 15:15 作者:陸辰風(fēng)

          meta公司近日宣布,繼9月推出Llama 3.2的1B與3B模型后,他們于10月24日發(fā)布了這兩個模型的量化版本。通過量化,模型大小平均縮減了56%,RAM使用量降低了41%,并且模型運行速度提升了2至4倍,功耗也有所下降,這使得模型更易于部署在移動設(shè)備上。

          meta采用了兩種量化方法:量化感知訓(xùn)練(QAT)和后訓(xùn)練量化(SpinQuant)。前者注重模型的準確性,后者則強調(diào)模型的可移植性。

          針對Llama 3.2的1B和3B模型,meta分別推出了兩款量化版本。這些量化模型相較于非量化的Llama BF16模型,速度更快,RAM占用更少,功耗更低,同時保持了與Llama BF16版本相近的精度。

          盡管量化后的模型支持的Token上下文有所減少,但meta的測試顯示,量化版本的基準測試結(jié)果與原版相差無幾。

          meta已在一加12、三星S24+/S22及蘋果iOS設(shè)備等移動平臺上測試了這些量化模型,并計劃未來通過神經(jīng)處理單元(NPU)進一步提升模型性能。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號
          ITBear微信賬號

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數(shù)碼群

          久久热这里只有精品在线观看| 中文字幕日韩精品无码内射| 国产色无码精品视频免费| 亚洲а∨精品天堂在线| 法国性xxxx精品hd| 日韩精品高清在线| 3D动漫精品啪啪一区二区下载| 国产亚洲午夜高清国产拍精品| 国产精品视_精品国产免费| 无码国产精品一区二区免费3p | 日韩精品视频一区二区三区| 香港黄页精品视频在线| 国产精品电影一区| 日韩精品在线视频| 精品美女在线观看| 日韩成人免费视频| 97久久超碰成人精品网站| 99久久人妻精品免费二区| 国产精品单位女同事在线| 精品国产一区二区麻豆| 久久久无码精品亚洲日韩按摩| 国产精品禁18久久久夂久| 538prom精品视频我们不只是| 国产精品嫩草影院久久| 国内精品久久人妻无码不卡| 99久久精品国产亚洲| 午夜精品在线观看| 久久99蜜桃精品久久久久小说| 亚洲精品成人区在线观看| 成人免费无码精品国产电影| 日韩精品福利片午夜免费观着 | 久久国产精品无码一区二区三区| 国产精品夜色视频一级区| 无码精品人妻一区二区三区AV| 精品视频国产狼人视频| 亚洲欧美日韩久久精品| 亚洲精品天天影视综合网| 久久久久琪琪去精品色无码 | 国产精品伦一区二区三级视频| 国内精品久久久久久99| 中日韩无砖码一线二线|