智快網 - 新科技與新能源行業網絡媒體

          Hugging Face發布SmolVLM系列:小巧而強大的視覺語言模型登場

             發布時間:2025-01-26 20:38 作者:楊凌霄

          近日,Hugging Face 推出了兩款創新的多模態模型——SmolVLM-256M和SmolVLM-500M,這兩款模型在視覺與語言處理領域引起了廣泛關注。其中,SmolVLM-256M更是被譽為全球最小的視覺語言模型,這一突破性的成就令人矚目。

          據了解,這兩款模型均源自Hugging Face團隊去年訓練的龐大800億參數模型,通過精心的蒸餾技術提煉而成。它們成功地在高性能與資源效率之間找到了完美的平衡點。官方強調,無論是SmolVLM-256M還是SmolVLM-500M,都無需復雜配置,即可“即插即用”,輕松部署在transformer MLX和ONNX平臺上。

          從技術細節來看,SmolVLM-256M和SmolVLM-500M均采用了SigLIP作為圖像編碼器,而文本編碼任務則交由SmolLM2完成。SmolVLM-256M以其小巧的體積脫穎而出,成為目前最小的多模態模型。它能夠接收任意序列的圖像和文本輸入,并生成相應的文字輸出,功能涵蓋圖像描述、視頻字幕生成、PDF處理等。尤為該模型體積小巧,即便在移動平臺上也能流暢運行,僅需不到1GB的GPU顯存即可完成單張圖像的推理任務。

          相比之下,SmolVLM-500M則針對高性能需求進行了優化。Hugging Face表示,這款模型非常適合企業運營環境,盡管其資源需求略高于SmolVLM-256M,但在推理輸出的精準度上有了顯著提升。具體來說,SmolVLM-500M在處理單張圖像時,僅需1.23GB的GPU顯存。

          這兩款模型均遵循Apache 2.0開源協議,研究團隊還提供了基于transformer和WebGUI的示例程序,以便開發者快速上手。目前,所有模型及其演示均已公開發布,開發者可以輕松下載并使用,具體訪問頁面請點擊此處。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          久久99精品久久久久久久不卡| 国产精品无码a∨精品| 国产成人无码精品久久久露脸| 55夜色66夜色国产精品视频| 91天堂素人精品系列全集亚洲| 久久91精品国产一区二区| 国产在线精品免费aaa片| 99精品国产综合久久久久五月天| 久久se精品一区二区影院| 亚洲精品高清在线| 日韩色视频一区二区三区亚洲| 亚洲欧洲中文日韩久久AV乱码| 日本精品一二三区| 国产精品盗摄一区二区在线| 97超碰精品成人国产| 国产精品欧美成人| 69精品人人人人人人人人人| 人妻精品久久无码区洗澡| 亚洲国产精品自在自线观看| 亚洲熟妇久久精品| 久久久久国产精品免费免费搜索 | 国产精品美女午夜爽爽爽免费| 98色精品视频在线| 伊人久久精品无码麻豆一区| 波多野结衣久久精品| 亚洲综合一区无码精品| 无码日韩精品一区二区免费| 亚洲精品无码高潮喷水A片软| 亚洲国产精品成人AV在线| 国产欧美精品123区发布| 国产精品亚洲lv粉色| 在线播放精品一区二区啪视频 | 国产精品成人精品久久久| 精品乱子伦一区二区三区高清免费播放 | 日韩电影久久久被窝网| 日韩人妻无码精品系列| 亚洲日韩精品国产一区二区三区| 日本精品一区二区三区在线视频| 国产农村妇女毛片精品久久| 国产69精品久久久久9999APGF| 日韩精品成人一区二区三区|