智快網 - 新科技與新能源行業網絡媒體

          小米MiMo-VL大模型開源,多模態推理能力領先同尺寸標桿Qwen2.5-VL-7B

             發布時間:2025-05-30 16:13 作者:馮璃月

          小米公司近日宣布了一項重大進展,其多模態大模型Xiaomi MiMo-VL已正式向公眾開放源代碼。這一消息由Xiaomi MiMo官方公眾號發布,標志著小米在人工智能領域邁出了重要一步。

          據官方介紹,Xiaomi MiMo-VL在多模態任務上表現出色,尤其在圖片、視頻、語言通用問答及理解推理等方面,相較于同尺寸的多模態標桿模型Qwen2.5-VL-7B,有著顯著的優勢。更為引人注目的是,在GUI Grounding任務上,MiMo-VL的表現甚至可以與專用模型相媲美,預示著其在智能代理(Agent)時代的巨大潛力。

          特別MiMo-VL-7B版本在保持小米MiMo-7B純文本推理能力的基礎上,進一步在多模態推理任務上取得了突破。僅需7B參數規模,它就在奧林匹克競賽(OlympiadBench)及多個數學競賽(MathVision、MathVerse)中,大幅領先參數規模達10倍的阿里Qwen-2.5-VL-72B和QVQ-72B-Preview,甚至超越了閉源模型GPT-4o。

          在小米內部進行的大模型競技場評估中,MiMo-VL-7B同樣表現出色,超越了GPT-4o,成為開源模型中的佼佼者。這一成就不僅驗證了MiMo-VL的卓越性能,也彰顯了小米在人工智能技術研發方面的深厚實力。

          MiMo-VL-7B的應用場景廣泛,能夠完成復雜的圖片推理和問答任務。在長達10多步的GUI操作上,它也展現出了不俗的潛力。例如,用戶可以通過MiMo-VL-7B輕松地將小米SU7添加到心愿單中,享受更加便捷的智能體驗。

          小米表示,MiMo-VL的成功得益于高質量的預訓練數據以及創新的混合在線強化學習算法(MORL)。為了訓練這一模型,小米收集了涵蓋圖片-文本對、視頻-文本對、GUI操作序列等多種類型的高質量數據,總計達到2.4T tokens。通過分階段調整不同類型數據的比例,小米強化了模型的長程多模態推理能力。同時,混合文本推理、多模態感知+推理、RLHF等反饋信號,并通過在線強化學習算法穩定加速訓練,全方位提升了模型的推理、感知性能和用戶體驗。

          目前,MiMo-VL-7B的RL前后兩個模型已經開源,并提供了相應的技術報告和測評任務框架。感興趣的開發者可以前往Huggingface和GitHub平臺獲取更多信息,共同探索人工智能技術的無限可能。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          久久夜色精品国产亚洲av| 国产精品嫩草影院永久一| 国产精品jizz视频| 拍国产真实乱人偷精品| 国产成人精品视频福利app| 亚洲国产午夜精品理论片在线播放| 91热久久免费精品99| 久久综合精品视频| 在线精品国产一区二区三区| 国产成人精品免高潮在线观看| 国产日韩精品一区二区三区| 2019日韩中文字幕MV| 一本大道无码日韩精品影视| 国产精品9999久久久久仙踪林| 精品久久久中文字幕二区| 久久精品国内一区二区三区| 99精品国产免费久久久久久下载| 国产精品1024香蕉在线观看| 亚洲av午夜精品无码专区| 精品一区二区三区在线观看视频| 人人妻人人澡人人爽人人精品97| 久久精品99视频| 久久精品视频一区二区三区| 国产成人精品高清在线观看93| 久久精品免费观看| 久久精品国产精品青草| 国内精品久久九九国产精品| 一本色道久久88精品综合| 在线涩涩免费观看国产精品| 青青精品视频国产| 亚洲精品国产精品乱码不99 | 99精品全国免费观看视频..| 精品国产综合区久久久久久 | 亚洲精品白浆高清久久久久久| 99精品视频免费| 国产在线不卡午夜精品2021| 老司机69精品成免费视频| 国产香蕉精品视频在| 久久精品国产只有精品2020| 亚洲AV乱码久久精品蜜桃 | 国产伦精品一区二区三区无广告 |