智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          小米大模型團(tuán)隊(duì)突破音頻推理,強(qiáng)化學(xué)習(xí)助力登頂MMAU榜首!

             發(fā)布時(shí)間:2025-03-17 13:30 作者:唐云澤

          小米大模型團(tuán)隊(duì)在音頻推理領(lǐng)域取得了一項(xiàng)引人注目的成就。近日,該團(tuán)隊(duì)宣布,他們受Deepseek-R1的啟發(fā),在國(guó)際權(quán)威的MMAU音頻理解評(píng)測(cè)中取得了突破,以64.5%的準(zhǔn)確率登頂榜首,并且已經(jīng)將相關(guān)技術(shù)開(kāi)源。

          MMAU評(píng)測(cè)集,即大規(guī)模多任務(wù)音頻理解和推理評(píng)測(cè)集,是衡量音頻推理能力的重要標(biāo)尺。它包含了一萬(wàn)條涵蓋語(yǔ)音、環(huán)境聲和音樂(lè)的音頻樣本,并結(jié)合人類專家標(biāo)注的問(wèn)答對(duì),測(cè)試模型在27種技能上的表現(xiàn),旨在推動(dòng)模型達(dá)到接近人類專家的邏輯分析水平。然而,這一評(píng)測(cè)標(biāo)準(zhǔn)對(duì)人類來(lái)說(shuō)也并非易事,人類專家在MMAU上的準(zhǔn)確率也不過(guò)82.23%。

          在小米大模型團(tuán)隊(duì)登頂之前,MMAU官網(wǎng)榜單上的佼佼者是來(lái)自O(shè)penAI的GPT-4o,其準(zhǔn)確率為57.3%,緊隨其后的是Google DeepMind的Gemini 2.0 Flash,準(zhǔn)確率為55.6%。而來(lái)自阿里的Qwen2-Audio-7B模型,在此評(píng)測(cè)集上的表現(xiàn)則為49.2%。

          小米大模型團(tuán)隊(duì)并未止步于Qwen2-Audio-7B模型的表現(xiàn)。他們利用該模型的開(kāi)源特性,嘗試使用清華大學(xué)發(fā)布的AVQA數(shù)據(jù)集進(jìn)行微調(diào)。AVQA數(shù)據(jù)集雖然僅包含3.8萬(wàn)條訓(xùn)練樣本,但通過(guò)全量有監(jiān)督微調(diào)(SFT),Qwen2-Audio-7B模型在MMAU上的準(zhǔn)確率提升到了51.8%。這一初步成果為團(tuán)隊(duì)后續(xù)的研究奠定了堅(jiān)實(shí)的基礎(chǔ)。

          DeepSeek-R1的發(fā)布為小米大模型團(tuán)隊(duì)帶來(lái)了新的啟示。該模型采用的Group Relative Policy Optimization(GRPO)方法,使得模型能夠通過(guò)“試錯(cuò)-獎(jiǎng)勵(lì)”機(jī)制自主進(jìn)化,涌現(xiàn)出類似人類的反思和多步驗(yàn)證等推理能力。小米大模型團(tuán)隊(duì)深受啟發(fā),嘗試將DeepSeek-R1的GRPO算法遷移到Qwen2-Audio-7B模型上。

          經(jīng)過(guò)不懈的努力,小米大模型團(tuán)隊(duì)最終取得了令人矚目的成果。在僅使用AVQA的3.8萬(wàn)條訓(xùn)練樣本的情況下,強(qiáng)化學(xué)習(xí)微調(diào)后的模型在MMAU評(píng)測(cè)集上實(shí)現(xiàn)了64.5%的準(zhǔn)確率。這一成績(jī)不僅遠(yuǎn)超Qwen2-Audio-7B模型微調(diào)前的表現(xiàn),也比目前榜單上第一名的商業(yè)閉源模型GPT-4o有近10個(gè)百分點(diǎn)的優(yōu)勢(shì)。

          小米大模型團(tuán)隊(duì)的這一成就,不僅展示了他們?cè)谝纛l推理領(lǐng)域的強(qiáng)大實(shí)力,也為整個(gè)AI領(lǐng)域帶來(lái)了新的啟示。他們通過(guò)開(kāi)源技術(shù)和創(chuàng)新算法的結(jié)合,推動(dòng)了音頻理解和推理能力的提升,為未來(lái)的AI發(fā)展開(kāi)辟了新的道路。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門(mén)內(nèi)容
          本欄最新
           
          智快科技微信賬號(hào)
          微信群

          微信掃一掃
          加微信拉群
          電動(dòng)汽車群
          科技數(shù)碼群

          四虎永久在线精品免费网址| 国产精品国产AV片国产| 在线观看国产精品麻豆| 97在线精品视频| 国产精品国产亚洲区艳妇糸列短篇| 亚洲精品视频免费看| 精品无码国产自产拍在线观看蜜| 亚洲国产成人综合精品| 精品在线免费观看| 精品无码日韩一区二区三区不卡| 亚洲第一精品电影网| 精品人妻少妇一区二区三区在线| 日韩不卡高清视频| 中文字幕日韩精品一区二区三区 | 久久亚洲美女精品国产精品| 日韩在线不卡视频| 国产亚洲日韩一区二区三区| 国产精品国产三级国产专播| 99久久成人国产精品免费| 亚洲精品视频久久久| 精品久久久久久中文| 日韩精品无码一区二区三区 | 久9久9精品视频在线观看| 亚洲av日韩av永久在线观看| 8090成人午夜精品| 精品免费视在线观看| 9久久9久久精品| 国内精品人妻无码久久久影院导航| 亚洲国产精品日韩在线| 无码国产精品一区二区免费式直播 | 亚洲第一区精品日韩在线播放| 国精产品一品二品国精品69xx| 日韩精品专区在线影院重磅| 亚洲综合一区国产精品| 亚洲精品精华液一区二区 | 日韩电影免费在线观看中文字幕| 日韩免费在线观看视频| 亚洲欧美日韩一区二区三区| 日韩亚洲精品福利| 国产福利专区精品视频| 999久久久免费精品国产|