在人工智能領(lǐng)域的一次重大突破中,MiniMax公司于近日震撼發(fā)布了全球首個(gè)開(kāi)源大規(guī)模混合架構(gòu)推理模型——MiniMax-M1。這一發(fā)布不僅標(biāo)志著AI技術(shù)的新里程碑,還伴隨著一項(xiàng)為期五天的連續(xù)更新計(jì)劃,引起了業(yè)界的廣泛關(guān)注。
MiniMax-M1的參數(shù)規(guī)模達(dá)到了驚人的4560億,每個(gè)token能激活459億參數(shù),支持長(zhǎng)達(dá)100萬(wàn)的上下文輸入,以及業(yè)內(nèi)最長(zhǎng)的8萬(wàn)token推理輸出。這一能力不僅與閉源模型巨頭谷歌Gemini 2.5 Pro持平,更是DeepSeek-R1的8倍之多。為了滿(mǎn)足不同需求,MiniMax還訓(xùn)練了兩個(gè)版本的M1模型,思考預(yù)算分別為40K和80K。
在標(biāo)準(zhǔn)基準(zhǔn)測(cè)試集上的對(duì)比結(jié)果顯示,MiniMax-M1在復(fù)雜的軟件工程、工具使用以及長(zhǎng)上下文任務(wù)方面,均展現(xiàn)出了優(yōu)于DeepSeek-R1和Qwen3-235B等開(kāi)源模型的表現(xiàn)。這一成就不僅得益于其龐大的參數(shù)規(guī)模,更在于其獨(dú)特的混合架構(gòu)和高效算法。
在M1的研發(fā)過(guò)程中,MiniMax團(tuán)隊(duì)采用了創(chuàng)新的強(qiáng)化學(xué)習(xí)方法。據(jù)透露,整個(gè)強(qiáng)化學(xué)習(xí)階段使用了512塊H800訓(xùn)練了三周,租賃成本僅為53.74萬(wàn)美金(折合人民幣約385.9萬(wàn)元),遠(yuǎn)低于最初的成本預(yù)期。這一高效的成本控制策略,無(wú)疑為M1的成功發(fā)布奠定了堅(jiān)實(shí)基礎(chǔ)。
對(duì)于用戶(hù)而言,MiniMax-M1提供了極大的便利。在MiniMax APP和Web平臺(tái)上,用戶(hù)可以不限量免費(fèi)使用M1。而在API價(jià)格方面,MiniMax也提供了多種選擇。對(duì)于0-32k的輸入長(zhǎng)度,輸入價(jià)格為0.8元/百萬(wàn)token,輸出價(jià)格為8元/百萬(wàn)token;對(duì)于32k-128k的輸入長(zhǎng)度,輸入價(jià)格為1.2元/百萬(wàn)token,輸出價(jià)格為16元/百萬(wàn)token;對(duì)于128k-1M的輸入長(zhǎng)度,輸入價(jià)格為2.4元/百萬(wàn)token,輸出價(jià)格為24元/百萬(wàn)token。與DeepSeek-R1相比,M1在第三檔價(jià)格上展現(xiàn)出了絕對(duì)優(yōu)勢(shì),因?yàn)镈eepSeek-R1并不支持如此長(zhǎng)的輸入長(zhǎng)度。
在評(píng)測(cè)方面,MiniMax-M1在軟件工程、長(zhǎng)上下文和工具使用等方面的表現(xiàn)尤為突出。在OpenAI發(fā)布的MRCR測(cè)試集中,M1雖然略遜于Gemini 2.5 Pro,但相比其他模型仍具有明顯優(yōu)勢(shì)。在評(píng)估軟件工程能力的SWE-bench Verified測(cè)試集中,M1的表現(xiàn)也僅次于DeepSeek-R1-0528。特別是在航空業(yè)的TAU-bench(airline)測(cè)試集中,M1的表現(xiàn)優(yōu)于所有其他開(kāi)源和閉源模型。然而,在數(shù)學(xué)和編程能力方面,M1的得分相對(duì)較低,仍有提升空間。
MiniMax-M1的成功發(fā)布,不僅展示了MiniMax在AI技術(shù)方面的深厚積累,更為整個(gè)行業(yè)帶來(lái)了新的發(fā)展機(jī)遇。隨著AI技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展,MiniMax-M1有望在未來(lái)發(fā)揮更大的作用,推動(dòng)人工智能技術(shù)的持續(xù)創(chuàng)新和發(fā)展。