在人工智能領域,新一代多模態推理基模Step 3的發布引起了廣泛關注。這款模型專為推理時代設計,旨在成為應用領域的佼佼者,其推理效率據稱可達DeepSeek-R1的300%,刷新了行業天花板。Step 3將于7月31日正式開源,目標是成為開源領域最強的多模態推理模型。
2025年,AI模型的競爭異常激烈,谷歌和OpenAI之間的較量尤為引人注目。從年初開始,兩家公司頻繁發布新產品,爭奪“IMO金牌第一推理模型”的榮譽。然而,在開源模型領域,格局已悄然發生變化。
國內開源模型如DeepSeek、Qwen、StepFun、Kimi K2等,逐漸成為海外討論的焦點。曾經備受矚目的meta的Llama模型,如今已被遺忘,迫使meta的創始人扎克伯格不得不加大人才招募力度。
在喧囂的競爭背后,行業開始反思:什么才是真正“好用”的AI模型?業界普遍認識到,模型不僅要刷新榜單,更要能真正服務于各行各業。遺憾的是,能同時滿足“開源”、“多模態能力”和“推理”需求的模型寥寥無幾。
在2025年的WAIC大會上,階躍星辰發布的新一代主力基座模型Step 3帶來了令人驚喜的表現。這款模型采用了原創的MFA架構,通過模型和系統聯合創新,實現了行業領先的推理效率和極致性價比。
Step 3的核心亮點可以概括為“多開好省”:多模態、開源、強智能、低成本。在MMMU、MathVision、SimpleVQA等多個榜單上,Step 3都取得了開源多模態推理模型的SOTA成績。
在實際應用中,Step 3展現出了強大的能力。無論是識別圖片中的細節,還是進行復雜的視覺推理,Step 3都能應對自如。例如,在面對一張貓咪圖片時,Step 3能準確識別出“一只貓+影子”,并解釋視覺錯覺的原因。
Step 3還具備強大的數學和代碼推理能力。在監測食物卡路里、計算人均消費等場景中,Step 3都能提供準確的答案。其多模態能力使得它在處理復雜場景時更加得心應手。
Step 3的另一大優勢是對所有芯片友好。通過系統級的創新,Step 3在國產芯片上的推理效率最高可達DeepSeek-R1的300%。這一特性使得Step 3在各種硬件環境下都能保持高效的推理性能,大幅降低推理成本。
階躍星辰在發布會上宣布,預計7月31日將面向全球企業和開發者開源Step 3。這意味著企業和開發者可以根據自己的需求對模型進行私有化部署、訓練和微調。
階躍星辰在短短兩年多的時間里,已經發布了26款自研基座模型,其中多模態模型占比超過七成。Step 3的發布標志著階躍星辰在多模態推理領域邁出了重要一步。
階躍星辰創始人、CEO姜大昕表示:“從Step 1到Step 2的快速迭代,讓我們深刻認識到什么才是最適合應用的模型。Step 3的研發正是基于這一理念,旨在通過系統級創新提升模型性能和應用價值。”
為了推動大模型的落地應用,階躍星辰還聯合了近10家芯片及基礎設施廠商,共同發起了“模芯生態創新聯盟”。該聯盟致力于打通芯片、模型和平臺全鏈路技術,為企業提供高效易用的大模型解決方案。
隨著Step 3的發布和“模芯生態創新聯盟”的成立,階躍星辰正引領中國AI領域向更廣闊的未來邁進。