在2025年世界人工智能大會WAIC上,商湯科技帶來了一系列震撼業界的創新成果。會上,商湯正式推出了“日日新SenseNova V6.5”大模型體系與“悟能”具身智能平臺,并對旗下的明星產品商湯小浣熊進行了智能體升級。
日日新V6.5大模型體系在強推理、高效率及智能體三大方面進行了重點升級。該版本率先突破了圖文交錯思維鏈技術,使AI模型能夠更直觀地理解和處理圖像與文字交織的信息。商湯科技CEO徐立表示,之所以選擇推出V6.5而非V7,是因為他們希望進一步擴充多模態思維鏈構造數據,結合商湯在視覺感知領域的優勢,通過圖文關系的深度挖掘,推動模型核心能力的飛躍。
在性能表現上,日日新V6.5的文本推理能力和多模態推理能力均超越了Gemini 2.5 Pro和Claude-4 Sonnet,其多模態交互能力也領先Gemini 2.5 Flash和GPT-4o。這一突破得益于商湯對多模態模型融合架構的改進,新的架構不僅減輕了視覺編碼器的負擔,還通過深而窄的主干模型,實現了視覺與語言表征的早期對齊與融合,從而提高了感知效率和模態融合的深度。
基于日日新V6.5的多模態數據分析能力,商湯小浣熊也迎來了全面升級。升級后的商湯小浣熊能夠處理復雜的多模態輸入,進行深度融合分析,并以多模態形式輸出結果。在數據分析和智能體領域的測試中,商湯小浣熊的表現達到了國際標桿Claude 4 Opus的水平,遠超OpenAI o3等模型。在實際辦公場景中,商湯小浣熊能夠解析復雜的Excel表格,通過多模態思維鏈構造進行全局分析,最終生成結構化的報告。
商湯小浣熊還推出了教育版和金融版,針對不同行業的需求提供定制化服務。教育版能夠智能分析學生的學習表現和行為模式,已在多所院校協助提升教學效率和學生心理健康水平。金融版則提供知識助手、智能問數和多模態智能理賠等解決方案,構建金融領域的“人機協同”智能決策新范式。
“悟能”具身智能平臺是商湯科技的另一項重磅創新。該平臺以商湯的具身世界模型為核心引擎,為機器人等智能終端提供強大的感知、視覺導航和多模態交互能力。徐立在現場展示了搭載具身世界引擎的人形機器人,它能夠生動地講解PPT,語言自然流暢,還能回答觀眾的問題,進行階段性小結。
商湯的具身世界模型不僅能夠生成多視角視頻,還能構建面向人、物、場的4D真實世界。用戶只需輸入簡單的提示詞,模型就能自主進行位姿、動作骨架和指令的生成,實現與真實世界的深度交互。這一技術突破為機器人等智能終端提供了前所未有的自主化與智能化水平。
在WAIC的商湯科技展臺上,吸引了眾多參觀者駐足。會解說PPT的人形機器人成為全場焦點,它基于日日新V6.5多模態大模型,擁有強大的音視頻處理和AI交互能力,能夠在嘈雜環境中完成實時流暢的互動。傅利葉、鈦虎等多家機器人也亮相商湯展臺,展示了基于日日新V6.5多模態大模型的智能硬件產品。
商湯科技還展示了其AI基礎設施商湯大裝置、“開悟”世界模型以及各類AI原生應用,如商湯商量、辦公小浣熊、代碼小浣熊等。這些創新成果不僅展現了商湯在人工智能領域的深厚積累,也預示著AI技術正在逐步觸達AGI邊界,向“類人”標準靠近。