在華為開發者大會2025(HDC 2025)的盛會上,華為云計算迎來了一次重大飛躍。華為常務董事及云計算業務首席執行官張平安隆重宣布,基于CloudMatrix 384超節點的新一代昇騰AI云服務已全面投入使用,同時,盤古大模型5.5版本也正式面世,其涵蓋的自然語言處理(NLP)、計算機視覺(CV)、多模態、預測、科學計算五大核心模型均實現了全面升級。
面對AI技術所帶來的算力需求的急劇增長,傳統計算架構已難以滿足當前需求。華為云專家指出,傳統分布式系統多為松耦合架構,依靠25Gbps或100Gbps以太網帶寬即可應對多數應用。然而,AI時代的應用負載特性迥異,當前以太網互聯帶寬逐漸難以支撐AI訓練和推理等場景。因此,云平臺需借助新型超高性能網絡,將GPU、CPU等多元算力高效連接,并采用“對等架構”替代傳統的“主從架構”,實現多元算力間的直接通信,無需依賴CPU,這一能力是AI原生云基礎設施的關鍵所在。
華為云此次推出的新一代昇騰AI云服務,依托CloudMatrix 384超節點,創新性地將384顆昇騰NPU與192顆鯤鵬CPU通過全新高速網絡MatrixLink實現全對等互聯,構建出一臺前所未有的“超級AI服務器”。這一創新使得單卡推理吞吐量飆升至2300 Tokens/s,相較于非超節點配置,性能提升了近4倍。
超節點架構在支持混合多專家MoE大模型推理方面展現出顯著優勢,能夠實現“一卡一專家”,單個超節點即可支持384個專家并行推理,大幅提升效率。超節點還支持“一卡一算子任務”,能夠靈活分配資源,優化任務并行處理,減少等待時間,將算力有效使用率(MFU)提升50%以上。針對萬億、十萬億參數級別的大模型訓練任務,云數據中心可將432個超節點級聯,形成最高16萬卡的超大集群,同時支持訓推算力一體部署,如“日推夜訓”,實現訓推算力靈活分配,優化客戶資源使用。
昇騰AI云服務已服務于科大訊飛、新浪、硅基流動、面壁智能、中科院、360等超過1300家企業,提供強大的AI算力支持。
在國產算力基礎上,盤古大模型5.5版本實現了全面升級。華為在大模型領域的戰略聚焦于行業應用,旨在通過通用大模型推動行業AI的深入發展,避免各行業重復構建自己的大模型。基于此戰略,華為云發布了盤古大模型5.5,五大基礎模型均得到顯著提升。
盤古自然語言處理NLP大模型升級為全新的718B深度思考模型,由256個專家組成的MoE大模型,在知識推理、工具調用、數學等領域表現卓越,位居業界前列。該模型基于昇騰云的全棧軟硬件訓練,標志著昇騰平臺能夠打造世界一流的大模型。
盤古大模型5.5還在高效長序列、低幻覺、快慢思考融合、Agent等特性上進行了優化。例如,盤古提出了自適應快慢思考合一技術,通過構建難度感知的快慢思考數據和兩階段漸進訓練,實現模型根據問題難易程度自適應切換思考模式,簡單問題迅速回復,復雜問題則進行深入思考,整體推理效率提升8倍。盤古深度研究DeepDiver通過關鍵技術如長鏈難題合成、漸進式獎勵等,在網頁搜索、常識性問答等應用上展現出高效能。
針對行業企業客戶,華為云提供了六大核心能力,包括盤古基礎及行業大模型、預訓練和后訓練語料、數據工程工具集、模型訓練工具集、行業裁判模型、行業評測平臺。通過華為云ModelArts完備的工具鏈和工程化方法,企業能夠將自身數據資產進行高質量的增訓、微調和強化學習,快速構建專業大模型。
中國農業科學院基于盤古大模型,結合海量專業文獻與跨物種多組學數據,構建了面向育種領域的農業科學發現大模型,實現了精準農業專業知識問答、高效基因分析和定向位點設計,顯著縮短了研發周期,提升了目標性狀改良的精準性。
張平安還發布了盤古醫學、金融、政務、工業、汽車五個具備深度思考能力的行業自然語言大模型,旨在加速行業智能化進程,這些模型將于6月底正式上線。
基于盤古多模態大模型的世界模型,為智能駕駛、具身智能機器人的訓練構建了所需的數字物理空間,實現了持續優化迭代。華為云還發布了CloudRobo具身智能平臺,結合盤古大模型的多模態能力和思維能力。盤古預測大模型采用業界首創的triplet transformer統一預訓練架構,顯著提升了預測大模型的精度和跨行業、跨場景的泛化性。盤古科學計算大模型和盤古計算機視覺CV大模型也同步更新。
過去一年中,盤古大模型已在30多個行業、500多個場景中落地應用,在政務、金融、制造、醫療、煤礦、鋼鐵、鐵路、自動駕駛、氣象等領域發揮了重要作用。
在加強AI云服務的同時,華為云還發布了企業級Agent平臺ModelArts Versatile,內置各類業務場景的經驗模板,支持自助式智能體開發。Versatile提供了智能化工具鏈,實現Agent分鐘級工作輸出,顯著降低了Agent開發的復雜度和專業性。
CodeArts Doer構建了涵蓋項目經理、產品管理、開發、構建、測試和部署全流程的六大開發領域專業Agent,將軟件研發端到端效率提升40%以上。GaussDB Doer在精準查詢方面,基于盤古大模型,利用全球上萬個GaussDB運維案例的百億Tokens數據進行微調,構建了專業運維基模型。metaStudio則通過個性化TTS語音合成,實現了數字人音色相似度和讀音準確率的業界領先。
華為云還提供了包含語料數據安全、模型安全、推理安全、應用安全在內的端到端大模型安全方案。大模型防火墻通過防范提示詞攻擊和實時檢測敏感內容,保障大模型推理安全,識別越獄、角色扮演、惡意指令等主流攻擊手段,預置百萬級規則庫,針對提示詞攻擊的檢出率超過95%,整體幫助模型綜合安全評測得分提升20%以上。
作為華為公司面向開發者的統一底座,華為云致力于構建昇騰、鴻蒙、鯤鵬、GaussDB、歐拉等根技術的生態。目前,華為云開發者已超過800萬,支持鯤鵬、昇騰、鴻蒙等生態的開發者總數達到1300萬。