在華為開發(fā)者大會HDC 2025的盛會上,華為云計算的領軍人物張平安,以常務董事的身份,向全球開發(fā)者揭曉了盤古大模型的最新版本5.5。此次發(fā)布,標志著華為在自然語言處理(NLP)、計算機視覺(CV)、多模態(tài)、預測、科學計算等多個領域取得了重大突破。
盤古NLP大模型迎來了全面革新,其核心的718B深度思考模型,依托256個專家級MoE架構,實現了在知識推理、工具調用及數學領域的顯著提升。這一成就,得益于昇騰云的全棧軟硬件訓練平臺,進一步證明了昇騰架構在構建世界級大模型方面的卓越能力。盤古5.5在用戶體驗上亦有大幅提升,引入了自適應快慢思考合一技術,通過難度感知數據和兩階段訓練,使得模型能夠靈活應對不同復雜度的問題,整體推理效率躍升8倍。盤古深度研究DeepDiver技術的應用,更是讓網頁搜索、常識性問答等場景的執(zhí)行效率實現了質的飛躍。
盤古預測大模型則憑借業(yè)界首創(chuàng)的triplet transformer統(tǒng)一預訓練架構,實現了跨行業(yè)、跨場景的高效預測。這一架構通過三元組編碼,將不同行業(yè)的數據統(tǒng)一處理,極大地提升了預測精度和泛化能力。在科學計算領域,盤古大模型的應用同樣令人矚目。深圳氣象局和重慶市氣象局分別基于盤古升級了“智霽”和“天資?12h”氣象大模型,不僅提高了天氣預報的準確性,還增強了災害天氣的預警能力。深圳能源則利用盤古進行中短期風光水發(fā)電量預測,有效提升了能源開發(fā)效率。
計算機視覺方面,華為云發(fā)布了全新的300億參數MoE架構視覺大模型,這一模型是目前業(yè)界最大的視覺模型,支持多維度、泛視覺的感知、分析與決策。盤古CV大模型通過跨維度生成模型,構建了稀缺的工業(yè)場景故障樣本庫,顯著提升了業(yè)務場景的可識別種類與精度。在智能駕駛和具身智能機器人領域,盤古多模態(tài)大模型的應用更是開創(chuàng)了新篇章。基于盤古世界模型,可以構建數字物理空間,為智能駕駛和智能機器人提供大量的訓練數據,無需依賴高成本的實際采集。
盤古大模型5.5的發(fā)布,不僅展示了華為在AI領域的深厚積累,更為全球開發(fā)者提供了強大的工具和平臺。這一系列的創(chuàng)新成果,無疑將為AI技術的發(fā)展和應用開辟更加廣闊的空間。