近日,國內知名的第三方評測權威機構SuperCLUE揭曉了中文原生工業大模型評測新標桿——SC-Industry(SuperCLUE-Industry)的最新排名。北電數智旗下的驕陽·工業大模型在此次評測中以總分83.44的佳績,榮登榜首。
SuperCLUE作為業界公認的中文大模型綜合評測基準,此次發布的SC-Industry評測框架,專為中文語義環境與國內工業應用場景設計,旨在全面評估工業大模型在解決實際工業問題上的能力,同時考量模型的通用性和可擴展性。評測涵蓋了基礎能力和應用能力兩大維度,具體包括工業常規問答、工業數據分析、工業文檔問答、工業智能體Agent、工業理解計算、工業代碼生成等六大核心能力。
在SC-Industry的評測中,驕陽·工業大模型不僅在總分上獨占鰲頭,其應用能力更是以90.07分的優異成績位列第一。特別是在工業數據分析方面,驕陽·工業大模型以90.38分的最高分展現了其在表格類數據分析上的卓越能力,提供了深入的行業洞察。在工業智能體Agent的評測中,該模型同樣表現出色,以89.97分的高分領跑,展現了其在復雜工業環境中自主或半自主執行任務、做出有效決策以及與其他系統交互優化工業流程的能力。
SuperCLUE在評測報告中強調,產業級應用能力已成為當前工業大模型發展的新分水嶺。驕陽·工業大模型在工業數據分析上的強勢表現,不僅彰顯了國產模型在工業任務能力上的突破,也表明在基礎能力日益趨同的背景下,工業數據分析與智能體表現將成為拉開模型差距的關鍵因素。北電數智通過推動工業數據標準和開放協議體系的建立,運用可信數據空間技術實現數據安全共享,同時研發場景化微調數據生成和復雜任務強化學習等核心技術,有效提升了模型的行業認知能力。
據悉,北電數智即將在2025世界人工智能大會(WAIC)上正式發布驕陽·工業大模型。屆時,北電數智將聚焦工業企業最為關注的“AI+生產、AI+產品、AI+運營、AI+基礎設施”等核心業務場景,分享其創新能力和標桿實踐,期待為行業帶來更多驚喜。