在中國算力產(chǎn)業(yè)的轉(zhuǎn)型之路上,一場由“受制于人”向“自主可控”的深刻變革正轟轟烈烈地上演。2025年世界人工智能大會(WAIC)成為了國產(chǎn)算力技術(shù)突破與創(chuàng)新成果展示的璀璨舞臺,尤其是在超節(jié)點架構(gòu)、光互連技術(shù)、異構(gòu)協(xié)同以及算力集群化與全鏈路國產(chǎn)化等領(lǐng)域,展現(xiàn)了一幅由底層硬件創(chuàng)新驅(qū)動、產(chǎn)業(yè)協(xié)同共進的生態(tài)畫卷。
在這場技術(shù)盛宴中,核心技術(shù)的突破尤為引人注目。曦智科技攜手壁仞科技、中興通訊,推出了全球首款分布式光交換(dOCS)超節(jié)點,通過硅光芯片實現(xiàn)了GPU間的光互連,打破了傳統(tǒng)通信瓶頸。與此同時,華為昇騰384超節(jié)點則以突破英偉達(dá)NVLink私有協(xié)議壟斷的姿態(tài),為國產(chǎn)萬卡集群提供了全新的可擴展架構(gòu)范式。多家國內(nèi)AI芯片企業(yè)展示了系統(tǒng)級創(chuàng)新與軟硬協(xié)同成果,成功跨越了從技術(shù)探索到商業(yè)應(yīng)用的“最后一公里”。
國產(chǎn)算力正逐步擺脫“替代備份”的角色,向“技術(shù)引領(lǐng)”邁進。這一轉(zhuǎn)變的關(guān)鍵在于超節(jié)點集群對算力密度的突破、光互連與液冷技術(shù)對物理限制的破解,以及開放異構(gòu)生態(tài)對碎片化困局的化解。智能計算超節(jié)點的應(yīng)運而生,不僅為解決算力瓶頸提供了關(guān)鍵路徑,更標(biāo)志著中國AI產(chǎn)業(yè)從“硬件依賴”邁向“系統(tǒng)定義”的范式轉(zhuǎn)變。
隨著大模型參數(shù)的指數(shù)級增長,業(yè)界對GPU集群規(guī)模的需求迅速擴大,從千卡級、萬卡級躍升至十萬卡級,算力需求的增長速度遠(yuǎn)超芯片性能的提升。面對這一挑戰(zhàn),Scale Up(縱向擴展)與Scale Out(橫向擴展)成為構(gòu)建大規(guī)模GPU算力集群的兩大路徑。其中,超節(jié)點作為Scale Up的最優(yōu)解,通過內(nèi)部高速總線互連,有效支撐了并行計算任務(wù),加速了GPU間的參數(shù)交換與數(shù)據(jù)同步,顯著縮短了模型訓(xùn)練周期。
在2025WAIC現(xiàn)場,中國企業(yè)帶來的超節(jié)點技術(shù)方案成為大會的亮點之一。上海儀電聯(lián)合曦智科技、壁仞科技、中興通訊,正式發(fā)布國內(nèi)首個光互連光交換GPU超節(jié)點解決方案——光躍LightSphere X。該方案以曦智科技的分布式光交換(dOCS)芯片為核心,結(jié)合壁仞科技的大算力通用GPU液冷模組與中興通訊的高性能AI國產(chǎn)服務(wù)器,構(gòu)建了高帶寬、低延遲、靈活可擴展的自主可控智算集群生態(tài),即將在上海儀電智算中心落地。
光躍LightSphere X的推出,標(biāo)志著國產(chǎn)算力在光互連技術(shù)領(lǐng)域的重大突破。通過光互連技術(shù),該方案突破了傳統(tǒng)互連方式下的物理限制,實現(xiàn)了萬卡級彈性擴展,降低了部署成本,并可根據(jù)算力需求動態(tài)調(diào)整超節(jié)點規(guī)模,實現(xiàn)分階段建設(shè)。同時,曦智科技的dOCS技術(shù)進一步提升了超節(jié)點的靈活度和系統(tǒng)可擴展性,從而提高了系統(tǒng)的性價比。
在算力基礎(chǔ)設(shè)施的務(wù)實轉(zhuǎn)型中,系統(tǒng)化創(chuàng)新與全鏈路國產(chǎn)化的推進節(jié)奏備受矚目。大模型的快速發(fā)展與迭代,不僅改變了以往模型碎片化的產(chǎn)業(yè)生態(tài),更推動了算力基礎(chǔ)設(shè)施向系統(tǒng)化和集群化發(fā)展。國產(chǎn)AI芯片企業(yè)紛紛在不同維度上攻堅奮進,推動系統(tǒng)化創(chuàng)新。摩爾線程以全功能GPU為核心底座,構(gòu)建了“云邊端”全棧AI產(chǎn)品和解決方案,支持大規(guī)模智算中心部署。燧原科技則推出了高性能推理加速卡、一體機系列產(chǎn)品以及全新計算系統(tǒng),全面布局訓(xùn)推一體市場。
華為昇騰384超節(jié)點真機在展區(qū)的亮相,更是吸引了無數(shù)目光。該超節(jié)點通過總線技術(shù)實現(xiàn)了384個NPU之間的大帶寬低時延互聯(lián),有效解決了集群內(nèi)資源間的通信瓶頸。其單卡推理性能、Decoding吞吐以及通訊時延均處于業(yè)界領(lǐng)先水平,展示了華為在AI算力集群解決方案上的強大實力。
中興、新華三、超聚變等企業(yè)也在大會上展示了各自在智算超節(jié)點領(lǐng)域的最新成果。中興的智算超節(jié)點服務(wù)器實現(xiàn)了算力高密集成與高效互聯(lián),為超大參數(shù)模型提供高算效硬件底座;新華三的超節(jié)點產(chǎn)品H3C UniPod S80000則專為萬億級大模型打造,支持多種形態(tài)部署與互聯(lián)互通;超聚變則帶來了全球首個多元智算即插即用超級集群系統(tǒng),實現(xiàn)了全面軟硬件基礎(chǔ)設(shè)施技術(shù)與算力生態(tài)的兼容。
在這場中國智算超節(jié)點的“集體秀”中,我們看到了國產(chǎn)算力從底層硬件到系統(tǒng)級創(chuàng)新的全面突破,以及產(chǎn)業(yè)協(xié)同共進的力量。這不僅是中國AI產(chǎn)業(yè)技術(shù)路線選擇的重要體現(xiàn),更是關(guān)乎整個產(chǎn)業(yè)發(fā)展命脈的關(guān)鍵所在。隨著國產(chǎn)算力技術(shù)的不斷突破與創(chuàng)新,中國AI產(chǎn)業(yè)正加速邁向自主可控的新時代。