智快網 - 新科技與新能源行業網絡媒體

          字節開源MoE關鍵優化技術,主流大模型均能接入,訓練成本可省40%!

             發布時間:2025-03-10 19:01 作者:快訊

          3 月 10日,字節豆包大模型團隊官宣開源一項針對 MoE 架構的關鍵優化技術,可將大模型訓練效率提升1.7倍,成本節省40%。據悉,該技術已實際應用于字節的萬卡集群訓練,累計幫助節省了數百萬 GPU 小時訓練算力。

          MoE 是當前大模型的主流架構,但其在分布式訓練中存在大量跨設備通信開銷,嚴重制約了大模型訓練效率和成本。以海外主流模型Mixtral-8x7B為例, 其訓練過程中通信時間占比可高達 40%。針對這一難題,字節在內部研發了COMET計算-通信重疊技術,通過多項創新,大幅壓縮了MoE專家通信空轉時間。

          相較DeepSeek近期開源的DualPipe等MoE優化方案,COMET可以像插件一樣直接接入已有的MoE訓練框架,支持業界絕大部分主流大模型,無需對訓練框架進行侵入式改動。因簡潔、通用的設計理念,該工作以5/5/5/4 的高分入選全球機器學習系統頂級會議 MLSys 2025 ,被認為“在大規模生產環境中極具應用潛力”。

          具體而言, COMET 從系統層面建立了面向 MoE 的細粒度流水線編程方式,通過引入共享張量依賴解析、自適應負載分配兩項關鍵機制,來解決通信與計算之間的粒度錯配問題,并精準平衡通信與計算負載,最終大幅提升MoE流水線整體效率。 引入COMET后,單個 MoE 層上可實現 1.96 倍加速、端到端平均 1.71 倍效率提升,且在不同并行策略、輸入規模及硬件環境下均表現穩定。

          截屏2025-03-10 16.30.30

          COMET 的設計結構

          COMET 與Deepseek 研發的DualPipe方案還可以聯合使用。在降低MoE通信開銷上,COMET 采用了計算-通信融合算子的優化方式, DualPipe則通過排布算子來掩蓋通信,兩種方案并不沖突,結合使用或將更大幅度壓縮模型訓練成本。

          目前,COMET支持多種MoE并行模式,部署靈活、方便。同時,COMET核心代碼已開源,并向開發者提供了一套友好的 Python API,計劃兼容 Triton 等編譯生態。

          COMET論文鏈接:https://arxiv.org/pdf/2502.19811

          開源地址:https://github.com/bytedance/flux

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          久久精品无码专区免费青青| 精品日产一区二区三区手机| 精品久久中文字幕有码| 在线观看日韩精品| 亚洲国产精品一区二区久久| 精品国内片67194| 尹人久久久香蕉精品| 国产精品无码国模私拍视频| 精品日韩一区二区| 凹凸精品视频分类国产品免费| 成人精品一区二区不卡视频| 国产精品1024| 91成人午夜在线精品| 国产成人精品福利网站在线| 中文字幕精品一区影音先锋| 99re视频精品全部免费| 熟女精品视频一区二区三区 | 久久精品无码免费不卡| 无码人妻一区二区三区精品视频 | 99re国产精品| 99久久国产综合精品swag| 99热在线精品免费播放6| 日韩精品视频一区二区三区| 一本大道久久a久久精品综合| 久久久久久国产精品mv| 久久免费视频精品| 无码日韩精品一区二区三区免费| 久久精品青青大伊人av| 久久国产精品萌白酱免费| 久久亚洲精品无码| 99精品众筹模特自拍视频| 99久久免费中文字幕精品| 久久精品国产亚洲av高清漫画| 久久国产精品99精品国产| 91精品国产91久久| 亚洲精品伊人久久久久| 香蕉久久夜色精品国产尤物| 亚洲精品色播一区二区| 国产精品自在在线午夜| 国产精品盗摄一区二区在线| 国产成人综合久久精品|