智快網 - 新科技與新能源行業網絡媒體

          AMD ROCm 6.3重磅更新:加速AI推理,Fortran編譯器亮相

             發布時間:2024-11-27 10:19 作者:江紫萱

          AMD近日在AI及高性能計算領域邁出重要一步,發布了ROCm 6.3版本更新。此次更新不僅集成了專為AI推理加速設計的SGLang運行時,還對FlashAttention-2進行了全面優化,旨在提升AI訓練和推理的效率。

          SGLang的加入,標志著AMD在優化大型語言模型(LLMs)和視覺語言模型(VLMs)推理方面取得了新進展。AMD承諾,通過集成SGLang,能夠在AMD Instinct GPU上實現高達6倍的吞吐量提升。SGLang還支持Python,并配備了預配置的ROCm Docker容器,為用戶提供了更為便捷的使用體驗。

          在FlashAttention-2方面,AMD進行了全面革新。相較于FlashAttention-1,新版本在前向和后向傳遞方面取得了顯著改進,從而大幅提升了Transformer模型的訓練和推理速度。這一改進對于依賴Transformer架構的AI應用而言,無疑是一個重大利好。

          除了上述更新外,AMD還推出了全新的Fortran編譯器。這款編譯器支持直接GPU卸載,與舊版本兼容,并完美集成了HIP內核和ROCm庫。這為Fortran開發者提供了更為強大的GPU計算能力,使他們能夠更高效地利用AMD GPU進行高性能計算。

          在圖像和視頻處理方面,ROCm 6.3也帶來了諸多增強。rocDecode、rocJPEG和rocAL等計算機視覺庫得到了全面升級,分別支持AV1編解碼、GPU加速JPEG解碼以及更優的音頻增強功能。這些改進為圖像和視頻處理應用提供了更為強大的支持,使得AMD GPU在多媒體處理領域也展現出了出色的性能。

          ROCm(Radeon Open Compute)是AMD開發的一個開源軟件棧,旨在支持在AMD GPU上進行編程。它包含了驅動程序、開發工具和API,支持從底層內核到最終用戶應用程序的GPU編程。ROCm針對生成式AI和高性能計算(HPC)應用進行了優化,并涵蓋了通用計算(GPGPU)、高性能計算(HPC)和異構計算等多個領域。

          此次ROCm 6.3的發布,不僅展示了AMD在AI和高性能計算領域的持續投入和創新,也為廣大開發者提供了更為強大和便捷的編程工具。相信隨著ROCm的不斷完善和發展,AMD GPU將在更多領域展現出其卓越的性能和潛力。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          亚洲电影日韩精品| 国产微拍精品一区二区| 正在播放国产精品每日更新 | 日韩电影在线观看第一区| 国产精品一品二区三区的使用体验| 亚洲精品欧洲精品| 久久久久久久久久国产精品免费| 在线亚洲精品福利网址导航| 精品人妻伦一二三区久久| 亚洲国产精品成人久久蜜臀 | 99re66热这里只有精品| 国产vA免费精品高清在线观看| 中文字幕一区日韩精品| 国产三级精品三级男人的天堂| 天天综合亚洲色在线精品| 国产精品久久久久久久久久久不卡 | 麻豆精品人妻一区二区三区蜜桃| 国产成人精品免费午夜app| 2021国产精品久久久久| 99RE久久精品国产| 久久精品毛片免费观看| 久久久久久国产精品无码超碰| 久久精品一品道久久精品9| 秋霞久久国产精品电影院| 国产精品免费看久久久| 国产成人精品无码片区在线观看| 久久99精品国产麻豆宅宅| 国产a∨精品一区二区三区不卡| 亚洲国产精品国自产拍AV| 国产成人精品无码播放| 久久久国产成人精品| 熟妇人妻VA精品中文字幕| 人人妻人人澡人人爽精品日本 | 99久久精品国产一区二区成人| 亚洲国产精品自在在线观看| 熟妇人妻VA精品中文字幕| 999国产高清在线精品| 亚洲国产成人精品青青草原| 国产精品久久亚洲不卡动漫| 99rv精品视频在线播放| 亚洲精品无码中文久久字幕|