智快網 - 新科技與新能源行業網絡媒體

          加州大學團隊開源Sky-T1推理模型,訓練成本僅450美元引關注

             發布時間:2025-01-12 17:55 作者:江紫萱

          近期,加州大學伯克利分校 Sky Computing 實驗室的研究團隊 NovaSky 推出了一個名為 Sky-T1-32B-Preview 的推理模型,這一創新成果在AI界引起了廣泛關注。據悉,該模型在多項關鍵基準測試中的表現與 OpenAI 早期版本的 o1 模型不相上下,但其開源的特性使其更具吸引力。

          引人注目的是,Sky-T1-32B-Preview 是首個真正意義上的開源推理模型,其訓練數據集和代碼均向公眾開放。這意味著,任何有興趣的用戶都可以從零開始復現這一模型,無需依賴特定的商業平臺或昂貴的硬件資源。這一舉措無疑為AI領域的研究和發展注入了新的活力。

          NovaSky 團隊在官方博客中透露,Sky-T1-32B-Preview 的訓練成本僅為約450美元(當前約合3306元人民幣),遠低于同類模型的數百萬美元訓練成本。這一突破性的降低得益于合成訓練數據的廣泛應用。合成數據是由其他模型生成的數據,它不僅能夠顯著降低訓練成本,還能提高模型的訓練效率和性能。例如,AI 公司 Writer 最近發布的 Palmyra X 004 模型就幾乎完全依賴合成數據進行訓練,其開發成本僅為70萬美元。

          與傳統的AI模型相比,推理模型具備自我事實核查能力,這一特性使其能夠更有效地避免一些常見的錯誤。雖然推理模型在解決問題時可能需要花費更多的時間,通常在幾秒到幾分鐘之間,但在物理、科學和數學等領域,其更高的可靠性使其更具應用價值。

          據 NovaSky 團隊介紹,Sky-T1 的訓練數據由阿里巴巴的 QwQ-32B-Preview 推理模型生成,并經過了精心的篩選和重構。他們利用 OpenAI 的 GPT-4o-mini 對數據進行處理,使其更易于模型訓練。在僅使用8臺 Nvidia H100 GPU的情況下,訓練這款擁有320億參數的模型僅耗時約19小時。參數數量是衡量模型解決問題能力的一個重要指標,因此 Sky-T1 的高性能表現并不令人意外。

          在性能方面,Sky-T1 在 MATH500(一組“競賽級”數學挑戰)上的表現優于 o1 的早期預覽版本,同時在 LiveCodeBench 的編程評估中也展現出了更佳的性能。然而,在 GPQA-Diamond 測試中(包含物理學、生物學和化學領域的研究生水平問題),Sky-T1 的表現略遜于 o1 預覽版。盡管如此,NovaSky 團隊表示,他們將繼續優化 Sky-T1 的性能,并計劃推出更多版本的開源推理模型。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          国产精品 羞羞答答在线| 国产精品jizz在线观看网站| 日本精品一区二区三区在线观看| 网友偷拍日韩精品| 午夜国产精品久久影院| 最新国语自产精品视频在| 99re6这里有精品热视频| 91精品全国免费观看含羞草| 国产精品视频二区不卡| 国模精品一区二区三区| 国产精品午夜福利在线无码| 日本精品视频在线观看| 精品日韩亚洲AV无码一区二区三区| 日韩国产精品99久久久久久| 精品日产卡一卡二卡三入口| 一本色道久久88—综合亚洲精品| 国产精品视频免费观看| 久久精品国产亚洲av麻豆蜜芽 | 精品午夜国产福利观看| 亚洲精品中文字幕无码AV| 99这里只有精品| 无码国产精品一区二区免费vr| 久久国产精品免费视频| 亚洲AV无码久久精品成人 | 99热在线精品免费全部my| 国产精品天天影视久久综合网| 久久久久久九九99精品| 久久精品99久久香蕉国产色戒| 无码人妻丰满熟妇精品区| 亚洲AV无码成人网站久久精品大 | 精品人妻无码一区二区三区蜜桃一 | 99久久精品午夜一区二区| 精品国产一区二区三区不卡| 精品人妻一区二区三区浪潮在线| 亚洲精品中文字幕无乱码| 久久精品一区二区三区AV| 亚洲国产成人精品激情| 99热亚洲色精品国产88| 亚洲精品美女久久7777777| 人妻少妇精品久久久久久 | 国产日韩精品无码区免费专区国产|