智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          加州大學(xué)團(tuán)隊(duì)開(kāi)源Sky-T1推理模型,訓(xùn)練成本僅450美元引關(guān)注

             發(fā)布時(shí)間:2025-01-12 17:55 作者:江紫萱

          近期,加州大學(xué)伯克利分校 Sky Computing 實(shí)驗(yàn)室的研究團(tuán)隊(duì) NovaSky 推出了一個(gè)名為 Sky-T1-32B-Preview 的推理模型,這一創(chuàng)新成果在AI界引起了廣泛關(guān)注。據(jù)悉,該模型在多項(xiàng)關(guān)鍵基準(zhǔn)測(cè)試中的表現(xiàn)與 OpenAI 早期版本的 o1 模型不相上下,但其開(kāi)源的特性使其更具吸引力。

          引人注目的是,Sky-T1-32B-Preview 是首個(gè)真正意義上的開(kāi)源推理模型,其訓(xùn)練數(shù)據(jù)集和代碼均向公眾開(kāi)放。這意味著,任何有興趣的用戶都可以從零開(kāi)始復(fù)現(xiàn)這一模型,無(wú)需依賴特定的商業(yè)平臺(tái)或昂貴的硬件資源。這一舉措無(wú)疑為AI領(lǐng)域的研究和發(fā)展注入了新的活力。

          NovaSky 團(tuán)隊(duì)在官方博客中透露,Sky-T1-32B-Preview 的訓(xùn)練成本僅為約450美元(當(dāng)前約合3306元人民幣),遠(yuǎn)低于同類(lèi)模型的數(shù)百萬(wàn)美元訓(xùn)練成本。這一突破性的降低得益于合成訓(xùn)練數(shù)據(jù)的廣泛應(yīng)用。合成數(shù)據(jù)是由其他模型生成的數(shù)據(jù),它不僅能夠顯著降低訓(xùn)練成本,還能提高模型的訓(xùn)練效率和性能。例如,AI 公司 Writer 最近發(fā)布的 Palmyra X 004 模型就幾乎完全依賴合成數(shù)據(jù)進(jìn)行訓(xùn)練,其開(kāi)發(fā)成本僅為70萬(wàn)美元。

          與傳統(tǒng)的AI模型相比,推理模型具備自我事實(shí)核查能力,這一特性使其能夠更有效地避免一些常見(jiàn)的錯(cuò)誤。雖然推理模型在解決問(wèn)題時(shí)可能需要花費(fèi)更多的時(shí)間,通常在幾秒到幾分鐘之間,但在物理、科學(xué)和數(shù)學(xué)等領(lǐng)域,其更高的可靠性使其更具應(yīng)用價(jià)值。

          據(jù) NovaSky 團(tuán)隊(duì)介紹,Sky-T1 的訓(xùn)練數(shù)據(jù)由阿里巴巴的 QwQ-32B-Preview 推理模型生成,并經(jīng)過(guò)了精心的篩選和重構(gòu)。他們利用 OpenAI 的 GPT-4o-mini 對(duì)數(shù)據(jù)進(jìn)行處理,使其更易于模型訓(xùn)練。在僅使用8臺(tái) Nvidia H100 GPU的情況下,訓(xùn)練這款擁有320億參數(shù)的模型僅耗時(shí)約19小時(shí)。參數(shù)數(shù)量是衡量模型解決問(wèn)題能力的一個(gè)重要指標(biāo),因此 Sky-T1 的高性能表現(xiàn)并不令人意外。

          在性能方面,Sky-T1 在 MATH500(一組“競(jìng)賽級(jí)”數(shù)學(xué)挑戰(zhàn))上的表現(xiàn)優(yōu)于 o1 的早期預(yù)覽版本,同時(shí)在 LiveCodeBench 的編程評(píng)估中也展現(xiàn)出了更佳的性能。然而,在 GPQA-Diamond 測(cè)試中(包含物理學(xué)、生物學(xué)和化學(xué)領(lǐng)域的研究生水平問(wèn)題),Sky-T1 的表現(xiàn)略遜于 o1 預(yù)覽版。盡管如此,NovaSky 團(tuán)隊(duì)表示,他們將繼續(xù)優(yōu)化 Sky-T1 的性能,并計(jì)劃推出更多版本的開(kāi)源推理模型。

           
           
          更多>同類(lèi)內(nèi)容
          全站最新
          熱門(mén)內(nèi)容
          本欄最新
           
          智快科技微信賬號(hào)
          微信群

          微信掃一掃
          加微信拉群
          電動(dòng)汽車(chē)群
          科技數(shù)碼群

          日韩免费无砖专区2020狼| 国产精品盗摄一区二区在线| 国产精品免费大片| 亚洲国产91精品无码专区| 日韩人妻无码精品无码中文字幕| 婷婷射精av这里只有精品| 精品爆乳一区二区三区无码av| 久久一区二区精品综合| 国产中老年妇女精品| 国产精品亚洲精品日韩已方| 日韩中文字幕一区| 亚洲日韩精品射精日| 国产精品成年片在线观看| 欧美日韩久久久精品A片| 精品午夜国产福利观看| 国产精品婷婷久青青原| 久久精品免费一区二区| 91精品久久久久| 久久久久人妻一区精品性色av| 久久国产乱子伦精品免费看| 国产精品无圣光一区二区| 国产午夜精品一区理论片飘花| 久草热久草热线频97精品| 亚洲精品亚洲人成在线观看下载| 日韩精品久久不卡中文字幕| 亚洲日韩欧洲乱码AV夜夜摸| 日韩AV无码不卡网站| 国产精品三级av及在线观看| 日韩精品中文字幕无码专区| 成人精品一区二区激情| 精品一区二区ww| 99视频在线精品免费观看6| 国精品产区WNW2544| 成人国产精品秘片多多| 国产欧美另类久久久精品图片| 香港三级精品三级在线专区| 人妻熟妇乱又伦精品视频APP| 亚洲高清国产拍精品熟女| 精品无码人妻一区二区三区18| 国产乱码精品一区二区三区四川人| 久久久无码精品人妻一区|