智快網 - 新科技與新能源行業網絡媒體

          微軟rStar-Math技術助力,小語言模型數學推理能力大飛躍!

             發布時間:2025-01-11 12:41 作者:顧雨柔

          微軟亞洲研究院的數學與人工智能研究團隊近日取得了一項新的技術突破,他們專為解決數學問題設計并開發了名為rStar-Math的技術。這項技術于1月10日通過官方博文正式對外公布。

          與微軟此前推出的Phi-4技術相比,rStar-Math采用了蒙特卡洛樹搜索(Monte Carlo Tree Search)進行推理。這種方法模擬了人類逐步解決問題的思維方式,通過將復雜問題分解成更小的部分,逐步求解,從而提高了解決數學問題的效率。

          在開發過程中,研究團隊要求模型輸出自然語言描述和Python代碼形式的“思維鏈”步驟,并將自然語言作為Python代碼的注釋。他們僅使用Python代碼輸出進行訓練,這一做法旨在使模型更加清晰地展示其解題過程。

          為了進一步提升模型的性能,研究團隊還訓練了一個“策略模型”來生成數學推理步驟,并使用“過程偏好模型”(PPM)來選擇最有希望的解題步驟。這兩個模型通過四輪“自我進化”相互改進,不斷優化其解題能力。

          在訓練過程中,研究團隊使用了74萬道公開的數學應用題及其解答作為初始數據,并利用上述兩個模型生成了新的解題步驟。這一做法不僅豐富了訓練數據,還有助于模型更好地理解和解決數學問題。

          測試結果顯示,應用rStar-Math技術后,Qwen2.5-Math-7B模型的準確率從58.8%躍升至90.0%,Phi3-mini-3.8B模型的準確率也從41.4%提升到86.4%。與OpenAI的o1-preview模型相比,rStar-Math技術在兩個模型上的表現分別高出4.5%和0.9%。

          為了讓其他研究者能夠使用和改進rStar-Math技術,研究團隊已在Hugging Face上宣布,他們計劃將rStar-Math的代碼和數據在GitHub上公開。這一舉措將促進數學與人工智能領域的交流與合作,推動相關技術的進一步發展。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          1024你懂的国产精品| 97精品依人久久久大香线蕉97| AV天堂午夜精品一区二区三区| 99热这里只有精品6免费| 国内精品免费视频精选在线观看| 亚洲国产成人精品91久久久 | 国产产在线精品亚洲AAVV| 久久久久亚洲精品无码网址色欲 | 国产成人亚洲精品蜜芽影院| 少妇人妻偷人精品无码AV| 亚洲宅男精品一区在线观看| 精品人人妻人人澡人人爽人人| 久久精品亚洲综合专区| 精品999久久久久久中文字幕| 91精品国产高清91久久久久久| 国产日韩精品无码区免费专区国产| 亚洲国产精品13p| 国产成人精品怡红院在线观看| 亚洲第一区精品日韩在线播放| chinese精品男同志浪小辉| 国产精品日韩专区| 日韩国产精品99久久久久久| 日韩精品区一区二区三VR| 中美日韩在线网免费毛片视频| 国产成人久久精品| 国产真实乱子伦精品| 国产精品日韩专区| 国产日产精品_国产精品毛片| 国产精品第44页| 国产精品91在线播放| 八区精品色欲人妻综合网| 国产日韩一区二区三免费高清| 永久免费无码日韩视频| 日韩综合在线观看| 日韩视频中文字幕| 人妻少妇精品视频专区| 国产福利精品视频自拍 | 四虎国产精品永久在线网址| 四虎一影院区永久精品| 亚洲精品色午夜无码专区日韩| 日韩免费人妻AV无码专区蜜桃|