智快網 - 新科技與新能源行業網絡媒體

          Kimi視覺思考模型k1上線,拍照解題還能展示完整思考鏈

             發布時間:2024-12-16 10:22 作者:任飛揚

          近日,月之暗面科技公司正式推出了其最新研發的視覺思考模型k1,這一創新成果基于先進的強化學習技術,旨在實現端到端的圖像理解和思維鏈技術的原生支持,并將應用范圍拓展至數學以外的多個基礎科學領域。

          據月之暗面官方透露,k1模型在基礎科學學科的基準測試中表現出色,其性能已經超越了OpenAI的o1、GPT-4o以及Claude 3.5 Sonnet等業界知名模型。這一成就標志著k1模型在理解和解答科學問題上的能力邁上了一個新臺階。

          k1視覺思考模型一經發布即上線,用戶可以在最新版“Kimi智能助手”的Android和iPhone手機App以及網頁版kimi.com上體驗到這一新功能。用戶只需在App或網頁版中找到“Kimi視覺思考版”,即可通過拍照或上傳圖片進行體驗。該模型不僅能夠給出答題結果,還能完整展示推理思維鏈CoT,讓用戶清晰看到模型思索答案的全過程。

          從模型訓練的角度來看,k1視覺思考模型的訓練過程經過了兩個階段的精心打磨。首先,通過預訓練得到基礎模型,然后在基礎模型上進行強化學習后訓練。在基礎模型階段,k1特別優化了字符識別能力,在OCRBench上取得了903分的優異成績。同時,在MathVista-testmini、MMMU-val和DocVQA等基準測試集上,k1也分別獲得了69.1、66.7和96.9的高分。

          月之暗面在k1的強化學習后訓練階段也進行了諸多優化,特別是在數據質量和學習效率方面取得了顯著進步。同時,公司在強化學習的規模化上實現了新的突破,為k1模型的高性能表現奠定了堅實基礎。

          在科學模型能力基準測試方案方面,月之暗面也面臨著行業內的重要挑戰。由于市場上缺乏針對基礎科學學科的圖形測試集,Kimi模型研發團隊自主構建了一個標準化的測試集Science Vista。該測試集涵蓋了不同難度的數理化圖片題目,且與實際用戶需求較為匹配。月之暗面表示,該測試集將開放給全行業使用,以推動基礎科學領域大模型技術的發展。

          然而,在內部測試中,月之暗面也發現了k1視覺思考模型存在的一些局限性。例如,在分布外問題的泛化能力、復雜問題的成功率、噪聲場景的準確率以及多輪問答效果等方面,k1仍有較大的提升空間。與OpenAI的o1系列模型相比,k1在某些場景和泛化能力上仍存在一定差距。月之暗面表示,將繼續努力優化模型性能,為用戶提供更加高效、準確的視覺思考服務。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          国产大片51精品免费观看| 国产成人精品午夜福利在线播放 | 亚洲Av永久无码精品一区二区| 国产亚洲精品AA片在线观看不加载| 国产精品高清在线观看93| 99精品热这里只有精品| 精品国产福利久久久| 亚洲av日韩av永久在线观看| 精品久久中文网址| 精品日韩亚洲AV无码一区二区三区 | 亚洲AV日韩精品久久久久| MM1313亚洲国产精品| 亚洲午夜精品一区二区麻豆| 无码精品人妻一区二区三区漫画 | 91一区二区在线观看精品| 久久久久国产日韩精品网站| 亚洲精品成人在线| 国产伦精品一区二区三区免费迷| 在线日产精品一区| 亚洲国产日产无码精品| 久久精品国产亚洲AV香蕉| 在线观看国产精品普通话对白精品| 日韩一区二区在线播放| 一本大道无码日韩精品影视| 女人国产香蕉久久精品| 日本加勒比在线精品视频| 精品久久无码中文字幕| 亚洲国产精品久久久久秋霞影院| 中文字幕乱码中文乱码51精品| 日韩精品一二三四区| 日韩一级免费视频| 日韩国产成人资源精品视频| 日韩爽爽视频爽爽| 精品国偷自产在线不卡短视频| 国产精品va无码二区| 国产在线观看精品香蕉v区| 国产在线91区精品| 日韩精品人妻一区二区中文八零| 成人精品一区二区激情| 日韩精品福利视频一区二区三区| 午夜精品久久久久久影视riav|