智快網 - 新科技與新能源行業網絡媒體

          阿里云QwQ-32B大模型:萌名之下,能否與DeepSeek-R1一較高下?

             發布時間:2025-03-06 20:59 作者:馮璃月

          近日,阿里云旗下的通義千問團隊正式揭曉了其最新的技術成果——QwQ-32B推理模型。這款模型配備了驚人的320億參數,卻在性能上展現出了與擁有6710億參數(活躍參數370億)的DeepSeek-R1模型相媲美的實力。

          QwQ-32B模型現已在Hugging Face和ModelScope兩大平臺上開源,并遵循Apache 2.0開源協議,這標志著阿里云在推動AI技術開放共享方面邁出了重要一步。

          用戶可以通過Qwen Chat或通義平臺,親身體驗QwQ-32B的強大功能。在Qwen Chat中,用戶只需選擇Qwen2.5-Plus并開啟QwQ深度思考模式,即可感受其卓越的推理能力。同樣,在通義App或網頁端,用戶也能輕松選擇Qwen-QwQ-32B智能體進行互動。

          盡管QwQ的名字聽起來有些俏皮可愛,但其性能卻不容小覷。阿里云對QwQ-32B進行了全面的性能測試,包括數學推理、編程能力和通用能力等多個方面。測試結果顯示,QwQ-32B在數學能力評測集AIME24和代碼能力評估平臺LiveCodeBench上的表現,與DeepSeek-R1相當,甚至在某些方面超越了后者。同時,在與o1-mini及相同尺寸的R1蒸餾模型的對比中,QwQ-32B也展現出了明顯的優勢。

          在由meta首席科學家楊立昆領銜的“最難LLMs評測榜”LiveBench、谷歌提出的指令遵循能力IFeval評測集以及加州大學伯克利分校等提出的BFCL測試中,QwQ-32B的得分均超過了DeepSeek-R1,進一步證明了其強大的推理能力。

          阿里云表示,QwQ-32B的推出是其在大規模強化學習(RL)以增強推理能力方面的初步嘗試。通過這一嘗試,阿里云不僅看到了擴展RL的巨大潛力,還發現了預訓練語言模型中尚未充分發掘的可能性。未來,阿里云將繼續致力于開發下一代Qwen模型,計劃將更強大的基礎模型與依托規模化計算資源的RL相結合,以推動人工智能向人工通用智能(AGI)的邁進。

          阿里云還在積極探索將智能體與RL集成的可能性,以實現長時推理。這一目標的實現,將有助于通過推理時間的擴展來釋放更高的智能水平,為人工智能的發展注入新的活力。

          除了QwQ-32B外,阿里云通義千問團隊還擁有其他強大的模型,如QvQ等,它們共同構成了阿里云在AI領域的強大陣容。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          久久精品国产日本波多野结衣| 亚洲av无码国产精品色午夜字幕 | 日韩毛片人妻久久蜜桃传媒| 精品人人妻人人澡人人爽牛牛| 国产精品合集一区二区三区| 久久久精品人妻一区二区三区蜜桃 | 国内揄拍国内精品少妇国语| 国产精品白嫩在线观看| 国产私拍福利精品视频推出 | 国产精品久久香蕉免费播放| 国产精品无码久久四虎| 日韩免费精品视频| 精品日产卡一卡二卡麻豆| 91免费福利精品国产| 人人妻人人澡人人爽人人精品电影| 国产成人精品一区二区秒拍| 精品精品国产自在久久高清| 99精品无人区乱码1区2区3区| 国产综合色产在线精品| 9久热精品免费观看视频| 久久er国产精品免费观看8| 国产精品永久久久久久久久久 | 国产精品久久女同磨豆腐| 亚洲国产成人精品电影| 91精品国产91久久| 精品日产卡一卡二卡国色天香| 国产91精品一区二区麻豆网站| 久久精品卫校国产小美女| 精品国产乱码久久久久软件| 精品国产鲁一鲁一区二区| 国产精品视频免费观看| 国产精品爽爽va在线观看网站| 91国内揄拍国内精品对白不卡| 久久香蕉国产线看精品| 亚洲精品123区在线观看| 久久久这里有精品| 精品国偷自产在线视频99| 精品国产中文字幕| 国产在线精品国自产拍影院同性| 日韩高清在线二区| 国产成人综合日韩精品婷婷九月 |