站內搜索 | 手機版

智快網 - 新科技與新能源行業網絡媒體

當前位置：智快網 > 科技 > 正文內容

GPT-4.1編程能力飛躍，谷歌Gemini系列仍領跑AI性能榜？

發布時間：2025-04-16 09:11 來源：ITBEAR 作者：沈瑾瑜

近期，科技領域迎來了一波新的模型發布高潮，其中OpenAI推出的GPT-4.1系列模型尤為引人注目。據bleepingcomputer報道，這一最新版本相較于其前身GPT-4o，在性能上實現了顯著飛躍。

OpenAI于4月15日正式揭曉了GPT-4.1、GPT-4.1 mini及GPT-4.1 nano三款新模型。從官方公布的跑分數據來看，這些新模型在編程能力上有了質的飛躍，遠遠超越了GPT-4o及其小型版本GPT-4o mini。以SWE-bench Verified跑分為例，GPT-4o僅獲得了21.4%的分數，而GPT-4.1則一舉躍升至54.6%，展現出了強大的編程實力。

然而，盡管GPT-4.1系列模型在性能上取得了顯著提升，但在與谷歌Gemini系列的對比中，卻并未能占據上風。根據Stagehand發布的基準數據，Gemini 2.0 Flash在錯誤率和精確匹配率上均表現優異，錯誤率僅為6.67%，精確匹配率高達90%，且價格更為親民，速度更快。相比之下，GPT-4.1的錯誤率則高達16.67%，成本更是Gemini 2.0 Flash的十倍以上。

來自哈佛大學的RNA科學家Pierre Bongrand也提供了相關數據，進一步印證了GPT-4.1在性價比方面的不足。他指出，相較于Gemini 2.0 Flash、Gemini 2.5 Pro及DeepSeek等競品，GPT-4.1的性價比并不具備優勢。

在編碼專項測試中，GPT-4.1的表現同樣未能讓人眼前一亮。Aider Polyglot的測試結果顯示，GPT-4.1的編碼得分僅為52%，而谷歌的Gemini 2.5則以73%的得分遙遙領先，進一步凸顯了GPT-4.1在編碼能力上的不足。

值得注意的是，盡管GPT-4.1被歸類為非推理模型，但其在編碼能力方面依然處于行業領先地位。這一成績無疑為OpenAI的AI研發實力提供了有力證明，同時也為未來的AI模型發展提供了更多可能性。

然而，在與谷歌Gemini系列的對比中，GPT-4.1也暴露出了自身在性價比和錯誤率方面的不足。這提醒我們，在AI技術的快速發展中，仍需不斷追求性能與成本的平衡，以更好地滿足實際應用需求。

更多>同類內容

華碩2025款TUF Gaming A14游戲本登場：14英寸配RTX 5060，性能再升級

04-16

我國地月空間探索迎新突破：成功構建國際首個三星星座！

04-16

楊維廉逝世：他讓“嫦娥一號”多飛了一年

04-16

C919翱翔藍天！南航國產大飛機正式加盟武廣快線

04-16

一加 Nord CE5 渲染圖曝光：垂直雙攝設計，硬朗外觀引關注

04-16

杰發科技發布車規級多核MCU芯片AC7870，加速汽車智能化布局

04-15

影馳全新RTX 5060/Ti顯卡系列發布，金屬大師、刃、FIRE三大系列亮相

04-15

極氪攜高德首發沉浸式全域車道級導航，地圖導航迎來“游戲級”變革！

04-15

嵐圖汽車CEO揭秘：智控云測技術如何為整車性能保駕護航？

04-15

2025款小鵬X9 MPV上市，35.98萬起售，智能配置全面升級！

04-15

極氪007 GT冰上漂移創紀錄，純電品牌吉尼斯新王者誕生！

04-15

博通重啟VMware ESXi免費版，自帶永久許可證，入門虛擬化零門檻！

04-15

上海地鐵全線邁入5G時代！實測網絡峰值超千兆，乘車體驗再升級

04-15

聯發科天璣開發工具集：手游開發新利器，能否重塑安卓游戲生態？

04-15

愛暢K歌音箱引領智能娛樂新風尚，攜手寧夏移動鐵通共創未來

04-15

點擊查看更多 +

全站最新

華碩2025款TUF Gaming A14游戲本登場：14英寸配RTX 5060，性能再升級

華碩2025款TUF Gaming A14游戲本登場：14英寸配RTX 5060，性能再升級

馬斯克再立FLAG：特斯拉2025年能否真·完全自動駕駛？

馬斯克再立FLAG：特斯拉2025年能否真·完全自動駕駛？

Fedora Linux 42穩定版來襲！搭載Linux 6.14內核與GNOME 48桌面環境

Fedora Linux 42穩定版來襲！搭載Linux 6.14內核與GNOME 48桌面環境

英特爾推動筆記本模塊化革新：維修升級將迎大變革？

英特爾推動筆記本模塊化革新：維修升級將迎大變革？

驍龍8 Elite 2曝光：CPU頻率飆升至4.4GHz，小米16或將首發搭載

驍龍8 Elite 2曝光：CPU頻率飆升至4.4GHz，小米16或將首發搭載

榮耀GT Pro性能旗艦來襲，4月23日見證最強性能手機誕生！

榮耀GT Pro性能旗艦來襲，4月23日見證最強性能手機誕生！

折疊屏iPhone來襲！蘋果屏下攝像頭技術內測，真全面屏時代要來了？

折疊屏iPhone來襲！蘋果屏下攝像頭技術內測，真全面屏時代要來了？

老用戶的“難題” 零跑汽車的“解題”

老用戶的“難題” 零跑汽車的“解題”

熱門內容

本欄最新

GPT-4.1編程能力飛躍，谷歌Gemini系列仍領跑AI性能榜？

GPT-4.1編程能力飛躍，谷歌Gemini系列仍領跑AI性能榜？

華碩2025款TUF Gaming A14游戲本登場：14英寸配RTX 5060，性能再升級

華碩2025款TUF Gaming A14游戲本登場：14英寸配RTX 5060，性能再升級

我國地月空間探索迎新突破：成功構建國際首個三星星座！

我國地月空間探索迎新突破：成功構建國際首個三星星座！

楊維廉逝世：他讓“嫦娥一號”多飛了一年

楊維廉逝世：他讓“嫦娥一號”多飛了一年

C919翱翔藍天！南航國產大飛機正式加盟武廣快線

C919翱翔藍天！南航國產大飛機正式加盟武廣快線

一加 Nord CE5 渲染圖曝光：垂直雙攝設計，硬朗外觀引關注

一加 Nord CE5 渲染圖曝光：垂直雙攝設計，硬朗外觀引關注

杰發科技發布車規級多核MCU芯片AC7870，加速汽車智能化布局

杰發科技發布車規級多核MCU芯片AC7870，加速汽車智能化布局

影馳全新RTX 5060/Ti顯卡系列發布，金屬大師、刃、FIRE三大系列亮相

影馳全新RTX 5060/Ti顯卡系列發布，金屬大師、刃、FIRE三大系列亮相

智快實驗室評測約稿合作微信：netspread（注明:智快科技）簡體繁體根據客戶端智慧切換，如顯示有問題，請點擊頁面右上角的簡繁切換功能！
Copyright ? 2016-2021 zhikuai.com All rights reserved. 魯ICP備20033456號

微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

精品一区高潮喷吹在线播放| 国产国拍亚洲精品mv在线观看| 国产精品免费一级在线观看| 国内精品久久国产| 亚洲精品午夜视频| 99ri精品国产亚洲| 日韩精品专区AV无码| 久久精品国产亚洲AV果冻传媒| 精品一区二区久久久久久久网站| 中文字幕久久精品| 国内精品视频九九九九| 国产亚洲午夜高清国产拍精品| 久久精品国产亚洲Aⅴ香蕉| 精品国产午夜福利在线观看 | 国产精品伊人久久伊人电影 | 午夜精品久久久久| 无码精品A∨在线观看免费| 亚洲成a人片在线观看精品| 精品国产一区二区三区久久久狼| 精品欧洲AV无码一区二区男男| 麻豆国产精品免费视频| 95在线观看精品视频| 国产精品自在线| 久久水蜜桃亚洲AV无码精品| 国产精品美女午夜爽爽爽免费| 国语自产偷拍精品视频偷| 校园春色国产精品| 国产91精品久久久久999| 亚洲日韩人妻第一页| 日韩中文字幕在线播放| 全国精品一区二区在线观看| 九九热视频精品在线| www.精品在线| 三上悠亚国产精品一区| 亚洲日韩一页精品发布| 亚洲av永久无码精品古装片| 99精品视频在线在线视频观看| 91国语精品自产拍在线观看一| 亚洲国产精品综合久久20| 无码日韩精品一区二区免费| 国产自产拍精品视频免费看|