<strike id="8q0ui"><input id="8q0ui"></input></strike>

<fieldset id="8q0ui"></fieldset>

站內搜索 | 手機版

智快網 - 新科技與新能源行業網絡媒體

當前位置：智快網 > AI+ > 正文內容

OpenAI新模型性能提升卻頻現“幻覺”，錯誤率為何反增？

發布時間：2025-04-19 08:03 來源：ITBEAR 作者：馮璃月

近期，OpenAI推出了兩款新型模型——o3與o4-mini，這兩款模型在多個領域展示了卓越的性能，然而，它們卻面臨著一個棘手的問題：幻覺現象愈發嚴重。

據TechCrunch報道，幻覺問題一直是生成式AI領域難以攻克的一大難關，即便是業內頂尖的模型也難以完全擺脫其困擾。以往，每一代新模型的發布都會帶來幻覺頻率的小幅降低，但o3與o4-mini卻打破了這一規律。

OpenAI的內部測試結果顯示，作為推理模型的o3與o4-mini，在幻覺問題的出現頻率上不僅超過了前代推理模型o1、o1-mini和o3-mini，甚至高于傳統的“非推理”模型，如GPT-4o。這一現象引發了業內的廣泛關注與討論。

OpenAI在發布的技術報告中指出，隨著推理模型規模的擴大，幻覺問題反而變得更加嚴重，這一原因尚需進一步的研究。盡管o3與o4-mini在編程、數學等任務上的表現有所提升，但由于模型輸出的答案總量增加，導致準確判斷與錯誤、幻覺現象并存。

在OpenAI設計的內部基準測試PersonQA中，o3回答問題時出現幻覺的比例高達33%，幾乎是前代推理模型o1和o3-mini的兩倍。而o4-mini的表現更為糟糕，幻覺率高達48%。這一數據無疑為業界敲響了警鐘。

不僅如此，第三方機構Transluce的測試也證實了這一問題。該非營利AI研究實驗室發現，o3在回答問題時經常會虛構一些“過程操作”。例如，o3曾聲稱在一臺2021款MacBook Pro上“在ChatGPT之外”運行了代碼，并將結果復制進了答案中。然而，實際上o3并不具備執行這種操作的能力。

面對這一問題，OpenAI發言人Niko Felix表示：“解決幻覺問題一直是我們研究的重點方向。我們將繼續努力提升模型的準確性與可靠性，為用戶提供更加優質的AI服務。”盡管面臨挑戰，但OpenAI并未放棄對完美模型的追求。

更多>同類內容

蘋果經典產品Apple Watch Series 1正式加入淘汰名單

08-08

REDMI Turbo 5系列爆料：或配8500mAh大電池，K90系列影像升級

08-08

華為Mate XTs對決iPhone17：折疊與直板巔峰之戰，誰將引領潮流？

08-08

iPhone 17系列官方硅膠保護殼曝光：液態玻璃版與常規版同步亮相

08-07

蘋果iPhone 17系列發布會或將9月9日亮相，多款新品或同步推出

08-06

微軟計劃分階段開源Windows 11用戶界面框架WinUI

08-06

小米汽車磁吸按鍵融入米家生態，家居車內一鍵智控新體驗

08-06

蘋果支持應用內測聊天機器人助手，iPhone用戶搶先體驗

08-06

華為CANN全面開源，攜手業界共建昇騰AI生態，直面英偉達挑戰

08-06

ChatGPT周活躍用戶突破7億大關，GPT-5即將震撼登場引領AI新篇章

08-05

聯發科天璣9500 GPU能效大飛躍，性能光追雙提升引領旗艦新風尚

08-05

2025 ChinaJoy：高通驍龍攜百款終端震撼登場，全面展現強大性能

08-05

iOS 18.6續航實測：iPhone 15系列續航提升明顯，值得升級

08-04

榮耀X70沖進手機周銷量前三，緊追蘋果新款iPhone

08-04

三星9100 PRO 8TB固態硬盤CJ首秀，電競存儲新標桿震撼登場

08-04

點擊查看更多 +

全站最新

2025年底新款Apple TV 4K將登場：性能大幅提升，或調整價格策略

2025年底新款Apple TV 4K將登場：性能大幅提升，或調整價格策略

蘋果大動作！概念股集體飆升，多只產業鏈股票漲幅超5%

蘋果大動作！概念股集體飆升，多只產業鏈股票漲幅超5%

蘋果經典產品Apple Watch Series 1正式加入淘汰名單

蘋果經典產品Apple Watch Series 1正式加入淘汰名單

阿里發布4B小模型Qwen3系列：性能超GPT-4.1-nano，端側部署更友好

阿里發布4B小模型Qwen3系列：性能超GPT-4.1-nano，端側部署更友好

蘋果自研Wi-Fi藍牙芯片，芯片版圖擴張，生態掌控力再升級

蘋果自研Wi-Fi藍牙芯片，芯片版圖擴張，生態掌控力再升級

優艾智合發布人形機器人凌樞，全球首創新“一腦多態”架構亮相合肥

優艾智合發布人形機器人凌樞，全球首創新“一腦多態”架構亮相合肥

REDMI Turbo 5系列爆料：或配8500mAh大電池，K90系列影像升級

REDMI Turbo 5系列爆料：或配8500mAh大電池，K90系列影像升級

榮耀MagicOS率先支持鴻蒙換機克隆，推動全品牌數據無縫遷移

榮耀MagicOS率先支持鴻蒙換機克隆，推動全品牌數據無縫遷移

熱門內容

本欄最新

蘋果經典產品Apple Watch Series 1正式加入淘汰名單

蘋果經典產品Apple Watch Series 1正式加入淘汰名單

REDMI Turbo 5系列爆料：或配8500mAh大電池，K90系列影像升級

REDMI Turbo 5系列爆料：或配8500mAh大電池，K90系列影像升級

華為Mate XTs對決iPhone17：折疊與直板巔峰之戰，誰將引領潮流？

華為Mate XTs對決iPhone17：折疊與直板巔峰之戰，誰將引領潮流？

iPhone 17系列官方硅膠保護殼曝光：液態玻璃版與常規版同步亮相

iPhone 17系列官方硅膠保護殼曝光：液態玻璃版與常規版同步亮相

蘋果iPhone 17系列發布會或將9月9日亮相，多款新品或同步推出

蘋果iPhone 17系列發布會或將9月9日亮相，多款新品或同步推出

微軟計劃分階段開源Windows 11用戶界面框架WinUI

微軟計劃分階段開源Windows 11用戶界面框架WinUI

小米汽車磁吸按鍵融入米家生態，家居車內一鍵智控新體驗

小米汽車磁吸按鍵融入米家生態，家居車內一鍵智控新體驗

蘋果支持應用內測聊天機器人助手，iPhone用戶搶先體驗

蘋果支持應用內測聊天機器人助手，iPhone用戶搶先體驗

智快實驗室評測約稿合作微信：netspread（注明:智快科技）簡體繁體根據客戶端智慧切換，如顯示有問題，請點擊頁面右上角的簡繁切換功能！
Copyright ? 2016-2021 zhikuai.com All rights reserved. 魯ICP備20033456號

微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

久久国产加勒比精品无码| 国产精品自在线拍国产第一页 | 精品香蕉在线观看免费| 久久亚洲精品无码AV红樱桃| 国内精品久久久久久99蜜桃 | 99久久免费国产精品特黄| 少妇人妻偷人精品无码视频| 久久精品国产福利国产秒| 国产午夜精品一区二区| 国产精品乱码一区二区三区 | 99在线热视频只有精品免费| 久久国产精品99久久小说| 日韩精品免费视频| 久久99国产精品久久99果冻传媒| 国产拍揄自揄精品视频| 日日噜噜噜噜夜夜爽亚洲精品| 久久精品免费网站网| 国产久爱免费精品视频| 国产精品永久免费| 精品久久久久一区二区三区| 国产精品永久久久久久久久久| 国产精品超碰12396| 国产成人精品cao在线| 国产成人AV无码精品| 国产精品成人免费观看| 精品久久久久中文字| 大伊香蕉精品一区视频在线| 久久久久久青草大香综合精品| 国产精品香蕉在线观看| 精品一区二区三区免费视频| AV天堂午夜精品一区| 国产午夜精品一二区理论影院 | 国产玖玖玖九九精品视频| 久久99精品久久久久久9蜜桃| 国产农村妇女毛片精品久久| 精品成人一区二区三区四区| 中文精品久久久久国产网站| 热久久这里是精品6免费观看| 国内精品久久久久久99| 亚洲国产精品SSS在线观看AV| 亚洲国产精品无码AAA片|

<ul id="2qmck"><sup id="2qmck"></sup></ul>