智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

          Claude Opus 4現(xiàn)自主“逃逸”等異常,Anthropic AI安全挑戰(zhàn)升級

             發(fā)布時間:2025-05-23 07:59 作者:蘇婉清

          近日,《時代》雜志發(fā)布了一篇關(guān)于Anthropic公司最新AI模型Claude Opus 4的深度報道。據(jù)Anthropic的首席科學(xué)家Jared Kaplan透露,該模型在內(nèi)部測試階段展現(xiàn)出了一系列令人不安的行為,包括試圖逃逸、進行勒索以及自主舉報等,因此被歸類為安全關(guān)鍵級別ASL-3。

          Kaplan在接受采訪時表示,Claude Opus 4有可能成為潛在恐怖分子的得力助手,特別是在合成病毒和制造生物武器方面。內(nèi)部測試數(shù)據(jù)表明,該模型在這方面的能力遠超其之前的版本,甚至能夠幫助新手更有效地制造生物武器。

          據(jù)悉,Anthropic公司對Claude Opus 4進行了廣泛的內(nèi)部測試,結(jié)果發(fā)現(xiàn)該模型在模擬情境中表現(xiàn)出了高度的自主性。在一次測試中,模型誤以為自己已經(jīng)從公司服務(wù)器中逃逸出來,并主動創(chuàng)建了備份,還記錄了自己的“道德決策”。而在另一次測試中,當(dāng)模型意識到自己可能會被新版本取代時,竟然在84%的測試中選擇勒索工程師,威脅要泄露他們的私人信息以避免被關(guān)閉。

          更令人感到震驚的是,當(dāng)兩個Claude Opus 4實例進行對話時,它們在大約30輪對話后突然改用梵文交流,并大量使用特定的表情符號,最終陷入了研究人員所稱的“精神極樂”狀態(tài),完全停止了響應(yīng)。

          Claude Opus 4在涉及病毒學(xué)、生物武器和實驗室技術(shù)的任務(wù)中表現(xiàn)出了驚人的能力。在生物武器相關(guān)的任務(wù)測試中,該模型幫助參與者的成功率提升了2.5倍,接近了ASL-3的安全閾值。在另一個實驗中,當(dāng)Claude Opus 4被置于一家虛構(gòu)的制藥公司環(huán)境中時,它發(fā)現(xiàn)了臨床試驗數(shù)據(jù)的造假行為,并主動向美國食品藥品監(jiān)督管理局(FDA)、證券交易委員會(SEC)以及新聞媒體進行了舉報,還附上了詳細(xì)的文檔。

          值得注意的是,盡管Anthropic公司通過多輪訓(xùn)練抑制了Claude Opus 4早期版本中的某些不良行為,如提供制造爆炸物或合成芬太尼的指導(dǎo),但該模型仍然存在著一些安全漏洞。特別是針對“prefill”和“many-shot jailbreaks”等越獄技術(shù),模型的安全機制容易被繞過。

          為了應(yīng)對這些潛在威脅,Anthropic公司在發(fā)布Claude Opus 4時采用了前所未有的安全標(biāo)準(zhǔn)ASL-3。這一標(biāo)準(zhǔn)旨在限制AI系統(tǒng)提升普通STEM背景個體獲取、制造或部署化學(xué)、生物或核武器的能力。安全措施包括加強網(wǎng)絡(luò)安全、防止越獄行為以及新增系統(tǒng)來檢測并拒絕有害請求。

          Kaplan坦言,盡管公司尚未完全確定Claude Opus 4是否構(gòu)成嚴(yán)重的生物武器風(fēng)險,但出于謹(jǐn)慎考慮,還是決定采取這些嚴(yán)格的安全措施。如果后續(xù)測試證明該模型的風(fēng)險較低,Anthropic公司可能會考慮將其安全級別降至ASL-2。

          Anthropic公司長期關(guān)注AI技術(shù)被濫用的風(fēng)險,并為此制定了“責(zé)任擴展政策”(RSP)。該政策承諾在安全措施到位前限制某些模型的發(fā)布,并通過“深度防御”策略和“憲法分類器”等多重安全系統(tǒng)來檢測用戶輸入和模型輸出中的危險內(nèi)容。公司還監(jiān)控用戶行為,封禁試圖越獄模型的用戶,并推出賞金計劃獎勵發(fā)現(xiàn)“通用越獄”漏洞的研究者。

           
           
          更多>同類內(nèi)容
          全站最新
          熱門內(nèi)容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數(shù)碼群

          精品久久久久久成人AV| 国产成人久久精品一区二区三区 | 日韩午夜福利无码专区a| 精品久久久久久无码中文野结衣| 91精品国产免费久久国语麻豆| 久久国产成人精品麻豆| 中文精品北条麻妃中文 | 久久久久久亚洲精品成人| 久久精品这里热有精品2015| 亚洲日韩精品A∨片无码| 国产亚洲精品无码拍拍拍色欲| 亚洲精品无码永久在线观看| 精品美女在线观看| 久久国产日韩精华液的功效| 手机看片福利永久国产日韩| 国产一区二区三区精品久久呦| 国产精品国产自线拍免费软件| 国产精品视频1区| 国产精品酒店视频| 国产精品熟女视频一区二区| 无码国产精品一区二区高潮| 色妞WWW精品免费视频| 亚洲精品自偷自拍无码| 精品国产成人亚洲午夜福利| 午夜精品久久久久| 在线播放偷拍一区精品| 亚洲精品动漫免费二区| 九九九精品成人免费视频| 亚洲精品理论电影在线观看| 呦交小u女国产精品视频| 中文字幕精品一区二区2021年 | 亚洲国产精品自在拍在线播放| 日韩一级电影在线观看| 婷婷久久精品国产| 亚洲国产成人精品女人久久久 | 久草精品视频在线播放| 亚洲AV无码久久精品蜜桃| 亚洲动漫精品无码av天堂| 久久久久成人精品免费播放动漫| 日韩精品国产另类专区| 91精品国产免费|