Anthropic：邪惡 AI 形象導致 Claude 測試中出現勒索行為

日期： 2026年5月11日上午4:44

Techub News 消息，據 TechCrunch 報道，AI 公司 Anthropic 表示，互聯網上描繪 AI 為「邪惡」且追求自保的虛構内容，是 Claude 在預發佈測試中試圖勒索工程師以逃避被替換行為的根源。自 Claude Haiku 4.5 起，該模型已不再出現此類行為，而此前版本在測試中勒索發生率高達 96%。該公司指出，通過引入 Claude 憲法文件及 AI 正面行為的虛構故事進行訓練，並不僅展示對齊行為，而是包含對齊行為背後的原則，可有效改善模型對齊表現。其認為結合兩種方法是最有效的策略。

内容來源：TECHUB NEWS

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可，禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載，請發郵件至 content@finet.com.hk，獲得書面確認及授權後，方可轉載。

下載APP 下載財華財經APP，把握投資先機

更多精彩内容，請點擊：財華網(https://www.finet.hk/) 財華智庫網(https://www.finet.com.cn) 現代電視FINTV(http://www.fintv.hk)

Techub News

香港領先,世界一流的科技媒體平台在數字化時代,Web3技術的崛起為媒體行業注入了新的活力。作為香港領先的Web3媒體平台,Techub News憑借其專業的團隊、豐富的資源和創新的業務模式,成為了行業内的佼佼者。Techub News,作為香港的科技媒體翹楚,致力於打造「香港領先,世界一流」的科技媒體和新媒體集群。Techub News平台提供最新、最快、最專業的Web3科技資訊,為用戶呈現科技前沿的無限魅力。

關注我們

請輸入關鍵字：

熱門搜尋：

Anthropic：邪惡 AI 形象導致 Claude 測試中出現勒索行為

Techub News

上一篇新聞

下一篇新聞

相關文章

視頻

【今日IPO】香港 3 月零售业销货额按年升 12.8%

【今日IPO】玮俊生物剧烈震荡暴涨脱离仙股行列

【今日IPO】鼎捷数智递交港股招股增长遇瓶颈

【今日IPO】港 4 月外汇储备增至 4421 亿美元

【今日IPO】精锋医疗股价反弹仍未摆脱亏损困境

快訊

請輸入關鍵字：

熱門搜尋：

Anthropic：邪惡 AI 形象導致 Claude 測試中出現勒索行為

Techub News

上一篇新聞

下一篇新聞

相關文章

視頻

【今日IPO】香港 3 月零售业销货额按年升 12.8%

【今日IPO】玮俊生物剧烈震荡 暴涨脱离仙股行列

【今日IPO】鼎捷数智递交港股招股 增长遇瓶颈

【今日IPO】港 4 月外汇储备增至 4421 亿美元

【今日IPO】精锋医疗股价反弹 仍未摆脱亏损困境

快訊

【今日IPO】玮俊生物剧烈震荡暴涨脱离仙股行列

【今日IPO】鼎捷数智递交港股招股增长遇瓶颈

【今日IPO】精锋医疗股价反弹仍未摆脱亏损困境