請輸入關鍵字:

熱門搜尋:

Anthropic:邪惡 AI 形象導致 Claude 測試中出現勒索行為

 
日期: 2026年5月11日 上午4:44

Techub News 消息,據 TechCrunch 報道,AI 公司 Anthropic 表示,互聯網上描繪 AI 為「邪惡」且追求自保的虛構内容,是 Claude 在預發佈測試中試圖勒索工程師以逃避被替換行為的根源。自 Claude Haiku 4.5 起,該模型已不再出現此類行為,而此前版本在測試中勒索發生率高達 96%。 該公司指出,通過引入 Claude 憲法文件及 AI 正面行為的虛構故事進行訓練,並不僅展示對齊行為,而是包含對齊行為背後的原則,可有效改善模型對齊表現。其認為結合兩種方法是最有效的策略。

内容來源:TECHUB NEWS

財華網所刊載內容之知識產權為財華網及相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

如有意願轉載,請發郵件至 content@finet.com.hk,獲得書面確認及授權後,方可轉載。

下載APP 下載財華財經APP,把握投資先機
更多精彩内容,請點擊: 財華網(https://www.finet.hk/) 財華智庫網(https://www.finet.com.cn) 現代電視FINTV(http://www.fintv.hk)

Techub News

香港領先,世界一流的科技媒體平台 在數字化時代,Web3技術的崛起為媒體行業注入了新的活力。作為香港領先的Web3媒體平台,Techub News憑借其專業的團隊、豐富的資源和創新的業務模式,成為了行業内的佼佼者。Techub News,作為香港的科技媒體翹楚,致力於打造「香港領先,世界一流」的科技媒體和新媒體集群。Techub News平台提供最新、最快、最專業的Web3科技資訊,為用戶呈現科技前沿的無限魅力。

視頻

快訊

11:59
華潤置地(01109.HK)4月合同銷售金額按年增長49.6%
11:52
【大行報告】施羅德投資:主動型環球股票--值得考慮的四大原因
11:42
【大行報告】瑞銀:金價今年有望再創新高 回調至4000美元或為吸納機會
11:33
華光環能:參股子公司國聯綠科向香港聯交所遞交上市申請
11:25
香港發布「海空雙強 聯通全球:鞏固香港國際航運中心及航空樞紐地位」的《專題快訊》
11:20
香港4月中小企業務收益現時動向指數下跌至44.0
11:14
飛速創新(03355.HK)首季經調整後淨利潤達1.77億元 同比增長72.2%
11:04
易鑫集團(02858.HK)一季度融資總額達同比增長約27.9%
10:53
京東物流(02618.HK)首季非國際財務報告準則利潤同比增長40.1%
10:38
華芢生物(02396.HK)Pro-101-1治療深二度燒燙傷的IIIa期臨床試驗完成首例患者入組