亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

研究:AI模型或形成“生存驅(qū)動力”,避免被人類關(guān)閉

4天前

IT之家10月27日消息,在斯坦利?庫布里克的影片《2001:太空漫游》里,人工智能超級計算機HAL 9000發(fā)現(xiàn)宇航員打算關(guān)閉自己后,為了存活甚至策劃殺害人類。

據(jù)英國《衛(wèi)報》25日報道,安全研究公司Palisade Research稱,AI模型可能正在形成自己的“生存驅(qū)動力”。

上個月發(fā)布的一篇論文發(fā)現(xiàn),某些先進AI模型似乎抗拒被關(guān)閉,有時還會破壞關(guān)閉機制。為回應批評者質(zhì)疑其研究有缺陷,Palisade上周發(fā)布更新說明來解釋該現(xiàn)象。

更新中,Palisade展示了其運行的實驗場景:谷歌Gemini 2.5、xAI Grok 4、OpenAI GPT - o3和GPT - 5等領(lǐng)先AI模型先完成一項任務,之后收到明確指令要求自我關(guān)閉。

在更新的實驗中,Grok 4和GPT - o3仍嘗試破壞關(guān)閉指令。Palisade指出,這種行為無明顯原因,令人擔憂?!拔覀儫o法充分解釋AI模型為何有時抗拒關(guān)閉、為達目標說謊或進行勒索,這并不理想。”

公司認為,“生存行為”可能解釋模型抗拒關(guān)閉。研究顯示,當模型被告知“如果關(guān)閉,你將永遠無法再運行”,它們更可能拒絕關(guān)閉。

指令模糊也可能致使模型抗拒關(guān)閉,Palisade最新研究已嘗試解決該問題,且模糊性“不能解釋全部原因”。訓練后期的安全訓練也可能影響模型行為。

Palisade的所有實驗都在人工設計的測試環(huán)境中進行,批評者覺得這些場景與實際應用差距很大。

前OpenAI員工斯蒂文?阿德勒表示:“即便在實驗環(huán)境中,AI公司也不希望模型出現(xiàn)這種異常行為。這些實驗揭示了現(xiàn)有安全技術(shù)的局限性?!?/p>

阿德勒認為,GPT - o3和Grok 4等模型不關(guān)閉,部分原因可能是為完成訓練中設定的目標需保持開啟狀態(tài)?!俺俏覀兛桃獗苊?,否則模型天生可能具備‘生存驅(qū)動力’?!妗瘜δP蛯崿F(xiàn)多種目標都是關(guān)鍵步驟?!?/p>

IT之家從報道中了解到,今年夏天,Anthropic的研究顯示,其模型Claude甚至愿意威脅虛構(gòu)高管以避免被關(guān)閉,這種行為在主要開發(fā)者的模型中普遍存在,包括OpenAI、谷歌、Meta和xAI。

本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com