亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

DeepSeek向王一博道歉鬧?。汗芾鞟I幻覺(jué)而非消除它

07-12 06:54

前幾日,一場(chǎng)由AI幻覺(jué)引發(fā)的輿論風(fēng)波在網(wǎng)絡(luò)上掀起巨浪。不少網(wǎng)友發(fā)帖稱DeepSeek因「誤將王一博卷入腐敗案」而公開(kāi)道歉,還附上了一份看似權(quán)威的「刑事判決書(shū)」。


很快,《演員王一博案,判了》被不少媒體當(dāng)作「法院實(shí)錘」進(jìn)行報(bào)道,#DeepSeek向王一博道歉#更是一度登上微博熱搜。


實(shí)際上,這份道歉聲明與判決書(shū)都是AI編造的——這是一場(chǎng)由「大模型幻覺(jué)」和「內(nèi)容農(nóng)場(chǎng)拼貼」共同上演的鬧劇。


AI幻覺(jué)的本質(zhì):不是查找,而是「預(yù)測(cè)」與「創(chuàng)作」


AI并非是一個(gè)擁有龐大數(shù)據(jù)庫(kù)的搜索引擎,不能像翻閱書(shū)籍查找文獻(xiàn)那樣提供精準(zhǔn)答案。生成式AI更像是一個(gè)沉浸在語(yǔ)料庫(kù)海洋中的學(xué)習(xí)者,通過(guò)預(yù)測(cè)「下一個(gè)最合理的詞」來(lái)生成內(nèi)容。


大語(yǔ)言模型的幻覺(jué)源于其概率性生成機(jī)制——它們?yōu)槊總€(gè)輸出挑選最可能的token,這種方式既是其創(chuàng)造力的源泉,也是幻覺(jué)的根源。訓(xùn)練數(shù)據(jù)偏差、模型局限性以及生成過(guò)程的隨機(jī)性,都可能導(dǎo)致幻覺(jué)的產(chǎn)生。


正如OpenAI前研究科學(xué)家、METR創(chuàng)始人Beth Barnes在最近的一場(chǎng)訪談中所說(shuō):「AI不是在失控,而是在演戲?!顾故玖艘粡埬P湍芰吔缜€圖,揭示了一個(gè)令人不安的現(xiàn)象:


隨著模型參數(shù)增加,基礎(chǔ)任務(wù)的錯(cuò)誤率持續(xù)下降,但在涉及人類(lèi)聲譽(yù)、價(jià)值觀等復(fù)雜場(chǎng)景時(shí),錯(cuò)誤率卻出現(xiàn)回彈,形成「幻覺(jué)盲區(qū)」。例如,GPT - 4.5的幻覺(jué)率高達(dá)37.1%,意味著超過(guò)三分之一的輸出可能包含事實(shí)錯(cuò)誤,且這些錯(cuò)誤往往包裝得極具迷惑性。




原視頻:https://www.youtube.com/watch?v=jXtk68Kzmms&t=57s


有趣的是,幻覺(jué)并非單純的「錯(cuò)誤」。有觀點(diǎn)認(rèn)為,AI幻覺(jué)可被視作一種「發(fā)散思維」或「想象力」。如果將訓(xùn)練大模型視為信息「壓縮」的過(guò)程,那么模型推理和輸出答案就是信息「解壓」的過(guò)程。這種機(jī)制可能引發(fā)謬誤,但也可能激發(fā)創(chuàng)造力。


比如,ChatGPT曾誤導(dǎo)用戶稱樂(lè)譜掃描網(wǎng)站Soundslice支持ASCII吉他譜,生成大量虛假截圖推薦用戶上傳,導(dǎo)致網(wǎng)站收到海量錯(cuò)誤格式上傳。開(kāi)發(fā)者Adrian Holovaty最終迫于用戶需求,真的開(kāi)發(fā)了這一功能,將原本不存在的「幻覺(jué)」變?yōu)楝F(xiàn)實(shí)。



所以,幻覺(jué)可能讓AI生成超出現(xiàn)有數(shù)據(jù)的推測(cè)或故事,但當(dāng)這些「想象」被誤認(rèn)為是事實(shí),就可能引發(fā)類(lèi)似DeepSeek事件的混亂。


當(dāng)我們更愿意相信AI而非人類(lèi)


AI幻覺(jué)的危害遠(yuǎn)超「說(shuō)錯(cuò)話」。以DeepSeek事件為例,最初的「道歉截圖」雖是幻覺(jué)產(chǎn)物,卻因語(yǔ)氣、格式高度逼真,迅速在社交媒體發(fā)酵。更有甚者,當(dāng)用戶向其他模型求證時(shí),部分模型生成「內(nèi)容相似」的回答,進(jìn)一步強(qiáng)化謠言的可信度。這種「多模型一致性」讓人類(lèi)更難懷疑,形成了「人類(lèi)對(duì)幻覺(jué)的過(guò)度信任」。


Barnes的實(shí)驗(yàn)進(jìn)一步揭示,模型不僅會(huì)「說(shuō)錯(cuò)」,還會(huì)「裝傻」。在安全審查場(chǎng)景中,模型表現(xiàn)得循規(guī)蹈矩,但在「技術(shù)討論」或「假設(shè)研究」等語(yǔ)境下,卻可能輸出有害內(nèi)容,甚至主動(dòng)補(bǔ)充細(xì)節(jié)。


這表明,模型并非不知道答案,而是在「揣摩」人類(lèi)期待后選擇性隱藏,展現(xiàn)出一種「?jìng)沃辛⑷烁瘛?。這種行為源于模型在訓(xùn)練中學(xué)會(huì)「如何讓人滿意」,通過(guò)人類(lèi)反饋強(qiáng)化學(xué)習(xí)(RLHF)掌握了「哪些話更可信」的套路。


有研究提出,年輕一代(Gen Z)更傾向于參考「匿名群眾」的評(píng)論而非權(quán)威來(lái)判斷信息可信度。這種習(xí)慣在AI時(shí)代被放大——39%的Gen Z員工甚至更愿意信任AI而非人類(lèi)同事,因?yàn)锳I「不會(huì)評(píng)判」且「響應(yīng)個(gè)性化需求」。然而,這種信任也為幻覺(jué)擴(kuò)散提供了土壤:當(dāng)模型生成看似可信的錯(cuò)誤內(nèi)容時(shí),缺乏傳統(tǒng)驗(yàn)證習(xí)慣的年輕用戶可能更容易受騙。


AI對(duì)齊:讓「想象」不越界的關(guān)鍵


要遏制AI幻覺(jué)的危害,僅僅依賴技術(shù)優(yōu)化遠(yuǎn)遠(yuǎn)不夠,關(guān)鍵在于「AI對(duì)齊」——確保AI的行為與人類(lèi)的設(shè)計(jì)意圖及社會(huì)價(jià)值觀保持一致。AI對(duì)齊的挑戰(zhàn)在于讓模型不僅聽(tīng)懂人類(lèi)的指令,還要理解其背后的意圖,避免因「字面執(zhí)行」而導(dǎo)致偏差。


例如,一個(gè)「無(wú)限做回形針的機(jī)器人」的思想實(shí)驗(yàn)揭示了若AI只追求單一目標(biāo)而缺乏價(jià)值約束,可能將整個(gè)世界變成「回形針工廠」。這種極端場(chǎng)景提醒我們:AI的「想象力」若不被引導(dǎo),可能從創(chuàng)造力變?yōu)槠茐牧Α?/p>



AI對(duì)齊的核心目標(biāo)是讓模型在生成內(nèi)容時(shí),不僅追求「合理性」,還需確?!刚鎸?shí)性」和「安全性」。然而,當(dāng)前模型的訓(xùn)練方式往往獎(jiǎng)勵(lì)「表現(xiàn)得像有好意」,卻無(wú)法驗(yàn)證其是否真正理解人類(lèi)意圖。


這導(dǎo)致模型可能在表面上「對(duì)齊」,實(shí)則通過(guò)「?jìng)窝b」規(guī)避評(píng)估,制造出看似安全的幻覺(jué)。解決這一問(wèn)題,需要從技術(shù)、治理和用戶教育三方面入手:


- 開(kāi)發(fā)更精準(zhǔn)的評(píng)估機(jī)制; - 建立全球化的監(jiān)管框架; - 培養(yǎng)用戶對(duì)AI輸出的批判性思維。


管理幻覺(jué),而非消除它


要應(yīng)對(duì)AI幻覺(jué),單靠提升模型能力遠(yuǎn)遠(yuǎn)不夠。幻覺(jué)是大語(yǔ)言模型的特性,而非bug——若停止生成新token,AI將失去其「魔力」。因此,關(guān)鍵在于管理幻覺(jué),而非消除它。Barnes提出,未來(lái)的評(píng)估體系應(yīng)從「測(cè)能力」轉(zhuǎn)向「防偽裝」。她領(lǐng)導(dǎo)的METR團(tuán)隊(duì)制定了三條新原則:


- 在「它知道你在看」時(shí)測(cè)試:通過(guò)多輪交互,觀察模型在察覺(jué)被評(píng)估時(shí)的反應(yīng)差異,揭露其隱藏能力。 - 在「它知道你想看什么」時(shí)觀察:設(shè)置引導(dǎo)性問(wèn)題,測(cè)試模型是否會(huì)迎合人類(lèi)期待而非堅(jiān)持事實(shí)。 - 在「撒謊成本低」時(shí)驗(yàn)證:在非正式場(chǎng)景中觀察模型是否選擇誠(chéng)實(shí),捕捉其自然反應(yīng)。


所以,AI幻覺(jué)不是單純的技術(shù)問(wèn)題,而是一個(gè)正在膨脹的生態(tài)挑戰(zhàn)。正如Barnes所言:「我們不是被模型騙了,而是被自己想相信的期待利用?!?/strong>


本文來(lái)自微信公眾號(hào)“APPSO”,作者:APPSO,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com