Bug變驚喜:AI失誤揭秘創(chuàng)造力本質(zhì)
擴散模型本應(yīng)是復(fù)制機器,卻常畫出“六指人像”和陌生場景。最新研究顯示,AI的“創(chuàng)造力”竟是架構(gòu)的副作用。有學(xué)者推測,人類靈感或許也如此。當靈感能用公式表達,人類與AI的區(qū)別還有多大?
你肯定見過那些奇特的AI畫作,人物手指增多、臉部細節(jié)怪異,卻又帶著一種難以言喻的新鮮感。
這不禁讓人疑惑:擴散模型明明只能“復(fù)刻”,為何能創(chuàng)作出前所未見的作品?
最新研究給出了答案:AI的創(chuàng)造力并非“神來之筆”,而是模型架構(gòu)的副作用。
只會復(fù)制的AI,緣何能創(chuàng)作?
擴散模型的任務(wù)很簡單,就是把數(shù)字噪聲還原成訓(xùn)練過的圖像。就像把一幅畫放入碎紙機,直到變成細小灰塵,再將碎片重新拼湊。按常理,它應(yīng)只生成“復(fù)制品”。
但現(xiàn)實讓研究者驚訝。DALL·E、Imagen、Stable Diffusion等模型畫出的不是“翻版”,而是全新圖像,不同元素組合成前所未見的場景,且這些拼貼并非雜亂無章,而是有語義的完整作品。

DALL·E 2制作了“金魚在海灘上啜飲可口可樂”的圖像。這個由OpenAI創(chuàng)建的程序可能從未見過類似圖像,卻能自行生成。
還記得社交平臺瘋傳的“AI多手指人像”嗎?有些圖類似超現(xiàn)實主義畫作,人物手指莫名增多,但整體結(jié)構(gòu)依然清晰。

這類怪異產(chǎn)物曾被當作笑料,卻也引起科學(xué)家警覺:模型為何會“即興發(fā)揮”?
Giulio Biroli將此現(xiàn)象稱為“擴散模型的悖論”:“如果它們只是記憶,就不該有創(chuàng)造力;可它們偏偏能畫出前所未見的東西”。
那么,AI的創(chuàng)造力究竟從何而來?
“六指人像”背后的“bug獎勵”
最新研究中,兩位物理學(xué)家給出意外答案:AI的“創(chuàng)造力”是其架構(gòu)的副作用。

擴散模型生成圖像依賴兩條規(guī)則。一是局部性,繪制時只關(guān)注一個小像素“拼塊”,就像拼圖時只盯著顏色相近的小碎片,不考慮其在整幅畫中的位置。二是平移等變性,輸入圖像整體移動,模型生成的畫面也同步移動,以保持圖像結(jié)構(gòu)連貫。
這兩條機制本是“去噪”的限制條件,研究者曾認為是缺陷,會使模型無法生成完美復(fù)制品。

但事實證明,這種“不完美”讓AI無法完全依賴記憶,必須在局部拼貼中即興重組,導(dǎo)致手指增多、元素拼接怪異,卻讓畫面生出新意。也就是說,AI的創(chuàng)造力是架構(gòu)的必然副作用。
ELS方程機:創(chuàng)造力的數(shù)學(xué)證明
若AI的創(chuàng)造力是副作用,如何證明?斯坦福大學(xué)研究生Mason Kamb和導(dǎo)師Surya Ganguli進行了實驗。


他們基于兩條規(guī)則構(gòu)建了ELS方程機(Equivariant Local Score machine),這是一個不依賴海量數(shù)據(jù)和黑箱深度網(wǎng)絡(luò)的數(shù)學(xué)系統(tǒng),用于預(yù)測噪聲去除時圖像的拼合方式。
他們將同一組噪聲圖像同時輸入ELS方程機和真實擴散模型,結(jié)果驚人:二者輸出平均重合度高達90%,在機器學(xué)習(xí)領(lǐng)域幾乎是前所未有的精度。

Ganguli感嘆:“這就像是用一組公式,寫下了創(chuàng)造力的來源?!彼^“AI創(chuàng)造力”,是局部性與等變性動態(tài)運行的必然產(chǎn)物,滿足這兩個條件,“創(chuàng)造”就會自動出現(xiàn)。
AI小失誤,揭開人類創(chuàng)造力秘密
這項研究不僅揭開了擴散模型的秘密,還讓人聯(lián)想到生命系統(tǒng)。Mason Kamb因長期研究形態(tài)發(fā)生,即胚胎如何從細胞自我組裝成器官和肢體,而獲得靈感。在這個過程中,細胞根據(jù)鄰居信號做出局部反應(yīng),多數(shù)時候能正常發(fā)育,但偶爾會出錯,如多長手指。
當Kamb看到“AI多指人像”時,聯(lián)想到胚胎發(fā)育的“局部拼貼錯誤”。這表明,AI的創(chuàng)造力與生物自組織過程驚人相似。

研究者大膽類比:人類創(chuàng)造力或許與AI并無本質(zhì)區(qū)別。我們的大腦并非憑空產(chǎn)生靈感,而是在有限經(jīng)驗和記憶中拼接、補全、想象,偶爾的錯誤與缺口成為創(chuàng)新源泉。
正如IBM研究員Benjamin Hoover所說:“人類和AI的創(chuàng)造力,可能都根植于對世界的不完整理解?!眲?chuàng)造力可能是副作用,是“不完美”帶來的意外之喜。
當“創(chuàng)造力”能用公式表達,人類與機器的界限愈發(fā)模糊。或許,真正的靈感不是天才的特權(quán),而是“不完美”的副產(chǎn)物。這項研究提醒我們:創(chuàng)造往往源于偏差。
參考資料:
https://www.wired.com/story/researchers-uncover-hidden-ingredients-behind-ai-creativity/
https://www.quantamagazine.org/researchers-uncover-hidden-ingredients-behind-ai-creativity-20250630/
本文來自微信公眾號“新智元”,作者:新智元,編輯:傾傾,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





