中國科學(xué)院科學(xué)家首次證實,大語言模型可以像人類一樣“理解”事物
IT 世家 6 月 11 日消息,IT 世家從中國科學(xué)院自動化研究所微信微信官方賬號了解到,最近神經(jīng)計算與腦機交互(NeuBCI)結(jié)合行為實驗和神經(jīng)圖像分析,課題組與中國科學(xué)院腦科學(xué)與智能技術(shù)卓越創(chuàng)新中心的聯(lián)合團隊,首次證實多模態(tài)大語言模型(MLLMs)能自發(fā)地形成與人類高度相似的物體概念表征系統(tǒng)。這項研究不僅為人工智能認知科學(xué)開辟了一條新的道路,也為人工智能系統(tǒng)構(gòu)建了一個理論框架,進一步構(gòu)建了類人認知結(jié)構(gòu)。有關(guān)研究成果如下 Human-like object concept representations emerge naturally in multimodal large language models 發(fā)表于《自然》的問題?機器智能》(Nature Machine Intelligence)。

人類可以概念自然界中的物體,長期以來被認為是人類智力的關(guān)鍵。當我們看到“狗”、“汽車”或“蘋果”時,我們不僅可以識別它們的物理特征(尺寸、顏色、形狀等)。),還可以理解它們的功能、情感價值和文化意義。 —— 這一多維概念的表征形成了人類認知的基石。
傳統(tǒng)的人工智能研究側(cè)重于物體識別的準確性,但很少討論模型是否真正“理解”物體的含義?!澳壳?,論文通訊作者何暉光研究員指出:” AI 可以區(qū)分貓狗的圖片,但是這種‘識別’和人類‘理解’貓狗的本質(zhì)區(qū)別還有待揭示。“團隊從認知神經(jīng)科學(xué)經(jīng)典理論出發(fā),設(shè)計了一套創(chuàng)新的模型計算、行為實驗和腦科學(xué)相結(jié)合的模型。選擇經(jīng)典的認知心理學(xué)“三選一異類識別任務(wù)”進行研究(triplet odd-one-out),從物體概念三元組(來自物體概念三元組)要求大模型和人類 1854 在日常概念的任意組合中選擇最不相似的選項。通過分析 470 團隊首次建立了萬次行為判斷數(shù)據(jù)。 AI “概念地圖”大模型。

試驗范式示意圖。a,物理概念集和包含語言描述的圖像示例。b-d,分別針對 LLM、MLLM 以及嵌入空間的人類行為測試范式和概念。
研究人員從海量大模型行為數(shù)據(jù)中提取出來 66 一個“精神層面”,并且給這些層面貼上了語義標簽。研究表明,這些層次是高度可以解釋的,并且與大腦類別選擇區(qū)域(如面部處理) FFA、處理場景的 PPA、處理軀體的 EBA)顯著的神經(jīng)活動模式有關(guān)。
在行為選擇模式上,研究還比較了多種模式與人類的一致性。(Human consistency)。資料顯示,多模態(tài)大模型(例如 Gemini_Pro_Vision、Qwen2_VL)在一致性方面表現(xiàn)更好。此外,研究還揭示了人類在做決定時更傾向于結(jié)合視覺特征和語義信息進行判斷,而大模型則側(cè)重于依靠語義標簽和抽象概念。這項研究發(fā)現(xiàn),大語言模型并不是“隨機鸚鵡”,而是類似于人類對現(xiàn)實世界概念的理解。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com