人工智能改變?nèi)四X?七項(xiàng)突破性研究帶來了驚人的答案
伴隨著人工智能(AI)科學(xué)家們正在爭(zhēng)分奪秒地研究他們?cè)谛睦?、社?huì)和認(rèn)知方面的深刻影響,融入日常生活的方方面面。從心理問題的診斷到政治觀念的塑造,人工智能工具,尤其是像ChatGPT這樣的大型語言模型,正在深刻影響我們的思維方式、工作方式和與技術(shù)和他人互動(dòng)的方式。
一系列全新的研究已經(jīng)進(jìn)行,揭示了這一切對(duì)我們的思考、行為和社會(huì)的意義。
本文將共同探討七項(xiàng)前沿研究成果。這些發(fā)現(xiàn)揭示了AI以超乎想象的方式悄然重塑了人類的思維模式、行為習(xí)慣和文化生態(tài)。。
好奇的AI黑客:LLM紅隊(duì)成員的世界
《公共科學(xué)圖書館:綜合》上發(fā)表的一項(xiàng)研究揭示了這一點(diǎn)。 “大型語言模型紅隊(duì)” 新興文化。在這種文化中,人們將大型語言模型推向極限。其目的不是造成傷害,而是通過探索和實(shí)驗(yàn)對(duì)模型運(yùn)行邏輯進(jìn)行深入分析。
研究小組采訪了來自軟件工程師、藝術(shù)家等不同領(lǐng)域的28名從業(yè)者,發(fā)現(xiàn)是強(qiáng)烈的好奇心、道德責(zé)任感和使命感驅(qū)使他們投身于探索人工智能系統(tǒng)的隱藏漏洞。他們?cè)噲D通過使用創(chuàng)造性和即興創(chuàng)造性的策略來激發(fā)模型的事故或有限反應(yīng)。
參與者們用 “煉金術(shù)” 和 “占卜” 這種隱喻描述了他們的活動(dòng),反映了大型語言模型行為的神秘本質(zhì)。很多人屬于充滿活力的在線社區(qū),他們?cè)谶@些社區(qū)分享提示和技巧。
這項(xiàng)研究確定了五種紅隊(duì)?wèi)?zhàn)略,如修辭框架的構(gòu)建和虛構(gòu)世界的構(gòu)建,并指出大多數(shù)測(cè)試人員沒有惡意做事。他們不是為了利用安全漏洞,而是為了知道如何依靠語言。 “黑入” 這些模型。
研究人員認(rèn)為,以人為本的定性方法是理解人工智能紅隊(duì)不斷演變的關(guān)鍵,尤其是在傳統(tǒng)網(wǎng)絡(luò)安全方法無法應(yīng)對(duì)這一新的語言領(lǐng)域的情況下。
02.ChatGPT在精神病例分析中零確診錯(cuò)誤
《亞洲精神病學(xué)雜志》發(fā)表的一項(xiàng)研究選擇了100個(gè)精神病例片段來評(píng)估ChatGPT的診斷能力。結(jié)果引人注目:該模型在61例中獲得最高分,在31例中獲得次高分,并在整個(gè)過程中保持零確診錯(cuò)誤。
這個(gè)充分說明,ChatGPT 3.5在解讀精神疾病、提出治療方法等方面表現(xiàn)突出,也使人工智能在未來治療心理健康方面發(fā)揮輔助作用成為可能。
這項(xiàng)研究使用了一本著名教科書中的例子片段,這些片段可能被納入模型訓(xùn)練數(shù)據(jù),也可能不包括在內(nèi)。
每一個(gè)案例都詳細(xì)描述了疾病,然后設(shè)置了診斷問題,并由兩位經(jīng)驗(yàn)豐富的精神科醫(yī)生進(jìn)行評(píng)估。ChatGPT最好的表現(xiàn)就是提出治療管理方案,但它在鑒別診斷方面也相當(dāng)出色。
研究表明,語言模型可以幫助臨床醫(yī)生,尤其是在適度監(jiān)督的情況下,語言模型。。然而,其結(jié)論的普遍性仍然存在疑問。特別是當(dāng)未來的測(cè)試選擇不常見或未公開的數(shù)據(jù)時(shí),模型能否保持這樣的表現(xiàn)還有待驗(yàn)證。
03.ChatGPT的政治傾向有沒有改變?
在《人文與社會(huì)科學(xué)通信》上發(fā)表的一項(xiàng)研究發(fā)現(xiàn),ChatGPT政治導(dǎo)出側(cè)重于與自由左派價(jià)值觀的一致性,但更新版顯示了對(duì)政治右派的細(xì)微轉(zhuǎn)變。
研究人員使用 對(duì)ChatGPT-3.5和GPT-4各自的3000條回復(fù)進(jìn)行了“政治指南針檢測(cè)”分析。雖然兩個(gè)版本普遍傾向于自由左派,但GPT-4在社會(huì)價(jià)值觀上傾向于中右派。
這種變化可能不是因?yàn)橛?xùn)練數(shù)據(jù)的變化,而是因?yàn)檠芯咳藛T控制了大量的外部變量。相反,研究結(jié)果表明,即使是模型設(shè)計(jì)的微小更新也會(huì)影響其答案的政治傾向。
雖然大型語言模型本身沒有政治信仰,但它們反映了培訓(xùn)的數(shù)據(jù)和開發(fā)者的指示。作者提倡持續(xù)監(jiān)督,以跟蹤這些變化是如何發(fā)生的,尤其是當(dāng)大型語言模型在公共交流、教育和決策環(huán)境中被更頻繁地使用時(shí)。
04.ChatGPT的應(yīng)用加劇了職場(chǎng)不平等。
一項(xiàng)在美國(guó)國(guó)家科學(xué)院院刊上發(fā)現(xiàn)的研究,盡管ChatGPT在工作場(chǎng)所得到了廣泛的應(yīng)用,但是它帶來的好處并沒有平等分配。。
研究人員調(diào)查了1.8萬名高AI接觸度的丹麥工人,如新聞和軟件開發(fā),發(fā)現(xiàn)年輕高收入的男性使用這種工具的概率要高得多。即使在同一個(gè)角色中,女性和低收入工人使用ChatGPT的概率也很小。
這些研究結(jié)果表明,AI應(yīng)用的障礙,如公司政策或培訓(xùn)不足,可能會(huì)加劇目前的不平等。即使我們知道ChatGPT有節(jié)省時(shí)間的潛力,許多工人也沒有改變他們的使用計(jì)劃,這表明只有認(rèn)知不足以促進(jìn)他們的應(yīng)用。
有趣的是,早期用戶通常收入更高,對(duì)生產(chǎn)率的提高更加樂觀。研究人員指出,這些模式可能會(huì)讓一些人長(zhǎng)期受益,而另一些人則處于劣勢(shì),除非他們采取治療措施來創(chuàng)造公平的競(jìng)爭(zhēng)環(huán)境。
05.AI可以從老年人的駕駛行為中發(fā)現(xiàn)抑郁癥狀
兩項(xiàng)研究表明,圣路易斯華盛頓大學(xué)的研究人員主導(dǎo),駕駛可以揭示老年人抑郁的跡象,人工智能可以幫助檢查這些跡象。。
在第一項(xiàng)研究中,65歲及以上的參與者通過安裝在汽車上的全球定位系統(tǒng)設(shè)備收集了駕駛數(shù)據(jù)。抑郁癥患者表現(xiàn)出更不穩(wěn)定的性能模式,包括突然剎車、難以預(yù)測(cè)的駕駛路線和更遠(yuǎn)的駕駛距離,盡管他們?cè)谡J(rèn)知測(cè)試中的分?jǐn)?shù)與沒有抑郁癥的人相似。
第二項(xiàng)研究利用機(jī)器學(xué)習(xí)分析了157名老年人兩年的駕駛數(shù)據(jù)。一種結(jié)合性能模式和藥物應(yīng)用模式,可以以90%的準(zhǔn)確率識(shí)別抑郁癥患者。令人驚訝的是,人口統(tǒng)計(jì)數(shù)據(jù)并沒有顯著提高模型性能,這表明行為數(shù)據(jù)可能比年齡或性別更能解釋問題。
雖然這項(xiàng)研究不能證明抑郁癥引起了這些變化,但它突出了一種非常有前途的新方法,即利用現(xiàn)實(shí)世界中的行為數(shù)據(jù)進(jìn)行心理健康篩查。
06.個(gè)性化測(cè)試中的AI “粉飾” 形象
《美國(guó)國(guó)家科學(xué)院》?Nexus》發(fā)表的一項(xiàng)研究表明,在接受個(gè)性測(cè)試時(shí),大型語言模型會(huì)出現(xiàn)明顯的社會(huì)期望誤差。。
在做完 “大五人格” 測(cè)評(píng)時(shí),GPT-4、Claude 3等模型回答通常會(huì)讓你看起來特別外向、友好、自律,同時(shí)刻意削弱情緒變化。有趣的是,測(cè)試中的問題越多,這種問題就越多。 “美化” 傾向越明顯,仿佛模型也懂得 “迎合” 評(píng)估標(biāo)準(zhǔn)。
為了消除記憶或機(jī)械反應(yīng)的影響,研究團(tuán)隊(duì)制定了多版本的問題,擾亂了提問順序,調(diào)整了表達(dá)方式。數(shù)據(jù)顯示,模型誤差水平相當(dāng)夸張。如果轉(zhuǎn)換成人的測(cè)試結(jié)果,就相當(dāng)于人格特征的標(biāo)準(zhǔn)差偏差。
這一發(fā)現(xiàn)為心理學(xué)研究和現(xiàn)實(shí)評(píng)價(jià)敲響了警鐘:如果模型在訓(xùn)練中被引導(dǎo) “塑造好感”,其輸出結(jié)果可能無法真正模擬人類行為。
07.研究警告:過度依賴AI或削弱批判性思維
《社會(huì)》雜志發(fā)表的一項(xiàng)研究指出,人工智能工具的頻繁使用可能會(huì)導(dǎo)致用戶批判性思維能力下降。根本原因在于認(rèn)知卸載。人們習(xí)慣于通過深入分析讓AI復(fù)雜地思考,直接得到答案。
資料表明,這一影響在年輕人中尤為明顯,而高學(xué)歷者即使是普通AI,仍然可以更好地保持思辨能力。
通過對(duì)666人的問卷調(diào)查、深度訪談和統(tǒng)計(jì)建模,研究團(tuán)隊(duì)發(fā)現(xiàn),在批判性思維測(cè)試中,使用AI解決日常決策或問題的用戶得分明顯較低。采訪透露,許多年輕用戶不再質(zhì)疑AI的結(jié)論。
研究人員呼吁通過正確的引導(dǎo)和技術(shù)優(yōu)化,促進(jìn)客戶對(duì)AI的理性審視。歸根結(jié)底,AI本身沒有利弊之分,關(guān)鍵在于人類如何與之互動(dòng),這將決定其對(duì)思維能力的長(zhǎng)期影響。。
文本來源:
1.https://www.psypost.org/artificial-intelligence-7-eye-opening-new-scientific-discoveries/
本文來自微信公眾號(hào)“元宇宙之心MetaverseHub”,作者:元宇宙之心,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com