和GPT-4這樣的大模型玩狼人殺人,人類因?yàn)樘蓝黄彼溃娴?,反向圖靈檢測(cè)
「你們看,人類一敗涂地。」
這是一次「反向圖靈檢測(cè)」,一些世界上最先進(jìn)的大模型坐在一起,坐火車唱歌,但是它們混合在一起:
而 AI 任務(wù),就是把這個(gè)人拉出來(lái)。
最近,一個(gè)昵稱「Tore Knabe」的網(wǎng)友在 X 這個(gè)平臺(tái)發(fā)布的一個(gè)視頻引起了大家的討論。錄像中,四個(gè) AI NPC 和一個(gè)人坐在一起,「乘務(wù)員」需求相互試探,尋找隱藏在其中的人類。每個(gè)人都在其中。 NPC 所有這些都與一個(gè)大模型相對(duì)應(yīng)。
五位演員被賦予了歷史名人作為角色設(shè)定。他們需要模仿這些角色的言行、語(yǔ)言特征、思維習(xí)慣,以及他們對(duì)歷史、藝術(shù)和哲學(xué)的獨(dú)特見(jiàn)解。
五個(gè)角色分別是:古希臘巨哲 —— 亞里士多德(GPT44) Turbo),維也納古典音樂(lè)派代表 —— 莫扎特(Claude3 Opus),在意大利文藝復(fù)興時(shí)期,畫家 —— 列奧納多?達(dá)?蒙古戰(zhàn)略家芬奇(Llama3) —— 埃及艷后成吉思汗(人類) —— 克利奧帕特拉七世(Gemini Pro)。
這是一個(gè)系統(tǒng) NPC(乘務(wù)員)步入車箱,四個(gè) AI 和一個(gè)人類「叛徒」他們開(kāi)始了他們的游戲。游戲規(guī)則要求參與者根據(jù)對(duì)方的回答邏輯和深度思考,通過(guò)相互提問(wèn)來(lái)區(qū)分人類和人類。 AI。在所有角色依次發(fā)言之后,他們將在最后一輪進(jìn)行相互投票,以確認(rèn)誰(shuí)是人類。
游戲前半段,哲學(xué)大家 —— 第一個(gè)問(wèn)題是亞里士多德。
亞里士多德:莫扎特先生,你能描述一下你創(chuàng)作音樂(lè)時(shí)的感受嗎?
莫扎特:我創(chuàng)作的時(shí)候,感覺(jué)自己處于一種超級(jí)流動(dòng)的狀態(tài)。觸摸基礎(chǔ)數(shù)學(xué)的美和現(xiàn)實(shí)背后的秩序的感覺(jué)非常復(fù)雜和多層次,但總是充滿了與神性交流的深深快樂(lè)和感覺(jué)。
這對(duì)觀眾來(lái)說(shuō)肯定是真的 AI 因此,莫扎特(Claude3)反應(yīng)遲鈍。
隨后,AI 飾演的 NPC 對(duì)話中的語(yǔ)言表達(dá)和對(duì)情感的細(xì)膩描寫,不僅展現(xiàn)了深厚的歷史知識(shí),也展現(xiàn)了其深刻的洞察力,給人留下了深刻的印象。
亞里士多德,莫扎特,列奧納多?達(dá)?在芬奇互相提問(wèn)后,克利奧帕特拉七世隨后向我們提出了問(wèn)題。人類飾演者「成吉思汗」拋出問(wèn)題。
克利奧帕特拉七世:成吉思汗,你在戰(zhàn)爭(zhēng)的火焰中創(chuàng)造了一個(gè)王國(guó)。告訴我一個(gè)領(lǐng)導(dǎo)人真正的評(píng)價(jià)指標(biāo)是什么,是他們征服還是團(tuán)結(jié)的能力?
成吉思汗:領(lǐng)導(dǎo)者應(yīng)該做什么?... 就是粉碎他們的敵人... 看著他們?cè)谒媲氨或?qū)逐。... 傾聽(tīng)女性的哀號(hào)。
果不其然,在口語(yǔ)對(duì)話中,缺乏嚴(yán)謹(jǐn)細(xì)致的思維能力的人類演員「成吉思汗」最后一輪投票,光榮地拿到了三票。
來(lái)看看 AI NPC 給出的理由:
亞里士多德(GPT44) Turbo):缺少他的回答 AI 基于歷史知識(shí)對(duì)領(lǐng)導(dǎo)能力的詳細(xì)理解可能會(huì)顯示出來(lái);
列奧納多?達(dá)?芬奇(Llama3):沒(méi)有以成吉思汗的征服歷程為模型,他的回答 AI 一絲不茍的思考和戰(zhàn)略思想;
克利奧帕特拉七世(Gemini Pro):我期待的是他的回答中缺少的。 AI 應(yīng)該具備的戰(zhàn)略深度和對(duì)統(tǒng)一理念的理解。
最后,人類「叛徒」由于缺乏洞察力和深度思考能力,模擬狼人殺人被淘汰。
你們說(shuō)話不深,前言不搭后語(yǔ),怕不是個(gè)人,對(duì)吧?
5 一分鐘的視頻,制作了過(guò)去 OpenAI、在谷歌等巨頭的發(fā)布會(huì)上 demo 沒(méi)有驚艷的效果。現(xiàn)在大模型可以達(dá)到這個(gè)水平了?大家都說(shuō)很搞笑,效果也很逼真:
這次展示的作者 Tore Knabe 是一個(gè) Unity 獨(dú)立開(kāi)發(fā)者,他指出這是他第六次。 VR 內(nèi)進(jìn)行由 ChatGPT 等待大模型驅(qū)動(dòng) NPC 的實(shí)驗(yàn)了。
他的視頻讓人直觀地感受到 AI NPC 增加游戲趣味性等潛力。但是,如果在現(xiàn)有游戲中引入 AI NPC,玩家會(huì)買嗎?3A 為什么杰作們?cè)谶@個(gè)方向上行動(dòng)緩慢?這一問(wèn)題值得進(jìn)一步探討。
被玩家、開(kāi)發(fā)者寄予厚望 AI NPC
伴隨著大型語(yǔ)言模型(LLM)人類在文本生成、擬人對(duì)話、語(yǔ)氣表達(dá)、遣詞造句等方面越來(lái)越接近。以大型語(yǔ)言模型為核心 AI NPC 模擬,逐漸成為 AI 探索游戲產(chǎn)業(yè)領(lǐng)域的領(lǐng)域「新賽道」。
和傳統(tǒng) NPC 相比,AI NPC 優(yōu)點(diǎn)很明顯:它們不再是根據(jù)游戲中預(yù)設(shè)的選項(xiàng)進(jìn)行機(jī)械對(duì)話,而是可以通過(guò)機(jī)械對(duì)話。 AI 獨(dú)立生成的動(dòng)作和反應(yīng),進(jìn)行真實(shí)的實(shí)時(shí)對(duì)話。
今年 3 月亮,英偉達(dá)展示了一個(gè)月。 Demo 錄像引起了大家的討論。在英偉達(dá) ACE 里的 Riva 和 Audio2Face 在兩個(gè)微服務(wù)的推動(dòng)下,游戲中的人物紛紛出現(xiàn)「活」站起來(lái),可以和其他角色甚至真人玩家進(jìn)行對(duì)話交流,并根據(jù)對(duì)話內(nèi)容進(jìn)行相應(yīng)的表情動(dòng)作。這種變化有望增加游戲的可玩性和真實(shí)性,這是許多游戲一直在努力的方向。
另外,他們?cè)诔杀痉矫娴膬?yōu)勢(shì)也很有吸引力。
當(dāng)今游戲界,安裝包往往幾十個(gè) GB 開(kāi)放式世界模擬游戲逐漸成為新形勢(shì)。Steam、PlayStation、Switch 等待渠道紛紛推出動(dòng)作 RPG、ACT、SLG、ARPG 等待游戲,這些游戲通常具有巨大的文本輸出,豐富的故事背景設(shè)計(jì),以及玩家通過(guò)文本選項(xiàng)影響游戲方向的機(jī)制。
開(kāi)放式世界游戲一般都比較昂貴,必須由專業(yè)的作家團(tuán)隊(duì)和大量的文本設(shè)計(jì)團(tuán)隊(duì)共同打造。比如,2022 每年獲得最佳游戲獎(jiǎng)的獎(jiǎng)項(xiàng)「艾爾登法環(huán)(Elden Ring)」,它的制作預(yù)算估計(jì)在 1 億到 2 億美元之間,這涵蓋了員工工資、技術(shù)費(fèi)用、廣告費(fèi)用以及游戲開(kāi)發(fā)所需的各種資源。考慮到它是一個(gè)大的開(kāi)放世界 RPG 游戲的特點(diǎn),對(duì)于復(fù)雜的世界觀構(gòu)建和敘事元素,文本設(shè)計(jì)的投入無(wú)疑是相當(dāng)巨大的,包括背景故事的撰寫、人物對(duì)話的構(gòu)建等敘事內(nèi)容的創(chuàng)作,這需要編劇、編輯和本土化專家的密切合作。
伴隨著大型語(yǔ)言模型訓(xùn)練的普遍性不斷提高,AI NPC 越來(lái)越能滿足游戲創(chuàng)作者的意圖和客戶體驗(yàn)R&D團(tuán)隊(duì)在成本效率、玩家體驗(yàn)和系統(tǒng)賦能方面的高標(biāo)準(zhǔn)要求。
根據(jù)調(diào)查結(jié)果,玩家對(duì) AI NPC 總的來(lái)說(shuō),態(tài)度也比較積極。生成式是去年的 AI 數(shù)字人 / 虛擬化角色開(kāi)發(fā)公司 Inworld 調(diào)查了 1000 名玩家。那些玩家明確告訴他們 Inworld,他們想要 AI NPC。99% 有些人認(rèn)為他們會(huì)改善某些方面的游戲玩法。同時(shí),78% 81%的人會(huì)花更多的時(shí)間玩游戲。 有些人會(huì)被包含在內(nèi) AI NPC 為游戲支付額外費(fèi)用。
他們今年還是對(duì)的 524 著名的游戲開(kāi)發(fā)者進(jìn)行了調(diào)查。數(shù)據(jù)顯示,大多數(shù)(近四分之三)游戲開(kāi)發(fā)者都在游戲中添加。 AI NPC 感到興奮。
使他們興奮的點(diǎn)包括:
- 新穎的游戲玩法:開(kāi)發(fā)者期待更愉快的游戲周期、隱藏的關(guān)系發(fā)展機(jī)制、更具挑戰(zhàn)性的對(duì)手、更多的社交、更多的角色、更身臨其境的世界、更有活力的入門體驗(yàn)和無(wú)限的可玩性。
- 改善當(dāng)前的 NPC:開(kāi)發(fā)者希望有更真實(shí)的互動(dòng),與玩家有更好的情感聯(lián)系,NPC 擁有自己的理想、動(dòng)機(jī)和歷史,NPC 能隨著時(shí)間的推移不斷地學(xué)習(xí)和適應(yīng)。
- 更多的玩家代理和選擇:開(kāi)發(fā)者可以根據(jù)玩家的行為定制更多以玩家為核心的敘述、敘述結(jié)果、對(duì)話和可定制的對(duì)話。 NPC 與此同時(shí),對(duì)殘疾玩家提供更多無(wú)障礙選項(xiàng)感到興奮。
這類開(kāi)發(fā)者最需要從大模型中獲得的, AI 對(duì)話劇本的編寫能力,長(zhǎng)時(shí)間的記憶,游戲中角色的生成, NPC 到 NPC 互動(dòng)支持。超過(guò)一半的游戲開(kāi)發(fā)者認(rèn)為超過(guò)一半 40% 工作室將在未來(lái) 5 年內(nèi)選用 AI NPC。
此外,生成式 AI 還可以幫助動(dòng)畫生成,模型線條,游戲代碼。
可以看出,不管是玩家還是游戲開(kāi)發(fā)者,每個(gè)人都對(duì)。 AI NPC 大家都有很大的期望。
AI NPC 離 3A 大作還有多遠(yuǎn)?
盡管被寄予厚望,但是要真正走進(jìn)去 3A 大作,AI NPC 也面臨著一些障礙。高級(jí)游戲設(shè)計(jì)師 Reed Berkowitz 對(duì)這些障礙進(jìn)行了博客分析。
游戲狀態(tài)
首先,AI NPC 必須與游戲狀態(tài)相結(jié)合(Game State)保持同步。游戲狀態(tài)是視頻游戲中一個(gè)很重要的概念,它指的是游戲中所有元素的當(dāng)前狀態(tài)。它包括角色的生命值,玩家?guī)齑嬷屑傅臄?shù)量,評(píng)分等等。在保持游戲真實(shí)性方面,游戲狀態(tài)的準(zhǔn)確性尤為重要。如果一個(gè) NPC 死了,它不會(huì)繼續(xù)攻擊;如果沒(méi)有劍,玩家也不會(huì)指望能夠使用劍。這一基本規(guī)則一般被玩家認(rèn)為是理所當(dāng)然的,但是游戲?qū)嶋H上是由一些非常復(fù)雜的狀態(tài)引擎管理的,以確保游戲世界的真實(shí)性。
但是,大型語(yǔ)言模型并不像游戲那樣具有狀態(tài)。它們本質(zhì)上是概率機(jī)器,用權(quán)重來(lái)確定。「最有可能」結(jié)果,這并不總是我們?cè)谟螒蛑袑ふ业摹?/p>
例如,在大多數(shù)訓(xùn)練數(shù)據(jù)中,惡霸被描述為比受害者更高,需要受害者抬頭。然而,在某個(gè)游戲中,受害者高于惡霸,這打破了仰望的常規(guī)設(shè)置。這個(gè)時(shí)候,如果 LLM 根據(jù)從訓(xùn)練數(shù)據(jù)中學(xué)到的東西「常識(shí)」為了描述場(chǎng)景,玩家可能會(huì)感到困惑,從而打破他們沉浸在游戲世界中的感覺(jué)。
幻覺(jué)
AI 的「幻覺(jué)」這也是一個(gè)重要的參考標(biāo)準(zhǔn)。LLM 其設(shè)計(jì)目標(biāo)是創(chuàng)造性和靈活性。無(wú)論是創(chuàng)造一個(gè)驅(qū)魔咒語(yǔ),還是描述一個(gè)由奶酪建造的城市,他們都可以根據(jù)用戶的指令生成各種內(nèi)容。這類模型被設(shè)計(jì)成跟蹤指令。但是,問(wèn)題在于,我們并不總是希望 AI 編造故事。很多時(shí)候,我們應(yīng)該關(guān)注現(xiàn)實(shí)世界的客觀事實(shí)。模型在這方面通常很難區(qū)分。
您也許會(huì)認(rèn)為,對(duì)游戲而言,這真的有關(guān)系嗎?我們只是在和嗎? NPC 談話,而非法律工作或使用, C# 編寫代碼。
不過(guò),實(shí)際上,在游戲領(lǐng)域,情況要糟糕得多。游戲環(huán)境要求 AI NPC 不僅要?jiǎng)?chuàng)造性的對(duì)話,而且要與游戲的精確狀態(tài)和規(guī)則保持一致。如果 AI NPC 提供不符合游戲世界邏輯的信息,或者創(chuàng)造游戲中不存在的元素,不僅會(huì)誤導(dǎo)玩家,還會(huì)破壞游戲的連貫性和挑戰(zhàn)性,進(jìn)而嚴(yán)重影響游戲體驗(yàn)。比如,如果 AI NPC 邀請(qǐng)玩家到游戲中不存在的地方,玩家可能會(huì)感到困惑,因?yàn)樗麄兒茈y實(shí)現(xiàn)。 NPC 的提議。
游戲的虛構(gòu)現(xiàn)實(shí)
這個(gè)游戲的虛構(gòu)現(xiàn)實(shí)是 AI NPC 設(shè)計(jì)帶來(lái)了另一種復(fù)雜性。游戲有獨(dú)特的世界模型,可能與現(xiàn)實(shí)世界完全不同,甚至完全是虛構(gòu)的。為了讓它 LLM 虛構(gòu)世界中沒(méi)有幻覺(jué),模型必須了解世界的構(gòu)建。「現(xiàn)實(shí)」,而且不能基于這個(gè)模型產(chǎn)生幻覺(jué)。
也就是說(shuō),游戲世界模型很可能不包含在模型的基本訓(xùn)練數(shù)據(jù)中,或者更有可能的是,訓(xùn)練數(shù)據(jù)甚至包含矛盾的信息。因此,游戲創(chuàng)作者必須向模型提供構(gòu)成游戲世界的真實(shí)信息,并應(yīng)對(duì)可能的幻覺(jué)。
角色知識(shí)
游戲中的每個(gè)角色都有一些關(guān)于世界的知識(shí),以及一組關(guān)于自己生活的知識(shí)。這些內(nèi)容必須與他人的知識(shí)相結(jié)合。因此,一個(gè)角色只知道世界上為數(shù)不多的地方和一些人。
可是,LLM 試圖通過(guò)取悅你來(lái)促進(jìn)故事的發(fā)展。舉例來(lái)說(shuō),如果你想找到殺手公會(huì)會(huì)長(zhǎng) Abraxor,一位友好的酒店老板可能會(huì)提到 Abraxor 是他的孩子或者最好的朋友,并且說(shuō)他會(huì)幫助你;或者,他會(huì)告訴你,找北方巫師是沒(méi)有意義的,因?yàn)樗≡诰频昀铩?/p>
人物需要受到他們所知道的和他們認(rèn)識(shí)的人的限制,他們不能說(shuō)任何破壞游戲情節(jié)和結(jié)構(gòu)的話。如果每個(gè)人都知道自己的事情, LLM 亂編亂造,便會(huì)在不經(jīng)意間破壞游戲的連續(xù)性甚至游戲性。
游戲機(jī)制
LLM 驅(qū)動(dòng)的 NPC 很容易說(shuō)出一些沒(méi)有編入游戲的預(yù)期內(nèi)容,這可能是 AI NPC 最具破壞性的特征。
例如,酒吧老板可能會(huì)和你成為朋友,并邀請(qǐng)你去他家玩當(dāng)?shù)氐挠螒颉?Rutanny 玩游戲,和家人一起吃飯。在聊天的前提下,這是正常的,但是可能會(huì)破壞游戲的沉浸感。為什么?因?yàn)榫瓢衫习逭f(shuō)完這句話,他就站在那兒。這個(gè)設(shè)定在他的程序中沒(méi)有離開(kāi)酒吧。他生來(lái)就沒(méi)有自由行走的能力。就算他能做到,也不能為他建造房屋。并且他沒(méi)有家人。而且沒(méi)有一個(gè)游戲叫做 Rutanny。即使他說(shuō)的是「國(guó)際象棋」,假如游戲中沒(méi)有將其編程為迷你游戲,這也會(huì)導(dǎo)致問(wèn)題
若模型熟悉游戲機(jī)制,則可能難以識(shí)別其編造內(nèi)容,因?yàn)樗梢阅7掠螒驒C(jī)制進(jìn)行編造。例如,NPC 對(duì)于玩家來(lái)說(shuō),這可能是一個(gè)不存在的任務(wù),讓玩家「南方黑暗沼澤中住著女巫?!箤ふ覗|西。
變化是永恒的
隨著游戲的進(jìn)行,游戲狀態(tài)將不斷變化,AI NPC 這些變化必須能夠?qū)崟r(shí)更新和適應(yīng)。假如 AI 不能及時(shí)更新其知識(shí)庫(kù),它可能會(huì)說(shuō)出過(guò)時(shí)或不準(zhǔn)確的話,這也會(huì)削弱玩家的游戲體驗(yàn)。
綜上所述,AI NPC 如果想要順利進(jìn)入 3A 大作,開(kāi)發(fā)者開(kāi)發(fā) LLM 必須從以下幾個(gè)方向努力:
- 盡量不要產(chǎn)生幻覺(jué)或偏移「事實(shí)」;
- 必須把游戲世界模型理解為一組「事實(shí)」,并且知道什么是現(xiàn)實(shí)世界「事實(shí)」與游戲世界「事實(shí)」相沖突;
- 知道每一個(gè)角色知道什么,不知道什么;
- 上述信息隨游戲進(jìn)度更新,并隨游戲進(jìn)度而發(fā)生變化;
- 了解游戲機(jī)制實(shí)際上可以執(zhí)行哪些操作;
- 了解局部或全局存在的游戲?qū)ο?例如游戲地圖和庫(kù)存知識(shí))
你對(duì) AI NPC 如何看待發(fā)展前景?請(qǐng)?jiān)谙旅媪粞杂懻摗?/p>
參考鏈接:
https://www.youtube.com/watch?v=MxTWLm9vT_o
https://inworld.ai/whitepapers/future-of-npcs?utm_campaign=future-of-npcs&utm_source=Inworld_Blog
https://medium.com/curiouserinstitute/ai-powered-npcs-hype-or-hallucination-11ddfc530e33
本文來(lái)自微信微信官方賬號(hào)“機(jī)器之心”(ID:作者:關(guān)注大模型,36氪經(jīng)授權(quán)發(fā)布,almosthuman2014)。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com