剛剛開(kāi)始AI,職場(chǎng)人就踩上了幻覺(jué)坑?
"你查過(guò)這個(gè)數(shù)據(jù)嗎?"
沒(méi)有,是AI寫(xiě)的,看起來(lái)沒(méi)問(wèn)題。
在截止日期的編輯周子衡看來(lái),那段話“邏輯流暢,語(yǔ)氣專業(yè),甚至百分比都標(biāo)得恰到好處”,結(jié)果卻是憑空捏造的;電商客服王萌團(tuán)隊(duì),因?yàn)锳I生成了“模板演講”,誤發(fā)了不適用的退貨規(guī)則??蛻舯г菇貓D,平臺(tái)只能賠錢;專業(yè)講師蔡倩第一次用AI起草課件,在直播間被學(xué)生問(wèn)及。才知道那組“情感價(jià)值”數(shù)據(jù),AI“編得像真的”;而且一個(gè)產(chǎn)品經(jīng)理更早意識(shí)到問(wèn)題,自己做AI產(chǎn)品,但是他制定了團(tuán)隊(duì)使用標(biāo)準(zhǔn):AI產(chǎn)生的段落不能直接決定任何事情。
那不是一個(gè)“AI作惡”的故事。這是一組關(guān)于AI幻覺(jué)的職場(chǎng)眾生相。
豆包,文心一言,DeepSeek、元寶...這些國(guó)產(chǎn)AI工具正在大規(guī)模進(jìn)入職場(chǎng)內(nèi)容流。我們認(rèn)為它們是工具。事實(shí)上,它們更像是一種“說(shuō)得太像真語(yǔ)氣”,這使得每個(gè)用戶都可能在不經(jīng)意間表現(xiàn)出判斷。
沒(méi)有絕對(duì)安全的人在這個(gè)由幻覺(jué)組成的認(rèn)可測(cè)試中。
有的人把AI當(dāng)成思路傳播,有的人開(kāi)始給AI的每一句話貼標(biāo)簽;如果有人被它坑過(guò)一次,他們就再也不會(huì)讓它寫(xiě)結(jié)論了;直到有人全權(quán)托付,他們才意識(shí)到AI不會(huì)為你背黑鍋,幻覺(jué)也不會(huì)紅。
坤輿論商業(yè)觀察記錄了幾個(gè)用AI寫(xiě)東西的人。他們不是專家,不是極客,而是像你我一樣,在每個(gè)普通工作日按下“復(fù)制”、“粘貼”和“完成稿件”的人。
當(dāng)他們遇到AI時(shí),他們也開(kāi)始重新理解什么是“自我負(fù)責(zé)”。
01·“那段引用是AI編的,我沒(méi)有檢查”|新媒體編輯
周子衡是互聯(lián)網(wǎng)科技內(nèi)容平臺(tái)的編輯。日常生活就是不斷寫(xiě)作、修改稿件、配圖、校對(duì)。節(jié)奏快,壓力大,最怕出錯(cuò),最怕拖稿。
一年前,他開(kāi)始習(xí)慣性地用豆包幫助自己“加速”。
有一次,他在趕一篇關(guān)于消費(fèi)電子的行業(yè)稿,提到“市場(chǎng)份額的變化趨勢(shì)”需要在一半的時(shí)間內(nèi)補(bǔ)上。他輸入指令,讓AI幫他寫(xiě)一個(gè)關(guān)于“2024年中國(guó)智能手機(jī)市場(chǎng)結(jié)構(gòu)變化”的分析段。
AI很快給出了一個(gè)數(shù)據(jù)看似清晰的內(nèi)容——其中寫(xiě)道:“根據(jù)2024年第三季度某研究機(jī)構(gòu)的數(shù)據(jù),一個(gè)國(guó)內(nèi)品牌以18.6%的市場(chǎng)份額排名第一,同比增長(zhǎng)3.2。%?!?/p>
這句話似乎沒(méi)有問(wèn)題。數(shù)據(jù)準(zhǔn)確、語(yǔ)氣專業(yè)、語(yǔ)法絲滑、“同比增長(zhǎng)”等細(xì)節(jié)增強(qiáng)了感染力。他沒(méi)有多想,直接復(fù)制到了手稿里。
直到第二天主編審稿時(shí),只留下一句評(píng)論:“誰(shuí)查了這個(gè)數(shù)據(jù)?什么是報(bào)告名?”
周子衡當(dāng)場(chǎng)愣住了,開(kāi)始尋找原來(lái)的來(lái)源。因此,在所有主流機(jī)構(gòu)中(Canalys、Counterpoint、IDC)這組數(shù)字在官網(wǎng)上找不到。報(bào)告標(biāo)題也沒(méi)有這篇文章。
那個(gè)AI產(chǎn)生的內(nèi)容——完全是編輯的。
他回憶道:“最可怕的不是胡說(shuō)八道,而是它說(shuō)得像真的。”
之后,他再次嘗試了同樣的問(wèn)題,發(fā)現(xiàn)AI每次寫(xiě)的數(shù)據(jù)段都不一樣,報(bào)告名稱、數(shù)值、變化幅度都不一致?;糜X(jué)不是偶然的,而是正常的。
他告訴自己,以后一定要“驗(yàn)證”,但很多時(shí)候,面對(duì)高韌性稿件的節(jié)奏和碎片化補(bǔ)寫(xiě)的需求,他也承認(rèn)“有時(shí)候真的沒(méi)有時(shí)間管理”。
現(xiàn)在,他不再使用AI生成帶有數(shù)據(jù)的段落。結(jié)構(gòu)、語(yǔ)言和框架也可以幫助AI,但只要關(guān)鍵詞“報(bào)告”、“數(shù)字”和“來(lái)源”出現(xiàn),他就會(huì)直接跳過(guò)?!澳蔷湓捒雌饋?lái)是對(duì)的,但大多數(shù)時(shí)候你找不到來(lái)源”。
一張貼在工作站上的便利貼上寫(xiě)著八個(gè)字:“AI寫(xiě)得快,錯(cuò)誤更快”。
02·“AI說(shuō)支持退貨,顧客讓我們賠錢”|電商客服
王萌是一家電商平臺(tái)的客服主管,負(fù)責(zé)一個(gè)十幾人的小團(tuán)隊(duì)。去年,公司開(kāi)始引入一套基于國(guó)內(nèi)大型AI演講輔助系統(tǒng)的標(biāo)準(zhǔn)回復(fù),可以一鍵生成售后場(chǎng)景,如物流延遲解釋、退款規(guī)則說(shuō)明、簽約流程提醒等。
起初,效果非常好。
在高峰期,該系統(tǒng)為客戶服務(wù)節(jié)省了近30%的打字時(shí)間??蛻舴?wù)只需輸入問(wèn)題關(guān)鍵字,就可以快速調(diào)用模板回復(fù),然后手動(dòng)進(jìn)行個(gè)性化調(diào)整,效率要高得多。
一直到春節(jié)前的一場(chǎng)售后糾紛。
一位客戶申請(qǐng)退貨,原本被拒絕,因?yàn)樯唐穼儆凇跋迺r(shí)秒殺,賣不退”的范疇。但十分鐘后,客戶在平臺(tái)上發(fā)了一張截圖,顯示客服回復(fù)中明確寫(xiě)道:
"按照平臺(tái)規(guī)則,您可以在簽收后七天內(nèi)享有無(wú)理由退貨的權(quán)利."
這個(gè)句子不是手工制作的,而是AI生成可以自動(dòng)插入的。當(dāng)時(shí)客服操作匆忙,直接發(fā)回復(fù),沒(méi)有修改。
問(wèn)題在于,商品頁(yè)面上明確標(biāo)注“不支持無(wú)理由退貨”。
因此,客戶投訴平臺(tái)“誤導(dǎo)性承諾”,要求退款。最后,公司決定對(duì)客戶進(jìn)行一次性賠償,并在內(nèi)部通知此事?;仡櫷趺鹊牧奶煊涗?,確認(rèn)這句話確實(shí)是系統(tǒng)生成的模板內(nèi)容。
王萌說(shuō):“它沒(méi)有說(shuō)錯(cuò)平臺(tái)規(guī)則,但是它不知道它們的產(chǎn)品不合適。
之后,公司立即調(diào)整了AI功能權(quán)限,關(guān)閉了“自動(dòng)插入回復(fù)”選項(xiàng),只保留了“人工確認(rèn)后發(fā)送”的機(jī)制。她還做了一輪新的培訓(xùn),要求座位團(tuán)隊(duì)重新學(xué)習(xí)不同類別的售后條款。
她說(shuō):“AI并不真正理解規(guī)則,它只是預(yù)測(cè)我們會(huì)怎么說(shuō)。但是客戶服務(wù)無(wú)法通過(guò)預(yù)測(cè)來(lái)應(yīng)對(duì)例外。
03·“我第一次用AI做課件,它給我編了一個(gè)概念”|培訓(xùn)師
蔡倩是一名職業(yè)培訓(xùn)師,從事職場(chǎng)技能課程,有時(shí)是平臺(tái)直播,有時(shí)是公司內(nèi)部培訓(xùn)。她講了很多關(guān)于“如何做品牌定位”和“新媒體營(yíng)銷路徑”的話題,節(jié)奏緊張,信息量大,對(duì)內(nèi)容更新要求高。
去年,她第一次接觸到AI寫(xiě)作工具,正在準(zhǔn)備一個(gè)在線課程。
在那節(jié)課上,她說(shuō)“品牌情感價(jià)值”,她認(rèn)為AI可以幫助她節(jié)省一些時(shí)間去尋找例子。她讓AI生成了一個(gè)開(kāi)場(chǎng)段落,希望它能提供一組“當(dāng)代年輕人的情感消費(fèi)偏好”的數(shù)據(jù),引入情感價(jià)值的核心概念。
AI反應(yīng)幾乎是完美的——幾秒鐘后,她寫(xiě)了一段邏輯流暢、語(yǔ)氣嚴(yán)謹(jǐn)?shù)亩温洌昧艘唤M“超過(guò)60%的年輕人喜歡有情感表達(dá)的品牌”,并提到了“最新研究”。
看完之后,她毫不懷疑,語(yǔ)氣“太像PPT了”,一段直接貼在第一頁(yè)。
直播當(dāng)天,她剛剛完成開(kāi)場(chǎng)部分,一名學(xué)生在評(píng)論區(qū)留言:“老師,這個(gè)研究是從哪里來(lái)的?我們公司想?yún)⒖家幌?。?/p>
她下意識(shí)地驚呆了,試圖回憶起自己來(lái)自哪里,但她不記得了。下課后,她查了幾個(gè)公共數(shù)據(jù)平臺(tái),找不到類似的數(shù)據(jù)和數(shù)字。她終于明白,“引用”其實(shí)是AI憑空拼接的錯(cuò)覺(jué)。
她說(shuō):“這寫(xiě)得太像真的了。”“我第一次用它,就中了招?!?/p>
從那以后,她制定了一個(gè)規(guī)則:只允許AI提供結(jié)構(gòu)建議,而不是接受它寫(xiě)的“事實(shí)”。她必須手動(dòng)檢查數(shù)字、百分比和時(shí)間節(jié)點(diǎn)的所有區(qū)域兩次。
“它最大的問(wèn)題是它太能模仿‘專業(yè)演講’了。我們模仿得越多,就越容易放棄判斷?!彼f(shuō):“但是我要對(duì)課堂上的每一句話負(fù)責(zé),所以我不需要?!?/p>
04·“我是做AI的,但是我從來(lái)不讓它決定”|AI產(chǎn)品經(jīng)理
高哲所在的公司,是一家To公司 AI創(chuàng)業(yè)團(tuán)隊(duì)B智能應(yīng)用。與普通用戶相比,他負(fù)責(zé)產(chǎn)品設(shè)計(jì),與各種國(guó)產(chǎn)大型模型打交道的時(shí)間要早上兩年。
幾乎每天都在使用AI。
需求文檔、競(jìng)爭(zhēng)產(chǎn)品分析、PRD文稿、用戶故事地圖、市場(chǎng)調(diào)研報(bào)告...他為自己設(shè)定了一套“效率模板”:利用AI制定結(jié)構(gòu),快速分類觀點(diǎn),統(tǒng)一術(shù)語(yǔ)措辭,節(jié)省前60%的精神負(fù)擔(dān)。剩下的40%,然后自己修改和打磨。
他說(shuō):“不是我相信它,而是我太熟悉它了。
來(lái)自一次“內(nèi)部演示事故”,他對(duì)AI幻覺(jué)的警惕。
那天,他用文心寫(xiě)了一篇關(guān)于行業(yè)發(fā)展前景的解釋,希望在會(huì)上展示“AI在市場(chǎng)分析方面的輔助能力”。模型寫(xiě)得很流暢,包括年份、增速百分比、行業(yè)預(yù)測(cè),甚至引用了看似具體的“研究方向”。
結(jié)果演示前10分鐘,他臨時(shí)決定復(fù)習(xí)一次,發(fā)現(xiàn)“預(yù)測(cè)”中引用的年份是錯(cuò)誤的,“下降2.7%”的描述找不到任何來(lái)源。整段拼得太順利,讓人忽略了檢查的步驟。
“我當(dāng)時(shí)就意識(shí)到,不是因?yàn)閷?xiě)得不好,而是因?yàn)閷?xiě)得太像了。”高哲說(shuō):“它會(huì)產(chǎn)生‘演講級(jí)別的信心’,但你不知道它是否在胡說(shuō)八道?!?/p>
之后,他為自己的團(tuán)隊(duì)建立了一套機(jī)制:
AI產(chǎn)生的內(nèi)容必須標(biāo)明來(lái)源;任何沒(méi)有來(lái)源的部分都必須經(jīng)過(guò)人工驗(yàn)證;AI不能直接定稿涉及客戶交付或關(guān)鍵判斷的內(nèi)容,需要兩人以上確定。
他還在文檔合作平臺(tái)上制定了“AI片段提示”功能:系統(tǒng)通過(guò)AI生成的所有段落自動(dòng)添加“AI生成內(nèi)容”亮點(diǎn)標(biāo)簽,方便團(tuán)隊(duì)合作時(shí)特別注意看到什么。
他說(shuō):“AI不是作家,它是個(gè)腦暴助手?!薄澳悴荒茏屗鼛湍阕鰶Q定,只能讓它幫你擴(kuò)散?!?/p>
AI只負(fù)責(zé)生成概率,人們負(fù)責(zé)選擇合理性,這是他的默認(rèn)邏輯。
現(xiàn)在他讓團(tuán)隊(duì)中的年輕產(chǎn)品經(jīng)理盡可能多地使用AI——不是因?yàn)樗麄兿嘈潘鼫?zhǔn)確,而是因?yàn)樗麄冊(cè)诠ぷ髦懈绲匾庾R(shí)到:“你最終會(huì)對(duì)AI的每一個(gè)建議負(fù)責(zé)?!?/p>
05·“AI為什么要編輯?由于它根本不知道真?zhèn)巍保糜X(jué)原理分析
在語(yǔ)言模型的世界里,沒(méi)有“真?zhèn)巍?,只有“概率”?/p>
AI幻覺(jué),這個(gè)術(shù)語(yǔ)聽(tīng)起來(lái)像是技術(shù)世界的詩(shī)意表達(dá),但本質(zhì)非常具體——它指的是大模型產(chǎn)生的內(nèi)容,語(yǔ)法正確,邏輯流暢,但與事實(shí)不符。比如不存在的報(bào)告,編造的數(shù)據(jù),拼接的結(jié)論。
AI并非“錯(cuò)誤”,而是AI完成任務(wù)的方式本來(lái)就不依賴事實(shí)。
大多數(shù)人認(rèn)為AI就像一個(gè)搜索引擎,可以“搜索”正確答案。其實(shí)更像是一個(gè)“非常自信的語(yǔ)言預(yù)測(cè)器”——你給它一個(gè)開(kāi)頭,它根據(jù)龐大的語(yǔ)言訓(xùn)練數(shù)據(jù)“猜測(cè)”下一個(gè)詞最有可能是什么,拼出一個(gè)“看起來(lái)合理”的詞。
其訓(xùn)練目標(biāo),從不是“說(shuō)實(shí)話”,而是“說(shuō)得像人”。
正是因?yàn)槿绱?,它?xiě)的段落通常句型流暢,術(shù)語(yǔ)專業(yè),邏輯流暢,甚至模仿“權(quán)威”引用的方式。對(duì)于用戶來(lái)說(shuō),這些特征“降低了警惕”。
它不會(huì)說(shuō)謊,它只是編得太像真了。
特別是在中文場(chǎng)景中,這種幻覺(jué)更容易放大。
互聯(lián)網(wǎng)行業(yè)評(píng)論家彭德宇告訴坤輿商業(yè)觀察:一方面,漢語(yǔ)表達(dá)具有高度的抽象性和結(jié)構(gòu)彈性:一個(gè)概念可以不定義,一個(gè)數(shù)字可以不標(biāo)記來(lái)源,一個(gè)觀點(diǎn)可以沒(méi)有主題。在生成內(nèi)容時(shí),模型更容易用“語(yǔ)言慣性”來(lái)組織句子,而不自覺(jué)地繞過(guò)事實(shí)進(jìn)行驗(yàn)證。另一方面,中文開(kāi)源語(yǔ)料中充斥著大量的二手信息、模板文章、商業(yè)軟文和平臺(tái)內(nèi)容,沒(méi)有標(biāo)注來(lái)源。這些內(nèi)容在AI培訓(xùn)中沒(méi)有“事實(shí)權(quán)重”的區(qū)別——它們會(huì)把“說(shuō)得更好”當(dāng)成人類學(xué)習(xí)語(yǔ)言中的“對(duì)”。
這種幻覺(jué)并非個(gè)別事件,而是一種結(jié)構(gòu)性風(fēng)險(xiǎn)。
這種情況最常見(jiàn)于以下幾種情況:
?引用內(nèi)容:編造機(jī)構(gòu)名稱,白皮書(shū),調(diào)查報(bào)告;
?列出數(shù)據(jù)時(shí):拼接不相關(guān)的數(shù)字,甚至創(chuàng)建自己的比例;
?提及政策/法規(guī)時(shí):使用落伍信息或偽造條款;
?得出結(jié)論時(shí):將常見(jiàn)的邏輯鏈拼接起來(lái),但不會(huì)有事實(shí)基礎(chǔ);
而且這些內(nèi)容正是很多職場(chǎng)人最依賴AI的地方。
科大訊飛董事長(zhǎng)劉慶峰曾表示,生成型人工智能存在幻覺(jué),特別是深層推理模型的邏輯自洽性提高,使得AI生成的內(nèi)容難以辨別。
360集團(tuán)創(chuàng)始人周鴻祎也在兩會(huì)期間告訴媒體,雖然AI幻覺(jué)有利于文藝創(chuàng)作,但在AI安全方面,幻覺(jué)可能會(huì)帶來(lái)嚴(yán)重的問(wèn)題。比如在醫(yī)療、法律、金融等專業(yè)領(lǐng)域,一旦隨意編造大模型,就會(huì)帶來(lái)嚴(yán)重的后果。
坤輿的商業(yè)觀察也認(rèn)為:“我們太容易把AI寫(xiě)的東西當(dāng)成出處和可靠的內(nèi)容。其實(shí)它只是比你寫(xiě)‘似乎有出處’的句子。”幻覺(jué)是生成式AI寫(xiě)作不可避免的副產(chǎn)物。就像你教寶寶說(shuō)話,卻不告訴他什么是真的,他只會(huì)模仿大人說(shuō)的“重現(xiàn)世界”,卻不理解這個(gè)世界。
06·“它沒(méi)有說(shuō)謊,但是我們必須學(xué)會(huì)布防”|應(yīng)對(duì)平臺(tái)和用戶的機(jī)制
面對(duì)AI幻覺(jué),沒(méi)有人能夠完全幸免。但是越來(lái)越多的AI用戶正在學(xué)習(xí)“布防”。
彭德宇認(rèn)為,面對(duì)頻繁的幻覺(jué),不僅僅是用戶在承擔(dān)后果。越來(lái)越多的廠商開(kāi)始意識(shí)到,讓AI“看起來(lái)像”并不意味著“說(shuō)得對(duì)”。沒(méi)有廠商敢說(shuō)“我們解決了幻覺(jué)”,但至少他們開(kāi)始正視它——開(kāi)始標(biāo)記、阻止和約束,試圖用一層一層的提示、審批線和知識(shí)庫(kù)來(lái)包裹這個(gè)問(wèn)題,防止它輕易流向公眾。
“這只是幻覺(jué)的根本問(wèn)題,至今仍懸而未決。模型的底層邏輯仍然在預(yù)測(cè)單詞和句子,而不是判斷事實(shí)。AI還是不會(huì)輕易告訴你:“我其實(shí)是編這句話的?!钡吘蛊脚_(tái)能做的有限。幻覺(jué)不是“個(gè)別錯(cuò)誤”,而是AI生成機(jī)制的一部分。徹底消除它是不現(xiàn)實(shí)的,就像要求人類寫(xiě)作永遠(yuǎn)不會(huì)出錯(cuò)一樣?!迸淼掠钐岬?。
由于這個(gè)原因,越來(lái)越多的企業(yè)開(kāi)始將“AI使用規(guī)則”納入日常管理體系:
?在面對(duì)“AI協(xié)助生成內(nèi)容”時(shí),內(nèi)容平臺(tái)要求員工多次校對(duì);
?在使用AI工具編寫(xiě)合同時(shí),品牌所有者應(yīng)建立“二次審批”機(jī)制;
?教育學(xué)院提示講師:“只用AI寫(xiě)句型,不用它寫(xiě)結(jié)論”;
這些變化背后的共識(shí)是:
人工智能的幻覺(jué)是可控的,但是責(zé)任必須明確。
AI不會(huì)為你做決定,也不會(huì)為一個(gè)錯(cuò)誤的引用道歉。它的工作是生成的,判斷仍然屬于人。
AI進(jìn)入職場(chǎng)的速度太快了,很多人還沒(méi)來(lái)得及建立界限?;糜X(jué)只是告訴我們,任何新工具的使用,在理解了它的局限性之后,都是真正有意義的。
07·“真正的智慧,就是在幻覺(jué)中保留判斷力”|末尾
AI幻覺(jué)并非一種技術(shù)缺陷,它是我們必須共同面對(duì)的時(shí)代“共病”。
它不屬于某個(gè)人,也不屬于某個(gè)平臺(tái)。它隱藏在無(wú)數(shù)邏輯流暢、語(yǔ)氣專業(yè)的內(nèi)容背后,在我們不想驗(yàn)證、來(lái)不及判斷、急于工作的時(shí)候悄然落地。
你用它來(lái)補(bǔ)充文案,我用它來(lái)改變合同。他用它來(lái)寫(xiě)劇本——AI就像一種氣體,滲透到每一個(gè)內(nèi)容的縫隙中。它讓我們變得更快,也讓我們變得太快,忘記驗(yàn)證,忽略來(lái)源,放棄懷疑。
在坤輿商業(yè)觀察訪談的幾位受訪者中,沒(méi)有一位說(shuō)過(guò)“我再也不用AI了”。
他們?nèi)匀辉谑褂茫踔粮嗟厥褂盟?。但是他們變得?jǐn)慎了——有些人只用它來(lái)寫(xiě)結(jié)構(gòu),有些人只讓它提供措辭,有些人干脆設(shè)置“標(biāo)簽”來(lái)警告自己:這句話不一定是真的。
也許這就是我們真正進(jìn)入AI時(shí)代的標(biāo)志:并非AI取代了誰(shuí),而是每一個(gè)使用它的人,都必須重新學(xué)習(xí)“判斷”這個(gè)問(wèn)題本身。
技術(shù)沒(méi)有對(duì)錯(cuò),它只專注于“像人類”。但人類之所以不同,不是因?yàn)樗麄儠?huì)說(shuō)話,而是因?yàn)樗麄冊(cè)敢馔O聛?lái)分辨一句話是否可靠。
真正的智慧,不是讓AI為你著想,而是你知道它何時(shí)不應(yīng)該被信任。
(根據(jù)要求,上述受訪者均為化名)
本文來(lái)自微信微信官方賬號(hào)“坤輿商業(yè)觀察”,作者:高見(jiàn),36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com