維基百科宣戰(zhàn)AI內(nèi)容:能否阻斷互聯(lián)網(wǎng)污染?
自ChatGPT風(fēng)靡全球后,許多有識(shí)之士預(yù)言,生成式人工智能生成的內(nèi)容將“污染”互聯(lián)網(wǎng)。現(xiàn)實(shí)的確如此,從知乎、小紅書、抖音等內(nèi)容平臺(tái),到微信朋友圈,再到淘寶、拼多多,AI生成的垃圾內(nèi)容幾乎滲透到互聯(lián)網(wǎng)的各個(gè)角落。

隨著AI生成的內(nèi)容日益增多,互聯(lián)網(wǎng)上真正“人寫的東西”愈發(fā)難尋。為此,維基百科近日做出新決定,賦予管理員更高權(quán)限,在特定條件下可迅速刪除AI生成的內(nèi)容。
維基百科編輯表示,“總體而言,AI內(nèi)容的泛濫被視為對(duì)維基百科的一種‘生存威脅’。我們的工作流程向來依賴討論與共識(shí)構(gòu)建,若缺乏快速刪除機(jī)制,AI高效生成的大量虛假內(nèi)容將成為嚴(yán)重問題。”
具體來說,維基百科會(huì)立刻刪除“AI味過重”的內(nèi)容,比如“作為一個(gè)大語言模型,我XXXX”等生成式AI工具的經(jīng)典話術(shù),或是引用出現(xiàn)明顯錯(cuò)誤的內(nèi)容,這也是生成式AI常見錯(cuò)誤,它們會(huì)引用根本不存在的文獻(xiàn)、論文。
實(shí)際上,維基百科對(duì)AI內(nèi)容如臨大敵是有原因的,兩個(gè)月前他們?cè)鴩L試擁抱AI。今年6月起,維基百科部分頁面加入類似谷歌AI概覽的AI總結(jié)內(nèi)容,以折疊形式呈現(xiàn)并標(biāo)注“沒有經(jīng)過驗(yàn)證”,但這一實(shí)驗(yàn)引發(fā)了維基百科志愿者和用戶的強(qiáng)烈抵制。

維基百科的內(nèi)容創(chuàng)作者和消費(fèi)者抵制AI是有道理的。作為全球最大且最受歡迎的網(wǎng)絡(luò)百科全書,維基百科由全球志愿者合作編撰,其核心價(jià)值是可靠性、可追溯性和人人可編輯。其中的內(nèi)容是不同語言、背景的志愿者精心打磨、確認(rèn)的成果,因此成為互聯(lián)網(wǎng)上優(yōu)質(zhì)、權(quán)威的內(nèi)容。
對(duì)于百科全書類產(chǎn)品,內(nèi)容的真實(shí)性和可靠性是基石,而目前AI生成內(nèi)容的最大問題就是不可靠。如今AI模型常因幻覺而胡說八道,答非所問、前后矛盾的現(xiàn)象屢見不鮮,沒有廠商能保證自己的AI模型不會(huì)胡編亂造。

所以在生產(chǎn)環(huán)境使用生成式AI,幾乎都離不開人類員工的后期校正。比如AI客服答非所問激怒用戶,需人工客服補(bǔ)救;AI生圖產(chǎn)出違背物理規(guī)律的圖片,需人類畫師潤色,這些都是互聯(lián)網(wǎng)、游戲等行業(yè)的真實(shí)案例。
但維基百科并非商業(yè)實(shí)體,而是開源社區(qū)和眾創(chuàng)空間。任何人注冊(cè)賬號(hào)就能成為志愿者編輯和更新百科內(nèi)容,低參與門檻使內(nèi)容豐富多樣,但也導(dǎo)致編輯者素質(zhì)參差不齊。
維基百科運(yùn)營團(tuán)隊(duì)稱,對(duì)明顯AI生成內(nèi)容一刀切,是因?yàn)榇罅恐驹刚呱踔廖赐ㄗx所提交內(nèi)容?!叭绻驹刚哌B基本問題都不檢查,可合理推定他們沒審閱內(nèi)容,只是照搬,這種條目毫無價(jià)值?!?/p>

如今,不僅維基百科,F(xiàn)acebook、YouTube等平臺(tái)也在積極打擊AI生成的垃圾內(nèi)容。與谷歌和Meta因擔(dān)憂機(jī)器生成內(nèi)容、點(diǎn)贊評(píng)論使人類成為旁觀者,導(dǎo)致真實(shí)用戶逃離,影響平臺(tái)商業(yè)價(jià)值而采取行動(dòng)相比,維基百科運(yùn)營團(tuán)隊(duì)堪稱理想主義。
近年來,維基百科是AI廠商爬蟲重點(diǎn)“光顧”對(duì)象。自2024年1月以來,維基共享資源上存放的1.44億個(gè)圖像、視頻或其他文件帶寬增長(zhǎng)50%,但流量并非來自人類用戶,而是AI廠商的爬蟲。

維基百科受AI廠商重視是必然的,因?yàn)锳I模型訓(xùn)練需要高質(zhì)量語料數(shù)據(jù),而維基百科的內(nèi)容質(zhì)量在互聯(lián)網(wǎng)上處于第一梯隊(duì)。若維基百科放任AI生成的垃圾內(nèi)容泛濫,使用其數(shù)據(jù)訓(xùn)練AI模型的廠商將面臨訓(xùn)練效率下降的問題。
面對(duì)AI廠商近乎DDoS的“攻擊”,維基百科嚴(yán)控內(nèi)容質(zhì)量,這給了AI廠商繼續(xù)爬取其內(nèi)容的理由,可謂理想主義爆棚。但問題是,僅靠維基百科自身,真能阻斷AI生成的垃圾內(nèi)容污染互聯(lián)網(wǎng)嗎?
本文來自微信公眾號(hào)“三易生活”(ID:IT - 3eLife),作者:三易菌,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





