OpenAI悄悄下架AI檢測(cè)器,“用AI監(jiān)管AI”暫不奏效
常言道," 一物降一物 ",但對(duì)現(xiàn)在的生成式 AI 來說,事情也許很難如此。
據(jù) TechCrunch,OpenAI 于 7 月 20 日悄悄下架了其 AI 檢測(cè)器,但因?yàn)檫^于低調(diào),不少人還沒有發(fā)現(xiàn)。
OpenAI 的通知顯示,下架是因?yàn)闄z測(cè)的準(zhǔn)確率過低。OpenAI 團(tuán)隊(duì) " 會(huì)繼續(xù)研究更有效的文本技術(shù) ",希望未來能夠?qū)?AI 生成的音頻、視頻內(nèi)容進(jìn)行檢測(cè)。
ChatGPT 爆火以來,AI 生成文本在各行各業(yè)得到了更廣泛的應(yīng)用。但比起廣泛應(yīng)用,AI 生成內(nèi)容引發(fā)了人們更大的擔(dān)憂—— AI 或許會(huì)成為更大的假新聞源頭、泄露人們數(shù)據(jù)和隱私。
AI 生成內(nèi)容引發(fā)的現(xiàn)實(shí)問題也不絕于耳——典型案例是是在大學(xué)里,學(xué)生們用 ChatGPT 生成論文,已經(jīng)擾亂了學(xué)校的教學(xué)秩序,不少學(xué)校已經(jīng)明令禁止在學(xué)術(shù)場(chǎng)景下使用 ChatGPT。
面對(duì)洶涌的輿論,OpenAI 在今年 2 月就迅速推出應(yīng)對(duì)方案,也就是這款 AI 文本檢測(cè)器。
AI 文本檢測(cè)器的主要功能,是用來判斷文本是否由人工智能生成。此前,在檢測(cè)過程中,用戶無需付費(fèi),只要將所檢測(cè)的文本復(fù)制到檢測(cè)器上,就可以檢查到內(nèi)容是否為 AI 生成。OpenAI 也沒有限定可以檢測(cè)的文本限定類型,用戶可以檢測(cè)包括郵件、文章以及論文在內(nèi)的文件。
然而直到下架,這款產(chǎn)品壽命只有短短半年。
AI 文本檢測(cè)器其實(shí)一開始就并不完美。據(jù) OpenAI 公布的數(shù)據(jù),AI 檢測(cè)器在識(shí)別 AI 生成文本方面的正確率為 26%,同時(shí)將人類所寫的內(nèi)容識(shí)別為 AI 生成的錯(cuò)誤率為 9%。
在發(fā)布檢測(cè)器時(shí),OpenAI 就表明 "AI 文本檢測(cè)器并不完全可靠 "。同時(shí),OpenAI 團(tuán)隊(duì)也承認(rèn),檢測(cè)器很容易將人類寫的文本識(shí)別為 AI 寫的,AI 生成的文本性內(nèi)容如果經(jīng)過人類編輯,AI 也無法進(jìn)行準(zhǔn)確地識(shí)別。
OpenAI 已經(jīng)大模型應(yīng)用中的技術(shù)領(lǐng)頭羊。如今 AI 檢測(cè)器的下架,某種程度上也意味著,人們現(xiàn)在可能還沒有更好的方式監(jiān)管 AI。" 用 AI 監(jiān)管 AI" 的路子,可能還不太能走通。
近期的一則斯坦福研究,也得出了同樣的結(jié)論。
數(shù)位斯坦福的專家教授對(duì)目前主流的七款 AI 文本檢測(cè)器進(jìn)行了測(cè)試,研究結(jié)果顯示,一些檢測(cè)器生成的 99% 的準(zhǔn)確率具有 " 誤導(dǎo)性 "。非英語母語的人寫的文章,常被錯(cuò)誤地標(biāo)識(shí)為由 AI 生成,這會(huì)嚴(yán)重影響母語非英語的使用者如學(xué)生、學(xué)者以及求職者,也會(huì)很容易增加他們被歧視的可能性。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com