亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

聊天機器人胡言亂語？牛津研究人員利用語義熵識破 AI“幻覺”

2024-06-25

IT 世家 6 月 24 近年來，人工智能蓬勃發(fā)展，聊天機器人等應用逐漸普及。人們可以從這些聊天機器人中獲得簡單的指令(例如 ChatGPT）獲取信息。但是，這些聊天機器人仍然容易出現(xiàn)“幻覺”問題，即提供錯誤的答案，有時甚至是危險的信息。

圖源 Pexels

“幻覺”的原因之一是訓練數(shù)據(jù)不準確、泛化能力不足、數(shù)據(jù)收集過程中的副作用。然而，牛津大學的研究人員采取了不同的方法，并在最新出版的《自然》雜志上闡述了他們新開發(fā)的方法，用于檢測大型語言模型 ( LLMs ) 的"編造" ( 即隨意生成的不正確信息 ) 問題。

LLM 通過在訓練數(shù)據(jù)中找到特定的模式來生成答案。但是這種方法并不總是有效的，就像人類可以從云的形狀中看到動物一樣，AI 機器人也可以找到不存在的方法。但是，人們知道云只是一個形狀，天空中沒有漂浮的巨大大象。LLM 這可能被視為真實的，然后“編造”出不存在的新技術和其他虛假信息。

牛津大學的研究人員運用語義熵的概念，通過概率來判斷 LLM 是否存在“幻覺”？。語義熵是指同一句話有多種含義的情況，例如，" desert “可以指沙漠，也可以指拋棄某人。” LLM 當你使用這種詞語時，你可能會對表達的意思感到困惑。研究人員旨在通過檢測語義熵來判斷 LLM 輸出內容沒有“幻覺”的可能。

使用語義熵的優(yōu)點是可以快速檢測，無需額外的監(jiān)督或加強學習。 LLM “幻覺”問題。由于這種方法不依賴于特定任務的數(shù)據(jù)，所以即使是 LLM 面對從未遇到過的新任務，也可以應用。這將大大提高用戶對于用戶的應用。 LLM 信任，即使是 AI 第一次遇到問題或指令。

研究小組說：“我們的方法可以幫助用戶理解什么時候必須？ LLM 保持謹慎的輸出，并因不可靠而受到限制 LLM 應用程序開辟了一個新世界。

假如語義熵被證明是一種有效的“幻覺”檢測方法，那么我們就可以使用這種工具對人工智能輸出進行雙重檢查，使之成為更可靠的合作伙伴。不過 IT 家庭需要注意的是，即使配置了最先進的錯誤檢測工具，就像人類并非無可挑剔一樣，LLM 還是有可能出錯的。所以，永遠是對的 ChatGPT 等待聊天機器人提供的答案進行仔細檢查仍是明智之舉。

本文僅代表作者觀點，版權歸原創(chuàng)者所有，如需轉載請在文中注明來源及作者名字。

免責聲明：本文系轉載編輯文章，僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布，請及時與我們聯(lián)系進行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

看到北京婚外情“劇本殺”慘案，才明白為什么自古以來奸情出人命！

金山這所中學這樣做，探索高中育人的新方式?！?

中國第一個涼爽的城市，沒有夏天。

攜手出線！1-1瑞士德國瑞士在德國排名第二菲爾克魯格補時絕平

100分鐘殺人！1-0蘇格蘭匈牙利匈牙利3分第三蘇格蘭1分墊底出局

項目推薦

康小虎 · 健康小屋

<center id="z92lv"></center>

<rt id="z92lv"><small id="z92lv"><rt id="z92lv"></rt></small></rt>

<rt id="z92lv"><tr id="z92lv"></tr></rt>

<center id="z92lv"></center>

<center id="z92lv"><optgroup id="z92lv"></optgroup></center>