亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<li id="x49ky"></li>

<span id="x49ky"></span>

<bdo id="x49ky"></bdo>

Bing Chat越來越“愚蠢”，但是微軟無法解決這個問題。

商界觀察

2023-08-17

隨著時間的推移，AI聊天機器人的使用越來越差，似乎已成為全球用戶的共同體驗。

例如微軟的Bing Chat，即使在GPT-4的支持下，并且打開了創(chuàng)造性的方法，也經(jīng)常會出現(xiàn)經(jīng)?；乇軉栴}或無法回復(fù)的情況。許多網(wǎng)民在海外社交媒體Reddit上嘲笑Bing。 Chat已經(jīng)變得不那么有趣了，回答的內(nèi)容也不再幽默，不再快樂，讓人覺得是冷酷無人的設(shè)備。

更有甚者，一些顧客試圖要求Bing。當Chat圍繞一個虛構(gòu)人物進行演繹時，當知道相關(guān)的討論是無害的時候，Bing 事實上，Chat認為這種行為是有風險的。事實上，微軟也承認Bing。在給出的相關(guān)回復(fù)中，Chat性能下降的事實表明，我們正在積極監(jiān)控客戶的反饋，并計劃在不久的將來做出改變，以解決相關(guān)問題。

事實上，自今年2月初內(nèi)測以來，New Bing經(jīng)歷了幾次大大小小的更新，從一開始的“牛Bing”開始。、最后，微軟一直在努力做一個讓大家滿意的AI模型，從“賽博”到“New病”，再到提供準確、平衡、創(chuàng)造力三種方式。

但是現(xiàn)在看來，似乎有點適得其反，而ChatGPT這種大語言模式(以下簡稱LLM)之所以能夠在2022年秋季爆紅，是因為ChatGPT比以往任何類似的產(chǎn)品都更智能，或者說更像是人，因為它在AI熱退燒后重新點燃了外界對它未來的熱情。

01

巧合的是，ChatGPT現(xiàn)在已經(jīng)開始被用戶吐槽，逐漸出現(xiàn)速度變慢、回復(fù)復(fù)雜、聊天主題單一乏味等問題。事實上，這種聊天機器人的商品性能下降并不是一個孤立的事件，而是發(fā)生在不同制造商的LLM中。

事實上，這種現(xiàn)象已經(jīng)被業(yè)界注意到了。例如，為了驗證ChatGPT的行為如何隨著時間的推移而變化，斯坦福大學和加州大學伯克利分校的研究人員在今年3月和6月測試了GPT-4的兩個版本。測試內(nèi)容涵蓋四個部分:數(shù)學問題、敏感問題答案、代碼生成和視覺推理。

最終的測試結(jié)果也證明了ChatGPT能力的下降，例如在數(shù)學和視覺推理部分，研究人員使用了思維鏈（chain-of-thought，CoT）技術(shù)，讓LLM模擬人類思維的過程，幫助LLM生成一條推理路徑，將復(fù)雜的推理問題分解成幾個簡單的步驟，而不僅僅是直接從語料庫中擬合最終答案。

不過，數(shù)據(jù)顯示，GPT-4表現(xiàn)出顯著的飄移，從三月到六月，GPT-四是數(shù)學問題的準確性從97.6%下降到2.4%，同時答案長度也會下降90%以上。

但是在視覺推理方面，6月份的GPT-4在之前3月份正確回答的一些查詢中出現(xiàn)了錯誤。也就是說，6月份不可能給出3月份正確結(jié)果的問題。

如今，相當多的程序員每天都在使用AI編寫代碼，但研究人員發(fā)現(xiàn)，3月份GPT-4輸出代碼的50%以上可以直接實現(xiàn)，但6月份這個數(shù)字只有10%。而且這還不是最夸張的，在回答敏感問題時，GPT-4的直接回答率從21%下降到5%。即使在拒絕回答不當問題時，6月份的GPT-4版本也側(cè)重于不向用戶提供解釋。

一般來說，事物的發(fā)展通常呈螺旋狀上升，在信息技術(shù)領(lǐng)域呈現(xiàn)出跳躍狀態(tài)?！敖裉觳蝗绻糯钡那闆r是獨一無二的。那么問題來了?！翱蒲锌靠脊拧钡目赡苄灾挥幸环N，那就是整個行業(yè)已經(jīng)崩潰，現(xiàn)在還在重建。但是AI模型簡單的前沿技術(shù)沒有類似的問題，所以肯定很奇怪。

02

當前網(wǎng)絡(luò)上最主流的聲音，是ChatGPT、Bing Chat能力下降是平衡客戶體驗的結(jié)果。歸根結(jié)底，ChatGPT生成內(nèi)容需要消耗計算能力，客戶需要的計算率越多，但是OpenAI、自半年以來，微軟購買計算率資源的速度一直與用戶增長不符，導致響應(yīng)速度下降?？蛻粢抨爢栠@類產(chǎn)品，問題數(shù)量有限。所以在這種情況下，降低性能來平衡響應(yīng)速度就是一種不難想到的解決辦法。

當然，更深層次的核心矛盾是AI倫理問題，也就是幾個月前引起了很多討論的“AI可能會給人類帶來滅絕風險”。對AI的焦慮甚至讓OpenAI創(chuàng)始人奧特曼參加了美國參議院的聽證會，這讓他在過去的幾個月里一直在世界各地“傳道”。不受控制的人工智能將成為摧毀人類文明的罪魁禍首，這無疑是科幻小說的一個重要主題，因此自誕生以來，人工智能失控的焦慮就存在于這項技術(shù)中。

這也導致了一個控制AI的概念“AI對齊”，即AI系統(tǒng)的目標要與人類的價值觀和利益對齊，這樣才能滿足設(shè)計師的利益預(yù)期，不會造成意想不到的有害后果，比如生成各種不當言論。事實上，微軟和OpenAI公司不可避免地會進行AI對齊。例如，2016年微軟發(fā)布的聊天機器人Tay發(fā)布了種族歧視內(nèi)容，這直接導致其在開始工作之前死亡。

03

然而，強迫AI遵循人類的價值觀是一件反直覺的事情。開發(fā)者需要指定正確的目標函數(shù)，以確定應(yīng)該提供什么樣的反饋來正確引導AI。

此外，我們甚至需要證明提供這些反饋是合理的，這無疑是目前難以解決的技術(shù)問題。那么問題來了。如果你想讓一個人不去想，糾正他的思維方式，最直觀的方法是什么？當然，諾貝爾獎中的黑歷史前腦葉白質(zhì)摘除術(shù)直接從物理上消除了人類的思維能力。

回到AI領(lǐng)域也是如此。微軟研究所發(fā)表的一篇論文證實，任何AI對齊的AI模型都會失去它的準確性和性能。由于ChatGPT是基于人類反饋的增強學習來構(gòu)建智能的產(chǎn)品，人工強制干預(yù)的AI對齊會阻礙大模型理解任務(wù)的真實水平。因此，自然，AI大模型的性能會出現(xiàn)開場即巔峰的情況。

但無論是計算率緊張還是AI倫理限制，短時間內(nèi)幾乎沒有解決辦法。所以客戶體驗高開低走是必然的，相關(guān)企業(yè)也不太可能處理這個問題。

本文來自微信微信官方賬號“三易生活”（ID：IT-作者：三易菌，36氪經(jīng)授權(quán)發(fā)布，3eLife)。

本文僅代表作者觀點，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請及時與我們聯(lián)系進行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

前三季度78家企業(yè)登陸A股，IPO融資額已超去年全年

劉強東“10年1元年薪”之約到期，律師解構(gòu)高凈值人群如何妥善處理財產(chǎn)

工信部擬推新規(guī)：劃定輔助駕駛安全紅線終結(jié)模糊營銷時代

西貝翻車事件最可怕后續(xù)！上海家長們這次是真怒了……

華為發(fā)布十大技術(shù)趨勢 2035年算力總量增長10萬倍

<label id="urd9a"></label>

<span id="urd9a"></span>