亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

Bing Chat越來越“愚蠢”,但是微軟無法解決這個問題。

商界觀察
2023-08-17

隨著時間的推移,AI聊天機器人的使用越來越差,似乎已成為全球用戶的共同體驗。

 

例如微軟的Bing Chat,即使在GPT-4的支持下,并且打開了創(chuàng)造性的方法,也經(jīng)常會出現(xiàn)經(jīng)?;乇軉栴}或無法回復(fù)的情況。許多網(wǎng)民在海外社交媒體Reddit上嘲笑Bing。 Chat已經(jīng)變得不那么有趣了,回答的內(nèi)容也不再幽默,不再快樂,讓人覺得是冷酷無人的設(shè)備。

 

更有甚者,一些顧客試圖要求Bing。 當Chat圍繞一個虛構(gòu)人物進行演繹時,當知道相關(guān)的討論是無害的時候,Bing 事實上,Chat認為這種行為是有風險的。事實上,微軟也承認Bing。 在給出的相關(guān)回復(fù)中,Chat性能下降的事實表明,我們正在積極監(jiān)控客戶的反饋,并計劃在不久的將來做出改變,以解決相關(guān)問題。

 

事實上,自今年2月初內(nèi)測以來,New Bing經(jīng)歷了幾次大大小小的更新,從一開始的“牛Bing”開始。、最后,微軟一直在努力做一個讓大家滿意的AI模型,從“賽博”到“New病”,再到提供準確、平衡、創(chuàng)造力三種方式。

 

但是現(xiàn)在看來,似乎有點適得其反,而ChatGPT這種大語言模式(以下簡稱LLM)之所以能夠在2022年秋季爆紅,是因為ChatGPT比以往任何類似的產(chǎn)品都更智能,或者說更像是人,因為它在AI熱退燒后重新點燃了外界對它未來的熱情。

 

01

 

巧合的是,ChatGPT現(xiàn)在已經(jīng)開始被用戶吐槽,逐漸出現(xiàn)速度變慢、回復(fù)復(fù)雜、聊天主題單一乏味等問題。事實上,這種聊天機器人的商品性能下降并不是一個孤立的事件,而是發(fā)生在不同制造商的LLM中。

 

事實上,這種現(xiàn)象已經(jīng)被業(yè)界注意到了。例如,為了驗證ChatGPT的行為如何隨著時間的推移而變化,斯坦福大學和加州大學伯克利分校的研究人員在今年3月和6月測試了GPT-4的兩個版本。測試內(nèi)容涵蓋四個部分:數(shù)學問題、敏感問題答案、代碼生成和視覺推理。

 

最終的測試結(jié)果也證明了ChatGPT能力的下降,例如在數(shù)學和視覺推理部分,研究人員使用了思維鏈(chain-of-thought,CoT)技術(shù),讓LLM模擬人類思維的過程,幫助LLM生成一條推理路徑,將復(fù)雜的推理問題分解成幾個簡單的步驟,而不僅僅是直接從語料庫中擬合最終答案。

 

 

不過,數(shù)據(jù)顯示,GPT-4表現(xiàn)出顯著的飄移,從三月到六月,GPT-四是數(shù)學問題的準確性從97.6%下降到2.4%,同時答案長度也會下降90%以上。

 

 

但是在視覺推理方面,6月份的GPT-4在之前3月份正確回答的一些查詢中出現(xiàn)了錯誤。也就是說,6月份不可能給出3月份正確結(jié)果的問題。

 

如今,相當多的程序員每天都在使用AI編寫代碼,但研究人員發(fā)現(xiàn),3月份GPT-4輸出代碼的50%以上可以直接實現(xiàn),但6月份這個數(shù)字只有10%。而且這還不是最夸張的,在回答敏感問題時,GPT-4的直接回答率從21%下降到5%。即使在拒絕回答不當問題時,6月份的GPT-4版本也側(cè)重于不向用戶提供解釋。

 

 

一般來說,事物的發(fā)展通常呈螺旋狀上升,在信息技術(shù)領(lǐng)域呈現(xiàn)出跳躍狀態(tài)?!敖裉觳蝗绻糯钡那闆r是獨一無二的。那么問題來了?!翱蒲锌靠脊拧钡目赡苄灾挥幸环N,那就是整個行業(yè)已經(jīng)崩潰,現(xiàn)在還在重建。但是AI模型簡單的前沿技術(shù)沒有類似的問題,所以肯定很奇怪。

 

02

 

當前網(wǎng)絡(luò)上最主流的聲音,是ChatGPT、Bing Chat能力下降是平衡客戶體驗的結(jié)果。歸根結(jié)底,ChatGPT生成內(nèi)容需要消耗計算能力,客戶需要的計算率越多,但是OpenAI、自半年以來,微軟購買計算率資源的速度一直與用戶增長不符,導致響應(yīng)速度下降??蛻粢抨爢栠@類產(chǎn)品,問題數(shù)量有限。所以在這種情況下,降低性能來平衡響應(yīng)速度就是一種不難想到的解決辦法。

 

當然,更深層次的核心矛盾是AI倫理問題,也就是幾個月前引起了很多討論的“AI可能會給人類帶來滅絕風險”。對AI的焦慮甚至讓OpenAI創(chuàng)始人奧特曼參加了美國參議院的聽證會,這讓他在過去的幾個月里一直在世界各地“傳道”。不受控制的人工智能將成為摧毀人類文明的罪魁禍首,這無疑是科幻小說的一個重要主題,因此自誕生以來,人工智能失控的焦慮就存在于這項技術(shù)中。

 

這也導致了一個控制AI的概念“AI對齊”,即AI系統(tǒng)的目標要與人類的價值觀和利益對齊,這樣才能滿足設(shè)計師的利益預(yù)期,不會造成意想不到的有害后果,比如生成各種不當言論。事實上,微軟和OpenAI公司不可避免地會進行AI對齊。例如,2016年微軟發(fā)布的聊天機器人Tay發(fā)布了種族歧視內(nèi)容,這直接導致其在開始工作之前死亡。

 

03

 

然而,強迫AI遵循人類的價值觀是一件反直覺的事情。開發(fā)者需要指定正確的目標函數(shù),以確定應(yīng)該提供什么樣的反饋來正確引導AI。

 

此外,我們甚至需要證明提供這些反饋是合理的,這無疑是目前難以解決的技術(shù)問題。那么問題來了。如果你想讓一個人不去想,糾正他的思維方式,最直觀的方法是什么?當然,諾貝爾獎中的黑歷史前腦葉白質(zhì)摘除術(shù)直接從物理上消除了人類的思維能力。

 

回到AI領(lǐng)域也是如此。微軟研究所發(fā)表的一篇論文證實,任何AI對齊的AI模型都會失去它的準確性和性能。由于ChatGPT是基于人類反饋的增強學習來構(gòu)建智能的產(chǎn)品,人工強制干預(yù)的AI對齊會阻礙大模型理解任務(wù)的真實水平。因此,自然,AI大模型的性能會出現(xiàn)開場即巔峰的情況。

 

但無論是計算率緊張還是AI倫理限制,短時間內(nèi)幾乎沒有解決辦法。所以客戶體驗高開低走是必然的,相關(guān)企業(yè)也不太可能處理這個問題。

 

本文來自微信微信官方賬號“三易生活”(ID:IT-作者:三易菌,36氪經(jīng)授權(quán)發(fā)布,3eLife)。

本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com