亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

ChatGPT終于活出了“Siri”本該有的樣子

2024-05-17

ChatGPT再次更新,這次,OpenAI沒有大談數(shù)字和術(shù)語,而是回到了“聊天機器人”本身。


在北京時間5月14日凌晨1點,OpenAI舉行春季新聞發(fā)布會,公司首席技術(shù)官米拉·穆拉蒂(Mira Murati)ChatGPT更新現(xiàn)場主持。


新聞發(fā)布會的核心是最新的多模式大模式GPT-4o。不同于之前發(fā)布的“硬核指標(biāo)”,如訓(xùn)練信息量、各種測試結(jié)果等。GPT-4o的升級主要集中在體驗上。


與上一代GPT相比-Turbo,GPT-4o可以說是打通了任督二脈,各項技能融合在一起,與人的互動更加靈活,更加迅速——換句話說,更像是“人”。


客戶可以隨意輸入文本、音頻和圖像,獲得任意組合的ChatGPT即時文本、音頻和圖像導(dǎo)出。在交流過程中,ChatGPT可以隨時中斷,而不是等待幾秒鐘的響應(yīng)。OpenAICEO山姆·奧特曼(Sam Altman)稱之為“人類級別的反應(yīng)”。


OpenAI現(xiàn)場展示了一些與ChatGPT的互動,包括:即時對話交互、語音多樣化(使用不同的情緒、語氣等。根據(jù)客戶的需求)、錄像指導(dǎo)做題,錄像識別環(huán)境和人(包括人的情緒)、協(xié)助編程,實時翻譯桌面應(yīng)用。


同時,OpenAI還發(fā)布了一些預(yù)先錄制的展示示例,包括:2個GPT-4o交流與唱歌、唱搖籃曲、在線會議應(yīng)用、毒舌諷刺、視頻識別、給出西班牙語單詞、協(xié)助面試準(zhǔn)備、與狗互動等。


OpenAI現(xiàn)場演示選擇的聲音是“Sky”,聽起來像好萊塢明星斯嘉麗·約翰遜(寡姐)。讓人想起科幻電影《她》(Her)》,在這些人中,AI助手是由斯嘉麗配音的。影片中,男主從使用AI助手,一步一步走向一段不成功的人機戀情。


奧特曼本人也在X上發(fā)了這部電影的名字:her。也有人干脆把電影海報里的臉換成了奧特曼。



當(dāng)GPT-4o驅(qū)動的ChatGPT用充滿情感的聲音與人交談時,你可以看、聽、說、唱,你就會知道科幻已經(jīng)照進了現(xiàn)實。


更加重要的是,穆拉蒂現(xiàn)場宣布,GPT-向所有人免費開放4o。換言之,隨著后續(xù)的更新,免費客戶也可以直接使用GPT-4o,但是每天的限制比付費用戶少,達(dá)到限制后會自動選擇返回GPT-3.5。


還有,ChatGPT的桌面應(yīng)用將推出蘋果計算機系統(tǒng)Mac OS,今年晚點將推出Windows版本。


A


若用四個字來概括GPT-4o的特點,則為:更通人性。


這體現(xiàn)在兩個方面。一方面,GPT-4o多模式融合在一起,反應(yīng)速度大大提高,交互技術(shù)更接近人;另一方面,由GPT-4o驅(qū)動的機器人顯然更加活潑,更愿意表達(dá)人類的情緒。


首先談到GPT-4o的多模態(tài)能力,準(zhǔn)確地說,GPT-4o最引人注目的是跨模態(tài)的能力。


2023年3月,OpenAI在一年多前發(fā)布了多模態(tài)模型GPT-4。從那以后,每個人都可以給GPT-4發(fā)一張圖片來幫助分析,或者發(fā)送文件和語音通話。但是,文字、圖像和聲音之間有一堵“墻”。


例如,如果你想讓ChatGPT幫你解決一個數(shù)學(xué)問題,你只能截圖或復(fù)制問題,并將其發(fā)送給ChatGPT。如果你想聽ChatGPT語音講解,你必須在輸入框發(fā)送后切入語音。


但是在GPT-4o下,你可以直接使用桌面應(yīng)用程序,打開ChatGPT放在一邊,在與它聊天的同時,用“拍攝”功能向它展示你電腦屏幕的內(nèi)容,它可以在對話中回答你的問題。


在一次演示中,用戶同時打開了ChatGPT桌面應(yīng)用和問題界面。ChatGPT沒有直接給出答案,而是帶客戶一步一步解決一個問題和答案的幾何問題。


或者,你也可以打開攝像頭,ChatGPT也可以“看”紙面來指導(dǎo)答案。



在所有的演示中,最可怕的是視頻對話:客戶打開攝像頭,讓ChatGPT“看到”當(dāng)下并進行互動。


ChatGPT不僅可以通過前置鏡頭自拍來識別客戶的情緒,比如“看起來很開心,甚至很興奮”,還可以從客戶背后的場景來判斷他們所處的環(huán)境,比如“看起來你在一個工作室里,背后有一些燈,胸前沒有麥克風(fēng),可能在錄視頻之類的”。如果另一個人進入鏡頭并扮演鬼臉,ChatGPT也準(zhǔn)確地指出了這種“不尋?!钡那闆r,并加以描述。


使用后置鏡頭,ChatGPT可以與客戶分享角度。例如,在語言學(xué)習(xí)過程中,打開攝像頭,讓ChatGPT用某種語言講述物體的名稱?;蛘呖梢越o視障用戶提供指導(dǎo),告訴用戶“有一輛出租車來了,就是現(xiàn)在,揮手吧”。


另外,客戶話剛說完ChatGPT就接電話,用戶可以直接打斷ChatGPT,也可以繼續(xù)聊天,導(dǎo)致整體體驗更像是人與人之間的對話,快速靈活。


順便說一句,由于GPT-4o響應(yīng)速度快,可以中斷,實際上翻譯效果非常驚人。兩個語言不通的人把GPT-4o驅(qū)動的ChatGPT放在中間作為翻譯,然后就可以聊天了。


總得來說,GPT-ChatGPT在4o驅(qū)動下,不再只是一個什么都能做的應(yīng)用,而是一個真正的“AI助手”。


B


再者,情緒,這一點不可小覷。


這個聊天機器人自2022年11月ChatGPT上線以來,一直給人一種不茍言笑的印象。ChatGPT不僅回答了問題,而且只要有機會,ChatGPT就會向客戶強調(diào)“我只是一個機器人,我沒有愛情”,這很可能是OpenAI為了防止麻煩而故意做的。顧客要想讓ChatGPT更加“放松”,就必須給出明確的指示。


但是在GPT-4o的驅(qū)動下,ChatGPT顯然是不同的。ChatGPT不再刻意防止像人類一樣,而是反其道而行之。


舉例來說,當(dāng)顧客向ChatGPT求助時,ChatGPT接過話開玩笑地說:“他很快就要參加OpenAI面試了。OpenAI,嗯?怎么聽起來這么熟悉?”然后他笑了笑,然后興奮地繼續(xù)說:“開玩笑的!太棒了,洛基(演示者的名字)!什么樣的面試?”



在洛基尋找外貌建議時,ChatGPT用幽默的方式表示頭發(fā)需要整理,說他“看上去有寫了一整夜代碼的氣氛”。洛基戴著一頂遮陽帽,ChatGPT立刻“哈哈哈”地笑了起來,說他“肯定會很顯眼”,但在面試中并不合適,勸他像朋友一樣放棄這樣做。



換句話說,GPT-ChatGPT在4o驅(qū)動下,不再是一種只追求特征的AI工具,而是主動提供“情感價值”。


在ChatGPT走嚴(yán)肅路線的兩年里,許多競爭產(chǎn)品以更加活潑、更加“人性化”的姿態(tài)出現(xiàn),并贏得了許多顧客的心。


例如Inflection.AI曾經(jīng)推出的機器人Pi,以“陪伴”為主,語氣總是溫柔,對用戶充滿關(guān)懷。不到一年,它就實現(xiàn)了數(shù)百萬日常用戶,平均對話持續(xù)了半個多小時。


埃隆·馬斯克(Elon Musk)人工智能公司xAI的大型Grok,由于其毒舌一上線就引起了不少關(guān)注。


即使是最后一波AI聊天機器人熱潮也深知這一點。2011年,蘋果將Siri集成到iPhone4S,AI聊天機器人成為一個賽博玩具。每個人都熱衷于“戲弄Siri”,讓它唱歌和講笑話。雖然Siri不是一個神奇的力量,但它提供了足夠多的快樂。天貓精靈、小愛同學(xué)等。,這些都是中國客戶熟悉的,都有俏皮的“個人設(shè)計”。


然而,我們都知道后來的故事。由于技術(shù)限制,上一代AI助手能夠做的事情真的很有限?!扒纹ぁ眮碜杂邢薜念A(yù)設(shè),由于理解能力差、不靈活,逐漸被用戶釘上了“人工智障”的恥辱柱。


2024年,每個人都對Siri抱有期待——一個AI,可以幫助做事,也可以作為賽博玩具聊天和玩耍,最終在GPT-4o身上定居下來。


C


去年五月,比爾·蓋茨(Bill Gates)曾在AI Forward 在2023活動中談到AI,對AI的前景非??春茫骸澳阌肋h(yuǎn)不會去搜索網(wǎng)站,也不會再去亞馬遜?!?/p>


在蓋茨眼里,能干掉搜索和電子商務(wù)的不是別的,而是未來頂級的AI助手:“無論誰贏得了AI助手的比賽,這都是一件大事。”


對于C端用戶來說,AI助手的戰(zhàn)爭已經(jīng)開始。


微軟已將Copilot帶入Windows11,依靠側(cè)欄工具幫助顧客;Gemini在內(nèi)部集成了谷歌大腦和DeepMind之后,發(fā)布了Gemini的拳頭模型,未來有望更深入地嵌入到Android、谷歌搜索和Workspace等各種產(chǎn)品和應(yīng)用中,;去年九月,亞馬遜發(fā)布了一款新的Alexa,接入了大型模型。


同時,蘋果也有明顯的戰(zhàn)略傾斜,加快了AI的步伐。六月份,蘋果將舉行全球開發(fā)者大會(WWDC24),iOS18是否會用人工智能進行軟件更新是外界關(guān)注的焦點。蘋果將大模型重塑Siri,這是外界普遍關(guān)注的焦點。


今年三月以后,有幾條消息不斷傳出。首先,彭博社援引知情人士透露,蘋果正在iPhone談判中內(nèi)置谷歌Gemini大模型,同時也在與OpenAI進行類似的談判。接著是蘋果首席執(zhí)行官蒂姆·庫克(Tim Cook)訪華后,《科創(chuàng)板日報》報道蘋果將與百度進行技術(shù)合作,iPhone16將于今年發(fā)布。、Mac系統(tǒng)和iOS 提供AIGC功能18。


使用GPT-4o,OpenAI再一次震撼了世界上的億點,下一次AI助手的競爭只會更加精彩。


“新的語音(和視頻)方式是我用過的最好的計算機界面。感覺就像電腦里的人工智能,它的真實性還是讓我有點驚訝。達(dá)到人類水平的反應(yīng)時間和表達(dá)能力發(fā)生了很大的變化?!眾W特曼在GPT-4o發(fā)布的一篇博文中寫道。


本文來自微信微信官方賬號“字母榜”(ID:wujicaijing),36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com