攻擊谷歌?展示蘋果?在GPT-4o背后,OpenAI推出了遐想
北京時間5月14日凌晨,OpenAI在線舉辦了“春季更新”活動。他們推出了最新的旗艦大型GPT-4o,不僅可以免費(fèi)使用,還可以跨越聽、看、說,光滑順暢,沒有任何延遲,就像打視頻通話一樣。
那么,GPT-4o還有什么能力?為什么GPT-4o這次發(fā)布的不是GPT-5?為什么OpenAI會在谷歌I/O大會之前發(fā)布這個產(chǎn)品?讓我們看看我們能否在這次活動中找到答案。
GPT-4o有什么不同?
此次發(fā)布,GPT-4o最大的特點(diǎn)是增強(qiáng)了語音交互,聲稱與一些類似的競爭產(chǎn)品相比,它的響應(yīng)時間更快,可以減少延遲,更接近與真人交談的節(jié)奏。
當(dāng)用戶使用語音模式與ChatGPT對話時,GPT-4o之前,GPT-平均延遲3.5為2.8秒,GPT-4為5.4秒,由于處理方法,音頻在輸入時會丟失大量信息,使得GPT-4無法直接觀察語氣、說話人和背景噪音,也無法導(dǎo)出笑聲、唱歌和表達(dá)情感。
與之相比,GPT-4o可以在232ms內(nèi)行動音頻輸入,類似于人類在對話中的反應(yīng)時間。在錄制和播放視頻中,兩位高管做了一個演示:機(jī)器人可以從急促的呼吸聲中理解“緊張”的含義,并指導(dǎo)他深呼吸,或者根據(jù)用戶要求改變語氣。
根據(jù)OpenAI網(wǎng)站的介紹,GPT-omni(翻譯成全能)在4o中表示,它已經(jīng)向更自然的人機(jī)交互邁出了一步,因?yàn)樗邮芪谋?、音頻和圖像的任意組合作為輸入內(nèi)容,并生成任何組合的輸出內(nèi)容,包括文本、音頻和圖像。
穆拉迪迪OpenAI項(xiàng)目負(fù)責(zé)人(Mira Murati)新型GPT-4o在直播活動中表示,“速度要快得多”,在文字、視頻、音頻等方面都有所提高,公司最終計劃讓用戶與ChatGPT進(jìn)行視頻通話。這是我們第一次在方便方面邁出巨大的一步。
值得注意的是,新模型允許ChatGPT處理50種不同的語言,提高了速度和質(zhì)量。它還支持OpenAI的API,讓開發(fā)者今天可以開始使用新模型來構(gòu)建應(yīng)用程序。GPT-GPT-44o的速度是44o Turbo的兩倍,費(fèi)用只有一半。
就性能而言,OpenAI表示,在以往的基準(zhǔn)測試中,GPT-在文本、推理和代碼智能方面,4o實(shí)現(xiàn)了GPT-4 在多語言、音頻和視覺能力方面,Turbo級的性能達(dá)到了一個新的高度。GPT-4 Turbo相當(dāng),在非英語文本方面有了顯著的改進(jìn)。
另外,通過過濾訓(xùn)練數(shù)據(jù)和訓(xùn)練后改進(jìn)模型行為等技術(shù),GPT-4o在設(shè)計中內(nèi)置了跨方式的安全性,并創(chuàng)建了一個新的安全系統(tǒng),為語音導(dǎo)出提供護(hù)欄。GPT-4o還與70多名來自心理學(xué)、偏見和公平、信息錯誤等方面的外部專家進(jìn)行了廣泛的外部團(tuán)隊(duì)合作。,以識別新增加引入或放大的風(fēng)險,提高與GPT-4o互動的安全性。
值得注意的是,OpenAI不僅將GPT-4o直接提供給用戶,而且將其作為API向開發(fā)者開放。這就意味著開發(fā)者可以很容易地利用GPT-4o的強(qiáng)大功能來構(gòu)建自己的應(yīng)用程序,從而顯著提高研發(fā)速度、成本控制和功能實(shí)現(xiàn)。
而且,OpenAI竟然直接向用戶免費(fèi)開放該模型。
元宇宙新聲認(rèn)為,再一次提高語音能力,將使GPT-4o有望打破人與機(jī)器互動的“天花板”,未來的ChatGPT,可以無處不在——比如,它可以隨時隨地出現(xiàn)在人們身邊,可以嵌入到?jīng)]有屏幕的設(shè)備中與人交談??偠灾?,GPT-4o能使人們更加關(guān)注與ChatGPT的合作,而非受屏幕界面本身的限制。
GPT-4o在此時發(fā)布,是狙擊谷歌還是示好蘋果?
我相信OpenAI有理由在這個時間點(diǎn)發(fā)布GPT-4o。最直觀的表現(xiàn)就是谷歌將在活動結(jié)束后的一天召開2024年I/O開發(fā)者大會,OpenAI再次精準(zhǔn)攻擊谷歌。如果谷歌I/O大會沒有驚人的發(fā)布,也許這個風(fēng)頭會被OpenAI奪走。
從歷史上看,OpenAI的每一個產(chǎn)品發(fā)布時間都非常準(zhǔn)確。2024年2月15日,谷歌發(fā)布了多模式大模式Geminini。 1.5 Pro,根據(jù)官方檢測數(shù)據(jù),這款多模態(tài)大模型支持100萬tokens,其性能遠(yuǎn)遠(yuǎn)超過GPT-4 Turbo。
不過,同一天,OpenAI發(fā)布了Sora,一個很大的文生視頻模型。
Sora的發(fā)布再次讓全網(wǎng)關(guān)注OpenAI作為文化視頻產(chǎn)品,搶走了本該屬于谷歌的亮點(diǎn),也讓谷歌Gemini 1.5 在模型發(fā)展史上,Pro的意義再次被低估。
事實(shí)上,現(xiàn)在回想起來,Sora的發(fā)布是一個徹頭徹尾的“表演”項(xiàng)目,因?yàn)榈侥壳盀橹梗琒ora還沒有向公眾開放。
除狙擊谷歌外,我們還發(fā)現(xiàn)在OpenAI活動中,iPhone和MacBook都用于整個活動。 在Mac桌面版的ChatGPT上,Pro進(jìn)行了演示,這讓我們不得不懷疑,他們是否在和蘋果合作?
最近,有消息透露,蘋果與OpenAI達(dá)成協(xié)議,今年將iPhone引入后者的一些技術(shù)。這樣,蘋果就可以作為iOS提供一個由ChatGPT支持的“聊天機(jī)器人” 18中人工智能功能的一部分。
事實(shí)上,面對AI技術(shù)的激烈競爭,蘋果與OpenAI的合作讓人們有理由期待一個更智能、更互動的Siri。這也可能是蘋果鞏固其在全球科技領(lǐng)域領(lǐng)先地位的重要一步。
元宇宙新聲認(rèn)為,當(dāng)OpenAI推出GPT-4o時,它再次向大家證明了它們的營銷思維,這不僅給競爭對手谷歌帶來了壓力,也向潛在合作伙伴蘋果示好。但需要注意的是,谷歌的風(fēng)頭并不容易被奪走,反而有可能被它吃掉。蘋果絕不是一家長期依賴其他廠商生存的公司。OpenAI的最大賣點(diǎn)是產(chǎn)品,比如傳說中的“GPT-5”。
GPT-4o為何不是GPT-5?
當(dāng)人們覺得GPT-4o進(jìn)一步提升了大模型能力時,不禁要問,為什么傳說中的GPT-5沒有推出?它現(xiàn)在的研發(fā)進(jìn)展如何?
我們認(rèn)為,GPT-4o現(xiàn)階段發(fā)布的原因是GPT-5的R&D肯定遇到了一些問題。如果沒有,OpenAI可以直接推出GPT-5。一個科技企業(yè)必須盡早發(fā)布新產(chǎn)品,尤其是在模型領(lǐng)域。因此,OpenAI在開發(fā)GPT-5時,要么存在性能危機(jī),要么存在成本問題。
但是,根據(jù)大家對OpenAI的理解,即使成本很高,只要效果足夠驚艷,它肯定會推出。首先,我們應(yīng)該威懾這個行業(yè)。即使GPT-5每天可以使用三個項(xiàng)目,我們也希望吸引所有人的注意力。因此,我們認(rèn)為在GPT-5的研發(fā)過程中,可能會出現(xiàn)更多的性能或安全問題。
事實(shí)上,不僅僅是我們,網(wǎng)友們也紛紛在線催促OpenAI,快速發(fā)送GPT-5。
之前的采訪中,OpenAICEOSam “關(guān)于GPT-5的發(fā)布日期,Altman也回答了GPT-5的問題,他指出:“關(guān)于GPT-5的發(fā)布日期,我們還沒有確定具體的日期。在推出新型號時,我們對新型號持謹(jǐn)慎態(tài)度,并致力于確保它能達(dá)到我們的高標(biāo)準(zhǔn)。我們正在考慮選擇一種新的發(fā)布策略,這可能與以前的方式不同。我們?nèi)栽谟懻揋PT-5的命名和發(fā)布策略,但可以肯定的是,我們致力于讓這個新模型在發(fā)布時給用戶帶來卓越的感受?!?/p>
元宇宙新聲認(rèn)為,OpenAI在發(fā)展過程中肯定會遇到很多挑戰(zhàn)。然而,我們希望他們始終保持堅(jiān)強(qiáng)的意志和不斷創(chuàng)新的精神,不斷突破自我,實(shí)現(xiàn)全球AI龍頭企業(yè)的期望。特別是在GPT系列模型的推出上,OpenAI引領(lǐng)了AI領(lǐng)域的新一輪技術(shù)革命。
寫在最后
每一次技術(shù)飛躍都意味著人類智能與機(jī)器智能在人工智能領(lǐng)域的深度融合。GPT-作為OpenAI的最新旗艦?zāi)P停?o無疑在技術(shù)上取得了顯著進(jìn)步。其新的音頻理解能力和對便利性的重視確實(shí)為用戶提供了更自然、更便捷的互動體驗(yàn)。
在目前的發(fā)展中,OpenAI仍然面臨著更多的機(jī)遇和挑戰(zhàn)。然而,OpenAI將繼續(xù)發(fā)揮引領(lǐng)作用,為人們社會的進(jìn)步做出更多貢獻(xiàn),公司始終保持著堅(jiān)強(qiáng)的意志和不斷創(chuàng)新的精神。
本文來自微信微信官方賬號“元宇宙新聲”(ID:NFTMall),作者:元時文化,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com