OpenAI重磅更新定檔周一,奧特曼暗示將會有“法術(shù)”
OpenAI終于要放大了!官方宣布將于周一在線直播,預(yù)計將發(fā)布全新的AI語音助手,以及ChatGPT、GPT-四是一系列更新。奧特曼澄清,沒有GPT-5,也沒有搜索引擎!
確定,沒有GPT-5,沒有搜索引擎,但是還是會有驚喜!
今天,OpenAI正式宣布將于13日,下周一上午10點(太平洋時間)開始在線直播。
屆時,將會有全新的ChatGPT demo演示,GPT-4升級更新。
而且Altman本人更加興奮地表示,「對于我來說,感覺就像法術(shù)一樣?!?。
原本,發(fā)布「搜索引擎」這個事件基本上是真錘,甚至連路透援引內(nèi)部人士的消息這篇報道,昨天在全網(wǎng)瘋狂。
不過,發(fā)布時間是對的,但是奧特曼突然改變主意,直言不諱?!笡]有搜索引擎」。
根據(jù)網(wǎng)友的爆料,這是OpenAI投出的誘餌,目的是抓住內(nèi)部泄密者。而且經(jīng)常給Jimmyy。 Apples、OpenAI已經(jīng)解雇了Flowers泄露的爆料者。
不得不說,OpenAI的套路還是很深的。
所以,萬眾期待的GPT-5沒有,確定后再確定?!杆阉饕妗瓜轮芤籓penAI也沒有?!改Хā沟降资巧叮?/p>
據(jù)Information獨家報道,OpenAI正在開發(fā)一個全方位的AI語音助手,估計下周會顯示。
通過聲音和文字,這項新技術(shù)可以與人交流,可以聽到不同人的語氣、語氣,并且可以識別物體和圖像。
網(wǎng)民們紛紛表示,還沒有等到GPT-5的那一天。
01 Her即將實現(xiàn)!AI語音助手即將到來
事實上,OpenAI希望能夠像人類一樣開發(fā)AI進行交流。
Altman曾經(jīng)說過,他對Spike說。 由Jonze執(zhí)導(dǎo)的電影《Her》對此感興趣,并稱之為前瞻性。
這部電影講述了主人公愛上一個對話操作系統(tǒng)的故事?!猄emantha,而且在互動的過程中,AI也逐漸熟悉了他。
「她」記住他的故事,他的習(xí)慣,也發(fā)展了自己的個性。
所以,OpenAI一開始就致力于最終開發(fā)類似的產(chǎn)品?!禜er》里面的虛擬助手,同時讓現(xiàn)在的語音助手,比如Siri更好。
新型號包括音頻輸入、音頻輸出功能和更好的推理能力。在一些查詢中,GPT-4 Turbo
據(jù)兩位知情人士透露,OpenAI已經(jīng)向一些客戶展示了這項新技術(shù),包括許多能力,包括比目前的模型邏輯推理能力更好。
而且,預(yù)計在下周一的活動中,這款高級AI將首次公開展示。
可以肯定的是,OpenAI這波操作又一次截斷了胡谷歌,占據(jù)了搶眼的機會。
預(yù)計谷歌將于14日召開I/O大會(OpenAI掐點的直播時間真的很及時,不會給谷歌留下喘息的機會)
根據(jù)網(wǎng)民的發(fā)現(xiàn),Altman的官方公告不會發(fā)布?!杆阉饕妗?,谷歌股價立即飆升。
準確地識別語氣語氣,但是體積太大無法安裝手機
OpenAI團隊確信它具有視覺效果。 AI助手的音頻能力,可能會像智能手機一樣,給世界帶來顛覆性的變化。
ChatGPT,這只是強大AI助手的雛形。
從理論上講,他們想象這個AI助手能夠完成不可能完成的任務(wù)。
比如引導(dǎo)學(xué)生寫論文,處理數(shù)學(xué)問題,或者提供及時豐富的信息、翻譯標志,甚至指導(dǎo)如何修理故障車。
遺憾的是,OpenAI這款A(yù)I目前體積太大,根本無法在個人智能終端上運行。
但是,用戶可以在短時間內(nèi)使用基于云的版本來提高OpenAI已經(jīng)支持的軟件功能,例如自動客戶服務(wù)智能體。
據(jù)了解這個AI的人說,新軟件的音頻功能可以幫助他們更準確地理解來電者的音頻功能?!刚Z氣」,當他們提出要求時,他們是否使用?「諷刺語氣」。
現(xiàn)在,OpenAI已開發(fā)用于轉(zhuǎn)錄音頻(Whisper)以及文本轉(zhuǎn)換語言(TTS)模型。
這些能力集成在ChatGPT的背后,但是在使用的時候,需要各自調(diào)用這些工具。
據(jù)報道,OpenAI即將推出的新模型將這些能力融入到一個模型中,即創(chuàng)建一個模型「原生多模態(tài)模型」。
這款全新的多模態(tài)模型,在分析圖像和音頻方面表現(xiàn)更好,同時其響應(yīng)速度也超過了那些能力較弱的模型。
第一次體驗微軟
一如既往,OpenAI更新當天,「金主父親」微軟,一定是第一個使用新功能的人。
據(jù)估計,微軟將使用OpenAI新產(chǎn)品來升級他們的語音助手。
而且,他們想要試圖壓縮這項技術(shù),以便將其壓縮?!阜胚M」在配置前攝像頭的可穿戴設(shè)備中,可以捕捉到用戶的周圍環(huán)境。
然而,目前尚不清楚OpenAI什么時候會為付費用戶提供這些新功能,但最終目標是將其納入ChatGPT的免費版本。
根據(jù)一位經(jīng)驗豐富的人士的說法,OpenAI的目的是使AI模型的運行成本低于目前收費最先進的模型GPT-4。-Turbo。
同時,他也指出,新模型在回答某些問題時表現(xiàn)得更好。但是,它仍然會出現(xiàn)?!富糜X」。
02 GPT-五年年底前發(fā),冰山下隱藏的秘密
OpenAI的領(lǐng)先優(yōu)勢,幾乎無人能及。
谷歌高管一直夢想著用AI開發(fā)一個強大的助手。
去年12年,谷歌首次展示了AI對話?!窯emini」,能對人的語音命令進行實時響應(yīng),并識別人類正在觀看的照片。
有一段時間,這段宣傳視頻在全網(wǎng)引起了強烈的反響,讓很多人瞬間對谷歌有了特別的看法。
沒想到,一天之前,視頻竟被曝光?!冈旒佟??!
隨后谷歌解釋說,這些能力的實現(xiàn),需要研究人員通過圖片和文字指令來引導(dǎo)模型,而不是視頻所展示的簡單對話。
此后,隨著Gemini的迭代升級,除了分析圖像和文本外,還增加了一些新的功能,還可以分析音頻。
即便如此,它仍然不能理解大多數(shù)傳統(tǒng)語音命令,也不能像Siri和Google那樣。 其他語音助手,如Assistant,與用戶進行交流。
而且OpenAI即將發(fā)布的AI語音助手,也許對于谷歌來說,這是另一個致命的打擊。
另外,OpenAI也在盡最大努力確保自己在AI領(lǐng)域的領(lǐng)先水平,不會被推動?!搁_源王牌」Meta趕超。
今年4月,Llama 8B版本和70B版本發(fā)布,并預(yù)測400B版本 開源模型,直接狙擊GPT-4。
而具有「音頻 視覺」AI模型的能力,只是OpenAI正在開發(fā)的許多產(chǎn)品之一。
盡管這次不會發(fā)布「網(wǎng)上搜索引擎」,但是這個問題的確在OpenAI內(nèi)部推廣,只是為了和谷歌搜索競爭。
歸根結(jié)底,OpenAI已經(jīng)在上周的主頁上展示了一個新的UI。
另外,OpenAI還在開發(fā)一種叫做自動化的軟件?!钢悄苡嬎銠C操作體」(computer-using agent)。
該軟件有望加快軟件開發(fā)和其它計算機相關(guān)任務(wù)的發(fā)展。
另外,今年年初,AI視頻生成器Sora的出現(xiàn),雖然目前還沒有公開發(fā)布,但在好萊塢已經(jīng)掀起了巨大的震動。
更加重要的是,GPT-5也在默默推進,明顯優(yōu)于GPT-4。據(jù)知情人士透露,OpenAI可能會在今年年底前完成GPT-5的研發(fā),并公開發(fā)布。
OpenAI之所以在商品和AI模型的開發(fā)上取得快速進展,是因為之前宣布的項目沒有得到足夠的關(guān)注。
舉例來說,他們曾經(jīng)承諾,在今年第一季度,開發(fā)者可以通過建立定制的聊天機器人來賺錢。
但是到目前為止,OpenAI還沒有推出具體的方法來實現(xiàn)這個目標。
將ChatGPT放入iPhone中,與蘋果的合作基本達成。
另外一方面,創(chuàng)造視覺 AI助手可以幫助OpenAI,并將其能力引入數(shù)億甚至數(shù)十億的蘋果設(shè)備。
就在剛才,彭博報道稱,蘋果和OpenAI正在敲定一項協(xié)議,這似乎已經(jīng)結(jié)束,并且已經(jīng)基本達成。
這項協(xié)議將為今年的iOS提供全新的AI生成能力。
在此之前,蘋果和谷歌就Gemini進行了談判,但還沒有達成協(xié)議。
說到底,距離蘋果今年的開發(fā)者大會WWDC(6月10日),留給蘋果的時間并不多。
多家媒體爆料稱,本次會議將AI整合到新的iOS中。 18系統(tǒng)內(nèi)。
對每個人的期望,蘋果都不想辜負。
硬件配置,OpenAI也要自己做。
另外,Altman還和iPhone設(shè)計師Jony一起工作。 Ive合作,開發(fā)單獨的AI消費設(shè)備。
Information曾經(jīng)報道過,這個硬件可能來自Emerson。 Collective和Thrive 像Capital這樣的投資者,籌集了高達10億美元的資金。
過去一年,AI Pin、Rabbit 像R1這樣的AI驅(qū)動設(shè)備和可穿戴產(chǎn)品蜂擁而至,Altman也希望加入這個陣列。
必須承認,即使推出了OpenAI最先進的AI模型,由于其巨大的規(guī)模,也只能在云端運行,并且需要在線運行。
而且將來,如果想要復(fù)雜的「視覺 音頻」對話AI,可能需要幾個月,甚至幾年的時間才能在系統(tǒng)上運行。
03 全網(wǎng)大預(yù)測:智能體,gpt4-lite...
OpenAI這波官方宣布,可謂戳中了大家的興奮。
爆料人Jimmy Apples再次泄露,「預(yù)計下周,我們將看到智能體的發(fā)布?!埂?/p>
而「搜索引擎」在蘋果WWDC大會上,有可能一起發(fā)布。
BowenAI研究科學(xué)家 Cheng甚至說,它比GPT-5酷得多。
不知道為什么,這個帖子現(xiàn)在已經(jīng)被刪除了。
另一位負責(zé)視頻生成的OpenAI科學(xué)家Willll。 Depue發(fā)了一張圖片,不知道是什么預(yù)示。
另一位網(wǎng)友Siqi 下周一,Chen預(yù)測將更新GPT-4模型:
- gpt4-lite:更換gpt-3.5
- gpt4-auto:一個新的模型節(jié)點(endpoint),可以自動從網(wǎng)絡(luò)上搜索數(shù)據(jù),集成內(nèi)部數(shù)據(jù)來提高響應(yīng)(不是「搜索引擎」)
- gpt4-lite-auto:類似于gpt4-auto,但是使用了lite版本。
還有人說gpt4-lite即將發(fā)布。
辭掉OpenAI,加入谷歌的Logan。 Kilpatrick說,「六個月后,AI領(lǐng)域的情況將完全不同。大多數(shù)人會對事物的發(fā)展感到驚訝。」。
另外一個問題是,OpenAI這次會不會解釋gpt2?
在接下來的一個月里,AI海嘯將會爆發(fā)。
最近Altman在Alllllan的GPT-5什么時候出現(xiàn)?-In 在Pod中回應(yīng),「我甚至不確定我們是否會命名GPT-5」。
他建議,未來可能不再遵循GPT。 N 第一種發(fā)布方式,轉(zhuǎn)變?yōu)槌掷m(xù)的改進過程。
但,GPT-5還得再等一次。
參考資料:
https://www.theinformation.com/articles/openai-develops-ai-voice-assistant-as-it-chases-google-apple
https://www.bloomberg.com/news/articles/2024-05-11/apple-closes-in-on-deal-with-openai-to-put-chatgpt-on-iphone
https://twitter.com/sama/status/1788989777452408943
本文來自微信微信官方賬號“新智元”(ID:AI_era),作者:新智元,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com