告別“人工智障”?Alexaalexai將被亞馬遜重塑
真正符合大眾想象的人工智能助手應(yīng)該是什么樣的de? ?基于GPT-4o的新ChatGPT無(wú)疑給整個(gè)行業(yè)帶來(lái)了一個(gè)模樣。新ChatGPT可以進(jìn)行實(shí)時(shí)語(yǔ)音對(duì)話,可以用文字和視覺(jué)進(jìn)行交互,并且具有記憶功能,幾乎可以與電影《她》相媲美。(Her)AI助理扮演中斯嘉麗·約翰遜。當(dāng)OpenAI在5月14日凌晨的新聞發(fā)布會(huì)上似乎觸手可及時(shí),亞馬遜作為競(jìng)爭(zhēng)對(duì)手自然并不平靜。
近日有消息稱,亞馬遜利用生成人工智能升級(jí)其智能語(yǔ)音助手Alexa,并計(jì)劃向用戶收取相應(yīng)的訂閱費(fèi)。據(jù)知情人士透露,亞馬遜將推出更具對(duì)話性的版本,以便與谷歌和OpenAI的競(jìng)爭(zhēng)產(chǎn)品競(jìng)爭(zhēng)。
這個(gè)消息也符合亞馬遜最近發(fā)給股東的年度信中描述的事實(shí)。當(dāng)時(shí)已經(jīng)確認(rèn)GenAI應(yīng)用程序正在消費(fèi)者業(yè)務(wù)中建立,包括更強(qiáng)大的Alexa。
從某種意義上說(shuō),在這一輪人工智能浪潮中,亞馬遜現(xiàn)在已經(jīng)回憶起Alexa,他之前已經(jīng)被忽視了。自2021年Andyy 自從Jassy成為亞馬遜的新首席執(zhí)行官以來(lái),由于多年來(lái)Alexa部門的業(yè)績(jī)難以提高,這個(gè)項(xiàng)目在貝索斯時(shí)代被稱為亞馬遜開(kāi)拓創(chuàng)新能力的代表,在亞馬遜內(nèi)部逐漸優(yōu)先,甚至成為裁員的重災(zāi)區(qū),也是大規(guī)模收緊支出計(jì)劃的主要目標(biāo)。
不過(guò),Alexa確實(shí)是亞馬遜消費(fèi)者業(yè)務(wù)中最好的媒介,AIGC應(yīng)用程序也是如此。
早在2014年,亞馬遜就推出了Alexa。起初,客戶只能使用Alexa語(yǔ)音助手來(lái)播放歌曲、設(shè)置計(jì)時(shí)器和鬧鐘。隨著后續(xù)的不斷迭代,Alexa逐漸可以用來(lái)控制智能家居、觀看視頻、看電視節(jié)目、購(gòu)物,甚至給孩子看睡前故事。有了Echo智能音響,一個(gè)新的語(yǔ)音控制計(jì)算平臺(tái)也準(zhǔn)備出來(lái)了。為了真正實(shí)現(xiàn)語(yǔ)音控制,亞馬遜甚至制造了Alexa。 Skills。就像蘋果App一樣 在Store中,大量的應(yīng)用程序擴(kuò)展了iPhone的更多應(yīng)用場(chǎng)景,亞馬遜也希望借助Alexa Skills允許Alexa語(yǔ)音助手執(zhí)行更多樣化的任務(wù)。
遺憾的是,在當(dāng)時(shí)的技術(shù)標(biāo)準(zhǔn)下,語(yǔ)音操作終究是空中樓閣。僅僅因?yàn)锳lexa不能理解復(fù)雜的指令,就讓Alexa Skills僅限于許多與語(yǔ)音密切相關(guān)的場(chǎng)景。所以在2018年,亞馬遜也試圖改造Alexa。 Skills,在不需要先安裝的情況下,Alexa可以直接執(zhí)行任何技能。例如,在這種新模式下,客戶不再需要告訴Alexa“打開(kāi)美團(tuán),訂購(gòu)肯德基”,而只是說(shuō)“我想點(diǎn)外賣”。Alexa會(huì)利用語(yǔ)境線索找出用戶的真實(shí)意圖,并利用客戶的位置、訂閱、服務(wù)和歷史記錄來(lái)決定需要使用的應(yīng)用程序。
但遺憾的是,當(dāng)時(shí)的自然語(yǔ)言理解(NLP)這項(xiàng)技術(shù)還不足以支撐亞馬遜的這一愿景,它仍然只能簡(jiǎn)單、機(jī)械地從預(yù)設(shè)的數(shù)據(jù)庫(kù)中提取和匹配信息。無(wú)論Alexaa,終端用戶發(fā)現(xiàn)、或者Siri,或者Google助手,語(yǔ)音助手和智能真的沒(méi)有太大關(guān)系,也不足以改變?nèi)粘I?,以至于Alexa在客戶口中變成了“美化收音機(jī)”。
現(xiàn)在ChatGPT的出現(xiàn),給了亞馬遜重振Alexa的理由。ChatGPT在模型相關(guān)技術(shù)的支持下,擁有Alexaa、上一代語(yǔ)音助手如Siri所沒(méi)有的廣度、靈活性和復(fù)雜性。從某種意義上說(shuō),ChatGPT是亞馬遜想要塑造Alexa的理想方式。而且ChatGPT之所以能在2022年底重燃大眾對(duì)AI的熱情,無(wú)疑是因?yàn)樗朴凇罢f(shuō)實(shí)話”,能讓用戶擁有真正的“人”。、而非“機(jī)器”交流的感覺(jué)。

到2024年初,GPTs Store的出現(xiàn)讓ChatGPT更加強(qiáng)大,從而在目前的GPT-4o中,ChatGPT已經(jīng)能夠快速響應(yīng)文本、音頻和視頻輸入的即時(shí)對(duì)話,并以語(yǔ)調(diào)和措辭進(jìn)行對(duì)話,傳達(dá)強(qiáng)烈的情感和個(gè)性。通過(guò)自然語(yǔ)言了解客戶的要求,并在一個(gè)或多個(gè)GPTs中執(zhí)行這些要求,從而實(shí)現(xiàn)“聽(tīng)客戶的話,幫助用戶”。
很容易看出,目前的ChatGPT幾乎就是亞馬遜Alexa想要“活出的樣子”。
由于OpenAI的珠玉在前面,亞馬遜對(duì)Alexa進(jìn)行了全面的技術(shù)改造,以全新的姿態(tài)回歸戰(zhàn)場(chǎng)顯然并不生硬。Rohitit使用亞馬遜Alexa新負(fù)責(zé)人 “Alexa不僅是推動(dòng)廣義智能最肥沃的實(shí)驗(yàn)場(chǎng)之一,而且還進(jìn)化了超越語(yǔ)音交互的類人交互能力,”Prasad說(shuō)。但愿Alexa將來(lái)能夠?qū)崿F(xiàn)更多類人的交流,不僅僅是語(yǔ)音,還有面部情緒、手勢(shì)和肢體語(yǔ)言。
所以問(wèn)題來(lái)了,亞馬遜能不能用AI大模型來(lái)重塑Alexa?
目前,亞馬遜已經(jīng)在全球范圍內(nèi)銷售了超過(guò)1億臺(tái)配備Alexa的設(shè)備,甚至三分之一的美國(guó)家庭也出現(xiàn)了Alexa,因此它擁有優(yōu)秀的用戶基礎(chǔ)。如果Alexa上出現(xiàn)GPT-4o,后者可以算是“原地升級(jí)”。
遺憾的是,亞馬遜在AI方面的優(yōu)勢(shì),特別是面向C端的AI能力,從來(lái)沒(méi)有得到證實(shí)。事實(shí)上,與蘋果相比,亞馬遜在AI大模型賽道上的探索進(jìn)度并不多。即使沒(méi)有與OpenAI深度綁定的微軟,在Meta的LLaMA也是如此。、除了谷歌的Gemini,到目前為止,亞馬遜的大模型“Titan“不但推出時(shí)間最晚,而且?guī)缀鯖](méi)有引起公眾的討論。
如果“Titan“顯然,沒(méi)有人不可能討論它,因?yàn)樗诩夹g(shù)上有任何突破。事實(shí)上,將語(yǔ)音助手與大型模型連接起來(lái)并不難。在過(guò)去的一年里,智能音響行業(yè)一直試圖這樣做,但結(jié)果并不令人滿意。
其實(shí)原因很簡(jiǎn)單。由于多模態(tài)技術(shù)的限制,大模型“附體”語(yǔ)音助手的過(guò)程并不順利。為什么GPT-4o剛出來(lái)的時(shí)候,外界會(huì)給出“爆炸場(chǎng)”的評(píng)價(jià)?音頻輸入的平均反饋時(shí)間只有320毫秒,這無(wú)疑是最重要的。即使是與人類對(duì)話的響應(yīng)時(shí)間,這個(gè)數(shù)字也相當(dāng)接近。
當(dāng)前,用戶在面對(duì)ChatGPT時(shí),有GPT-4o加成,覺(jué)得自己在與人交談,但是在與其他語(yǔ)音助手交談時(shí),卻需要面對(duì)漫長(zhǎng)的等待。換言之,亞馬遜想要重塑Alexa,關(guān)鍵在于它能否在模型多模態(tài)能力上取得突破。
本文來(lái)自微信微信官方賬號(hào)“三易生活”(ID:IT-作者:三易菌,36氪經(jīng)授權(quán)發(fā)布,3eLife)。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




