晚上巨人:為什么蘋果在? AI 時過境遷?
2024年,注定是生成式AI大放異彩的一年,但是對于蘋果來說,也是一個多事之秋。
不久前,在蘋果舉行的新產品發(fā)布會上,蘋果推出了iPad系列中最輕、最薄的新iPad。 Pro,并且配備了性能可以稱之為變態(tài)的M4芯片。
M4的CPU根據蘋果公布的參數(shù)值為4大核。 6小核,采用3nm工藝,計算率達到。38 TFLOPS(每秒38萬億次)。
但是,激進的堆積,仍然無法緩解AI時代蘋果的焦慮。
發(fā)布會后,蘋果股價僅在周二(5月7日)收漲0.38%,這種不溫不火的股價,也體現(xiàn)了市場對這種一味“卷硬件”的策略,已經不太感興趣了。
畢竟在客戶眼里,今天的手機和平板電腦性能已經過剩很久了。為什么要為實際上不需要的“高性能”付出昂貴的溢價?
同樣由于這個原因,蘋果的Mac銷量和iPad銷量從去年開始下降了40%。
更為危險的信號是,iPhone在今年中國市場第一季度的排名中,首次跌出前五。
根據TechInsights在市場調研機構發(fā)布的最新數(shù)據,2024年第一季度,中國智能手機出貨量達到6330萬臺,同比增長1%。頭部制造商排名中,在13.7%的市場份額下,蘋果跌出前五名,并加入“others"(其他)團隊。
隨著競爭對手微軟和谷歌已經推出了自己的AI工具和平臺,越來越多的人已經看到,個人終端手機的下一場革命就是目前的生成式AI。
據Gartner預測,到2024年底,全球生成型AI智能手機的出貨量有望達到。2.95億臺,占基礎和高級智能手機出貨量的22%
但是不幸的是,在這個本該大有作為的新世界里,蘋果卻拉胯了,到目前為止還沒有自己的大模型。
01 ipone時刻,AI手機正在迎來”
蘋果的腳步在當今的生成式AI競爭中顯得尤為緩慢和被動。
當微軟、谷歌等巨頭紛紛亮劍,推出自己的大模型時,就連國內榮耀、OPPO等手機廠商也相繼公布了自己專門推出的手機大模型(“法術大模型”、AndesGPT)與此同時,蘋果仍未能推出自主研發(fā)生成型AI產品。
與此同時,Siri早已顯得落后,在當今AI浪潮的沖擊下,其表現(xiàn)也越來越不盡如人意。甚至前蘋果工程師John 同時,Burkey也對Siri的性能進行了尖銳的批評,稱之為“愚蠢”。
實際上,自庫克時代以來,許多人已經意識到,今天的蘋果已經不再是喬布斯時代追求創(chuàng)新、產品為王的蘋果了。
一個重要的區(qū)別是,現(xiàn)在的蘋果已經失去了之前顛覆性的創(chuàng)新和突破—— 例如最近最新的OpenAI發(fā)布會。GPT-4o顯示出強大的AI能力。
在5月14日的新聞發(fā)布會上,OpenAI最新旗艦大模型GPT-4o不僅能夠跨越聽、看、說等能力,而且交互過程流暢順暢,沒有任何延遲,因此可以均值320ms在此期間響應音頻輸入,與真人對話的響應速度幾乎相同。
更加令人敬畏的是,在整個演示中,GPT-4o還進行了多項需求。實時交互的任務。
比如用攝像頭和客戶實時監(jiān)控聊天,或者用攝像頭看客戶寫在紙上的數(shù)學題,回答問題,或者在客戶寫代碼的時候看屏幕上的代碼,給出評價和建議。
所有這些感覺,都像真人一樣絲滑,自然,沒有延遲。
這一爆炸性的功能,直接將Siri這一只能進行腳踏式語音交互的AI,甩到了不知有多少條街。
同理,谷歌的I/O開發(fā)者大會在一天后舉行,為了與GPT-4o進行比較,Gemini 1.5 Pro,還展示了類似逆天的功能。
在演示中,在召喚Gemini后,測試人員打開攝像頭,邊走邊提問,比如:“當你看到會發(fā)出聲音的東西時,告訴我”。
結果,當鏡頭穿過一個揚聲器時,Gemini果然回答說:“我看見一個揚聲器,它可能會說話?!?/p>
正如喬布斯最初在iPhone中引入多點觸摸屏一樣,推動了移動互聯(lián)網時代的到來。
這一毫無門檻、更人性化的交互技術,必將在手機上引發(fā)AI應用的革命,進而推動AI進入家家戶戶。
毫不夸張地說,如果未來手機AI真的有一個iPhone時刻”,因此,構成這一“時刻”的一個關鍵因素,正是這種實時、充滿人性和情感的語音交互AI。
然而,就像第一代iPhone的奇跡是由許多技術元素組成的一樣,AI時代的“iPhone時刻”除了語音交互之外,還需要更多的元素來構成。
這種隱性因素,也可稱為“技術協(xié)力”。蘋果的技術協(xié)力能不能打AI重拳?
02 蘋果AI的實力到底是什么?
在這個階段,構成手機AI“iPhone時刻”的主要技術標準,至少可以概括為三個關鍵因素:端面芯片,模型壓縮技術,以及AI語音交互技術。
在這些模型中,端側芯片作為硬件基礎,不僅決定了手機能夠運行多少參數(shù),而且直接影響到數(shù)據處理的速度和效率;
模型壓縮技術是在手機中實現(xiàn)高性能AI的關鍵。它決定了模型能否保持先進復雜的推理能力,同時將大模型縮小并放入手機。
AI語音交互技術是構建流暢操作界面與人機交流感受的關鍵,它使手機AI能夠準確地理解和響應用戶的語音命令。
端端芯片方面,雖然蘋果在新聞發(fā)布會上聲稱M4強大,但從M3的數(shù)據和相對M3的改進來看,盡管有16個NPU,但從AI算率/生產力的關鍵參考Token生成速度來看,M4的可能性只有26-29/秒左右。
與競爭產品相比,蘋果的M4芯片AI算率(38TOPS)只能算一般。
就AI而言,高通驍龍8Gen3的峰值算率達到45TOPS,英特爾面向AI 酷睿UltraCpuAIPC的算率也可以達到34TOPS,而天璣9300搭載的vivoAI算率 X100 可運行 100 大型億參數(shù)模型,計算率達到 33TOPS。
可見,在AI時代,蘋果在硬件方面并沒有像R&D第一代iPhone那樣占據絕對優(yōu)勢(比如當時的多點觸摸)。
雖然蘋果M系列芯片具有統(tǒng)一內存的巨大優(yōu)勢,但當?shù)啬P瓦\行緩慢,無法面對多線程的劣勢。蘋果的AI芯片可以說是讓開發(fā)者愛恨交加。
但是,第二大技術要素,即模型壓縮技術,蘋果顯示出明顯的滯后。
模型壓縮技術相當于一開始形成“iPhone時刻”的iOS系統(tǒng)。在這個技術領域,雖然蘋果發(fā)表了幾篇關于手機大模型的論文,比如《LLM in a flash: Efficient Large Language Model Inference with Limited Memory》, 總體上看,盡管這些論文的思路,都是在盡最大努力壓縮模型,同時保持其強大的性能,但是到目前為止,蘋果還沒有推出任何具體的大型商品。
在這一領域,一些致力于大模型技術的AI公司,如國內一些AI公司,通常走在前列。。
開源MiniCPM智能公司-V 2.0模型,不只是參數(shù)為2B,超過多個較大模型。,例如Mistral-7B,甚至在許多方面,它也可以與Llama2-13B和Falcon-40B等數(shù)據相媲美。
最后,從語音交互的角度來看,Siri早已顯得滯后、笨拙,在今天的OpenAI中,、面對先進的AI技術,如谷歌,根本沒有任何招架之力。
尤其在5月14日的OpenAI發(fā)布會上,ChatGPT展示了最新的語音功能后,大家都感覺到了這一點。有語氣和情緒,能像人類互相交流時那樣允許插嘴,情緒飽滿。AI語音系統(tǒng),已經對上一代語音AI(如Siri)構成了肉眼可見的輾壓。
由于蘋果在AI方面的拉胯,同時看到今年WWDC(蘋果全球開發(fā)者大會)越來越近,感受到壓力的蘋果,不得不與OpenAI和谷歌進行深入的談判,計劃引入ChatGPT技術,對Siri進行一次重大的“大腦”升級。
03 破損的城墻
長期以來,蘋果之所以能在科技舞臺上脫穎而出,是因為它獨特的封閉生態(tài)系統(tǒng),軟硬件垂直整合。這個系統(tǒng)保證了從iPhone到Mac的每一款產品都能讓用戶體驗到更純粹、更穩(wěn)定的感覺。
但是,隨著AI時代的到來,蘋果在新技術競爭中越來越難以占據所有有益因素。
同樣由于這個原本封閉的IOS系統(tǒng),現(xiàn)在也不得不向OpenAI等巨頭開放,而這種情況,本質上已經表明,原本固若金湯的蘋果城墻,今天已被部分地“攻克”。
然而,這種困境,也不能完全怪庫克,說他不求上進。事實上,這與蘋果本身的商業(yè)性質有關。
我們必須明白,蘋果一直在玩什么?是那種能夠適應自己硬件的。傳統(tǒng)AI。
什么是傳統(tǒng)AI?簡單來說,就是那些致力于特定任務的人,比如面部識別、語音助手、照片推廣等。這些技術側重于利用算法優(yōu)化硬件性能,提升用戶體驗,與蘋果擅長的軟硬件一體化設計理念不謀而合。
比如Face上的iPhone。 ID,看看屏幕就可以解鎖,比如Apple Watch結合AI算法分析,通過心率監(jiān)測、血氧檢測等功能,為用戶提供健康預警和健身建議,這些都是蘋果設備中傳統(tǒng)AI的體現(xiàn)。
這一高度依賴于硬件銷售和服務相結合的商業(yè)模式,決定了生成式AI必然會與之有一定的移位。
由于像ChatGPT這樣的AI,本質上是一個更加“獨立”的系統(tǒng),并非手機、平板等硬件的附屬品。如果沒有硬件,它依賴于云計算率,也可以進行推理。
從這個角度來看,蘋果在生成式AI時代的衰落,難道不是一種必然嗎?
事實上,這并不完全可見。
如果喬布斯仍然掌舵蘋果,蘋果的語音AI表現(xiàn)可能不會像今天這樣糟糕,因為他對用戶體驗的偏執(zhí)追求至少不會容忍Siri這么長時間的不良感受。
與此同時,喬布斯不僅了解了客戶目前的需求,而且憑借對市場和技術的洞察,預見未來顧客的可能需求。
例如,在20世紀80年代,喬布斯預見到了圖形用戶界面(GUI)取代傳統(tǒng)的命令界面。并且將GUI應用到蘋果的Lisa和Macintosh計算機上,成為個人計算機行業(yè)的重要里程碑。
同樣,在2000年代初,當手機市場主要由功能手機主導時,他預見到了智能手機的巨大潛力,并推出了iPhone。
2010年代,它對便攜式、長壽命的移動計算設備的需求進行了前瞻性的預見,并推出了iPad,迅速開啟了平板電腦市場。
庫克在銷售方面很出色,顯然已經意識到蘋果的問題,最近也發(fā)布了端側UI模型Ferretret-UI,他可以理解屏幕上的內容,并且可以識別和使用特定的UI元素。
許多人猜測,蘋果的意圖是在移動終端上用自己的大模型處理簡單的任務(短信處理/iPhone 通知),云用其他大型家庭模型處理復雜的任務(生成圖像/電子郵件回復)。
這種權宜之計,對蘋果來說,也是最好的辦法,一向閉源的iOS也不得不半推半就地接受“靈魂”植入。 畢竟三星Galaxy 通過與Google大模型的合作,S24的手機銷量增加了兩位數(shù)。 。自身銷售下滑趨勢無法停止,暗流涌動下的傍晚非常艱難。
停止造車后,AIl In AI 蘋果,也沒有勇氣全力打造一個堪比ChatGPT的大模型,只能說時代正在慢慢地碾過巨人的尸體。
本文來自微信公眾號“鯨選Pro”(ID:gh作者:舉名耳,36氪經授權發(fā)布,_a334d6a5e7ef)。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。
免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com