亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

AI手機(jī),蘋果再次走在國(guó)內(nèi)廠商前面?

2024-06-16

今年蘋果WWDC結(jié)束后,雖然媒體的評(píng)價(jià)是“沒(méi)有驚喜”,但羅永浩作為頭號(hào)黑粉,卻異常安靜。今年1月,最后一條“殺人”微博憤怒地譴責(zé)榮譽(yù)抄襲。


相反,馬斯克發(fā)了七篇文章。 ,狂噴蘋果完全訪問(wèn)了OpenAI的ChatGPT。他甚至在庫(kù)克的帖子下放大了自己的臉,說(shuō)如果庫(kù)克不阻止這個(gè)令人毛骨悚然的植入軟件,他會(huì)把禁止蘋果設(shè)備進(jìn)入自己的企業(yè),并給出一個(gè)科技界廣為人知的表情包。



雖然外界也罷奇馬斯克為什么這么狂躁,但主要關(guān)注的還是Apple“沒(méi)有驚喜”。 Intelligence(蘋果智能)。著名的果鏈分析師郭明邈在給蘋果敲響警鐘的同時(shí),也沒(méi)有忘記提醒消費(fèi)者,AI可能是蘋果區(qū)分高端和低端機(jī)型的新標(biāo)簽。


在WWDC發(fā)布會(huì)之后,蘋果股價(jià)做了一圈過(guò)山車,首先在發(fā)布當(dāng)天聞到的聲音下降了2%,第二天又奇妙地上漲了7%。


從不滿到青睞,資本市場(chǎng)態(tài)度在24小時(shí)內(nèi)驚天動(dòng)地。投資者誤解庫(kù)克了嗎?然而,原本樂(lè)于看到它的國(guó)內(nèi)廠商仍在盡最大努力制造蘋果落后的話題。


不是國(guó)內(nèi)廠商蹭流量,主要是AI手機(jī)。蘋果之所以被評(píng)價(jià)為“沒(méi)有驚喜”,是因?yàn)橐恍┫M(fèi)者已經(jīng)使用了國(guó)產(chǎn)AI手機(jī)。換句話說(shuō),國(guó)內(nèi)廠商已經(jīng)教育了WWDC上蘋果拿出來(lái)的所有東西。


所以問(wèn)題來(lái)了,這次蘋果還能走在國(guó)內(nèi)廠商前面嗎?


01 AI手機(jī)已經(jīng)到了第二階段


先說(shuō)說(shuō)AI手機(jī)在討論先后問(wèn)題之前到了哪個(gè)階段。


一般來(lái)說(shuō),AI手機(jī)分為三個(gè)階段:App、功能和原生化。簡(jiǎn)單來(lái)說(shuō),去年年初出現(xiàn)了各種chatGPTApp的第一階段,隨著OPPO、三星等廠商推出AI手機(jī),第二階段也已經(jīng)到來(lái)。


現(xiàn)階段的AI手機(jī),今年1月發(fā)布的OPPO Find X7 還有三星Galaxy S24,具有典型的AI功能特征:支持通話摘要,AIGC清除,AI語(yǔ)音助手等。


而且,在AI手機(jī)的整體思路上,每個(gè)家庭都趨于一致:將大模型能力內(nèi)在于操作系統(tǒng),而不是以醒目的AI應(yīng)用呈現(xiàn),而是進(jìn)一步落地到具體的手機(jī)使用場(chǎng)景,最終目的是讓AI功能看似無(wú)處不在,卻無(wú)處不在。


具體功能集中在以下幾類:


1 輸入法。將生成式AI集成到鍵盤軟件中,提供風(fēng)格建議和智能重寫等功能。例如三星Galaxyy AI用戶可以改寫不同風(fēng)格和情感的句子,同時(shí)提供拼寫和語(yǔ)法糾正。


2 例如三星Galaxyyy的實(shí)時(shí)翻譯和轉(zhuǎn)錄。 ZenfoneS24和華碩 11 Ultra可以利用設(shè)備端的AI功能實(shí)現(xiàn)通話的實(shí)時(shí)翻譯。另外,S24的實(shí)時(shí)翻譯功能提供電話實(shí)時(shí)轉(zhuǎn)錄,文本顯示在屏幕上,以便于參考,Zenfone的AI Transcript可以自動(dòng)將語(yǔ)音轉(zhuǎn)換成書(shū)面文本。


3 生成和編輯圖像內(nèi)容。比如小米14和小米14Ultra引入了“AI人像”功能,用戶可以在手機(jī)中使用圖庫(kù)中自己的照片進(jìn)行訓(xùn)練。訓(xùn)練結(jié)束后,用戶可以在幾乎任何設(shè)置中生成逼真的AI自拍,只需輸入文本提醒。OPPO Find X7 Ultra可以實(shí)現(xiàn)AIGC橡膠擦拭功能,允許不需要的物體或人物在離線狀態(tài)下從照片中刪除。


4 通過(guò)LLM實(shí)現(xiàn)AI驅(qū)動(dòng)的個(gè)性化功能。三星Galaxyy S24可以根據(jù)需要生成類似人類的文本能力,也可以幫助編寫電子郵件或文檔。OPPO Find X7 Ultra提供了多回合的上下文感知對(duì)話,還提供了虛擬助手。


5 生成AI界面工具。榮耀的任何門功能用戶都可以在應(yīng)用程序之間拖動(dòng)文本或圖像等元素,AI可以預(yù)測(cè)客戶的意圖,并建議相關(guān)應(yīng)用程序共享內(nèi)容。


根據(jù)上述功能,蘋果之所以被評(píng)為“沒(méi)有驚喜”,是因?yàn)樗闹饕δ茳c(diǎn)落在了文字、照片、語(yǔ)音轉(zhuǎn)錄、語(yǔ)義搜索和語(yǔ)音助手上。換句話說(shuō),比蘋果強(qiáng),還停留在AI手機(jī)的第二階段。


然而,蘋果似乎故意制造了一套盲目的方法,并沒(méi)有在新聞發(fā)布會(huì)上公布自主研發(fā)的大模型。此外,Apple“沒(méi)有驚喜” Intelligence,導(dǎo)致股價(jià)短暫波動(dòng)。然而,發(fā)布會(huì)結(jié)束后,蘋果在一個(gè)低調(diào)的技術(shù)博客中進(jìn)行了深度摩擦的介紹。端側(cè)模型和云模型都是自己開(kāi)發(fā)的。


其中,端側(cè)模型是一個(gè)30億參數(shù)(3B)的小模型,蘋果沒(méi)有公布云模型的具體參數(shù)。蘋果基本可以在3B級(jí)小模型和幾個(gè)主流7B級(jí)模型的能力上獲勝,而云模型則直接達(dá)到GPT-4。 Turbo級(jí)別。


此外,一些分析人士認(rèn)為,即使蘋果實(shí)現(xiàn)的AI功能并不突出,它仍然有一定的優(yōu)勢(shì),因?yàn)樗梢愿玫貙?shí)現(xiàn)AI功能。


以文生圖功能為例。一般用戶對(duì)手機(jī)沒(méi)有生圖的需求,但蘋果把這個(gè)功能放在了真正的需求上:比如GenEmoji、在message中聊天圖片,iPad文檔處理草圖變精圖等,AI介入使這一功能真正有用,促進(jìn)了客戶的需求。


而且這并非蘋果最大的欲望。


02 由功能到原生化


騰訊于去年十二月發(fā)表了一篇題為《《AppAgent: Multimodal Agents as Smartphone Users》論文直譯為“作為智能手機(jī)客戶,需要多種代理方式”。介紹了一個(gè)基于LLM的新型多模態(tài)Agent框架,旨在操作智能手機(jī)應(yīng)用。


簡(jiǎn)單來(lái)說(shuō),騰訊設(shè)計(jì)了一個(gè)可以模仿人類點(diǎn)擊、滾動(dòng)等交互操作的框架,從而達(dá)到控制手機(jī)的目的的框架。關(guān)鍵是這種方法不需要瀏覽系統(tǒng)的后端,換句話說(shuō),它在不同的應(yīng)用程序中有很高的適用性。


騰訊為AppAgent設(shè)置了三個(gè)主要功能:


1) 獨(dú)立探索學(xué)習(xí):智能體可以獨(dú)立探索應(yīng)用程序,不需要外部指導(dǎo)。


2) 觀察人類演示學(xué)習(xí):智能體通過(guò)觀察客戶的操作演示來(lái)學(xué)習(xí)任務(wù)執(zhí)行。


3) 建立知識(shí)庫(kù):智能體通過(guò)上述學(xué)習(xí)過(guò)程積累經(jīng)驗(yàn),建立知識(shí)庫(kù),用于跨應(yīng)用程序執(zhí)行復(fù)雜的任務(wù)。


從理論上講,AppAgent是一個(gè)應(yīng)用程序,可以幫助你操作所有的應(yīng)用程序。與蘋果在新聞發(fā)布會(huì)上的演示類似,客戶告訴Siri他想接機(jī)。Siri可以從郵件中獲取航班信息,查找最新的航班信息,調(diào)用地圖App形成路線,最后生成一個(gè)完整的建議。


通過(guò)了解UI來(lái)執(zhí)行智能體指令,或者AI手機(jī)從功能性轉(zhuǎn)向原生化,將多模態(tài)能力客戶的UI界面。蘋果發(fā)布的Ferret UI大模型,意在操作系統(tǒng)層面學(xué)習(xí)用戶的使用習(xí)慣,并有望取代用戶進(jìn)行操作。


AI手機(jī)基于對(duì)UI的認(rèn)知,結(jié)合終端智能體的任務(wù)規(guī)劃和分配能力,具有實(shí)現(xiàn)以下重大飛躍的潛力:用戶使用自然語(yǔ)言下達(dá)指令,AI手機(jī)理解意圖并將其拆分為具體的工作流程,然后模擬用戶操作從UI執(zhí)行指令。最后,實(shí)現(xiàn)了跨App的操作和復(fù)雜的任務(wù)執(zhí)行。完成了AI原生手機(jī)操作系統(tǒng)的主要結(jié)構(gòu)。


例如,當(dāng)客戶用自然語(yǔ)言向AI手機(jī)輸入指令“幫我買一張明天下午2點(diǎn)去北京的火車票”時(shí),智能手機(jī)首先接受語(yǔ)音、語(yǔ)義分析和意圖理解,然后拆分任務(wù)。拆分為:開(kāi)啟12306 App、選擇搜索票,選擇地址“北京”、選擇“明天下午2點(diǎn)”、選擇“靠窗”、選擇“乘客名”、點(diǎn)擊“購(gòu)買”;并且通過(guò)UI模型,在App上解讀不同的UI界面,模擬用戶點(diǎn)擊操作,實(shí)現(xiàn)整個(gè)過(guò)程。


這一系列操作是否與蘋果在新聞發(fā)布會(huì)上的演示非常相似,但蘋果現(xiàn)階段并沒(méi)有使用智能名稱,而是稱之為了解客戶情況,實(shí)現(xiàn)跨App操作。


今年MWC展上也出現(xiàn)了類似的產(chǎn)品。Brain.基于App-less交互模式的ai展示概念手機(jī)T-Phone,使用者只需在對(duì)話框中輸入需求,即可快速響應(yīng)。T-Phone的核心概念是摒棄以App為中心的傳統(tǒng)手機(jī),然后通過(guò)AI使用前后的預(yù)測(cè)生成界面,幫助用戶實(shí)現(xiàn)目標(biāo)。


在國(guó)內(nèi)廠商中,榮譽(yù)在法術(shù)OS上推出的任何一個(gè)門功能也是AI手機(jī)原生化的雛形。它允許用戶在應(yīng)用程序之間拖動(dòng)文本或圖像等元素。雖然被羅永浩抄襲,但其核心能力是“AI預(yù)測(cè)客戶意圖,建議相關(guān)應(yīng)用共享內(nèi)容”。當(dāng)時(shí)榮譽(yù)聲稱,預(yù)計(jì)將支持世界上約100個(gè)最常用的應(yīng)用程序。


無(wú)論是蘋果、騰訊、榮譽(yù)還是Brain.ai,這類企業(yè)最終希望實(shí)現(xiàn)的目標(biāo)是:


用戶只需輸入自己想要的服務(wù)(通過(guò)語(yǔ)音、文字等)。),手機(jī)會(huì)直接跳轉(zhuǎn)到服務(wù)頁(yè)面,或者AI智能系統(tǒng)會(huì)直接完成客戶需要的服務(wù)。


但是基于AI智能體的多元化、自然交互體驗(yàn),需要一定的甚至所有的功能和服務(wù)支持。在此基礎(chǔ)上,AI智能體的交互可以從過(guò)去的GUI中獲得。(Graphical User Interface)發(fā)展成VUI(Voice User Interface),最終升級(jí)為全新的Agent(App-less)UI,這意味著AI智能體與用戶之間的交互將會(huì)發(fā)生,削弱APP的存在感。


因此,預(yù)計(jì)這種進(jìn)化不會(huì)一蹴而就。在未來(lái)很長(zhǎng)一段時(shí)間內(nèi),AI智能體和App將同時(shí)活躍在AI手機(jī)中。而且不僅手機(jī)廠商,頭部App也可以圍繞自己的業(yè)務(wù)生態(tài)打造專門的AI智能體,例子就是騰訊發(fā)表的論文。


03 尾聲


回到我們?cè)谖恼麻_(kāi)頭提到的問(wèn)題,蘋果能否在AI手機(jī)上領(lǐng)先。表面上看,蘋果似乎沒(méi)有突破現(xiàn)有AI手機(jī)的特點(diǎn),但有三點(diǎn)值得關(guān)注。


首先,蘋果利用Siri實(shí)現(xiàn)的跨App操作,與AI手機(jī)原生化階段的智能體非常接近。目前國(guó)產(chǎn)品牌在這方面還是落后的;


其次,在第二階段的演變中,蘋果仍然保持著技術(shù)優(yōu)勢(shì)。比如蘋果和國(guó)內(nèi)品牌在處理大模型手機(jī)內(nèi)存瓶頸時(shí),選擇了不同的技術(shù)路線。


蘋果的思路是通過(guò)內(nèi)存優(yōu)化解決小內(nèi)存操作大模型的問(wèn)題。它構(gòu)建了一個(gè)以閃存為核心的推理成本模型,并使用窗口化。(Windowing)還有團(tuán)隊(duì)捆綁(Row-Column Bundling)為了最大限度地減少數(shù)據(jù)傳輸,最大限度地提高閃存吞吐量,兩項(xiàng)核心技術(shù)。


簡(jiǎn)而言之,蘋果實(shí)現(xiàn)了iPhone,8G內(nèi)存。 15 同樣是8G內(nèi)存的Pixel跑通3B參數(shù)模型 8和8a,今年5月才跑過(guò)1.8B。Gemnini Nano。


相比之下,國(guó)內(nèi)廠商之所以能夠在12G內(nèi)存型號(hào)上運(yùn)行7B參數(shù)模型,是因?yàn)檫x擇了壓縮路線。


例如vivo和OPPO已經(jīng)在端側(cè)運(yùn)行了7B參數(shù)模型,但核心能力來(lái)自聯(lián)發(fā)科。借助后者的混合精度INT4量化技術(shù)和NeuroPilot Compression技術(shù)可以將130億參數(shù)LLM所需的存儲(chǔ)空間從13GB減少到5GB。


今年四月,榮譽(yù)還宣布,基于自己的平臺(tái)級(jí)AI壓縮技術(shù),7B模型可以在12GB內(nèi)存設(shè)備中快速啟動(dòng)。


總而言之,在AI手機(jī)這個(gè)問(wèn)題上的競(jìng)爭(zhēng),已經(jīng)不再是大模型了,而是如何以更低的成本提供更好的服務(wù)。


三是蘋果宣布開(kāi)放AI。 SDK,這個(gè)信息可能被很多人忽略了。


未來(lái)開(kāi)發(fā)者可以調(diào)用蘋果手機(jī) SDK,基于用戶情景理解,完善第三方App的AI功能。AI手機(jī)的使用體驗(yàn)將在未來(lái)第三方應(yīng)用程序配備AI能力后得到增強(qiáng),這是目前用戶手機(jī)的主要使用場(chǎng)景。


但是對(duì)于國(guó)內(nèi)廠商來(lái)說(shuō),這可能是一項(xiàng)艱巨的工作。所以國(guó)內(nèi)廠商的問(wèn)題變成了,雖然在思路和布局上領(lǐng)先蘋果,但在技術(shù)和生態(tài)上還是要追求的,這恰恰是蘋果難以超越的環(huán)城河。


參考資料


[1] AppAgent:Multimodal Agents as Smartphone Users,騰訊團(tuán)隊(duì)


[2] 為何華為麒麟9000s,MTK9300S?極客視野?


[3] 蘋果發(fā)布了Ferrettret的多模式模型-UI,部分手機(jī)UI任務(wù)超過(guò)GPT-4V,雷峰網(wǎng)leiphone


[4] 全面禁用蘋果設(shè)備的馬斯克,隱私泄露賊喊捉賊?太平洋科技


[5] 股價(jià)暴漲7%!在深入挖掘了兩份低調(diào)公布的信息后,我們發(fā)現(xiàn)了蘋果AI的秘密,騰訊科技


[6] AI端深度報(bào)告之AI手機(jī),中銀國(guó)際


[7] 蘋果2024 中銀國(guó)際WWDC評(píng)價(jià)


本文來(lái)自微信公眾號(hào)“解碼Decode”(ID:36氪經(jīng)授權(quán)發(fā)布kankeji001)。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com