亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<span id="tvfmj"></span>

AI 大模型向智能移動(dòng)端側(cè)狂奔

2023-07-17

智能手機(jī)革命性的技術(shù)突破停滯已久。GPT出現(xiàn)后，業(yè)界逐漸達(dá)成共識(shí)：在智能終端（包括手機(jī)）落地端側(cè)大模型，將再次拉開激動(dòng)人心的重大創(chuàng)新的大幕。

在上海MWC 2023期間，榮耀CEO趙明宣稱，榮耀將在智能手機(jī)端推動(dòng)部署端側(cè)大模型，以此作為榮耀新一輪產(chǎn)品技術(shù)攻堅(jiān)的起點(diǎn)。但在7月12日，趙明沒(méi)有披露其新一代折疊屏Magic V2端側(cè)AI大模型的相關(guān)信息。

目前，端側(cè)大模型的呈現(xiàn)形式均為軟件。華爾街見聞了解到，榮耀AI大模型也將呈以軟件形式，很可能被整合在MagicOS 8.0版本中。

不同于榮耀提出的在智能手機(jī)端部署AI大模型的能力著眼于未來(lái)，今年2月，高通已首次在Android智能手機(jī)上部署Stable Diffusion模型，十多秒即能生成AI圖像。

高通產(chǎn)品管理高級(jí)副總裁兼AI負(fù)責(zé)人Ziad Asghar認(rèn)為，大模型將迅速重塑人機(jī)交互方式。

高通先行：洞察個(gè)體需求

7月12日，榮耀發(fā)布新一代旗艦機(jī)“Magic V2”。在此之前的6月29日，榮耀CEO趙明曾公開宣稱，Magic V2將具有革命性的越級(jí)體驗(yàn)。榮耀希望以此與行業(yè)一起，打破蘋果一家獨(dú)大局面。趙明同時(shí)表示，榮耀將率先將AI大模型引入端側(cè)。

但在7月12日，趙明對(duì)Magic V2的技術(shù)特性或產(chǎn)品特征等信息的闡述，著重的是該機(jī)型的厚度（9.9mm）和重量（231克），卻并未涉及端側(cè)AI大模型。此舉與趙明此前對(duì)Magic V2的端側(cè)AI大模型吹風(fēng)形成鮮明對(duì)比。若是細(xì)品趙明在6月29日的說(shuō)法——“未來(lái)將率先把AI大模型引入端側(cè)”，趙明或許意有所指。據(jù)華爾街見聞了解，未來(lái)榮耀要發(fā)布的MagicOS 8.0版，在部署AI大模型方面，很可能就會(huì)有所動(dòng)作。

榮耀的AI大模型在端側(cè)到底具有什么樣的能力，這是個(gè)什么樣的軟件矩陣（包括編譯/解碼器、算力平臺(tái)、能耗控制、參數(shù)數(shù)量和開發(fā)工具等），目前不得而知。

從行業(yè)層面看，高通已在今年2月首次在智能手機(jī)上實(shí)現(xiàn)了AI模型部署。到今年5月，高通部署的Stable Diffusion模型參數(shù)已增至10億+。

Stable Diffusion是一個(gè)從文本到圖像的生成式AI擴(kuò)散模型，能基于任何文本輸入，在數(shù)十秒內(nèi)創(chuàng)作出逼真圖像。

目前AI繪畫最火的模型是Midjorney和Stable Diffusion，但目前Midjourney模型沒(méi)有開源。Stable Diffusion由StabilityAI公司于2022年提出，論文和代碼都已開源。Stable Diffusion是Diffusion的改進(jìn)版，主要作用是解決Diffusion模型的速度問(wèn)題。

關(guān)于文字怎么生成圖片，技術(shù)原理解釋起來(lái)過(guò)于復(fù)雜。簡(jiǎn)單來(lái)說(shuō)，從Stable Diffusion最初的名字“Latent Diffusion Model（LDM）”看，本質(zhì)是壓縮了圖片的像素，尺寸變小，再通過(guò)編譯器（為何提及榮耀端側(cè)大模型包含了什么樣的編譯器？）將擴(kuò)散壓縮后的圖片還原成原始尺寸，其余的過(guò)程和Diffusion模型差不多類似。

在壓縮圖片的過(guò)程中，提升了文本轉(zhuǎn)化成圖片的速度，這是Stable Diffusion的主要功能。

回到高通在安卓手機(jī)中部署的Stable Diffusion模型。實(shí)現(xiàn)文本轉(zhuǎn)圖像，只是大模型在端側(cè)實(shí)現(xiàn)部署時(shí)，就像宇宙的一粒塵埃，這只是智能手機(jī)未來(lái)革命性的應(yīng)用體驗(yàn)的一個(gè)極小的“元素”。

通過(guò)部署端側(cè)大模型的數(shù)字助手，將成為一種超越想象的存在。未來(lái)的用戶，將有幸通過(guò)智能手機(jī)操控一切商業(yè)服務(wù)，包括餐飲、各類訂票、專業(yè)咨詢、娛樂(lè)、攝影攝像、撰稿、辦公、參與金融活動(dòng)等等。

這就真能實(shí)現(xiàn)高通這位AI負(fù)責(zé)人Ziad Asghar說(shuō)的那樣，“大模型有能力真正重塑我們與應(yīng)用交互的方式”。

只有真正在端側(cè)部署AI大模型，智能終端的“智能”一詞，才能名副其實(shí)。

趙明說(shuō)，“端側(cè)AI大模型的使命就是更好地理解用戶：知道我?guī)c(diǎn)睡覺，知道我喜歡吃什么，能解決我的即時(shí)需求，相當(dāng)于擁有洞察我需求的能力。”

做到擁有對(duì)使用者的個(gè)性需求洞察，原因是每部智能手機(jī)包含的個(gè)人應(yīng)用數(shù)據(jù)，與能理解文字、影音和圖像等多模態(tài)輸入的大語(yǔ)言模型結(jié)合，最終智能手機(jī)的數(shù)字形式（比如虛擬數(shù)字人）就能極為精準(zhǔn)地掌握使用者的偏好。更重要的是，這樣強(qiáng)悍的個(gè)性化體驗(yàn)，還能建立在保護(hù)個(gè)體隱私的基礎(chǔ)上。

怎樣解決端側(cè)AI模型短板

目前，尚無(wú)哪家技術(shù)公司能真正全面部署端側(cè)AI大模型。

高通和華為成為了先行者。兩者的區(qū)別在于高通更加系統(tǒng)，從底層技術(shù)入手，比如利用高通AI軟件棧（Qualcomm AI Stack）執(zhí)行全棧AI優(yōu)化；而華為則更側(cè)重具體的應(yīng)用體驗(yàn)，但相比高通，華為的探索以其具象，從而顯得更具有節(jié)點(diǎn)嘗試特征。

從技術(shù)角度看，高通在智能手機(jī)中部署Stable Diffusion模型，實(shí)際上是將Stable Diffusion模型整合在手機(jī)的混合AI架構(gòu)中，進(jìn)而將之作為量化、編譯和硬件加速優(yōu)化等AI技術(shù)，以此支撐高度智能的應(yīng)用體驗(yàn)。

榮耀未來(lái)若真的在MagicOS 8.0中部署端側(cè)AI大模型，也將是這個(gè)技術(shù)原理。

實(shí)際上，通過(guò)自然語(yǔ)言（NLP）搜索，華為P60已能以之匹配出與描述相符的照片。這一功能，也是端側(cè)AI大模型龐大強(qiáng)悍能力中的一個(gè)極小的應(yīng)用點(diǎn)。

這個(gè)應(yīng)用體驗(yàn)的實(shí)現(xiàn)，背后有華為多模態(tài)大模型技術(shù)和模型小型化處理技術(shù)的支撐。華為將自然語(yǔ)言智能搜圖模型整合進(jìn)了鴻蒙系統(tǒng)（HarmonyOS），實(shí)現(xiàn)與眾不同的精準(zhǔn)自然語(yǔ)言手機(jī)圖庫(kù)搜索體驗(yàn)。

相比華為，高通的端側(cè)AI大模型部署，更側(cè)重系統(tǒng)性的特征。

比如，高通的全棧AI研究，是指優(yōu)化跨應(yīng)用、神經(jīng)網(wǎng)絡(luò)模型、算法、軟件和硬件。針對(duì)Stable Diffusion，高通從Hugging Face（開源模型庫(kù)公司，旗下明星開源庫(kù)是“Transformers”）的FP32 1-5版本開源模型入手，通過(guò)量化、編譯和硬件加速推動(dòng)優(yōu)化，使其能在搭載第二代驍龍8移動(dòng)平臺(tái)的手機(jī)上運(yùn)行。

在智能終端部署AI大模型，必須要解決性能和能耗問(wèn)題。

首先，通過(guò)讓大模型在高通專用AI硬件上高效運(yùn)行，并降低內(nèi)存帶寬消耗，量化不僅能提高性能，還可降低功耗。這些包括諸如自適應(yīng)舍入（AdaRound）等高通AIMET量化技術(shù)，能在更低精度水平保持模型的準(zhǔn)確性，而無(wú)需做重新訓(xùn)練。

其次，以高通AI模型增效工具包（AIMET）訓(xùn)練后量化，可實(shí)現(xiàn)將大模型從FP32壓縮為INT8。這是基于高通AI Research創(chuàng)造的技術(shù)所開發(fā)的工具，目前已集成進(jìn)Qualcomm AI Studio中。

這部分能力由量化完成，其作用是將大模型在精度不變的情況下，從浮點(diǎn)數(shù)轉(zhuǎn)變成整數(shù)，節(jié)省計(jì)算時(shí)間，以及在確保模型性能的同時(shí)，壓縮整體規(guī)模，使之更容易部署在終端。

此外，AI模型能以最高性能和最低功耗高效運(yùn)行的關(guān)鍵，在于編譯器。AI編譯器將輸入的神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)化為能在智能應(yīng)用終端上運(yùn)行的代碼，同時(shí)針對(duì)時(shí)延、性能和功耗做持續(xù)優(yōu)化。

值得一提是高通5G移動(dòng)平臺(tái)驍龍8 Gen2首度集成的AI專用Hexagon處理器，采用了獨(dú)立的專用供電系統(tǒng)，支持微切片推理、INT4精度和Transformer網(wǎng)絡(luò)加速等，能在提供更高性能的同時(shí)，降低能耗和內(nèi)存占用。這也是高通AI軟件棧的組成部分。

這些技術(shù)能應(yīng)用于構(gòu)成Stable Diffusion的所有組件模型，即基于Transformer的文本編碼器、VAE解碼器和UNet。這對(duì)于讓大模型在終端上的順利運(yùn)行至為重要。

高通的全棧AI優(yōu)化，最終實(shí)現(xiàn)了通過(guò)Stable Diffusion模型在智能手機(jī)上的運(yùn)行，能達(dá)成15秒內(nèi)執(zhí)行20步推理，并生成一張512x512像素的圖像。這是在智能手機(jī)上最快的推理速度，能媲美云端時(shí)延，且用戶文本輸入完全不受限制。

無(wú)論是大模型公司，還是像高通這樣的終端軟硬件技術(shù)公司，抑或者是榮耀和華為一類的智能終端商，當(dāng)行業(yè)實(shí)現(xiàn)上下游協(xié)同，共同推動(dòng)將AI大模型在端側(cè)實(shí)現(xiàn)泛在部署，最終將真正引發(fā)新一輪智能終端的技術(shù)創(chuàng)新浪潮，切實(shí)擔(dān)起趙明所稱的在智能終端帶來(lái)革命性的應(yīng)用體驗(yàn)重任。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

馴服AI，用技術(shù)對(duì)抗技術(shù)風(fēng)險(xiǎn)

好萊塢大規(guī)模抵制AI，他們?cè)趽?dān)憂什么

微眾信科：小微全客群覆蓋，提高融資獲得率和滿足率

貴州茅臺(tái)上半年凈賺356億，凈利同比增長(zhǎng)19.5%

2023年度大盤票房達(dá)301億，已超去年全年

<i id="fduu8"><legend id="fduu8"></legend></i>

<li id="fduu8"><dl id="fduu8"></dl></li>

<label id="fduu8"></label>

<span id="fduu8"></span>