五大手機實測,大模型新功能到底能做什么?
假使你像老狐一樣關(guān)注手機發(fā)布會啊,你會發(fā)現(xiàn)除了Cpu之外、圖像,屏幕,系統(tǒng)這些,最近有一個功能各大手機品牌會花很多時間來介紹。
但是,如果你買了手機,前面的軟硬件就是你要考慮的問題, AI 大型模型,我想 99% 沒有人會考慮,對吧?
不可否認(rèn),AI 代表未來,而且手機廠商都在這方面投入了很高的成本,那么現(xiàn)在手機的大模型哪個最好用呢?
我們找到了華為,小米,OPPO 、vivo ,而且看了其他家庭的新聞發(fā)布會后,自信心爆棚,又決定召開新聞發(fā)布會的魅族,他們的新旗艦機。
看看這五個大模型中誰的功能更強。
首先介紹一下參數(shù)。
vivo X100 和 OPPO Find X7 用的是天璣 9300 , 根據(jù)MTK的說法,支持最高支持 330 大模型的億參數(shù)在 端側(cè)運行 。
vivo 宣傳手機的大模型是端側(cè)側(cè) 70 億加云端 700 億 。
OPPO 在這里,安第斯大模型是 70 億端側(cè)加 1800 億云端。
華為 Mate 60 Pro 在華為背后有一個盤古大模型團(tuán)隊,而不是側(cè)載大模型,而是通過云大模型來處理客戶的需求。
高通驍龍用于小米和魅族。 8 Gen3 ,支持端側(cè) 100 十億參數(shù)模型。
大型魅族模型 Flyme AI ,宣傳是開放的 AI 。 簡而言之,就是自己不開發(fā),與其他大型團(tuán)隊合作。
雷軍在去年 8 月亮發(fā)布會上提到小米跑通了。 13 一億規(guī)模的端側(cè)大模型,但達(dá)到小米。 14 但是發(fā)布的時候沒有提到。
因此,小米 14 、魅族 21 和華為手機一樣,很有可能沒有大模型的側(cè)載,或者不值一提。
在 AI 在設(shè)置中,還可以找到一些證據(jù),find X7 支持清除離線圖線,vivo 支持本地圖片風(fēng)格化和文檔總結(jié)。
但在 Mate 60 Pro 、小米 14 和魅族 21 里面,沒有本地大模型的設(shè)置。
要說的是,OPPO 的離線和 vivo 這個地方是有區(qū)別的。
OPPO 即使斷網(wǎng),還是 可以消除畫面物體,vivo 當(dāng)?shù)氐拇笮湍P鸵坏嗑W(wǎng)就不能使用。
上述是各大模型的基本情況。
就參數(shù)而言,OPPO 的云端 1800 億挺唬人,但華為有盤古大模型,在模型技術(shù)這一塊積累得更深,大家覺得誰強?
各手機廠商對于大模型的應(yīng)用,都是將大模型融入到原來的語音助手中,所以開啟方式還是包括在內(nèi)。語音喚醒、長按電源鍵喚起、耳機喚起。
但是各大廠商也有不同的設(shè)計,華為和 OPPO 為語音助手提供快捷的方法。
vivo 除了 “ 藍(lán)心小 V 還有“”,還有“” Jovi 聲音”,藍(lán)心小 V 是 Jovi 部分語音功能。
小米沒有 APP ,點擊底部搜索框右側(cè)的小愛同學(xué)圖標(biāo)即可進(jìn)入大模型功能。若經(jīng)常使用搜索功能,這種設(shè)計非常好。
但是一位原教旨主義資深米粉同事則表示,這一搜索框必須撤銷,因為不能使用還占用屏幕。
最佳設(shè)計是魅族,長按底部橫條 mback 按鍵可以進(jìn)入語音助手,這種呼出方式還支持識屏,在設(shè)備上如影隨形,讓人感覺很簡潔。
我知道這里可能有人夸耀魅族,但是先等等…
魅族還有一個“魅族” Aicy 語音 ”,而在這里 APP 主界面,但沒有語音入口,需要進(jìn)入下一級菜單才能打開場景語言助手功能。
并且,在 Aicy 語音里,Mback 呼出語音助手功能無效。
這兒的交互邏輯,讓人感到十分疑惑,就像我們蓋了一棟房子,一樓沒有門,要從二樓的窗戶進(jìn)去。
但我還是想夸一句,魅族的 mback 真的很有氣場。
回到日常使用體驗,我們從日常服務(wù)開始,首先是最常用的語音助手功能。
比如打開相冊,播放歌曲,這位語音助手都會,不做演示。
現(xiàn)在我們將延長對話:我想讓你幫我打開一些。 APP ,先打開相冊。
華為小藝在這里,OPPO 小布和小米小愛都可以正確識別并打開相冊。
vivo 小 V 說明超出了理解范圍…
魅族小溪也沒有打開,但是從對話的角度來看,它似乎理解了我的要求,推薦了相冊應(yīng)用。
那么我們再復(fù)雜一點,把相冊前面放在相冊前面。“ 開啟 ”去掉這個關(guān)鍵字:請幫我打開一些APP,首先是相冊。
來到這兒,小愛同學(xué)和小布都失敗了,“ 開啟一些 ” 成為干擾因素,小愛同學(xué)就是 APP 請求暫時無法支持,小布已經(jīng)開始推薦其他請求。 APP 了。
小 V 仍然超出了理解范圍,魅族明白了,推薦了相冊應(yīng)用, 只有華為成功了 。
順便說一句,在這里,沒有大模型。 Siri 同時執(zhí)行成功,小伙伴們可以試一試。
再復(fù)雜一點,變成多個。 APP :我想讓你幫我打開一些。 APP ,第一個是相冊,然后關(guān)掉,再打開嗶哩嗶哩。
華為仍然是唯一一個執(zhí)行操作的人。
也許有些人會認(rèn)為這樣測試語音助手的理解能力是沒有用的,是在吹毛求疵, 那么,如果我們想讓它設(shè)置鬧鐘...
像我這樣起床困難的家庭,起床 起碼得設(shè)置 3 個鬧鈴吧:明天早上請幫我設(shè)置鬧鐘,一個7:50,一個7:55,一個8:00。
只有小藝三個鬧鐘設(shè)置成功,而其它鬧鐘只能讀取一個時間點來設(shè)置鬧鐘。
此時此刻,我明白,每個人的腦海里都有那四個字啊。
就在我驚嘆小藝遠(yuǎn)遠(yuǎn)領(lǐng)先于同行這么多時候,檢測其他人。 APP 時間卻翻車了。
舉例來說,讓他們在美團(tuán)找外賣:尋找美團(tuán)的雞蛋炒飯
小 V 能夠成功識別并找到雞蛋炒飯,小愛和小布同學(xué)可以打開美團(tuán)。
而且小藝不能執(zhí)行。
但如果換成京東、淘寶搜索耳機,小藝可以成功。
類似地,在嗶哩嗶哩搜索央視新聞,小藝和小布會失敗,小布會失敗, V 可以和小愛同學(xué)一起成功。
在第三方 APP 執(zhí)行指令,小 V 這是最好的表現(xiàn)。
細(xì)心的朋友可能已經(jīng)發(fā)現(xiàn)了,這里我沒有提到魅族。 “ 小溪 ” ,由于……
總體而言,小藝和小藝 V 各有勝負(fù),小藝語言理解能力最好,但是第三方 APP 操作方面,小 V 表現(xiàn)更佳。
而且“小溪”語音助手和大模型似乎是分開的,理解我的指令,但是沒有操作。 APP 的權(quán)限。
就計算而言,我們可以使用大型模型來幫助我們進(jìn)行簡單的計算。
例如,我去年真正遇到的一個概率問題,0.975 的 126 第二方,這個數(shù)據(jù)手機助手可以正確計算,通過。
值得注意的是,這一數(shù)據(jù)最近火了。 kimi 推算出來是錯誤的。
再次使用常見的雞腿同籠問題進(jìn)行檢測,原本以為大模型處理這類問題已經(jīng)駕輕就熟了啊,沒想到有個玩家翻車了。...
這個問題:一個鐵籠子關(guān)著雞和兔子, 76 只腿,26 大小,雞和兔子分別是多少?
大多數(shù)大模型計算雞是一種大模型。 14 只,兔子 12 只是,只有小愛同學(xué)是錯誤的,數(shù)值是雞。 23 只,兔子 7 只。
我們測試了很多次這個結(jié)果。...
更離譜的是,有時候小愛的同學(xué)會列出一個二元方程。當(dāng)你認(rèn)為這次終于對了,他的價值顛倒了兔子和雞。
此時此刻,老狐大概感覺到了幫助學(xué)渣學(xué)習(xí)的痛苦。
不知雷總是怎么看待這個結(jié)果。
就工作效率而言, 作為自媒體,我們最看重的自然是大模型在文稿方面的優(yōu)勢。
假如要總結(jié)一篇稿子的重點內(nèi)容,它們的表現(xiàn)如何?
我們找到了一篇文章,科技狐最近讀了一百多萬。 。
但是,小愛和小布都沒有總結(jié)這篇長文的能力,無法上傳。 Word 文件,粘貼文本有字?jǐn)?shù)限制,兩者都撤出了這個評價。
剩下的小 V 、小溪和小藝?yán)?,?V 有的舍本逐末,有一半的總結(jié)是文章介紹,后面討論的內(nèi)容被一筆帶過。相比之下,小溪和小藝的總結(jié)顯然更加全面。
另一方面,我又測試了他們寫稿子的水平,給出的指令是寫一篇關(guān)于英偉達(dá)歷史發(fā)展的稿子,然后尷尬地來了。
小布與小溪的開頭部分高度相似, 同樣的錯誤也出現(xiàn)了。
關(guān)于黃仁勛早期的一段描述,都提到他曾經(jīng)在一段時間里。 1983 2008年在加州大學(xué)伯克利分校攻讀博士學(xué)位。
事實上,在這段時間里,黃仁勛還在讀本科。
他們同時引用了錯誤的信息來源,這的確讓人感到尷尬。
小藝的稿子就像列重點一樣,記住流水賬。
小 V 無論走到哪里,幾乎每一段都是從年份開始的,簡單描述一下今年企業(yè)的重大事件。小藝和小藝 V 結(jié)果就是編年體公司的發(fā)展歷史。
相比之下,小愛生產(chǎn)的稿件可以用出眾的文采來形容,分為副標(biāo)題,重要的產(chǎn)品介紹,現(xiàn)在的行業(yè)地位描述,最后還有兩個提升。
除這類科普稿外,我們還要求他們寫作 產(chǎn)品推薦稿,推薦稿, 2000 手機元價位段。
小藝推薦了 3 這款手機,其中數(shù)據(jù)可謂一塌糊涂,紅米 note 11 pro 攝像機和屏幕胡寫,reno 5 處理器和屏幕尺寸錯誤。
更加離譜的是,華為享受著。 X20 這個手機,市場上不會有,真正存在的機型就是華為享受。 20 和榮耀 X20 。
華為與榮耀的關(guān)系,也許是對大模型的誤解。
唯一值得稱贊的是,小藝并不自私,推薦紅米和紅米。 OPPO 的商品。
小布和小 V 這兩種商品私心較強,只推薦自己的品牌。
小布把自家 reno5 K 和 A93s 處理器型號錯誤,小型 V 參數(shù)上沒有錯誤,而且是新款,但是建議手機簡單列出幾個參數(shù)賣點。
不知大家有沒有發(fā)現(xiàn),小藝,小布和小布。 V 不管是多寫還是少寫,都只推薦三款,轉(zhuǎn)到小愛的時候,它終于推薦了四款手機。
但是,產(chǎn)品參數(shù)還是有錯誤的,自己家 note 12 pro 錯誤的相機參數(shù),iQOO Z6 充電功率也是錯誤的。
魅族小溪的參數(shù)至少是錯誤的,但是沒有預(yù)防, iQOO Z5 在這個手機上,原來的屏幕 幕尺寸 6.67 寸寫成了 6.78 寸。
總體來 看看,沒有值得信賴的大模型。
就文字形式而言, V 與小愛列舉參數(shù)的方式不同。
小布和小溪的文字看起來仍然像稿子, 但是每篇推薦文章的結(jié)構(gòu)都是一樣的,首先寫Cpu,然后介紹屏幕,然后是圖像,最后是電池和充電功率,缺乏變化。
小藝的稿子變化更大,但也是錯誤最大的。
由于這些大模型的形成,沒有一個可以使用。
這類手稿篇幅較短,推薦型號較少。
讓我們增加另一個條件,將字?jǐn)?shù)擴(kuò)展到 2000 字:幫助我寫一篇稿子,選題是 2000 推薦手機元左右,字?jǐn)?shù)在元左右。 2000 字左右。
就結(jié)果而言,小 V 忽略字?jǐn)?shù)要求,幾乎沒有變化。
小愛兩次推薦都是 4 一部手機,除了 iQOO Z6 除此之外,其它型號也發(fā)生了變化,為了提高字?jǐn)?shù),每個型號的描述都從特征轉(zhuǎn)變?yōu)閮?yōu)缺點。
小藝字?jǐn)?shù)沒有增加多少,型號也沒有改變。
小布增強了 2 模型,字?jǐn)?shù)增加了,但是遠(yuǎn)非如此。 2000 字。
溪流沒有增加型號, ,引入和總結(jié)的空間大大增加,并增加了兩章:推薦原則和標(biāo)準(zhǔn)、購買建議和注意事項,以滿足字?jǐn)?shù)要求,甚至將標(biāo)題從推薦改為深度推薦。
看 來到大模型,也是懂水字?jǐn)?shù)的。
總體而言,在文本生成方面,結(jié)果很難令人滿意,我真的拔不出矮子里的將軍。
除文字外,在圖像方面,小藝、小溪目前并不支持生成圖片。
小 V 、小布和小愛支持生成圖像。
無論畫什么場景,小愛同學(xué)都保持著色彩豐富的插畫風(fēng)格。
小布的場景偏向于現(xiàn)實。
而小 V 那就是各式各樣的風(fēng)格。
但是在一些詳細(xì)描述的場景中,大模型無法按規(guī)定導(dǎo)出照片。
比如描述一個小姑娘在賣火柴,小狗在旁邊睡著了,結(jié)果小姑娘也沒賣火柴。
而且他們 現(xiàn)在還不支持對生成圖片進(jìn)行微調(diào)。
上述就是我們在模型中常用的功能感受,由于篇幅的關(guān)系,我們不再介紹翻譯、敲碼等功能。
假如要對這些手機的大模型功能進(jìn)行評估,我們就要把它們分開。
手機對人類自然語言的理解能力在語音助手部分,在模型的加持下得到顯著提高。
因此,我們可以讓語音助手幫助我們做更多的事情。
這個部分華為手機最好,可以實現(xiàn)一次發(fā)布多個指令使其完成,雖然在 這些都是美團(tuán),嗶哩嗶哩 APP 上面失敗了,但是瑕不掩瑜。
其次是 vivo 、OPPO 、小米,最糟糕的是魅族小溪。
我理解魅族制作開放式設(shè)備與他人合作的方式,但是在融入手機系統(tǒng)方面的確不盡如人意。
但是在生成文本方面,手機大模型與理想效率還有很大差距。
他們生產(chǎn)的文章要點總結(jié)還可以,寫出來的稿子要么不能滿足需求,要么錯誤很多,要么太簡單,還有很長的路要走。
值得注意的是,在完成本項目的最后,當(dāng)我們再次檢測到大模型的推薦效果時,我們發(fā)現(xiàn) vivo 的小 V 取得了顯著的進(jìn)步。
再一次讓它推薦 2000 元手機,雖然推薦結(jié)果還是 vivo 三部手機,但是文字比以前有了很大的進(jìn)步,反而變成了一部手機, 5 臺式手機生成效果最好。
盡管 AI 目前大模型還不是消費者選擇手機的參考標(biāo)準(zhǔn),但是就像 vivo 一樣,整個 AI 該領(lǐng)域的技術(shù)進(jìn)步速度令人驚訝, 相信未來大模型將會有廣闊的前景。
智能手機自誕生之初就誕生了。 1993 2008年,迎來爆發(fā) iPhone 時刻 ( iPhone 3G ) ,整整用了 15 年。
和智能手機一樣 AI ,最終會迎來一個 iPhone 時刻。
本文來自微信微信官方賬號“科技狐”(ID:kejihutv),作者:老狐,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com