全面出擊字節(jié)AI:比行業(yè)平均便宜99%,豆包“大模型家族”正式開(kāi)業(yè)
作者 | 鄧詠儀
編輯 | 蘇建勛
這個(gè)星期可以算是大模型領(lǐng)域的又一次大戰(zhàn)——上面有谷歌和OpenAI的互相狙擊,國(guó)內(nèi)也不甘落后。
一直保持低調(diào)的字節(jié)AI,全面攻擊。5月15日,火山引擎拋出了從底座模型到上層應(yīng)用的一系列更新,這是每年常規(guī)的“原動(dòng)力大會(huì)”。
△來(lái)源:火山發(fā)動(dòng)機(jī)
首先,品牌名稱(chēng)是統(tǒng)一的。原來(lái)的“云雀”模型現(xiàn)在改名為“豆包大模型”?;鹕桨l(fā)動(dòng)機(jī)甚至搬出了“豆包大模型家族”的稱(chēng)號(hào),包括底座模型,豆包一口氣推出了9款模型。
與同行多尺寸、全特性的“專(zhuān)精”路線相比,豆包的底座模型思路更加簡(jiǎn)潔。
在這些模型中,豆包的主要模型分為通用模型pro和lite兩個(gè)版本,每個(gè)版本都適合不同用戶(hù)的使用需求。
此外,還有7種功能模型,包括角色扮演、語(yǔ)音識(shí)別、語(yǔ)音合成、聲音復(fù)制、文生圖等。
△來(lái)源:Dreamina
除基本模型外,火山發(fā)動(dòng)機(jī)還發(fā)布了今年的成績(jī)單:
現(xiàn)在,豆包大模型平均每天處理1200億Tokens文本,生成3000萬(wàn)張照片。
“豆包App”是字節(jié)跳動(dòng)的重點(diǎn)大模型應(yīng)用,也是基于豆包大模型,是國(guó)內(nèi)AI應(yīng)用的“頂流”?;鹕桨l(fā)動(dòng)機(jī)表示,在蘋(píng)果App中 在AIGC類(lèi)應(yīng)用中,Store和各大安卓應(yīng)用市場(chǎng)上,豆包App的下載量排名第一。
根據(jù)字節(jié)跳動(dòng)產(chǎn)品和戰(zhàn)略副總裁朱駿的說(shuō)法,豆包上已經(jīng)建立了800多萬(wàn)個(gè)智能體,每月活躍用戶(hù)達(dá)到2600萬(wàn)。
此外,字節(jié)并沒(méi)有改變“App工廠”的本色。在過(guò)去的一年里,除了主要的豆包App之外,字節(jié)跳動(dòng)還基于大模型推出了互動(dòng)娛樂(lè)應(yīng)用“貓箱”和星畫(huà)、即夢(mèng)等AI創(chuàng)作工具。
△來(lái)源:火山發(fā)動(dòng)機(jī)
底座模型“地板價(jià)格”,還可以再次降低
在新聞發(fā)布會(huì)上,火山發(fā)動(dòng)機(jī)可以算是一個(gè)竹子。這說(shuō)明在展示豆包模型家族時(shí),火山發(fā)動(dòng)機(jī)甚至沒(méi)有提到太多參數(shù)和性能相關(guān)的內(nèi)容,而是一上來(lái)就展示了價(jià)格:0.0008元/千Tokens。
它可以說(shuō)是一種“地板價(jià)格”。
例如,全新的OpenAI模型GPT-4o,GPT-4o的價(jià)格已經(jīng)到了5美元的輸入。 / 百萬(wàn) Token(約為0.035 導(dǎo)出15美元/千tokens / 百萬(wàn) Tokens(0.1元/千tokens)。
而且國(guó)內(nèi)大型模型廠家,均價(jià)在0.12元/千Tokens上下-豆包大型模型,比上述模型便宜很多。
“只有消耗大量,才能打磨出好的模型,大大降低模型推理的產(chǎn)品成本。根據(jù)火山引擎負(fù)責(zé)人譚待的說(shuō)法,按照目前企業(yè)市場(chǎng)豆包大模型的定價(jià),1500多個(gè)字的價(jià)格可以處理0.8%,比行業(yè)便宜99.3%。
△直接點(diǎn)名同行價(jià)格 來(lái)源:火山發(fā)動(dòng)機(jī)
他還強(qiáng)調(diào),這次降價(jià)是豆包的主要模式降價(jià),而不是用小模式降價(jià)來(lái)混淆是非。例如,豆包通用模型pro-32k版本,模型推理的輸入價(jià)格只有0.0008元/千Tokens。在市場(chǎng)上,同規(guī)格模型的定價(jià)一般為0.12元/千Tokens,是豆包模型的150倍。
也就是說(shuō),從“以分計(jì)費(fèi)”到“以厘計(jì)費(fèi)”的時(shí)代,大型行業(yè)。
為什么能實(shí)現(xiàn)大幅降價(jià)?譚待說(shuō):“一是我們能做到,二是我們需要這樣做?!?/p>
一個(gè)原因是,從ChatGPT爆發(fā)到現(xiàn)在,大型底座模型已經(jīng)進(jìn)入穩(wěn)定迭代階段。無(wú)論是模型訓(xùn)練還是推理應(yīng)用,都有很大的優(yōu)化空間,成本迅速下降。
以火山發(fā)動(dòng)機(jī)為例,譚待表示,在實(shí)踐中,豆包的模型結(jié)構(gòu)得到了很大的優(yōu)化和提升;但是在模型工程中,比如之前采用的是單機(jī)推理方法,現(xiàn)在豆包采用的是分布式推理——可以理解為不同的AI計(jì)算需求可以通過(guò)底層不同的芯片來(lái)處理,從而大大提高了計(jì)算效率。
譚待在會(huì)后的采訪中說(shuō),0.0008元/千Tokens“不是打價(jià)格戰(zhàn)的價(jià)格”。作為字節(jié)跳動(dòng)Tokens 火山的重要載體B,定價(jià)將遵循正常的商業(yè)邏輯,虧損補(bǔ)貼,無(wú)法獲得長(zhǎng)期的商業(yè)合作。
現(xiàn)在AI應(yīng)用市場(chǎng)還處于發(fā)展初期,以前的大型模型使用價(jià)格仍然過(guò)于昂貴,這顯然限制了應(yīng)用的發(fā)展,這也是模型制造商降低價(jià)格的原因。
就中國(guó)市場(chǎng)而言,字節(jié)豆包App已經(jīng)成為第一梯隊(duì)的AI應(yīng)用,但2600萬(wàn)月度活躍用戶(hù)還遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到“殺手級(jí)應(yīng)用”的水平。譚待說(shuō):“大模型領(lǐng)域還沒(méi)有達(dá)到競(jìng)爭(zhēng)激烈的階段。
根據(jù)QuestMobile的數(shù)據(jù),截至今年3月,AIGC行業(yè)基于大模型的用戶(hù)數(shù)量已達(dá)7380萬(wàn),盡管同比增長(zhǎng)8倍,但僅占移動(dòng)互聯(lián)網(wǎng)用戶(hù)的6%。
從其他玩家的動(dòng)作來(lái)看,2024年Q1,阿里巴巴云和騰訊云宣布大幅降價(jià),但主要針對(duì)CPU的通用計(jì)算率,AI相關(guān)GPU計(jì)算率價(jià)格降價(jià)不多。
相比之下,字節(jié)并不是中國(guó)唯一打“降價(jià)牌”的廠商,而是最強(qiáng)調(diào)AI算率降價(jià)。潛在的原因是,作為云計(jì)算市場(chǎng)的后起之秀,字節(jié)更渴望AI帶動(dòng)的增量需求。
在這個(gè)時(shí)候,選擇低價(jià)格來(lái)降低用戶(hù)使用AI的門(mén)檻,覆蓋更多的市場(chǎng),也是合理的。
可以預(yù)見(jiàn),今年國(guó)內(nèi)大型底座模型的降價(jià)趨勢(shì)還會(huì)繼續(xù)。推理方面的成本還有很大的降低空間,國(guó)內(nèi)模型廠商其實(shí)有很多技術(shù)實(shí)力。
舉例來(lái)說(shuō),最近有消息稱(chēng),國(guó)內(nèi)私募量化巨頭“幻方量化”發(fā)布的第二代Deepseek模型,基于框架創(chuàng)新,大大降低了推理成本,將API定價(jià)直接打到競(jìng)爭(zhēng)產(chǎn)品的1/10甚至1/100,每百萬(wàn)token的輸入只需1元。
“豆包”更像人,To B落地加快
不約而同,今年大廠發(fā)布的To C應(yīng)用程序,越來(lái)越像“人”。這背后透露的信息是:AI助手,正以比我們想象的更快的速度向我們走來(lái)。
這是本周的幾次大型工廠新聞發(fā)布會(huì)。首先,OpenAI發(fā)布的GPT-4o對(duì)話幾乎沒(méi)有延遲——用戶(hù)可以隨時(shí)打斷和回答,就像電影一樣?!禜er》超級(jí)人工智能,它甚至可以通過(guò)“看”和“聽(tīng)”來(lái)判斷顧客的情緒、狀態(tài),并給予回應(yīng)。
而且在昨天的谷歌發(fā)布會(huì)上,Project 作為谷歌的第一個(gè)AI,Astra Agent商品,可以基于手機(jī)鏡頭,實(shí)時(shí)語(yǔ)音進(jìn)行交互,也有“記憶”,這意味著與人類(lèi)的交互可以更深層次。
豆包App在火山引擎這次發(fā)布會(huì)上發(fā)布的信息,也有很多共同點(diǎn)。
字節(jié)產(chǎn)品和戰(zhàn)略副總裁朱駿表示,“我們?yōu)槎拱x了三個(gè)產(chǎn)品設(shè)計(jì)原則,第一個(gè)是“擬人化”。為了讓產(chǎn)品更像人,豆包團(tuán)隊(duì)在ASR模型和超自然TTS音質(zhì)上下了很大功夫,盡量做到類(lèi)似與真人交談的感覺(jué)。
以生活場(chǎng)景為例。五一假期,豆包真的像朋友一樣陪他去旅游——在旅途中,豆包不僅根據(jù)恐龍博物館和自貢井鹽的形成提供了詳細(xì)的解釋。在飯桌上,當(dāng)被問(wèn)到“如何剝皮蝦”時(shí),豆包不僅回答了問(wèn)題,還推了一段顫音視頻——讓他直觀地看到了剝皮蝦的技巧。
然而,就當(dāng)今國(guó)產(chǎn)模型的進(jìn)展而言,今天所展示的能力,只是AI智能體的第一步。
“現(xiàn)在大模型的能力在很多維度上令人驚嘆,但在很多維度上也存在缺陷,同時(shí)也在快速演變,每三個(gè)月或六個(gè)月都會(huì)發(fā)生很大的變化?!敝祢E說(shuō):“去年上半年,大模型回答10個(gè)問(wèn)題時(shí),可能會(huì)出現(xiàn)6個(gè)錯(cuò)誤,但今年幻覺(jué)大幅下降,隨著搜索引擎的增強(qiáng),知識(shí)已經(jīng)達(dá)到了可用的狀態(tài)。當(dāng)然,后期提升的空間還是很大的。”
現(xiàn)在應(yīng)用落地比較多,還在B端。
隨著“豆包模型家族”的出現(xiàn),字節(jié)的AI版圖已經(jīng)有了很大的原型:火山引擎負(fù)責(zé)基礎(chǔ)模型和開(kāi)發(fā)者生態(tài)的構(gòu)建。原來(lái)的To B服務(wù),也是當(dāng)今AI導(dǎo)出服務(wù)的抓手。與此同時(shí),這個(gè)底座還支撐著字節(jié)內(nèi)的許多AI應(yīng)用。
從原來(lái)的To開(kāi)始 就服務(wù)而言,火山引擎在模型應(yīng)用方面的業(yè)務(wù)思路,大致可分為三個(gè)方面:
第一,確定性高,行業(yè)天花板高的場(chǎng)景,如手機(jī)、汽車(chē)等,這部分火山將與行業(yè)合作伙伴共同創(chuàng)造。
第二,對(duì)于一些不太明確的創(chuàng)新方向,火山將成為支持創(chuàng)業(yè)團(tuán)隊(duì)的服務(wù)提供商。
最終,開(kāi)發(fā)者是火山特別重視的板塊?;鹕讲粌H提供了一套完整的AI開(kāi)發(fā)工具,還提供了語(yǔ)音功能的高互動(dòng)、低延遲等高自由度模型開(kāi)發(fā)模式和垂直場(chǎng)景所需的功能。字節(jié)有優(yōu)勢(shì)
在今天的新聞發(fā)布會(huì)上,火山發(fā)動(dòng)機(jī)建立了兩個(gè)生態(tài)聯(lián)盟:手機(jī)和汽車(chē)。汽車(chē)領(lǐng)域的合作伙伴包括吉利汽車(chē)、長(zhǎng)城汽車(chē)、捷途汽車(chē)、賽力斯、智己汽車(chē)等20多家廠商。
但是在手機(jī)領(lǐng)域,火山發(fā)動(dòng)機(jī)的推動(dòng)速度更快。大型服務(wù)已經(jīng)悄悄進(jìn)入了很多合作伙伴的產(chǎn)品,比如OPPO小布助手、榮耀智能辦公智能助手、小米“小愛(ài)同學(xué)”、華碩筆記本豆丁AI助手等等。
以O(shè)ppo的小布助手為例。與豆包大模型合作后,通過(guò)業(yè)務(wù)數(shù)據(jù)進(jìn)行調(diào)整。 Prompt,Oppo建立了多個(gè)垂域模型,真正使模擬面試、英語(yǔ)教學(xué)、情感聊天等場(chǎng)景得以實(shí)現(xiàn)。
火山的大型服務(wù),在更廣泛的公司場(chǎng)景中,已迅速使AI從POC(內(nèi)部試點(diǎn))階段,進(jìn)入真實(shí)的生產(chǎn)系統(tǒng)。
一個(gè)典型的例子是智能駕駛和智能駕駛艙之間的交互。在傳統(tǒng)的自動(dòng)駕駛計(jì)劃中,人與汽車(chē)之間的交互仍然會(huì)有延遲和不確定性。
但汽車(chē)配備豆包lite大模型后,汽車(chē)廠商可以在低延遲下進(jìn)行對(duì)話,支持多個(gè)駕駛艙智能助手場(chǎng)景,如聊天、搜索、娛樂(lè)、導(dǎo)航、車(chē)輛控制等。,效果比傳統(tǒng)語(yǔ)音處理高50%以上。
△配備大型車(chē)機(jī)系統(tǒng),詢(xún)問(wèn)附近的美食,會(huì)自動(dòng)推送相應(yīng)的抖音視頻。 來(lái)源:作者拍攝
但是在字節(jié)內(nèi)部,在過(guò)去的一年里,已經(jīng)有50多家業(yè)務(wù)廣泛使用豆包進(jìn)行AI創(chuàng)新,包括抖音、頭條、番茄小說(shuō)等多種產(chǎn)品。
下一步,火山引擎將繼續(xù)擴(kuò)大公司端的場(chǎng)景。AI開(kāi)發(fā)平臺(tái)面向開(kāi)發(fā)者的“紐扣”今天推出了公司標(biāo)準(zhǔn)版,公司版的紐扣將提供API。、事件推送,甚至純代碼的訪問(wèn)方式,使開(kāi)發(fā)者能夠訪問(wèn)AI。 在飛書(shū)等辦公平臺(tái)上部署B(yǎng)ot。
就企業(yè)而言,如今招商銀行、海底撈火鍋、超級(jí)猩猩、獵聘等公司,已經(jīng)在紐扣上建立了智能體。
超級(jí)猩猩的智能身體開(kāi)發(fā)了一個(gè)約課助手“猩猩同學(xué)的小同桌”,無(wú)代碼,為用戶(hù)提供個(gè)性化的健身建議,幫助用戶(hù)約課。
△“猩同學(xué)的小同桌” 來(lái)源:火山發(fā)動(dòng)機(jī)
在會(huì)議攤位上,字節(jié)還預(yù)測(cè)了未來(lái)的一些新功能——比如邊緣云的Bot在會(huì)場(chǎng)攤位上運(yùn)行,當(dāng)AI 當(dāng)Bot與場(chǎng)館中的攝像頭聯(lián)動(dòng)時(shí),你可以告訴觀眾會(huì)場(chǎng)有多少人,哪個(gè)攤位最受歡迎。很快,AI模型也可以訪問(wèn)硬件,如機(jī)器人等各種智能產(chǎn)品。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com