低價格“殺”大模型
最近幾天,大模型的價格戰(zhàn)如火如荼。百度、科大訊飛、騰訊甚至直接宣布免費降價。
五月六日,DeepSeek發(fā)布了第二代MoE大模型DeepSeek-V2,能力對比 GPT-4、llama 3-70B,價格是每百萬。 tokens 輸入輸出分別為1 塊和2元,GPT-4 近百分之一的Turbo價格。
DeepSeek成了降價潮的開始。
隨后,智譜AI首次跟進。5天后,智譜AI宣布GLM-3-入門級商品。 從5元起,Turbo模型調(diào)用價格/百萬tokens 降到1元/百萬tokens,減幅達到80%。
五月十五日,在火山發(fā)動機原動力會議上,字節(jié)跳動釋放了豆包0.0008元/千Tokens的極低定價,將模型價格直接融入“厘元”時代,可以說將大模型“低價”拉到了高潮,價格戰(zhàn)的火焰至今已燃燒。
五月二十一日上午,阿里云直接拋出重磅炸彈,正面回應(yīng)豆包降價:通義千問GPT-4級主力模型Qwen-Long,API輸入價格從0.02元/千tokens下降到0.0005元/千tokens,狂降97%。比豆包大模型0.0008元/千tokens低0.0003元/千tokens。
當日下午,百度更直接宣布文心大模型兩大主要模型全面免費,立即生效。
第二天上午9點,科大訊飛也緊急跟上,官網(wǎng)宣布訊飛星火Lite。 永久免費開放API。
下午5點,一向不著急的騰訊也宣布了混合元-lite模型,API輸入輸出總長計劃從目前的4k升級為256k,價格從0.008元/千tokens調(diào)整為全面免費。
到目前為止,國內(nèi)所有大型頭部玩家都加入了價格戰(zhàn)。
從卷參數(shù)到卷長文本、卷Agent,再到現(xiàn)在卷低價,國內(nèi)大模型的發(fā)展似乎是東錘,西錘,什么熱追,一個新家,其實有一條非常明確的主線——應(yīng)用和商業(yè)化。
這一次,每個大模型都參與了價格戰(zhàn)。原因是每個家庭都在探索大模型的商業(yè)化路徑??偟膩碚f,目前實現(xiàn)大模型的方式只有兩種,C端付費,賺普通用戶的錢;B端API收費,從公司賺錢。
就國內(nèi)環(huán)境而言,用戶的付費觀念并不強??赐辍渡畹臉啡ぁ?,你會找朋友借各種VIP和SVIP,更不用說用戶買一個不完美甚至有點“雞肋”的大模型產(chǎn)品了。
目前C端市場上只有百度的文心一言、字節(jié)豆包、阿里的通義千問、月亮暗面的Kimi聲音很大。
文心一言早已開啟了客戶付費模式,而且價格也不低,連續(xù)包年會費近600元,根據(jù)百度最新披露,文心一言用戶數(shù)已超過2億。
最近,Kimi也在為試水用戶付費。與文心的訂閱制度不同,Kimi選擇了獎勵制度。月亮的陰暗面之所以另辟蹊徑,可能與年輕用戶數(shù)量有關(guān)。
所以,B端成了各大模型企業(yè)爭奪的核心焦點。對于企業(yè)而言,使用“人工智能” “新質(zhì)量生產(chǎn)力的發(fā)展是必然趨勢,這不是選擇題,而是必須要回答的問題,但現(xiàn)實是,大型模型太貴,模型應(yīng)用成本太高。
火山發(fā)動機總裁譚待提到:“現(xiàn)在大模型還是太貴了,模型的應(yīng)用成本不應(yīng)該是這樣的。(通過)降低成本,讓大家更好的嘗試各種創(chuàng)新,整個行業(yè)都會崛起?!?/p>
有業(yè)內(nèi)人士表示,今年以來大模式降價已經(jīng)成為一種趨勢,將進一步加快應(yīng)用端的落地。
看起來大模型迎來了平價時代,但事實真的是這樣嗎?
究竟誰更具性價比?
大型工廠API動不動厘元/千Tokens,甚至很多公司都打出了“免費”的口號。
然后,這些看似低價、免費的大模型,真的做到了“便宜好用”,或者說只是為了獲得客戶,有我優(yōu)秀的競爭心態(tài)。
這次字節(jié)降價的是豆包通用模型pro-32k版本,模型推理的輸入價格為0.0008元/千Tokens。而且市場上同規(guī)格模型的定價一般為0.12元/千Tokens,是豆包模型的150倍。
Qwen通義千問GPT-4級主力模型-Long,從0.02元/千tokens到0.005元/千tokens,API輸入價格暴跌97%。Qwen-Long是通義千問的長文本增強模型,其性能與GPT-4相比,前后文長達1000萬。
ERNIE,百度官方公布的兩款主要模型。 Speed和ERNIE Lite 前后8K和128K的長度都是免費的。
訊飛星火Lite 永久免費開放API,訊飛星火頂配版(Spark3.5 Max)低至0.21/萬Tokens的API價格。
混元-lite模型是騰訊混元的主要模型之一,API輸入輸出總長計劃從目前的4k升級為256k,價格從0.008元/千tokens調(diào)整為全面免費。
經(jīng)過深入研究,字節(jié)、阿里的低成本模型、百度、科大訊飛、騰訊的免費模型都是輕量級模型版本,核心大規(guī)模、高性能模型并沒有卷入這場價格戰(zhàn)。
這場看似熱鬧非理性的價格戰(zhàn)背后,似乎更多的是大型廠商想用“互聯(lián)網(wǎng)”時代吸引更多的TOB客戶和開發(fā)者。
事實上,從另一個角度來看,這種“低價”不僅是大廠商獲得客戶的“餌料”,也是大池塘的“營養(yǎng)”。
水大魚大,如果回放互聯(lián)網(wǎng)的發(fā)展歷史,我們會發(fā)現(xiàn),在蘋果手機推出幾年后,抖音真正成為了一個超級應(yīng)用,一個是4G的普及,一個是安卓千元機的普及。
新技術(shù)浪潮來臨后,一開始并不完善,需要達到一個臨界點才能爆發(fā),而這一點的核心就是普惠點。
對大型模型而言,大型模型要想落地,想要迅速進入“價值創(chuàng)造階段”,首先要讓大家能夠負擔得起。
一切都是商業(yè)化的?
事實上,隨著技術(shù)的發(fā)展,模型推理的價格下降是可以預(yù)見的必然趨勢。大模型還處于起步階段,遠沒有達到殘酷競爭的水平。未來模型推理的成本肯定會繼續(xù)下降。
比如豆包模型選擇分布式推理和混合調(diào)度,充分發(fā)揮各種異構(gòu)算率,處理推理算力問題,從而降低模型推理成本;騰訊混合元模型選擇混合專家模型 (MoE)構(gòu)造,自研 Angel 與行業(yè)主流框架相比,機器學習平臺的訓(xùn)練速度是主流框架的2.6倍,推理成本降低70%。
最近,納德拉還在微軟Build開發(fā)者大會上提到,GPT-4在過去一年中的性能增長了6倍,但是成本降低到了之前的1/12,相應(yīng)的性能/成本增加了70倍。
在最近的一次記者采訪中,李開復(fù)提到:“我認為整個市場每年降低10倍的推理成本是可以預(yù)期的,而且必然會發(fā)生。”
談到降價的原因,一方面,字節(jié)和阿里云都表示希望降價能加速AI應(yīng)用的爆發(fā)。
目前,大型應(yīng)用的發(fā)展還處于起步階段,并沒有爆款應(yīng)用。根據(jù)QuestMobile的數(shù)據(jù),截至今年3月,AIGC行業(yè)基于大型的用戶數(shù)量已達7380萬,盡管同比增長8倍,但僅占移動互聯(lián)網(wǎng)用戶的6%。
所以,通過降低價格,公司希望能吸引更多的開發(fā)者和客戶參與其中,共同推動AI應(yīng)用的普及與發(fā)展。
獵豹移動董事長兼首席執(zhí)行官傅盛也表達了類似的觀點。他認為,降價的目的不是為了吸引開發(fā)者,而是為了吸引更多的客戶。目前各大模型的應(yīng)用基本都是免費的,但是用戶數(shù)量不能增加。大家都意識到,僅僅提供聊天窗口是不可能讓用戶越來越多地使用的,所以開發(fā)者必須參與其中。
有些網(wǎng)友調(diào)侃,大模型降價,壓力給應(yīng)用端,看誰先做應(yīng)用,先推動客戶AI轉(zhuǎn)型升級。
在李彥宏看來,AI應(yīng)用與基礎(chǔ)大模型的發(fā)展息息相關(guān)?!皯?yīng)用的進步可以促進基礎(chǔ)模型的創(chuàng)新,也有助于加速從互聯(lián)網(wǎng)時代向人工智能時代的轉(zhuǎn)變?!?/p>
另一方面,作為AI的關(guān)鍵基礎(chǔ)設(shè)施,各大企業(yè)都希望通過低價或免費快速占領(lǐng)市場,構(gòu)建生態(tài),形成客戶依賴。
據(jù)預(yù)測,中國所有大型公司API的日調(diào)用量將在年底增長100倍,從目前的不到1億增長到100億。每個人都不想錯過這個巨大的增長潛力。
另外,實際上從另一個角度來看,這場價格戰(zhàn)之所以能夠打起來,而且價格拉不開差距,是因為各種技術(shù)路徑很難拉開距離。
模型能力和后續(xù)服務(wù)和體驗仍然是大模型成功的關(guān)鍵因素。百度曾經(jīng)說過:“使用大模型不僅要看價格,還要看綜合效果。只有使AI的應(yīng)用效果明顯,響應(yīng)速度更快,分銷渠道更廣,人們才能真正感受到AI給社會生產(chǎn)帶來的便利。”
假如只是為了低價而降價,那么很可能會陷入OFO式的價格戰(zhàn)玩法,最終落得兩敗俱傷。
大型卷價格低,創(chuàng)業(yè)公司傷不起
大廠大模型價格戰(zhàn)如火如荼,創(chuàng)業(yè)公司安靜。雖然DeepSeek和智譜AI也進入市場,但大多數(shù)大模型創(chuàng)業(yè)公司并沒有加入降價潮。
李開復(fù)明確表示,他將無法參加價格戰(zhàn)。而且認為100萬token花十幾塊錢或者幾塊錢沒有太大區(qū)別。對于要求最高、需求最高的,大家還是會選擇最好的模型。
同時,王小川也認為,降價并非創(chuàng)業(yè)公司的事,百川也不會“摻雜”價格戰(zhàn)。
他解釋說,現(xiàn)在的To B不是百川的主要商業(yè)模式,價格戰(zhàn)對其影響有限,百川的精力更多,仍將投入超級應(yīng)用。
誠然,每個初創(chuàng)公司都有不同的定位和不同程度的價格戰(zhàn)對他們的影響。然而,一個不爭的事實是,價格戰(zhàn)必然會導(dǎo)致資源集中在少數(shù)頭部企業(yè)。對于初創(chuàng)企業(yè)來說,他們需要尋找新的商業(yè)模式來實現(xiàn)高質(zhì)量的發(fā)展,才能面臨更大的成本壓力。
傅盛表達了同樣的焦慮,他認為這一次,大規(guī)模降價基本宣布大規(guī)模初創(chuàng)企業(yè)必須尋找新的商業(yè)模式,下降最猛的是有云服務(wù)的大企業(yè),通過大模型獲得云客戶,羊毛出在豬身上,可以下降。大型初創(chuàng)企業(yè)沒有這種生態(tài),必須另尋商業(yè)模式。
無論是百度、阿里、騰訊還是字節(jié),降價背后都有“公共云” 大型API帶來的邊際成本降低,而對初創(chuàng)企業(yè)來說,無論是燒錢能力還是其它都無法與之抗衡。
一般來說,價格戰(zhàn)和泡沫一起出現(xiàn)。在某些情況下,價格戰(zhàn)通常會擠出一些泡沫。滴滴、OFO等價格戰(zhàn)要么擠出規(guī)模小、資金不足的競爭對手,要么擠出自己。
正如王小川所說,降價是一種優(yōu)勢,但不一定是競爭力,價格戰(zhàn)將加速泡沫周期,最終企業(yè)可能會消失。
本文來自微信微信官方賬號“AI大模型工廠”(ID:AIGCMakting),作者:星奈,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com