大?!?18”開啟,阿里:我降價(jià)!百度:我免費(fèi)!| 最前線
文|周鑫雨
編輯|鄧詠儀
互聯(lián)網(wǎng)大模型于2024年5月率先迎來(lái)“618”。
圖片:周鑫雨
5月20日晚,阿里云在微信官方賬號(hào)發(fā)布了一條“明天又發(fā)生了什么”的帖子,發(fā)布了降價(jià)風(fēng)聲——21日上午10:00,通義千問(wèn)模型家族宣布降價(jià),開源和閉源都有不同程度的限制和降價(jià)政策。
其中,Qwen是阿里云商業(yè)化的主要模型。-Long,從原來(lái)的20元/百萬(wàn)Tokens到0.5元/百萬(wàn)Tokens,輸入價(jià)格下降了97%,甚至達(dá)到了97%。
這個(gè)價(jià)格,以0.0003元/千Tokens的細(xì)微優(yōu)勢(shì),突破了5月15日字節(jié)剛剛發(fā)布的“豆包大模型”的輸入地板價(jià)格:0.8元/百萬(wàn)Tokens。
不過(guò),低價(jià)之王剛易位4小時(shí),百度就來(lái)“掀翻價(jià)格地板”——文心一言兩款ERNIE Speed和ERNIE Lite,直接宣布“免費(fèi)”。
到2023年,模型降價(jià)仍然遵循訓(xùn)練效率優(yōu)化和規(guī)模效應(yīng)的自然趨勢(shì)。
2023年11月,百度大模型平臺(tái)“文心千帆”調(diào)整了相同漢字?jǐn)?shù)量對(duì)應(yīng)的Token數(shù)量,變相降低了模型價(jià)格的20%。相應(yīng)地,文心大模型的推理成本降低到了原來(lái)的1%。
但是2024年模型價(jià)格戰(zhàn),幾乎沒(méi)有開戰(zhàn)的預(yù)兆。
價(jià)格懸崖的開始,是一條名為“DeepSeek “V2”鯰魚。在DeepSeek制作機(jī)構(gòu)“深度追求”的背后,有一萬(wàn)多張英偉達(dá)A100。 量化GPU基金-幻方量化。
五月六日,DeepSeek大模型V2的深度追求發(fā)布。DeepSeekk作為模型領(lǐng)域的“黑馬”,擁有2360億參數(shù)。 V2,模型性能處于國(guó)內(nèi)第一梯隊(duì),定價(jià)沒(méi)有負(fù)擔(dān)。支持32k左右的模型API定價(jià)僅為1元/百萬(wàn)Tokens(計(jì)算)。、2元/百萬(wàn)Tokens(推理),是當(dāng)時(shí)百度文心4.0-8k推理價(jià)格(120元/Tokens)的1/60。
圖片:周鑫雨
此后,大型獨(dú)角獸智譜AI率先加入價(jià)格戰(zhàn)。五月十一日,智譜AI旗下的GLM-3-Turbo,價(jià)格從5元/百萬(wàn)Tokens下降到1元/1元。Tokens。
另一方面,“黑馬”擾亂模型定價(jià),則是更具性價(jià)比的小模型被重新討論。
很多從業(yè)者對(duì)智能的出現(xiàn)表示,小模型的潛力還沒(méi)有完全挖掘出來(lái),可以通過(guò)數(shù)據(jù)治理、效率提升等策略,對(duì)下游客戶來(lái)說(shuō)也是更劃算的選擇。
Meta于2024年4月22日發(fā)布的開源模型Llama-3,以70B的“小參數(shù)”和20倍以上的GPT-4為性能掰腕。隨后,微軟再次發(fā)布了Phi-3.8B模型 mini,GPT-3.5號(hào)稱性能對(duì)比,也可以在蘋果A16芯片上流暢運(yùn)行。
對(duì)下游客戶來(lái)說(shuō),昂貴的大型模型不夠“香”。大型企業(yè)的集體降價(jià),也是順應(yīng)市場(chǎng)選擇的。
然而,即使價(jià)格打破了地板,大工廠仍然有利可圖。大模型只是門面,大工廠的漁民意味著通過(guò)模型銷售自己的云服務(wù)。
根據(jù)SemiAnalysis計(jì)算,DeepSeek每臺(tái)服務(wù)器在計(jì)算率服務(wù)力利用率最高的情況下,每臺(tái)服務(wù)器每小時(shí)收入可達(dá)35.4美元,毛利率超過(guò)70%。
但是對(duì)于被迫卷入價(jià)格戰(zhàn)的小廠商和初創(chuàng)企業(yè)來(lái)說(shuō),收入壓力會(huì)更大。2024年5月21日,零一萬(wàn)物CEO李開復(fù)直言不諱地表示,最新模式Y(jié)i-Large的API定價(jià)仍然是20元/百萬(wàn)Tokens。
未來(lái),小廠只有在單點(diǎn)或多點(diǎn)功能上與競(jìng)爭(zhēng)者拉開距離,才能得到蛋糕。
歡迎交流!
歡迎交流!
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com