狙擊英偉達(dá):推理市場的新挑戰(zhàn)
在AI芯片領(lǐng)域,英偉達(dá)憑借強(qiáng)大的訓(xùn)練芯片性能,短期內(nèi)難逢敵手。但隨著AI推理市場爆發(fā)式增長,眾多科技巨頭與初創(chuàng)公司紛紛入局。

出品|虎嗅科技組
作者|陳伊凡
編輯|苗正卿
頭圖|視覺中國
8月13日,美國加州初創(chuàng)公司Rivos被曝尋求4億到5億美元融資。若融資敲定,自2021年成立以來,其融資總額將超8.7億美元,是尚未大規(guī)模量產(chǎn)卻獲最大融資額的芯片初創(chuàng)公司之一,背后投資者包括英特爾首席執(zhí)行官陳立武。
這些公司為何從推理側(cè)狙擊英偉達(dá)?又如何憑借差異化技術(shù)與成本優(yōu)勢撕開壟斷缺口?
在人工智能領(lǐng)域,訓(xùn)練與推理是驅(qū)動(dòng)行業(yè)發(fā)展的雙引擎。訓(xùn)練是AI系統(tǒng)的“啟蒙教育”,需海量數(shù)據(jù)、強(qiáng)大算力和巨額資金,耗時(shí)漫長且難以復(fù)用。而推理是AI技術(shù)的“實(shí)戰(zhàn)應(yīng)用”,將訓(xùn)練好的模型知識轉(zhuǎn)化為實(shí)際生產(chǎn)力。
生成式AI時(shí)代,以Transformer為代表的AI架構(gòu)讓基礎(chǔ)模型訓(xùn)練趨向穩(wěn)定,降低了重復(fù)訓(xùn)練成本,推理成為持續(xù)創(chuàng)造價(jià)值的關(guān)鍵。從商業(yè)角度看,訓(xùn)練是高風(fēng)險(xiǎn)的“資本賭局”,只有少數(shù)巨頭能參與,且投入產(chǎn)出比不確定;推理則是AI產(chǎn)業(yè)的“現(xiàn)金印鈔機(jī)”,AI應(yīng)用多通過收取推理服務(wù)費(fèi)盈利。
第三方機(jī)構(gòu)數(shù)據(jù)顯示,AI推理芯片市場正爆發(fā)式增長,2023年規(guī)模為158億美元,預(yù)計(jì)2030年達(dá)906億美元。推理成本大幅下降是市場增長的主要驅(qū)動(dòng)力,18個(gè)月內(nèi),AI推理成本從每百萬token 20美元降至0.07美元,下降280倍,企業(yè)AI硬件成本每年降30%,能源效率每年提高40%。算法優(yōu)化技術(shù)也降低了模型計(jì)算復(fù)雜度和內(nèi)存需求。
摩根士丹利報(bào)告顯示,AI推理工廠利潤驚人,英偉達(dá)GB200利潤率達(dá)77.6%,讓科技巨頭“眼紅”。一位算法人士稱,生成式AI時(shí)代只有英偉達(dá)賺到錢。推理對生態(tài)和性能要求沒訓(xùn)練苛刻,重點(diǎn)是性價(jià)比和成本低,且推理暴利。同時(shí),推理對英偉達(dá)CUDA生態(tài)依賴比訓(xùn)練小,因?yàn)椴渴鸶`活,計(jì)算量相對較小。
因此,科技巨頭選擇在推理端滲透英偉達(dá)市場。據(jù)報(bào)道,AWS向客戶推銷自研推理芯片Trainium支持的服務(wù)器并提供25%折扣,該服務(wù)器計(jì)算能力與英偉達(dá)H100相當(dāng),但目前主要針對Anthropic。今年6月,OpenAI開始租用谷歌TPU,降低推理成本和對英偉達(dá)的依賴。不過,業(yè)內(nèi)人士表示這并非一蹴而就,生態(tài)仍是最大問題。
在AI推理市場,初創(chuàng)公司也試圖分一杯羹。隨著人工智能推理發(fā)展,對算力需求多元化,新興芯片初創(chuàng)公司聚焦AI專用芯片(ASIC)研發(fā),以低成本實(shí)現(xiàn)高效運(yùn)算。
Rivos備受關(guān)注,眾多行業(yè)巨頭為其注資。據(jù)悉,它正在開發(fā)軟件,可將英偉達(dá)CUDA軟件代碼翻譯成自己的語言,讓芯片承接英偉達(dá)生態(tài)軟件資源,降低用戶遷移成本。
另一家挑戰(zhàn)者Groq也在籌集資金。它由前谷歌TPU團(tuán)隊(duì)成員成立,開發(fā)了獨(dú)特的語言處理單元架構(gòu),號稱能提供“世界最快推理”性能,token處理成本遠(yuǎn)低于傳統(tǒng)GPU。Groq已累計(jì)籌集超10億美元,與沙特阿拉伯達(dá)成15億美元芯片合作協(xié)議,在中東市場拓展生意。其CEO表示,英偉達(dá)可專注高利潤訓(xùn)練業(yè)務(wù),他們接手低利潤但高體量的推理業(yè)務(wù)。
此外,邊緣側(cè)的小型分散推理需求正悄然爆發(fā),如智能家居和智能穿戴設(shè)備催生海量邊緣推理場景。同時(shí),一些新型算法架構(gòu)及相關(guān)芯片正在誕生?!八懔υ酱笤胶谩钡腟caling Law是否通往通用人工智能尚無定論,Meta首席人工智能科學(xué)家楊立昆就不認(rèn)同。對于處于絕對壟斷地位的英偉達(dá)來說,GPU“越多算力越好”的故事能講多久,充滿不確定性。

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com