谷歌憋了十年的大招,讓英偉達(dá)好日子到頭了?
不說(shuō)了,5090啥時(shí)候降價(jià)?

示意圖
要說(shuō)上個(gè)月誰(shuí)是科技巨頭里最大的贏家,提名谷歌應(yīng)該沒(méi)人有意見(jiàn)吧?
靠著性能炸裂的 Gemini 3,短短半個(gè)月,股價(jià)蹭蹭漲不說(shuō),還在競(jìng)技場(chǎng)內(nèi)拳打 OpenAI,競(jìng)技場(chǎng)外腳踢英偉達(dá)。
回撤一點(diǎn),問(wèn)題不大

谷歌股價(jià)
至于賣鏟子的老黃怎么也跟著躺槍,原因很簡(jiǎn)單,谷歌表示,Gemini 3 Pro 是在自研 TPU(Tensor Processing Unit)上訓(xùn)練的,至少在字面上,是沒(méi)提英偉達(dá)一個(gè)字兒。
緊跟著,媒體和吃瓜群眾開始紛紛猜測(cè),說(shuō)什么谷歌這回,可能真要終結(jié) CUDA 護(hù)城河了。

媒體報(bào)道
那么問(wèn)題來(lái)了,看似讓英偉達(dá)好日子到頭的 TPU,到底是個(gè)啥?
從名字上也能看得出,它其實(shí)是一類芯片,和 GPU 是近親,只不過(guò)做成了 AI 特供版。
雖然 TPU 最近才引起大伙兒的注意,但這是一個(gè)從 2015 年延續(xù)到現(xiàn)在的老項(xiàng)目。
第一代 TPU 長(zhǎng)這樣

第一代 TPU
那時(shí)候谷歌正經(jīng)歷技術(shù)轉(zhuǎn)型的陣痛,想把傳統(tǒng)的搜推算法全換成深度學(xué)習(xí)。結(jié)果他們發(fā)現(xiàn),這 GPU 不止不夠用,還巨耗電,根本用不起。
GPU 的問(wèn)題,在于它太想全能了。為了什么都能干,不得不搞了一套硬盤、內(nèi)存、顯存、核心,層層疊疊的復(fù)雜架構(gòu)。
這帶來(lái)一個(gè)大麻煩,在芯片的世界里,搬運(yùn)數(shù)據(jù)的成本,遠(yuǎn)比計(jì)算本身高得多。數(shù)據(jù)從顯存跑到核心,物理距離可能只有幾厘米,電子卻要翻山越嶺。
GPU 工作方式

GPU
于是,電費(fèi)大半沒(méi)花在算數(shù)上,全花在送快遞的路費(fèi)上了。最后變成熱量,還得拜托風(fēng)扇吹一吹。
這在做圖形渲染時(shí)沒(méi)毛病,因?yàn)楫嬅娓叨入S機(jī),要啥素材沒(méi)法預(yù)料,只能回顯存現(xiàn)取。
但 AI 的矩陣運(yùn)算,每個(gè)數(shù)怎么算,和誰(shuí)算,算幾次都是固定的。我明知道這個(gè)數(shù)算完了,一會(huì)兒還要接著用,GPU 硬是得把它存回去,等著別人再取進(jìn)計(jì)算單元,這不純純浪費(fèi)嗎?
GPU
所以,作為一個(gè) AI 專屬工具人,TPU 就這樣出生了。它把 GPU 那些用不上的圖形、控制流、調(diào)度模塊等等拆的拆,壓的壓。
核心思路,是專門對(duì) AI 最常用的矩陣乘法做優(yōu)化,搞了一個(gè)叫 “ 脈動(dòng)陣列 ” 的方法。
用上這一招,每個(gè)數(shù)據(jù)一旦開算,就會(huì)在密集排列的計(jì)算單元之間傳遞,沒(méi)用完不許回存儲(chǔ)單元。這樣,就不需要頻繁讀寫了。

TPU
就這樣,TPU 每個(gè)周期的計(jì)算操作次數(shù)達(dá)到了數(shù)十萬(wàn)量級(jí),是 GPU 的近十倍。初代 TPU v1 能效比達(dá)到同時(shí)期 NVIDIA Tesla K80 的 30 倍,性價(jià)比極高。
當(dāng)然,最開始谷歌也是邊緣試探,沒(méi)玩那么大。TPU 也還只搞推理,不會(huì)訓(xùn)練,功能單一,完全沒(méi)法和 GPU 比。
從第二代起,谷歌才開始往內(nèi)存上堆料,提升容量和數(shù)據(jù)傳輸速度,讓 TPU 能一邊計(jì)算,一邊快速記錄和修改海量的中間數(shù)據(jù)(比如梯度和權(quán)重),自此點(diǎn)亮了訓(xùn)練的技能樹。
隨著 TPUv3 規(guī)模增加,模型訓(xùn)練速度提升

TPU
但這么多年以來(lái),明明用 TPU 訓(xùn)練推理的成本更低,性能也和 GPU 不相上下,為啥巨頭們還非得去搶英偉達(dá)的芯片呢?
事實(shí)上,真不是大伙兒不饞,而是谷歌壞,一直在硬控。所有的 TPU 只租不賣,綁定在谷歌云里。大公司不能把 TPU 搬回家,相當(dāng)于把身家性命都交給谷歌云,心里總毛毛的。生怕英偉達(dá)沒(méi)卡死的脖子,在谷歌這直接快進(jìn)到掐斷了。
即使這樣,蘋果也沒(méi)架住便宜大碗的誘惑,多多少少租了點(diǎn)兒。
而這回?zé)岫冗@么高,一方面是 Gemini 3 證明了 TPU 的成功,品質(zhì)放心;另一方面,是因?yàn)榈谄叽?TPU Ironwood,谷歌終于舍得賣了。

第七代 TPU Ironwood
根據(jù) The Information 的報(bào)道,Meta 已經(jīng)在和谷歌洽談數(shù)十億美元的大合同,準(zhǔn)備從 2027 年開始,在機(jī)房部署 TPU,還計(jì)劃最早明年就要從谷歌那租用 TPU。
消息一出,谷歌股價(jià)立漲 2.1%,英偉達(dá)下跌 1.8%。
甚至有谷歌內(nèi)部人士放話,我們這一波大開張,可能會(huì)搶走英偉達(dá)幾十億美元的大蛋糕,直接切掉他們 10% 的年收入哦。

媒體報(bào)道
華爾街對(duì) TPU 也是愛(ài)得不行,覺(jué)得這好東西錢途一片光明。就連負(fù)責(zé)設(shè)計(jì)制造的博通都沾了光,被上調(diào)了業(yè)績(jī)預(yù)期。
但是,要說(shuō) TPU 會(huì)取代 GPU,真不至于。
TPU 是一種 ASIC(Application-Specific Integrated Circuit),又名專用集成電路。人話來(lái)講,TPU 除了擅長(zhǎng) AI 那幾個(gè)矩陣計(jì)算,別的啥都不太行。
這是它的優(yōu)點(diǎn),也是它的痛點(diǎn)。
TPU 工作方式

TPU
趕上大模型當(dāng)?shù)赖暮脮r(shí)候,對(duì)矩陣計(jì)算的需求大得離譜,TPU 跟著一步登天。但要是以后有啥更火的 AI 技術(shù)路線,不搞現(xiàn)在這一套,TPU 分分鐘失業(yè)。
而且 TPU 因?yàn)樘珜>?,一旦在?jì)算上沒(méi)有性能優(yōu)勢(shì),就徹底失去價(jià)值。四年前的 TPU v4,咱們已經(jīng)很難見(jiàn)到它了。
相比之下,GPU 就不一樣了。以五年前誕生在大模型浪潮前的 3090 為例,它硬是靠著 24G 超大顯存,和 CUDA 不拋棄不放棄的向下兼容生態(tài),直到現(xiàn)在還是普通人玩 AI 的超值主力卡,跑個(gè) Llama 8B 小模型不成問(wèn)題。
退一步講,就算 AI 這碗飯不香了,大不了回去接著伺候游戲玩家和設(shè)計(jì)師,照樣活得滋潤(rùn)。
另外,CUDA 生態(tài)依然是英偉達(dá)最大的殺招。
這就好比你用慣了 iOS,雖然安卓也很好,但讓你把存了十年的照片、習(xí)慣的操作手勢(shì)、買的一堆 App 全都遷移過(guò)去,你大概率還是會(huì)選下次一定。
現(xiàn)在的 AI 開發(fā)者也是一樣,大家的代碼是基于 CUDA 寫的,調(diào)用的庫(kù)是英偉達(dá)優(yōu)化的,甚至連報(bào)錯(cuò)怎么改都只會(huì)搜 CUDA 的。
想轉(zhuǎn)投 TPU?行啊,先把代碼重構(gòu)一遍,再適應(yīng)新的開發(fā)環(huán)境。
即使強(qiáng)兼了 PyTorch,很多底層的優(yōu)化、自定義算子,換到 TPU 上還是得重新調(diào)試。專門指定的 JAX 語(yǔ)言,也給人才招聘墊高了門檻。
對(duì)于大多數(shù)只想趕緊把模型跑起來(lái)的中小廠來(lái)說(shuō),與其費(fèi)勁巴拉地去適配 TPU,甚至根本搞不到,直接買英偉達(dá)芯片,反而是最省事的選擇。

社媒截圖
不說(shuō)別的,谷歌自己還在大量采購(gòu)英偉達(dá)的 GPU,就算自己不用,谷歌云那么多客戶還得用呢。
所以,TPU 這波開賣,確實(shí)在大模型訓(xùn)練這一畝三分地上,用經(jīng)濟(jì)劃算給英偉達(dá)上了一課。但也絕對(duì)沒(méi)有被吹的,要搶 GPU 飯碗那么神。
未來(lái)的算力市場(chǎng),更大概率是 TPU 占據(jù)頭部大廠的專用需求,而 GPU 繼續(xù)統(tǒng)治通用市場(chǎng)。
但只要巨頭們競(jìng)爭(zhēng)起來(lái),就有可能把算力價(jià)格打下來(lái),這怎么看,都是個(gè)好事啊。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




