HBM面臨挑戰(zhàn),未來存儲走向多層級架構(gòu)
高帶寬內(nèi)存(HBM)作為下一代動態(tài)隨機(jī)存取存儲器(DRAM)技術(shù),其核心創(chuàng)新在于獨(dú)特的3D堆疊結(jié)構(gòu)。通過先進(jìn)封裝技術(shù)將多個(gè)DRAM芯片(通常為4層、8層甚至12層)垂直堆疊,使HBM的帶寬(數(shù)據(jù)傳輸速率)遠(yuǎn)高于GDDR等傳統(tǒng)內(nèi)存解決方案。
憑借高帶寬、低延遲的特性,HBM已成為AI大模型訓(xùn)練與推理的關(guān)鍵組件。在AI芯片中,它扮演著“L4緩存”的角色,能顯著提升數(shù)據(jù)讀寫效率,緩解內(nèi)存帶寬瓶頸,增強(qiáng)AI模型的運(yùn)算能力。
01 HBM市場,SK海力士獨(dú)領(lǐng)風(fēng)騷
依托HBM技術(shù)的領(lǐng)先優(yōu)勢,SK海力士在行業(yè)中的地位不斷攀升。市場數(shù)據(jù)顯示,自2024年第二季度起,美光與SK海力士的DRAM市場份額持續(xù)增長,三星則逐步下滑。在HBM領(lǐng)域,原本與三星近乎平分秋色的格局被打破,截至今年第一季度,兩者份額差距已擴(kuò)大至兩倍以上。
今年第二季度,SK海力士以約21.8萬億韓元的DRAM及NAND銷售額,首次超越三星電子(約21.2萬億韓元),登頂全球存儲銷售額榜首。這主要得益于其HBM產(chǎn)品的強(qiáng)勢表現(xiàn)。作為英偉達(dá)的主要獨(dú)家供應(yīng)商,SK海力士早期在HBM市場未脫穎而出,但隨著全球AI開發(fā)熱潮興起,其高性能、高效率的產(chǎn)品需求激增。
第五代高帶寬內(nèi)存HBM3E是關(guān)鍵因素。該產(chǎn)品具備高帶寬、低功耗優(yōu)勢,廣泛應(yīng)用于AI服務(wù)器、GPU等高性能計(jì)算領(lǐng)域。2023至2024年間,吸引了AMD、英偉達(dá)、微軟、亞馬遜等科技巨頭競相采購,而SK海力士是全球唯一大規(guī)模生產(chǎn)HBM3E的廠商,其2025年的8層及12層HBM3E產(chǎn)能已全部售罄。
反觀三星電子,因向英偉達(dá)交付延遲錯(cuò)失良機(jī),在AI市場應(yīng)用最廣的HBM3E領(lǐng)域大幅落后于SK海力士。市場份額從去年第二季度的41%暴跌至今年第二季度的17%,甚至有報(bào)道稱其未通過英偉達(dá)第三次HBM3E認(rèn)證。
光大證券預(yù)計(jì)HBM市場需求將持續(xù)增長,帶動存儲產(chǎn)業(yè)鏈發(fā)展;花旗證券則預(yù)測,SK海力士將繼續(xù)主導(dǎo)HBM市場。SK海力士有望在AI時(shí)代成為“存儲器恐龍”。
02 存儲廠商開發(fā)HBM替代方案
面對SK海力士的強(qiáng)勢,行業(yè)內(nèi)其他廠商紛紛加速技術(shù)創(chuàng)新,探索HBM的替代方案。
三星重啟Z - NAND
2025年,三星電子在擱置七年后,決定重啟Z - NAND內(nèi)存技術(shù),并將其定位為滿足人工智能(AI)工作負(fù)載增長需求的高性能解決方案。這標(biāo)志著三星重新進(jìn)軍高端企業(yè)存儲領(lǐng)域。
三星內(nèi)存業(yè)務(wù)執(zhí)行副總裁Hwaseok Oh表示,公司正全力重新開發(fā)Z - NAND,目標(biāo)是將其性能提升至傳統(tǒng)NAND閃存的15倍,同時(shí)把功耗降低多達(dá)80%。即將推出的新一代Z - NAND將搭載GPU發(fā)起的直接存儲訪問(GIDS)技術(shù),讓GPU可直接從存儲器獲取數(shù)據(jù),無需經(jīng)過CPU或DRAM,以降低延遲,加速大型AI模型的訓(xùn)練與推理進(jìn)程。
Z - NAND的復(fù)蘇,反映出快速擴(kuò)展的AI模型已超越傳統(tǒng)存儲基礎(chǔ)設(shè)施的承載能力。當(dāng)前系統(tǒng)中,數(shù)據(jù)傳輸過程形成嚴(yán)重瓶頸,既導(dǎo)致性能下降,又增加能耗。而三星支持GIDS的架構(gòu)可消除這些瓶頸,允許GPU將大型數(shù)據(jù)集從存儲器直接加載到VRAM中,能顯著縮短大型語言模型(LLM)及其他計(jì)算密集型AI應(yīng)用的訓(xùn)練周期。
事實(shí)上,三星早在2018年就首次推出Z - NAND技術(shù),并發(fā)布了面向企業(yè)級和高性能計(jì)算(HPC)應(yīng)用的SZ985 Z - SSD。這款固態(tài)硬盤性能優(yōu)異,讀取速度快,延遲低,配備節(jié)能DRAM,額定寫入容量高,可靠性強(qiáng)。
X - HBM架構(gòu)重磅登場
NEO Semiconductor推出全球首款適用于AI芯片的超高帶寬內(nèi)存(X - HBM)架構(gòu)。該架構(gòu)基于其自研的3D X - DRAM技術(shù),突破了傳統(tǒng)HBM在帶寬與容量上的瓶頸,或?qū)⒁I(lǐng)內(nèi)存產(chǎn)業(yè)邁入AI時(shí)代的“超級內(nèi)存”新階段。
相比之下,預(yù)計(jì)2030年左右上市的HBM5,僅支持4K位數(shù)據(jù)總線和每芯片40Gbit的容量;預(yù)計(jì)2040年左右推出的HBM8,也僅能實(shí)現(xiàn)16K位總線和每芯片80Gbit的容量。而X - HBM憑借32K位總線和每芯片512Gbit的容量,可讓AI芯片設(shè)計(jì)人員繞過傳統(tǒng)HBM技術(shù)需耗時(shí)十年才能突破的性能瓶頸。其帶寬達(dá)到現(xiàn)有內(nèi)存技術(shù)的16倍,密度為現(xiàn)有技術(shù)的10倍,能滿足生成式AI與高性能計(jì)算的需求。
Saimemory開發(fā)堆疊式DRAM
由軟銀、英特爾與東京大學(xué)聯(lián)合創(chuàng)立的Saimemory,正研發(fā)全新堆疊式DRAM架構(gòu),目標(biāo)是成為HBM的直接替代方案,甚至超越其性能。
該公司聚焦3D堆疊架構(gòu)優(yōu)化,通過垂直堆疊多顆DRAM芯片并改進(jìn)芯片間互連技術(shù),提升存儲容量并降低數(shù)據(jù)傳輸功耗。目標(biāo)產(chǎn)品將實(shí)現(xiàn)容量較傳統(tǒng)DRAM提升至少一倍,功耗較HBM降低40% - 50%,且成本顯著低于現(xiàn)有HBM方案。
這一技術(shù)路線與三星、NEO Semiconductor等企業(yè)不同,后者聚焦容量提升,而Saimemory更側(cè)重解決AI數(shù)據(jù)中心的電力消耗痛點(diǎn),契合綠色計(jì)算的行業(yè)趨勢。
在技術(shù)合作層面,英特爾提供先進(jìn)封裝技術(shù)積累,東京大學(xué)等日本學(xué)術(shù)機(jī)構(gòu)貢獻(xiàn)存儲架構(gòu)專利,軟銀則以30億日元注資成為最大股東。初期150億日元研發(fā)資金將用于2027年前完成原型設(shè)計(jì)及量產(chǎn)評估,計(jì)劃2030年實(shí)現(xiàn)商業(yè)化落地。
閃迪聯(lián)手SK海力士推進(jìn)HBF高帶寬閃存
閃迪與SK海力士近日宣布簽署諒解備忘錄,聯(lián)合制定高帶寬閃存(High Bandwidth Flash,HBF)規(guī)范。HBF是閃迪今年2月提出的專為AI領(lǐng)域設(shè)計(jì)的新型存儲架構(gòu),融合了3D NAND閃存與高帶寬存儲器(HBM)的技術(shù)特性。閃迪將于2026年下半年推出首批HBF內(nèi)存樣品,采用該技術(shù)的AI推理設(shè)備樣品則預(yù)計(jì)在2027年初上市。
作為基于NAND閃存的內(nèi)存技術(shù),HBF采用類HBM封裝形式,能顯著提升存儲容量并降低成本,同時(shí)具備數(shù)據(jù)斷電保留的非易失性優(yōu)勢。這是業(yè)界首次將閃存的存儲特性與類DRAM的高帶寬性能整合到單一堆棧中,有望重塑AI模型大規(guī)模數(shù)據(jù)訪問與處理的模式。
03 多維度架構(gòu)創(chuàng)新降低HBM依賴
除了存儲技術(shù)創(chuàng)新,廠商們也在探索AI領(lǐng)域的架構(gòu)革新,以降低對HBM的依賴。
存算一體架構(gòu)
上世紀(jì)40年代,基于“存儲 - 計(jì)算分離”原理的馮?諾依曼架構(gòu)誕生,此后芯片設(shè)計(jì)基本沿用該架構(gòu)。近70年里,芯片行業(yè)技術(shù)進(jìn)步多集中于軟件與硬件優(yōu)化,底層架構(gòu)未發(fā)生根本改變。
存算一體(Processing - In - Memory, PIM或Compute - In - Memory, CIM)架構(gòu)應(yīng)運(yùn)而生。其核心理念是在存儲器本體或鄰近位置集成計(jì)算功能,規(guī)避傳統(tǒng)架構(gòu)中“計(jì)算 — 存儲 — 數(shù)據(jù)搬運(yùn)”的瓶頸。通過在存儲單元內(nèi)部直接部署運(yùn)算單元,縮短數(shù)據(jù)傳輸距離,整合計(jì)算與存儲單元,優(yōu)化數(shù)據(jù)傳輸路徑,突破傳統(tǒng)芯片的算力天花板。這不僅能縮短系統(tǒng)響應(yīng)時(shí)間,還能使能效比大幅提升。一旦技術(shù)成熟,有望降低對高帶寬內(nèi)存的依賴度,部分替代HBM的功能。
華為的AI突破性技術(shù)成果
華為近期發(fā)布的UCM(推理記憶數(shù)據(jù)管理器),是以KV Cache(鍵值緩存)為核心的推理加速套件。它融合多種緩存加速算法工具,可對推理過程中產(chǎn)生的KV Cache記憶數(shù)據(jù)進(jìn)行分級管理,擴(kuò)大推理上下文窗口,實(shí)現(xiàn)高吞吐、低時(shí)延的推理體驗(yàn),降低每個(gè)Token(詞元)的推理成本。通過這一創(chuàng)新架構(gòu)設(shè)計(jì),UCM能夠減少對高帶寬內(nèi)存(HBM)的依賴,同時(shí)提升國產(chǎn)大模型的推理性能。
04 未來將是多層級架構(gòu)的時(shí)代
在訓(xùn)練和推理場景中,算力與存儲是率先受益的領(lǐng)域,將決定未來十年AI競爭格局。
與GPGPU產(chǎn)品類似,HBM(尤其是HBM3及以上規(guī)格)需求旺盛,且長期被國外廠商壟斷。2025年初,HBM3芯片現(xiàn)貨價(jià)格較2024年初暴漲300%,單臺AI服務(wù)器的DRAM用量是傳統(tǒng)服務(wù)器的8倍。從市場格局看,海外廠商仍占主導(dǎo)地位:SK海力士以53%的份額領(lǐng)先,且率先實(shí)現(xiàn)HBM3E量產(chǎn);三星電子占比38%,計(jì)劃2025年將HBM供應(yīng)量提升至去年的兩倍;美光科技目前份額為10%,目標(biāo)是2025年將市占率提升至20%以上。
盡管HBM在高端AI應(yīng)用領(lǐng)域表現(xiàn)卓越,但隨著其他內(nèi)存技術(shù)在成本控制、性能提升及功耗優(yōu)化等方面的突破,其未來可能面臨新興技術(shù)的競爭壓力。不過短期內(nèi),HBM仍是高帶寬需求場景的首選方案。
從長期看,市場將隨技術(shù)演進(jìn)與應(yīng)用需求變化而調(diào)整優(yōu)化。未來AI內(nèi)存市場不是簡單的“替代與被替代”關(guān)系,HBM替代方案的創(chuàng)新呈現(xiàn)出“架構(gòu)哲學(xué)的多樣性”。AI計(jì)算與內(nèi)存領(lǐng)域不會出現(xiàn)全面取代HBM的“唯一贏家”,而是會形成更復(fù)雜、分散化且貼合具體場景的內(nèi)存層級結(jié)構(gòu),單一內(nèi)存解決方案主導(dǎo)高性能計(jì)算的時(shí)代正在結(jié)束。
未來的AI內(nèi)存版圖將是異構(gòu)多元的層級體系:HBM聚焦訓(xùn)練場景,PIM內(nèi)存服務(wù)于高能效推理,專用片上內(nèi)存架構(gòu)適配超低延遲應(yīng)用,新型堆疊DRAM與光子互連等技術(shù)也將在系統(tǒng)中占據(jù)一席之地。各類技術(shù)針對特定工作負(fù)載實(shí)現(xiàn)精準(zhǔn)優(yōu)化,共同構(gòu)成AI時(shí)代的內(nèi)存生態(tài)。
本文來自微信公眾號“半導(dǎo)體產(chǎn)業(yè)縱橫”(ID:ICViews),作者:鵬程,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com