人工智能時代的輝煌存在
數(shù)據(jù)已成為數(shù)字經(jīng)濟(jì)浪潮下新的生產(chǎn)要素。
當(dāng)前數(shù)據(jù)中心有三大力量:計算力-計算率,存儲力-存儲力,運(yùn)輸力-運(yùn)輸力,即網(wǎng)絡(luò)力。
在計算產(chǎn)業(yè)鏈蓬勃發(fā)展的同時,對存力的需求也大大增加。2023年上半年,我國存力規(guī)模增長23%,達(dá)1080EB。
為什么存力越來越受到重視?由于大模型的演變和計算率中心的發(fā)展,大量的數(shù)據(jù)基礎(chǔ)和與數(shù)據(jù)密切相關(guān)的存儲是不可或缺的。
中國工程院教授倪光南曾指出:“每個地方都在建設(shè)AI計算中心。通常每個人都關(guān)心每秒計算多少次。這是計算率,這顯然很重要。但從科學(xué)的角度來看,AI計算應(yīng)該用廣義的計算率來表示,存力、計算能力和運(yùn)力的結(jié)合構(gòu)成了廣義的計算率。”
01 存力的定義
伴隨著智能世界的到來,信息量正以驚人的速度增長,預(yù)計到2030年,全球數(shù)據(jù)將進(jìn)入YB時代。
所有有數(shù)據(jù)的地方都需要數(shù)據(jù)存儲。如何妥善安全地存儲信息尤為重要,取決于數(shù)據(jù)存儲的綜合能力,即數(shù)據(jù)存儲能力。
計算存儲能力的容量,采用單位GDP存儲容量來保證不同國家的對比,即數(shù)據(jù)存儲空間容量除以GDP規(guī)模。每萬美元GDP對應(yīng)的存儲容量越高,數(shù)據(jù)存儲容量水平越高,GDP中數(shù)字經(jīng)濟(jì)的滲透程度越高,可以更好地支撐經(jīng)濟(jì)社會的高質(zhì)量發(fā)展。
各國單位GDP存儲容量表現(xiàn)
根據(jù)計算數(shù)據(jù),新加坡、捷克、美國等發(fā)達(dá)國家的GDP存儲容量較高,每萬美元的GDP存儲容量分別達(dá)到46.7GB、33.4GB、33.3GB,經(jīng)濟(jì)發(fā)展中存儲的支撐能力較為明顯。經(jīng)濟(jì)量較大的發(fā)展中國家,如南非、俄羅斯、中國等,處于中間水平,每萬美元GDP的存儲容量為23GB和31GB。
通過計算一個國家的數(shù)據(jù)存儲容量,除以一個國家的總數(shù)據(jù)產(chǎn)值,可以反映一個國家和地區(qū)最初生產(chǎn)的所有信息中存儲的比例有多大,從而反映一個國家的數(shù)據(jù)存儲能力是否足以支撐其經(jīng)濟(jì)社會的高質(zhì)量發(fā)展需求。

各國數(shù)據(jù)存力充足的表現(xiàn)
全球范圍內(nèi),每億美元GDP聚集的數(shù)據(jù)量保持14.5%的快速增長,北美美國、加拿大等發(fā)達(dá)國家達(dá)到16.8%,反映了信息量的快速增長。
存力投資增長率指標(biāo)利用2017年至2019年三年各國存儲投資的復(fù)合增長率來衡量各國的增長動能。高增長率反映了數(shù)據(jù)存儲在各國現(xiàn)有數(shù)據(jù)存儲規(guī)模之上的發(fā)展速度和潛力。
各國存力投資增長率的表現(xiàn)
2017-2019年,沙特、中國、俄羅斯等發(fā)展中國家的存儲市場增長迅速,復(fù)合存力投資增長率均超過40%。
作為計算率的重要組成部分,隨著計算能力需求的爆炸式增長,行業(yè)對存儲能力提出了更高的需求,先進(jìn)的存儲能力已經(jīng)成為計算率高質(zhì)量發(fā)展的重要發(fā)展方向。
02 在AI時代,存力是如何演變的?
AI時代對存儲提出了更多的要求:
高速數(shù)據(jù)處理:尤其是在深度學(xué)習(xí)模型中,AI需要快速處理和分析龐大的數(shù)據(jù),這就要求存儲系統(tǒng)具備高效的數(shù)據(jù)讀寫能力。
大容量存儲:由于信息量的急劇增加,存儲系統(tǒng)需要更多的空間來容納訓(xùn)練數(shù)據(jù)、模型參數(shù)和推理結(jié)果。
延遲瀏覽量低:即時AI應(yīng)用對存儲系統(tǒng)的響應(yīng)速度要求很高,低延遲存儲解決方案可以顯著提高響應(yīng)速度和響應(yīng)時間。
可擴(kuò)展性:隨著AI應(yīng)用的擴(kuò)展,存儲系統(tǒng)必須能夠靈活增長,以適應(yīng)日益增長的存儲需求。
AI時代所需的內(nèi)存和存儲器可以根據(jù)調(diào)取速度和支出水平分為四種類型。
最終層次,位于金字塔的低端,與SSD存儲產(chǎn)品相對應(yīng),速度較慢,成本較低。
SSD是數(shù)據(jù)存儲的基礎(chǔ)。與DRAM相比,它主要處理計算時的數(shù)據(jù)傳輸問題。大量的數(shù)據(jù)仍然依賴于NAND 由Flash制成的SSD、嵌入式存儲。
“SSD(固態(tài)板)將成為AI的一部分。PeterPeter Lee最近發(fā)布了一份報告,提醒投資者注意“更換周期”即將到來,SSD可能會取代AI硬盤驅(qū)動器。他指出,SSD因為它的速度比HDD快40倍,所以更適合AI訓(xùn)練應(yīng)用。
SSD的演變主要有兩個方面:一是容量,二是性能和功耗。
另一方面,AI時代對高容量SSD的需求正在迅速增長。SSD不僅需要更大的存儲容量,而且可以通過技術(shù)改進(jìn)來提高NAND密度,而不會犧牲性能。
隨著 TLC 閃存結(jié)構(gòu)開始達(dá)到原始存儲容量的極限(正如之前的 SLC 和 MLC 一樣),QLC 代表著不斷突破主流消費的希望 SSD 容量極限的 SSD 制造商的未來。現(xiàn)在,存儲商已經(jīng)發(fā)布了QLC閃存。

新一代三星發(fā)布 QLC NAND 閃存,其面積密度極高,達(dá)到每平方毫米。 28.5 Gbit。 Solidigm的子公司SK海力士推出了61.444,選擇QLC閃存。 TB D5-P5336 SSD商品。
根據(jù)最新需求,TrendForce集邦咨詢表示,AI服務(wù)器在第二季度對大空間SSD的需求持續(xù)上升,除了推動第二季度Enterprise之外, 預(yù)計第二季EnterpriserpriserSSD合約價格將繼續(xù)上漲超過20%。 SSD收入增長率仍有機(jī)會延長20%,QLC大空間產(chǎn)品的需求動能明顯優(yōu)于其它容量。
另一方面,在性能和功耗方面,隨著數(shù)據(jù)中心對存儲設(shè)備速度要求的不斷提高,,SSD需要提交更高的IOPS(每秒輸入輸出操作頻率)和帶寬(GBPS),在保證高性能的同時,必須有效地控制功耗,實現(xiàn)單位性能所需的能耗降低。
最大的助力點是協(xié)議接口和NAND接口的速度。 現(xiàn)在,為了追求高性能,NVMe/PCIe SSD是數(shù)據(jù)中心的高性能標(biāo)準(zhǔn)。
PCIe5.0的規(guī)范早在五年前就已經(jīng)發(fā)布,但是PCIe5.0的排熱、信號消耗等問題已經(jīng)被阻止了。 PC市場推廣SSD的重要原因。然而,隨著技術(shù)的普及,PCIe5.0的市場份額將繼續(xù)擴(kuò)大。三星半導(dǎo)體還預(yù)測PCIe5.0在PC端SSD商品中迅速使用。
另外,目前的PCIe 6.0已經(jīng)發(fā)布,數(shù)據(jù)傳輸速率將由PCIe發(fā)布。 5.0的32 GT/s和PCIe 4.0的16 GT提升到每個引腳64 GT/s,PCIe 6.0 ×16通道單向理論數(shù)據(jù)傳輸速度達(dá)到128 GB/s(雙向256 GB/s)。
三是能夠以更高的性價比為大型模型提供大容量CXL內(nèi)存擴(kuò)展方案。
需要注意的是,PCLe可以擴(kuò)展和分層,包括嵌入式交換機(jī)或交換機(jī)芯片,支持一個根端口與多個終端連接,如多個存儲設(shè)備(以及其他終端,如以太網(wǎng)卡和顯示驅(qū)動軟件)。然而,這種實現(xiàn)方式在一個大型系統(tǒng)中有局限性,包括一個獨立的內(nèi)存池。這個系統(tǒng)中的處理器和加速器在同一個系統(tǒng)中。 64 在位置空間中共享相同的數(shù)據(jù)和存儲空間進(jìn)行異構(gòu)計算。
與使用 CXL 與替代實現(xiàn)方案相比,緩存一致性機(jī)制的缺乏會導(dǎo)致這些應(yīng)用程序內(nèi)存性能低下,延遲是不可接受的。
因此,盡管 64GT/s 的 PCIe 6.0.1 引入有助于增加存儲應(yīng)用程序的可用帶寬,而延遲增加很少或沒有增加,但缺乏一致性仍然限制了它。 PCIe 應(yīng)用程序,如傳統(tǒng)應(yīng)用程序 SSD 這種塊狀存儲設(shè)備。用于這種存儲應(yīng)用 PCIe 這是一個傳輸接口 NVMe 已經(jīng)占據(jù)了 SSD 技術(shù)的主導(dǎo)地位。下一代正在開發(fā)中 SSD,它們將使用 CXL 接口取代 PCIe。
就產(chǎn)品而言,三星在數(shù)據(jù)存儲方面有兩個CXL存儲模塊。一個是CXL2.0商品CMMM,已經(jīng)推出的第一代基于SoC。-D,三星半導(dǎo)體計劃在2025年推出一款新產(chǎn)品,配備第二代控制器,容量為128GB。同時,三星還在不斷開發(fā)和使用NAND和DRAM的混合CXL存儲模組結(jié)構(gòu)CMMM。-H,該架構(gòu)用于AI和ML系統(tǒng)。
CZ120在美光推出 CXL內(nèi)存擴(kuò)展方案,最多可擴(kuò)展2TB內(nèi)存空間。另外,在添加可擴(kuò)展內(nèi)存之后,Llama2 LLM的推理性能提高了22%,可以更大程度地釋放GPU性能。
二級,是DDR內(nèi)存,速度更快,價格更高。
DDR、LPDDR、基于DRAM的三種內(nèi)存規(guī)范或標(biāo)準(zhǔn),GDDR已經(jīng)成為目前PC和服務(wù)器端的主流內(nèi)存,因為它的性能和成本優(yōu)勢。
為了解決從客戶端系統(tǒng)到高性能服務(wù)器的廣泛應(yīng)用所面臨的性能和功耗挑戰(zhàn),2020年,JEDEC下一代主流內(nèi)存標(biāo)準(zhǔn)DDR5正式發(fā)布(固體技術(shù)協(xié)會) 最后的SDRAM規(guī)格(JESD79-5)。
JEDEC將DDR5描述為一種具有革命意義的內(nèi)存結(jié)構(gòu)。
DDR5具有速度更高、空間更大、節(jié)能性更強(qiáng)的特點,與DDR4相比。DDR5內(nèi)存的最高傳輸速度為6.4。Gbps,它是DDR4的兩倍?,F(xiàn)在, PC、筆記本電腦仍然是人工智能,各個行業(yè)都在加速 DDR5 新時代的進(jìn)步。
2024年初DDR5供不應(yīng)求,差距達(dá)到3%。根據(jù)市場內(nèi)部人士的預(yù)測,這是由于生成人工智能。(GenAI)必要時,內(nèi)存市場DDR5的滲透率將加快,預(yù)計2024年下半年將達(dá)到兩位數(shù)百分比。
當(dāng)前AI服務(wù)器的另一個趨勢是DDR轉(zhuǎn)換為GDDR。
DDR存儲器的設(shè)計延遲極低,其目的是盡可能快地傳輸少量緩存數(shù)據(jù),以配合CPU進(jìn)行串行計算。顯卡多為平行任務(wù),需要大量重復(fù)存儲,但對延遲的需求沒有CPU高。因此,GDDR帶寬更大,頻率更高。
如今,GDDR的標(biāo)準(zhǔn)已經(jīng)更新到第七代,即GDDR7。美光宣布,新一代GDDR7顯示存儲器將用于顯示卡進(jìn)行樣本檢測。與前一代GDDR6顯示存儲器相比,數(shù)據(jù)傳輸頻率將增加60%,并增加了新的睡眠模式,從而降低待機(jī)能耗的70%。
第一層位于金字塔頂端,對應(yīng)的工作速度特別快,但是成本很高的內(nèi)存,比如HBM。作為一個內(nèi)存芯片,它可以快速地向GPU喂養(yǎng)大量的數(shù)據(jù)。
HBM是一種高帶寬存儲器,是一種基于3D堆棧技術(shù)的高性能DRAM,實際上是將許多DDR芯片堆疊在一起,與GPU一起封裝,實現(xiàn)大空間、高位寬DDR組合陣型。
HBM 解決了傳統(tǒng) GDDR 遇到的“內(nèi)存墻”問題,采用了近存計算架構(gòu),不通過外部連接。 GPU/CPU/Soc 通過中間介質(zhì)層緊湊快速地連接信號轉(zhuǎn)換器芯片,大大節(jié)省了數(shù)據(jù)傳輸所使用的時間和能耗。
在技術(shù)上,HBM已發(fā)展到第五代。 分別是: HBM(第一代)、HBM2(第二代)、HBM2E(第三代)、HBM3(第四代)、HBM3E(第五代)。 2026年可能會推出規(guī)格較高的HBM4。
就HBM市場而言,SK海力士市場份額有望在2023年全球HBM市場上上升至53%,三星市場份額為38%。、美光的市場份額約為9%。然而,5日,美光宣布將在2024年會計期間搶占HBM市場20%以上的份額。AMD 和 NVIDIA 兩家尖端的 GPU相繼配置 HBM。
03 存儲的下一站:存算一體化
在這里,我們已經(jīng)可以看到存力不斷進(jìn)化的過程。
從最初的數(shù)據(jù)存儲SSD,到DDR5的數(shù)據(jù)計算,再到HBM的進(jìn)一步解決數(shù)據(jù)傳輸問題,存儲一直在處理數(shù)據(jù)存儲的效率問題。因此,下一步存儲的關(guān)鍵是打破“存儲墻”。
計算一體化的優(yōu)勢是解決傳統(tǒng)馮·諾依曼架構(gòu)下的“存儲墻”和“功耗墻”問題。清除不必要的數(shù)據(jù)處理延遲和功耗,利用存儲單元提高計算率,提高計算效率數(shù)百倍,降低成本。
AMD、特斯拉、三星、阿里巴巴等公司曾在公共場所表示,下一代技術(shù)的儲備和演變方向是在“計算一體化”的技術(shù)結(jié)構(gòu)中找到新的發(fā)展動能。
例如,阿里達(dá)摩院曾經(jīng)說過,與傳統(tǒng)的CPU計算系統(tǒng)相比,存算集成芯片的性能可以提高10倍以上,能效可以提高300倍以上。
當(dāng)前,存算一體化的技術(shù)路徑主要分為近存計算。(PNM)、存內(nèi)處理(PIM)、存內(nèi)計算(CIM)。英特爾等國際巨頭,IBM、探索磁性存儲器,如特斯拉、三星、阿里等。(MRAM)、憶阻器(RRAM)等待商品陸續(xù)量產(chǎn);國內(nèi)知存科技、億鑄科技、九天睿芯等創(chuàng)業(yè)公司都在下注PIM、CIM等“存”與“算”更加密切的存算一體化技術(shù)路線。
本文來自微信公眾號“半導(dǎo)體產(chǎn)業(yè)縱橫”(ID:ICViews),作者:九林,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




