時隔9年黃仁勛再給馬斯克送貨,跳票大半年的AI個人超算登場
等了大半年,DGX Spark 到底有何魅力?

今天星艦第十一飛圓滿結(jié)束,令人意外的是黃仁勛也現(xiàn)身現(xiàn)場。原來,黃仁勛親自飛到德州的星際基地(Starbase),在沖天的星艦旁,將一臺新“核彈”交到了馬斯克手中。這就是大家從年初盼到現(xiàn)在的——NVIDIA DGX Spark 個人 AI 超級計算機。

這一幕讓老科技迷們瞬間回憶起 2016 年。當時,馬斯克還是 OpenAI 的聯(lián)合創(chuàng)始人,尚未與奧特曼鬧掰,黃仁勛親自把全球第一臺 DGX - 1 超級計算機送到他們初創(chuàng)公司的辦公室。

黃仁勛當時開玩笑說:如果這是唯一一個出貨的產(chǎn)品,那這個項目造價就高達 20 億美元了。那臺“20 億美金的大家伙”開啟了整個大模型時代。次年 Google 公布了新的神經(jīng)網(wǎng)絡(luò)訓(xùn)練架構(gòu) Transformer,Sutskever 抓住這次突破,引領(lǐng) OpenAI 基于英偉達的超級計算機建造出第一個 GPT 模型。
9 年過去,馬斯克成了全球首富???,黃仁勛掌管著一度全球市值第一的公司。而此次英偉達交付的 DGX 不再是龐然大物,而是一臺可放在桌邊的“性能怪獸”,宣告著一個屬于每個人的 AI 超算時代開啟。

劇透一下,APPSO 的 DGX Spark 也在運輸途中,后續(xù)會帶來更多體驗細節(jié),敬請期待。
實際上,這臺 DGX Spark 能交到馬斯克手上著實不易。從今年 1 月在 CES 上以“Project Digits”之名驚艷亮相后,英偉達錯過了原定的 5 月和夏季發(fā)布日期,一直未出貨。這大半年的等待讓不少人心里沒底,一些開發(fā)者甚至覺得可能要徹底跳票了。
雖官方未作回應(yīng),但行業(yè)猜測都指向其核心——Grace Blackwell GB10 芯片。該芯片是“合體金剛”,Blackwell GPU 部分(與 5090 顯卡同款架構(gòu))早已準備好,可與聯(lián)發(fā)科(MediaTek)共同開發(fā)的 Grace CPU 部分生產(chǎn)進度滯后,拖了整個項目后腿。“萬事俱備,只欠 CPU”的情況竟發(fā)生在了英偉達身上。
那么,在 M3 Ultra Mac Studio 等競品憑借高內(nèi)存帶寬吸引眼球時,這臺姍姍來遲、還比最初傳聞貴 1000 美元的 DGX Spark 還值得等待嗎?答案是:絕對值得!因為它的獨特之處能直擊痛點。
等了大半年,DGX Spark 到底好在哪?APPSO 為你回顧。

整臺機器的核心是 Grace Blackwell GB10 超級芯片。它將一顆 20 核的 ARM 架構(gòu) Grace CPU 和一顆強大的 Blackwell GPU 封裝在一起,能提供高達 1 Petaflop(千萬億次)的 AI 計算性能,讓用戶在桌面就能體驗數(shù)據(jù)中心級別的強大動力。
DGX Spark 還有一殺手锏,即 CPU 和 GPU 通過 NVIDIA NVLink? - C2C 技術(shù)無縫連接,共享一個 128 GB 的統(tǒng)一內(nèi)存池。該連接技術(shù)帶寬是傳統(tǒng)第五代 PCIe 的 5 倍,確保數(shù)據(jù)在 CPU 和 GPU 間高速流轉(zhuǎn)且?guī)缀鯚o延遲。
雖其內(nèi)存帶寬(273 GB/s)在紙面上不如 Mac Studio M3 Ultra(819 GB/s),但英偉達采用“大力出奇跡”策略。

在 AI 任務(wù)尤其是運行大模型時,能將整個模型一次性裝進內(nèi)存的大容量,戰(zhàn)略價值遠超單純的帶寬數(shù)字。這意味著用戶可在桌上流暢運行 2000 億參數(shù)的超大語言模型,無需復(fù)雜的模型切分,這種體驗獨一無二。
Blackwell GPU 配備第五代張量核心(Tensor Cores),支持 FP4/FP8 超低精度格式,性能相比上一代 FP8 提升 5 倍。這如同給 AI 計算開啟“渦輪增壓”模式,讓推理速度大幅提升,能效比也十分出色。
若單臺不夠,DGX Spark 還內(nèi)置 NVIDIA ConnectX? - 7 200 Gb/s 網(wǎng)絡(luò)接口,可輕松將兩臺設(shè)備連接,組成擁有 256 GB 共享內(nèi)存的微型集群。英偉達稱,這樣的組合足以處理 4000 億參數(shù)的巨型模型,超出個人開發(fā)者想象。
除硬件外,別忘了英偉達強大的軟件生態(tài)。DGX Spark 預(yù)裝完整的 NVIDIA AI 軟件棧,包括 CUDA 庫、TensorRT 和各種 NVIDIA NIM? 微服務(wù),所有內(nèi)容都集成在定制的 DGXOS(基于 Ubuntu)上并調(diào)校好。這讓開發(fā)者無需花費時間處理兼容性問題,開箱即可投入使用,節(jié)省的時間成本難以估量。
這場在星艦基地的“世紀交接”只是開端。

從 10 月 15 日起,DGX Spark 將通過英偉達官網(wǎng)和全球合作伙伴正式發(fā)售,價格為 3999 美元。宏碁、華碩、戴爾、聯(lián)想等 PC 巨頭已第一時間跟進。
實際上,這個價格比最初承諾的 3000 美元貴了 1000 美元,與頂配的 Mac Studio M3 Ultra 相近,但它們定位不同:DGX Spark 預(yù)裝 DGXOS(基于 Ubuntu),不能安裝 Windows 或 macOS,是專為 AI 開發(fā)者和硬核玩家打造的“戰(zhàn)斗機器”。
其魅力在于,花 4000 美元能獲得在本地運行 2000 億參數(shù)大模型的能力,以及整個 CUDA 生態(tài)的全力支持。對于需要在本地處理敏感數(shù)據(jù)、追求極致性能或掌控自己 AI 工作流的專業(yè)人士來說,這個價格很有競爭力。
對于這臺優(yōu)缺點鮮明的“偏科生”,你若想了解更多細節(jié),歡迎在留言區(qū)告訴我們。
本文來自微信公眾號“APPSO”,作者:發(fā)現(xiàn)明日產(chǎn)品的,36 氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com


