超越CUDA的軟件生態(tài),究竟有多難?
電子愛(ài)好者網(wǎng)報(bào)道(文章 / 周凱揚(yáng))近日,英偉達(dá)正式超越微軟,成為全球市值最高的企業(yè),股價(jià)持續(xù)上漲,這當(dāng)然離不開微軟。 GPU 這一 AI 硬件之所以火爆,是因?yàn)樗芤慌e成為世界第一,也離不開軟件的支持。真正把它推向神壇的,還是圍繞著它。 CUDA 創(chuàng)建一系列軟件生態(tài)系統(tǒng)。
英偉達(dá)—— CUDA 的絕對(duì)統(tǒng)治
相信對(duì) GPU 有一定了解的人都知道,英偉達(dá)最大的環(huán)城河就是 CUDA。CUDA 隨著后端架構(gòu)處于絕對(duì)統(tǒng)治地位, AI 發(fā)展得越快,英偉達(dá) GPU CUDA 研究與開發(fā)的生態(tài)發(fā)展日益壯大,甚至達(dá)到了很多競(jìng)爭(zhēng)對(duì)手期待的水平。CUDA 自 2006 自2008年推出以來(lái),即使在 AI 與深度學(xué)習(xí)并未成為主流階段,也在不斷發(fā)展并行計(jì)算,為開發(fā)者提供豐富的庫(kù)、工具算法。
時(shí)至今日,CUDA 它為世界開發(fā)者創(chuàng)造了一個(gè)巨大的社區(qū),包括大多數(shù)深度學(xué)習(xí)框架, TensorFlow、Pytorch 等都對(duì) CUDA 進(jìn)行改進(jìn)。為迅速進(jìn)入市場(chǎng),大多數(shù)開發(fā)者更傾向于選擇 CUDA 作為主要的計(jì)算平臺(tái)。
同時(shí),英偉達(dá)也圍繞著英偉達(dá)。 CUDA 通過(guò)更先進(jìn)的工藝和封裝技術(shù),對(duì)硬件架構(gòu)進(jìn)行更深入的創(chuàng)新和優(yōu)化,提高計(jì)算性能和效率。例如, Volta 架構(gòu)中引入 Tensor 英偉達(dá)是核心之后 GPU 矩陣運(yùn)算得到了很大的加強(qiáng),深度學(xué)習(xí)訓(xùn)練和推理的性能也取得了飛躍。兩者的結(jié)合促進(jìn)了 CUDA 坐在第一個(gè)寶座上。
英偉達(dá)的游戲軟件領(lǐng)域 DLSS 可說(shuō)是市場(chǎng)上最先進(jìn)的專有超分技術(shù),而且歸功于持續(xù)的訓(xùn)練,每一次版本更新都能帶來(lái)圖形渲染領(lǐng)域的突破。
最終,在與生產(chǎn)力工具相關(guān)的軟件生態(tài)方面,英偉達(dá)在這一塊的優(yōu)勢(shì)更加充分,過(guò)去蘋果和蘋果 AMD 仍在 GPU 在合作的時(shí)候,很多生產(chǎn)力工具還是針對(duì)的。 AMD 的 GPU 做了很多硬件優(yōu)化。然而,隨著蘋果的發(fā)展 Arm 結(jié)構(gòu),英偉達(dá)在這一行業(yè)中逐漸壯大。
無(wú)論是 Adobe 旗下的多媒體處理軟件,或者是一些獨(dú)立開發(fā)商打造的軟件,許多都有英偉達(dá) CUDA 對(duì)硬件加速的支持,即使是英特爾的核顯在某些軟件支持方面,也要好于 AMD。正因?yàn)槿绱?,除了一些與特效制作相關(guān)的工作外,工作站內(nèi)的工作 AMD GPU 越來(lái)越少。
盡管谷歌、英特爾和高通等科技巨頭也在尋找打破 CUDA 壟斷地位的機(jī)會(huì),但對(duì)于軟件生態(tài)來(lái)說(shuō),合作并不一定意味著雙贏,最終很可能只是為市場(chǎng)提供更多的選擇,但在便利性和性能方面,還不如不停留一路奔跑。 CUDA。
AMD
AMD 對(duì)其 GPU 軟體生態(tài)態(tài)度較為開放,對(duì)開源開發(fā)社區(qū)的重視程度極高。AMD 的 ROCm 正是英偉達(dá)的對(duì)標(biāo) CUDA,但是它對(duì)硬件沒(méi)有限制,除了 Radeon、Instinct 系列 GPU 另外,設(shè)備也在擴(kuò)展到其它硬件制造商。這也得益于 AMD 不能在硬件中引入 Tensor 像核心這樣的專有硬件,但也正是因?yàn)槿绱耍?ROCm 有些任務(wù)稍遜一籌。
ROCm 作為一個(gè)開源平臺(tái),它還提供了多種庫(kù)和框架的支持,以及一套完整的開源工具鏈。就是這樣, HPC 在云計(jì)算等領(lǐng)域,廠商實(shí)際上更愿意使用。 AMD 的 GPU,沒(méi)有必要忍受英偉達(dá)的專用軟件棧。然而,由于英偉達(dá)的先行軟件生態(tài),他們不得不首選英偉達(dá)的軟件。 GPU。
AMD 就算有了 ROCm,整個(gè)軟件生態(tài)系統(tǒng)的成熟度仍然不如英偉達(dá), HPC 這些項(xiàng)目中有一部分不是為了商業(yè)成功而設(shè)計(jì)的,AMD 已獲得許多份額,例如, TOP500 前十名的多臺(tái)超算。但以整個(gè) TOP500 從名單上看,英偉達(dá)仍然占據(jù)主導(dǎo)地位。然而,對(duì)于云供應(yīng)商來(lái)說(shuō),英偉達(dá)的統(tǒng)治在短時(shí)間內(nèi)仍然無(wú)法擺脫。因?yàn)樽庥眠@些云服務(wù)的客戶更愿意在英偉達(dá)。 CUDA 開發(fā)平臺(tái)。
尤其是對(duì)于驅(qū)動(dòng)軟件, Linux 顯卡驅(qū)動(dòng),AMD 采用開源和閉源兩條路線,在不斷更新閉源驅(qū)動(dòng)的同時(shí),也允許開源社區(qū)定制開源驅(qū)動(dòng)。以基于 Linux 系統(tǒng)內(nèi) AMD Radeon 顯卡打造的 Vulkan 驅(qū)動(dòng) AMDVLK 舉例來(lái)說(shuō),它支持光跟蹤。但是,開源驅(qū)動(dòng)雖然因?yàn)槭謩?dòng)設(shè)備和社區(qū)貢獻(xiàn)而具有更高的兼容性,但如果追求更高的性能,那么閉源驅(qū)動(dòng)仍然更有優(yōu)勢(shì)。
摩爾線程
國(guó)產(chǎn) GPU 主要分為兩個(gè)方向,即支持圖形渲染和不支持圖形渲染。后者仍然希望 AI 前者正在推動(dòng)領(lǐng)域內(nèi)的突破。 C 在終端產(chǎn)品的同時(shí),也在布局上 B 端一系列 AI GPU 商品。國(guó)產(chǎn)產(chǎn)品 GPU 在產(chǎn)品中,摩爾線程在軟件生態(tài)方面做得更好,他們?cè)谲浖鷳B(tài)方面做得更好。 AI 以及圖形渲染軟件支持都有喜人的進(jìn)步。
基于 MUSA 摩爾線程建立了這種統(tǒng)一的結(jié)構(gòu)。 MTT S80 這種桌面顯卡,以及面向服務(wù)器的應(yīng)用 MTT S3000 等等。與之相匹配的是摩爾線程打造的軟件開發(fā)平臺(tái),包括 AI 開發(fā)平臺(tái)、MUSA SDK、MT Smart Media 和 MTVerse XR 等。
而且在摩爾線程打造的這種生態(tài)結(jié)構(gòu)中,可以充分適應(yīng)當(dāng)前的軟件生態(tài),借助于當(dāng)前的軟件生態(tài) MUSIFY 實(shí)現(xiàn)代碼零成本轉(zhuǎn)移的工具 MUSA 平臺(tái)。與 AMD 的 ROCm 一樣,MUSA 做同樣的事情也是適應(yīng) CUDA 路線,而非形象 ZLUDA 同樣重新編譯二進(jìn)制代碼,因此不違反英偉達(dá)的代碼。 EULA 條款。
根據(jù)摩爾線程最近官方發(fā)布的消息,他們 AI 在此基礎(chǔ)上,選擇了逐步完成大型模型適應(yīng)支持的路線。他們已經(jīng)完成了摩爾線程的夸娥千卡智算集群。 30 億到 700 大模型訓(xùn)練和推理適配億參數(shù)。摩爾線程的 GPU 與國(guó)際大廠相比,計(jì)算能力還是略遜一籌,但隨著未來(lái)的發(fā)展, IP、在硬件開發(fā)方面取得了進(jìn)一步的突破,我相信他們也可以創(chuàng)造出高性能。 AI 算率底座。
摩爾線程也在不斷更新和提高消費(fèi)級(jí)圖形顯卡的驅(qū)動(dòng)軟件的性能。以 5 月底發(fā)布的 v260.70 以版本驅(qū)動(dòng)為例,除提供對(duì)比外 OpenGL 4.0 支持和改進(jìn)功能 Blender 3.6 LTS 除了感覺(jué)之外,還有很多熱門游戲。 DirectX 11 下層性能得到了顯著提高。盡管與英偉達(dá)相比,這一驅(qū)動(dòng)更新規(guī)模仍有差距,但也代表了廠商不斷優(yōu)化性能的決心。
寫在最后
事實(shí)上,越來(lái)越多的制造商進(jìn)軍 GPU,越來(lái)越多的 GPU 廠商使力 AI 可以看出,即使是 CUDA 有著深厚的生態(tài)積累,但日新月異。 AI 其它廠商仍然有機(jī)會(huì)分一杯羹,甚至可能在某一應(yīng)用程序中后來(lái)者居上。但是,在圖形渲染相關(guān)軟件生態(tài)方面,廠商面臨著較厚的技術(shù)壁壘。不但要有鉆研十幾年的決心,還要繼續(xù)打磨硬件產(chǎn)品,與工業(yè)軟件生態(tài)系統(tǒng)合作,挖掘和培養(yǎng)更多的圖形研究人才。
閱讀更多熱門文章
加關(guān)注 星標(biāo)我們
把我們?cè)O(shè)為星標(biāo),不要錯(cuò)過(guò)每一次更新!
喜歡就獎(jiǎng)勵(lì)一個(gè)“在看”!
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




