一覺醒來(lái),國(guó)產(chǎn)顯卡開始挑戰(zhàn)英偉達(dá)4060了?
以下文章來(lái)源于差評(píng)硬件部 ,作者托尼
通常,托尼會(huì)在工作日撰寫新產(chǎn)品發(fā)布類文章,因?yàn)閺S商一般在工作日開發(fā)布會(huì)。
但“礪算科技”這家廠商很特別,他們周末加班發(fā)布了堪稱重磅的產(chǎn)品 —— 首款國(guó)產(chǎn)自研6nm工藝顯卡!

沒(méi)錯(cuò),這是能插在電腦上打游戲的顯卡。據(jù)礪算在發(fā)布會(huì)上所說(shuō),這款顯卡的光柵性能趕超了英偉達(dá)的RTX 4060,甚至能穩(wěn)玩1080P的《黑神話:悟空》??赐甑Z算科技的新品發(fā)布會(huì),托尼到現(xiàn)在都還有些懵。
相關(guān)報(bào)道顯示,截至2024年,礪算科技僅募資6.28億。而英偉達(dá)、英特爾和AMD,研發(fā)投入動(dòng)輒幾百億。國(guó)內(nèi)芯片創(chuàng)業(yè)公司用十幾分之一的資源“手搓”出4060級(jí)別的顯卡,這若屬實(shí),妥妥是“顯卡圈子”的傳奇故事。
不過(guò),想了解這兩款產(chǎn)品詳細(xì)測(cè)試情況的小伙伴還需等待。昨天發(fā)布的消費(fèi)級(jí)顯卡7G106及專業(yè)級(jí)顯卡7G105,預(yù)計(jì)8月送樣,9月量產(chǎn)。

真正的上手實(shí)測(cè)還需時(shí)日,若你想知道發(fā)布會(huì)公布的細(xì)節(jié),托尼可以帶大家梳理這兩款國(guó)產(chǎn)自研顯卡的公開信息。
首先是兩款顯卡的GPU部分,基于臺(tái)積電N6工藝,采用礪算科技自研的TrueGPU圖形架構(gòu)。這意味著從計(jì)算核心到指令集均為自主設(shè)計(jì),而非常見的“公版IP授權(quán) + 自主優(yōu)化”形式。

這樣做有諸多好處。以GPU的3D渲染為例,圖形由無(wú)數(shù)三角形拼湊而成,渲染過(guò)程就是三角形的拆分、拼湊和計(jì)算。據(jù)礪算科技官方稱,礪算7G106的三角形渲染重構(gòu)了圖形管線執(zhí)行邏輯,采用智能亂序渲染,能根據(jù)負(fù)載動(dòng)態(tài)分配計(jì)算單元,可在適配場(chǎng)景下提升50%的渲染效率。

此外,礪算7G106支持FP32或INT32指令雙發(fā)射,以方塊形式存儲(chǔ)矩陣數(shù)據(jù),可優(yōu)化40%的顯存使用效率。從這些特性看,礪算顯卡設(shè)計(jì)思路較為先進(jìn)。比如FP32/INT32雙發(fā)射,NVIDIA從20系顯卡開始支持,AMD從RX7000系顯卡開始,英特爾從A700系列獨(dú)顯開始。
說(shuō)完GPU,再看兩款顯卡的硬件規(guī)格。

消費(fèi)級(jí)顯卡礪算7G106搭載12GB GDDR6顯存,功耗頻率等基礎(chǔ)信息未公布。參考同行爆料,其位寬192bit,有192個(gè)紋理單元(TMU)和96個(gè)光柵單元(ROP)。若爆料屬實(shí),礪算7G106的紋理單元和光柵單元規(guī)模是4060的兩倍,跑分超4060也就說(shuō)得通了。此外,它支持DirectX 12、Vulkan 1.3、OpenGL 4.6和OpenCL 3.0等主流API,但缺乏DX12 Ultimate和Vulkan 1.4的支持,可能不支持光追和可變速率著色,影響畫面效果和幀率,渲染能力也有劣勢(shì)。
可變速率著色(VRS)示意,從左到右著色率變低

反觀英偉達(dá),2014年GTX 900系列支持瓦片式渲染和改進(jìn)的調(diào)度器,類似礪算的“智能亂序渲染”,但直到4年后的RTX20系列才支持可變速率著色(VRS)和完整的DX12 Ultimate API,礪算7G106后續(xù)產(chǎn)品還有提升空間。
其他方面,礪算7G106采用PCIe 4.0 x16標(biāo)準(zhǔn),提供4個(gè)DisplayPort 1.4接口,公版卡無(wú)HDMI接口。

專業(yè)卡7G105規(guī)格處于中高端水平,配備24GB GDDR6 ECC顯存、最大紋理填充率384GT / s,最大像素填充率192GP / s,支持FP32和INT8計(jì)算,F(xiàn)P32最大吞吐量為24 TFLOPS,適合高像素渲染和大模型訓(xùn)練。
架構(gòu)和規(guī)格方面資料有限,游戲黨更關(guān)心實(shí)測(cè)。礪算7G106部分光柵性能強(qiáng)于RTX 4060。在Geekbench測(cè)試的OpenCL跑分中,礪算7G106得111290分,比RTX 4060高10%,直逼RTX 5060。若上市價(jià)格合適,在光柵性能方面優(yōu)勢(shì)明顯。

在3DMark Fire Strike(1080p)測(cè)試中,礪算7G106跑分26800分,接近4060。在4K分辨率的Steel Nomad測(cè)試中,礪算7G106跑分2256分,與RTX 4060的2302分相近。


總體而言,礪算7G106光柵化性能趕上4060,并展現(xiàn)出一定優(yōu)勢(shì)。但英偉達(dá)除硬件外,軟件也是強(qiáng)項(xiàng),如DLSS技術(shù)。礪算推出了類似的NRSS,但無(wú)實(shí)機(jī)演示,發(fā)布會(huì)用黑神話內(nèi)置的游戲科學(xué)NXSR做超分演示。
《黑神話:悟空》在1080P分辨率、高畫質(zhì)設(shè)置下,礪算7G106平均幀數(shù)超70幀,打斗時(shí)無(wú)明顯掉幀,與4060關(guān)掉DLSS“裸玩”表現(xiàn)相近。

《明末:淵虛之羽》在1080P分辨率、高畫質(zhì)設(shè)置下,礪算7G106能跑70幀以上。RTX 5060在DLSS4多幀生成條件下可達(dá)149幀,但有明顯卡頓??紤]到游戲剛上線,礪算7G106未針對(duì)適配就能有此表現(xiàn),得益于核心規(guī)模大、大顯存和高位寬。

在《古墓麗影:暗影》中,礪算7G106平均80幀以上,不如4060適配優(yōu)化后的147幀。這也是國(guó)產(chǎn)GPU面臨的最大問(wèn)題,硬件追趕只是第一步,后續(xù)驅(qū)動(dòng)適配和游戲優(yōu)化任重道遠(yuǎn)。
若托尼拿到顯卡,會(huì)進(jìn)行全面測(cè)試。礪算7G106未來(lái)隨驅(qū)動(dòng)優(yōu)化,有望達(dá)到4060水平。游戲玩家對(duì)國(guó)產(chǎn)顯卡較為包容,只要價(jià)格合理,大家愿意陪其成長(zhǎng)。
對(duì)比國(guó)產(chǎn)顯卡摩爾線程S80,起初大家吐槽其缺乏優(yōu)化,很多游戲玩不了。但降價(jià)后,評(píng)論反轉(zhuǎn)。那么,這次礪算的顯卡會(huì)賣多少錢呢?
撰文:Levi



本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





