亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

華為引領(lǐng),三強(qiáng)入局!十萬卡智算集群落地,國產(chǎn)算力芯片崛起

10-16 06:54

電子發(fā)燒友網(wǎng)報(bào)道(文 / 章鷹)2025年10月10日至12日,中國移動全球合作伙伴大會在廣州保利世博館盛大舉行。中國移動宣布,會持續(xù)加大對人工智能領(lǐng)域的投入,總體投入翻倍,建成國內(nèi)規(guī)模最大、技術(shù)領(lǐng)先的智算基礎(chǔ)設(shè)施,探索十萬卡智算集群建設(shè),全國產(chǎn)智能算力規(guī)模突破100 EFLOPS,成為新質(zhì)生產(chǎn)力發(fā)展的“驅(qū)動燃料”。中移動在現(xiàn)場展示了“國芯國連”AI算力集群,移動云磐石智算交換機(jī)、超級點(diǎn)AI算力集群也精彩亮相。


左圖:移動云磐石智算交換機(jī) 右圖:超節(jié)點(diǎn)AI算力集群


在大會現(xiàn)場,記者看到華為、中興、中科海光、超聚變等廠商展示超節(jié)點(diǎn)AI集群服務(wù)器。在邁向AI+時(shí)代的進(jìn)程中,AI算力的需求發(fā)生了哪些變化?頭部通信運(yùn)營商、互聯(lián)網(wǎng)巨頭如何看待這些變化?國產(chǎn)算力芯片又有哪些最新進(jìn)展?記者結(jié)合實(shí)地采訪和前沿產(chǎn)品為大家分析。


中移動與三大互聯(lián)網(wǎng)巨頭布局AI智算,大型自主算力供給亟需國產(chǎn)芯片突破


鵬城實(shí)驗(yàn)室高效能云計(jì)算所所長余躍表示,2025年以來,國內(nèi)外算力發(fā)展模式路徑不同。國外十萬卡集群建設(shè)火熱,像“星際之門”這樣的大規(guī)模集群快速建設(shè),全球算力資源加速向少數(shù)國家、科技巨頭集中,發(fā)展態(tài)勢極不均衡。中國算力總量居世界第二,但單體算力與國外大型算力有差距,亟需通過有組織的方式推進(jìn)分散算力的互聯(lián)協(xié)同。


余躍分析,從通信層、計(jì)算層、網(wǎng)絡(luò)層和應(yīng)用層形成全棧式的關(guān)鍵挑戰(zhàn),算力網(wǎng)面臨四大技術(shù)難題:一是大型自主算力供給與應(yīng)用,如從千卡到萬卡,再到十萬卡,以華為384超節(jié)點(diǎn)Atlas 900 A3 SuperProD為代表的十萬卡集群,能否開展大模型方向的智能化服務(wù);二是芯光纖通信與網(wǎng)絡(luò)傳輸,即算力從局域網(wǎng)到廣域,芯片互聯(lián)集群走向IDC之間的互聯(lián),大型傳輸問題如何解決;三是協(xié)同調(diào)度和算力協(xié)同標(biāo)準(zhǔn),不同算力中心使用不同芯片,存在異構(gòu)性,計(jì)算層的互聯(lián)適配困難;四是安全可信的計(jì)算環(huán)境。


考慮到美國禁止高端算力芯片向中國供應(yīng),大型自主算力供給成為當(dāng)前的卡點(diǎn)。美國人工智能芯片龍頭企業(yè)英偉達(dá)CEO黃仁勛預(yù)測,今年中國AI市場約有500億美元的機(jī)會,且每年增長50%。


電子發(fā)燒友從多位供應(yīng)鏈人士處了解到,保守計(jì)算,2024年中國市場英偉達(dá)H20系列芯片出貨量約60萬 - 80萬枚,某國產(chǎn)主流AI芯片出貨量約30萬 - 40萬枚。2024年中國對AI芯片的需求約100萬枚。而2025年,中國移動、字節(jié)跳動、騰訊、阿里都在加大算力設(shè)施投入,意味著需要采購更多AI芯片。


據(jù)悉,2025年中國移動在智算領(lǐng)域投入373億元,AI直接投資超百億元,智算總規(guī)模達(dá)61.3 EFLOPS,并啟動50億元級AI推理設(shè)備集采,全面構(gòu)建“云 - 邊 - 端”一體化智算體系。此外,公開消息顯示,字節(jié)跳動2025年AI資本投入1600億元人民幣,AI芯片采購采用海外和國產(chǎn)芯片雙渠道模式。


8月13日,騰訊總裁劉熾平在Q2業(yè)績會表示,元寶、AI搜索等多個(gè)應(yīng)用場景的用戶數(shù)提升帶來推理負(fù)載占比提升,公司考慮推理芯片供應(yīng)渠道具備多種選擇。鑒于海外高端芯片貿(mào)易政策不確定性大,騰訊有望依托華為、寒武紀(jì)、海光等國產(chǎn)廠商的推理芯片滿足相關(guān)算力需求。


8月21日,DeepSeek更新模型版本至DeepSeek - V3.1,新版本模型相比前代能更快給出答案,具備更強(qiáng)的Agent能力,新版本模型使用了UE8M0 FP8 Scale參數(shù)精度,DeepSeek表示新精度格式針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計(jì)。


9月24日,在2025年阿里云棲大會上,阿里巴巴集團(tuán)CEO兼阿里云智能集團(tuán)董事長吳泳銘宣布公司最激進(jìn)的AI投資計(jì)劃,未來三年(2025 – 2027年)將投入超3800億元人民幣,用于云計(jì)算與AI硬件基礎(chǔ)設(shè)施建設(shè)。資金用于建設(shè)AI算力中心和采購AI芯片、服務(wù)器集群,以及研發(fā)通義千問大模型等AI基礎(chǔ)模型。


支持UE8MO FP8精度,國產(chǎn)算力芯片新品迭出


2025年,在出口管制與國產(chǎn)替代雙重刺激下,國產(chǎn)AI算力芯片進(jìn)入“新品爆發(fā)期”。AI芯片呈現(xiàn)高效能、高精度、軟硬協(xié)同三大發(fā)展趨勢,其中高精度計(jì)算能力的突破尤為關(guān)鍵。


10月10日,在2025中國移動伙伴大會2層華為展區(qū)前,昇騰384超節(jié)點(diǎn)Atlas 900 A3 SuperProD備受關(guān)注。該產(chǎn)品通過總線技術(shù)實(shí)現(xiàn)384個(gè)NPU之間的大帶寬低延時(shí)互聯(lián),算力規(guī)模300 PFlops,單卡推理量從每秒600Token提升到每秒2300Token,提升4倍,打破跨機(jī)通信帶寬性能瓶頸,實(shí)現(xiàn)從服務(wù)器級到矩陣級的資源供給模式轉(zhuǎn)變。


圖:華為超節(jié)點(diǎn)產(chǎn)品Atlas 900SuperPoD 電子發(fā)燒友拍攝


早在9月18日華為全連接大會2025上,華為副董事長、輪值董事長徐直軍宣布:“華為發(fā)布了最新超節(jié)點(diǎn)產(chǎn)品Atlas 950SuperPoD和Atlas 960 SuperPoD超節(jié)點(diǎn),分別支持8192及15488張昇騰卡,在卡規(guī)模、總算力、內(nèi)存容量、互聯(lián)帶寬等關(guān)鍵指標(biāo)上全面領(lǐng)先,未來多年將是全球最強(qiáng)算力的超節(jié)點(diǎn)。Atlas 950SuperPoD預(yù)計(jì)2025年四季度上市,Atlas 960 SuperPoD預(yù)計(jì)2027年四季度上市?!?/p>


徐直軍介紹,未來三年華為規(guī)劃多款昇騰算力芯片,包括昇騰950PR、950DT、以及昇騰960和970。其中昇騰950PR將在2026年第一季度推出,該芯片采用華為自研HBM。


據(jù)悉,昇騰950PR芯片架構(gòu)新增支持低精度數(shù)據(jù)格式,重點(diǎn)提升向量算力,互聯(lián)寬帶提升2.5倍,支持華為自研HBM高帶寬內(nèi)存,有HiBL 1.0和HiZQ 2.0兩個(gè)版本。HiBL 1.0容量128GB,帶寬1.6TB/s;HiZQ 2.0容量144GB,帶寬4TB/s。


此外,昇騰950DT采用HiZQ 2.0內(nèi)存,可提升推理Decode(解碼)性能、訓(xùn)練性能、內(nèi)存容量和帶寬。


寒武紀(jì)在7月的上海人工智能大會展示了最新的云端智能訓(xùn)練芯片思元590,采用MLUarch05全新架構(gòu),實(shí)測訓(xùn)練性能較在售旗艦產(chǎn)品大幅提升,提供更大內(nèi)存容量和更高內(nèi)存帶寬,其IO和片間互聯(lián)接口也大幅升級,讓AI運(yùn)算速度更快,處理復(fù)雜任務(wù)更輕松。


海光信息在AI大算力芯片(DCU)領(lǐng)域形成“深算一號、二號、三號、四號”的梯次迭代,并率先商業(yè)落地,是國產(chǎn)GPU陣營里唯一能穩(wěn)定盈利、批量供貨的企業(yè)。記者在中移動合作伙伴大會現(xiàn)場看到,中興海光服務(wù)器廣泛部署在中國移動關(guān)鍵業(yè)務(wù)場景,HYGON DCU深算二號K100 - AI是訓(xùn)推一體機(jī),覆蓋邊緣一體機(jī)到大型數(shù)據(jù)中心的集群部署。


圖:中興海光合作推出訓(xùn)推一體機(jī) 電子發(fā)燒友拍攝


海光信息的新一代AI算力芯片表現(xiàn)出色,采用7納米制程技術(shù),配備16核處理器,運(yùn)算速度比前一代提升50%,功耗大幅降低。海光信息官方微信顯示,9月29日,DeepSeek - V3.2 - Exp發(fā)布并開源,引入稀疏Attention架構(gòu),海光DCU第一時(shí)間實(shí)現(xiàn)無縫適配 + 深度調(diào)優(yōu),高效支持Tilelang算子,確保大模型算力“零等待”部署。


百度今年推出最新一代昆侖芯P800系列產(chǎn)品,采用昆侖芯100%自研的XPU - P架構(gòu),憑借卓越計(jì)算性能、完善軟件生態(tài)和領(lǐng)先的大規(guī)模部署能力,該芯片已在國產(chǎn)AI芯片行業(yè)率先實(shí)現(xiàn)3萬卡集群的成功部署。


更多熱點(diǎn)文章閱讀


點(diǎn)擊關(guān)注 星標(biāo)我們


將我們設(shè)為星標(biāo),不錯(cuò)過每一次更新!


喜歡就獎勵(lì)一個(gè)“在看”吧!


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com