亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

DeepSeek引發(fā)市場震蕩,國產(chǎn)芯片迎來新機遇

08-23 07:09

摘要:其實利好誰并不需要猜測,因為DeepSeek此次就是要普遍支持國產(chǎn)芯片生態(tài)。

8月21日,DeepSeek正式發(fā)布V3.1,一則官方補充留言引發(fā)了巨大反響。

由于官方在V3.1的發(fā)布文章里,對過程算力支持的描述過于隱晦,隨后又在評論區(qū)進行了補充。僅僅一夜,這短短的一句話就讓A股市場集體歡騰。據(jù)財聯(lián)社報道,全市場超2800只個股上漲。從板塊來看,算力股全線爆發(fā),云天勵飛等多股漲停;芯片股集體大漲,寒武紀漲停創(chuàng)歷史新高,中芯國際大漲14%,海光信息漲停。

資本市場的反應并非是對一句口號的盲目追捧,而是看到了國產(chǎn)芯片在算力賽道上切入國際前沿的可能性。DeepSeek的這句話,不僅是一次“技術(shù)換擋”的信號,更是國內(nèi)算力產(chǎn)業(yè)鏈難得的共振時刻。

DeepSeek引發(fā)關(guān)注的“炸彈”是什么?

要理解“UE8M0 FP8”為何備受關(guān)注,需將其拆分為“FP8”和“UE8M0”兩部分。FP8是一種將數(shù)字壓縮到僅用8位來存儲的浮點格式,目的是降低AI大模型訓練和推理中對顯存帶寬的壓力。

DeepSeek的模型一直使用FP8格式,但國內(nèi)只有極少數(shù)GPU廠商原生支持FP8,如摩爾線程,其旗艦產(chǎn)品MTT S5000是國內(nèi)首批原生支持FP8并大規(guī)模量產(chǎn)的GPU。國內(nèi)芯片普遍支持FP16,這使得國產(chǎn)芯片在運行DeepSeek的模型時,性能至少折損一半,這也是大家傾向于購買英偉達芯片的原因。

圖|豆包AI生成

有AI infra企業(yè)向鳳凰網(wǎng)科技透露,解決方案是在軟件上進行突破。國內(nèi)有企業(yè)專門針對國產(chǎn)芯片做軟件適配DeepSeek,如清程極智,其目標是提升國產(chǎn)芯片運行DeepSeek模型時的性能。

純粹的FP8在動態(tài)范圍和精度上存在權(quán)衡,處理復雜數(shù)據(jù)時可能出現(xiàn)精度損失或數(shù)值溢出問題。簡單來說,就像壓縮衣服,雖然能壓到很小,但衣服會皺得厲害。

由Meta、谷歌等推動的開放計算項目(OCP)制定的MX格式是一個突破。其核心思想是將張量切分為微小數(shù)據(jù)塊,并為每個塊配備一個8位縮放因子,在保持8位存儲效率的同時,動態(tài)范圍擴展了數(shù)十倍,就像把一批衣服分開打包。

DeepSeek發(fā)布的“UE8M0”是MX格式中為每個數(shù)據(jù)塊指定的關(guān)鍵縮放因子的數(shù)據(jù)格式。它是一種高效的8位指數(shù)表示法,“U”代表無符號,“E8”代表8個比特用于表示指數(shù),“M0”代表沒有尾數(shù)??梢园裊E8M0比喻成一個“只調(diào)檔位、不調(diào)微刻度”的超級節(jié)能燈泡開關(guān),就像AI芯片里的快進鍵。

這種“全指數(shù)”設計有兩大優(yōu)勢:一是硬件執(zhí)行縮放時簡單快捷,只需進行整數(shù)次冪運算,避免了復雜的浮點乘法與舍入操作,提升了能效;二是其巨大的動態(tài)范圍能確保數(shù)據(jù)塊被縮放至FP8表示范圍內(nèi),幾乎避免了信息損失,降低了錯誤率。

所以,UE8M0 FP8能讓國產(chǎn)芯片在運行大模型,尤其是DeepSeek的模型時,更快、更省、更能處理大數(shù)。

許多國產(chǎn)AI加速器雖未原生支持完整的E4M3/E5M2 FP8計算單元,但架構(gòu)正朝著支持塊縮放的MX格式演進。UE8M0作為縮放因子,格式極簡,降低了硬件實現(xiàn)門檻。更重要的是,它為突破“內(nèi)存墻”提供了最優(yōu)解,相較于傳統(tǒng)的32位FP32縮放因子,UE8M0僅需追加8位,即可高效管理32個FP8數(shù)據(jù),帶寬開銷驟降75%,為國產(chǎn)芯片在下一代競爭中實現(xiàn)效能躍升提供了關(guān)鍵技術(shù)路徑。這不僅是技術(shù)兼容,更是在主流標準框架內(nèi)實現(xiàn)差異化競爭力的精準卡位。

中國算力產(chǎn)業(yè)迎來發(fā)展契機

從產(chǎn)業(yè)層面看,DeepSeek的表態(tài)不僅是技術(shù)選擇,更是對國產(chǎn)芯片產(chǎn)業(yè)生態(tài)的確認。此前,中國優(yōu)質(zhì)大模型產(chǎn)品與英偉達緊密捆綁,而DeepSeek此次發(fā)布可視為一種漸進式的解綁,官方主動為國產(chǎn)芯片發(fā)展生態(tài)站臺。

UE8M0 FP8的落地,意味著國產(chǎn)算力廠商在浮點格式、編譯器優(yōu)化、訓練框架適配等環(huán)節(jié)實現(xiàn)了全棧打通,這是長期軟硬件協(xié)同積累的成果。

其實利好誰無需猜測,因為DeepSeek此次是要普遍支持國產(chǎn)芯片生態(tài)。目前成熟的頭部國產(chǎn)芯片公司大多與DeepSeek有接觸,不少公司支持FP8。除了摩爾線程,寒武紀旗下的思元590以及最新690系列都支持。摩爾線程的MUSA架構(gòu)原生支持硬件FP8張量加速計算,還能很好地支持UE8M0 FP8 Scale,相對于傳統(tǒng)的FP16計算,能實現(xiàn)兩倍的浮點算力提升、訪存和通信帶寬效率提升以及存儲容量利用率提升,同時優(yōu)化張量表達精度。

DeepSeek的表態(tài)重新定義了未來大模型算力效率,也是國產(chǎn)芯片廠商獲得國際話語權(quán)的起點。資本市場的狂歡,不僅是情緒的體現(xiàn),更釋放出一個信號:中國芯片正迎來前所未有的發(fā)展窗口期,這一次,它們有機會站到技術(shù)前沿。

本文來自微信公眾號“鳳凰網(wǎng)科技”,作者:鳳凰網(wǎng)科技,36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com