亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

DeepSeek更新:引領(lǐng)國(guó)產(chǎn)芯片新飛躍

08-27 06:12
DeepSeek V3.1發(fā)布,憑借混合架構(gòu)與FP8技術(shù)降低成本,引發(fā)國(guó)產(chǎn)芯片股大幅上漲。

DeepSeek V3.1上線后,官方的一條留言瞬間在AI圈引起轟動(dòng)。


“新的架構(gòu)、下一代國(guó)產(chǎn)芯片”,短短不到20個(gè)字,卻蘊(yùn)含豐富信息,引發(fā)廣泛熱議。



經(jīng)過對(duì)眾多科普文的研究,簡(jiǎn)單來(lái)說,國(guó)產(chǎn)AI正邁向軟硬協(xié)同階段,未來(lái)模型有望減少對(duì)英偉達(dá)、AMD等國(guó)外算力的依賴。


同時(shí),此次更新打破了“性能越高成本越貴”的行業(yè)常規(guī),為金融、醫(yī)療等高算力場(chǎng)景的應(yīng)用帶來(lái)更多想象空間。


資本市場(chǎng)反應(yīng)迅速:DeepSeek官宣后,國(guó)產(chǎn)芯片概念股應(yīng)聲上漲,每日互動(dòng)尾盤直線拉升,收盤漲幅達(dá)13.62%。



有網(wǎng)友調(diào)侃:國(guó)產(chǎn)芯片迎來(lái)暴漲,DeepSeek一句話讓周五大盤沖上3800點(diǎn)。


近日,DeepSeek官方低調(diào)上線V3.1版本,僅發(fā)布了一則公告。



此次V3.1更新的核心創(chuàng)新是其混合推理架構(gòu)——Hybrid Reasoning Architecture。


該架構(gòu)支持思考模式和非思考模式,用戶可隨時(shí)切換,既能慢慢分析,也能快速得出結(jié)果。



過去,DeepSeek產(chǎn)品線分工明確:V3模型擅長(zhǎng)通用對(duì)話,R1模型更適合深度思考。這種分離式架構(gòu)雖讓各模型在擅長(zhǎng)領(lǐng)域表現(xiàn)出色,但用戶切換不便。


如今,V3.1打破壁壘,將通用對(duì)話、復(fù)雜推理、專業(yè)編程等多種核心功能集成于同一模型,提升了使用靈活性和效率。


此外,V3.1的推理效率顯著提升。官方數(shù)據(jù)顯示,在思考模式下,其各項(xiàng)任務(wù)平均表現(xiàn)與前代頂級(jí)R1 - 0528相當(dāng),但輸出的token數(shù)量減少20% - 50%;非思考模式下,輸出長(zhǎng)度更短,性能卻不打折。



這得益于“思維鏈壓縮”技術(shù):模型在訓(xùn)練階段學(xué)會(huì)生成更簡(jiǎn)潔、高效的推理路徑,同時(shí)保證答案準(zhǔn)確,即算法更加智能。


這樣做的目的很明確:節(jié)省成本。


以往,思維鏈雖增強(qiáng)了模型推理能力,但冗長(zhǎng)的中間步驟導(dǎo)致計(jì)算成本和API調(diào)用費(fèi)用高昂,難以大規(guī)模應(yīng)用。


V3.1的思維鏈壓縮解決了這一問題,使高級(jí)AI推理能力從學(xué)術(shù)工具轉(zhuǎn)變?yōu)榭纱笠?guī)模商業(yè)化的經(jīng)濟(jì)方案。


在社區(qū)測(cè)試中,DeepSeek V3.1在Aider多語(yǔ)言編程測(cè)試中分?jǐn)?shù)超過Claude 4 Opus,且成本更低。



這引發(fā)開發(fā)者關(guān)注,Hugging Face上的熱度持續(xù)上升。



值得注意的是,DeepSeek官宣V3.1時(shí)提到,該模型采用UE8M0 FP8 Scale的參數(shù)精度,同時(shí)對(duì)分詞器和chat template進(jìn)行了調(diào)整,與之前的V3有明顯差異。


關(guān)于“UE8M0 FP8”,簡(jiǎn)單介紹如下:


FP8將普通浮點(diǎn)數(shù)壓縮為8位存儲(chǔ),節(jié)省空間和算力。



結(jié)合MXFP8的“塊縮放”思路,將數(shù)據(jù)分塊,每塊使用獨(dú)立縮放系數(shù),既減少信息損失,又節(jié)省資源。


名字中的U、E、M可理解為“無(wú)符號(hào) + 指數(shù) + 尾數(shù)”。UE8M0中8位都用于表示指數(shù),無(wú)尾數(shù)和符號(hào)位,處理器復(fù)原數(shù)據(jù)時(shí)只需移動(dòng)指數(shù)位,無(wú)需復(fù)雜乘法,速度快、路徑短。


該格式動(dòng)態(tài)范圍大,能同時(shí)表示大小數(shù),不易溢出或被壓成0,在保證8位張量精度的同時(shí),將信息損失降至最低。



這對(duì)國(guó)產(chǎn)新芯片非常合適,此前多數(shù)國(guó)產(chǎn)AI芯片采用FP16/INT8,無(wú)法原生支持FP8。


目前,大部分國(guó)產(chǎn)AI加速器采用FP16/INT8方案,缺乏完整的FP8單元。


新一代芯片,如摩爾線程MUSA 3.1 GPU、芯原VIP9000 NPU,開始支持原生FP8,DeepSeek V3.1的UE8M0格式與之匹配。


總之,UE8M0 FP8讓模型在新一代國(guó)產(chǎn)芯片上運(yùn)行更省空間、更快、更穩(wěn),同時(shí)保持精度。


這也是DeepSeek官微特別提及的原因,為國(guó)產(chǎn)AI帶來(lái)了低成本、高性能的新機(jī)遇。


下面看看更新后的使用體驗(yàn),大家關(guān)心的官網(wǎng)訪問問題,官方給出了答案。



打開官網(wǎng)發(fā)現(xiàn),DeepSeek將App和網(wǎng)頁(yè)端的“深度思考(R1)”改為“深度思考”,官方證實(shí)模型已更新。


看看網(wǎng)友們的新奇玩法。


推特X上有AI博主分析,新模型生成的小球跳動(dòng)效果更符合物理定律,還能調(diào)節(jié)重力、摩擦、旋轉(zhuǎn)速度、彈跳等參數(shù)。



有人用DeepSeek V3.1制作振動(dòng)編碼,變身VJ。



還有網(wǎng)友讓V3.1繪制自畫像,畫風(fēng)獨(dú)特。



不過,社區(qū)中部分用戶吐槽翻譯和寫作存在問題,SYSTEM PROMPT需現(xiàn)場(chǎng)寫指令,中英夾雜和錯(cuò)詞偶有出現(xiàn)。



感興趣的朋友可前往官網(wǎng)體驗(yàn)。


每次DeepSeek更新都讓人期待下一次,它幾乎成為國(guó)產(chǎn)AI的精神象征,讓我們一起期待DeepSeek R2的到來(lái)。


本文來(lái)自微信公眾號(hào)“科技狐”(ID:kejihutv),作者:老狐,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com