亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<rt id="1xzhq"></rt>

<label id="1xzhq"></label>

DeepSeek更新：引領(lǐng)國(guó)產(chǎn)芯片新飛躍

08-27 06:12

DeepSeek V3.1發(fā)布，憑借混合架構(gòu)與FP8技術(shù)降低成本，引發(fā)國(guó)產(chǎn)芯片股大幅上漲。

DeepSeek V3.1上線后，官方的一條留言瞬間在AI圈引起轟動(dòng)。

“新的架構(gòu)、下一代國(guó)產(chǎn)芯片”，短短不到20個(gè)字，卻蘊(yùn)含豐富信息，引發(fā)廣泛熱議。

經(jīng)過對(duì)眾多科普文的研究，簡(jiǎn)單來(lái)說，國(guó)產(chǎn)AI正邁向軟硬協(xié)同階段，未來(lái)模型有望減少對(duì)英偉達(dá)、AMD等國(guó)外算力的依賴。

同時(shí)，此次更新打破了“性能越高成本越貴”的行業(yè)常規(guī)，為金融、醫(yī)療等高算力場(chǎng)景的應(yīng)用帶來(lái)更多想象空間。

資本市場(chǎng)反應(yīng)迅速：DeepSeek官宣后，國(guó)產(chǎn)芯片概念股應(yīng)聲上漲，每日互動(dòng)尾盤直線拉升，收盤漲幅達(dá)13.62%。

有網(wǎng)友調(diào)侃：國(guó)產(chǎn)芯片迎來(lái)暴漲，DeepSeek一句話讓周五大盤沖上3800點(diǎn)。

近日，DeepSeek官方低調(diào)上線V3.1版本，僅發(fā)布了一則公告。

此次V3.1更新的核心創(chuàng)新是其混合推理架構(gòu)——Hybrid Reasoning Architecture。

該架構(gòu)支持思考模式和非思考模式，用戶可隨時(shí)切換，既能慢慢分析，也能快速得出結(jié)果。

過去，DeepSeek產(chǎn)品線分工明確：V3模型擅長(zhǎng)通用對(duì)話，R1模型更適合深度思考。這種分離式架構(gòu)雖讓各模型在擅長(zhǎng)領(lǐng)域表現(xiàn)出色，但用戶切換不便。

如今，V3.1打破壁壘，將通用對(duì)話、復(fù)雜推理、專業(yè)編程等多種核心功能集成于同一模型，提升了使用靈活性和效率。

此外，V3.1的推理效率顯著提升。官方數(shù)據(jù)顯示，在思考模式下，其各項(xiàng)任務(wù)平均表現(xiàn)與前代頂級(jí)R1 - 0528相當(dāng)，但輸出的token數(shù)量減少20% - 50%；非思考模式下，輸出長(zhǎng)度更短，性能卻不打折。

這得益于“思維鏈壓縮”技術(shù)：模型在訓(xùn)練階段學(xué)會(huì)生成更簡(jiǎn)潔、高效的推理路徑，同時(shí)保證答案準(zhǔn)確，即算法更加智能。

這樣做的目的很明確：節(jié)省成本。

以往，思維鏈雖增強(qiáng)了模型推理能力，但冗長(zhǎng)的中間步驟導(dǎo)致計(jì)算成本和API調(diào)用費(fèi)用高昂，難以大規(guī)模應(yīng)用。

V3.1的思維鏈壓縮解決了這一問題，使高級(jí)AI推理能力從學(xué)術(shù)工具轉(zhuǎn)變?yōu)榭纱笠?guī)模商業(yè)化的經(jīng)濟(jì)方案。

在社區(qū)測(cè)試中，DeepSeek V3.1在Aider多語(yǔ)言編程測(cè)試中分?jǐn)?shù)超過Claude 4 Opus，且成本更低。

這引發(fā)開發(fā)者關(guān)注，Hugging Face上的熱度持續(xù)上升。

值得注意的是，DeepSeek官宣V3.1時(shí)提到，該模型采用UE8M0 FP8 Scale的參數(shù)精度，同時(shí)對(duì)分詞器和chat template進(jìn)行了調(diào)整，與之前的V3有明顯差異。

關(guān)于“UE8M0 FP8”，簡(jiǎn)單介紹如下：

FP8將普通浮點(diǎn)數(shù)壓縮為8位存儲(chǔ)，節(jié)省空間和算力。

結(jié)合MXFP8的“塊縮放”思路，將數(shù)據(jù)分塊，每塊使用獨(dú)立縮放系數(shù)，既減少信息損失，又節(jié)省資源。

名字中的U、E、M可理解為“無(wú)符號(hào) + 指數(shù) + 尾數(shù)”。UE8M0中8位都用于表示指數(shù)，無(wú)尾數(shù)和符號(hào)位，處理器復(fù)原數(shù)據(jù)時(shí)只需移動(dòng)指數(shù)位，無(wú)需復(fù)雜乘法，速度快、路徑短。

該格式動(dòng)態(tài)范圍大，能同時(shí)表示大小數(shù)，不易溢出或被壓成0，在保證8位張量精度的同時(shí)，將信息損失降至最低。

這對(duì)國(guó)產(chǎn)新芯片非常合適，此前多數(shù)國(guó)產(chǎn)AI芯片采用FP16/INT8，無(wú)法原生支持FP8。

目前，大部分國(guó)產(chǎn)AI加速器采用FP16/INT8方案，缺乏完整的FP8單元。

新一代芯片，如摩爾線程MUSA 3.1 GPU、芯原VIP9000 NPU，開始支持原生FP8，DeepSeek V3.1的UE8M0格式與之匹配。

總之，UE8M0 FP8讓模型在新一代國(guó)產(chǎn)芯片上運(yùn)行更省空間、更快、更穩(wěn)，同時(shí)保持精度。

這也是DeepSeek官微特別提及的原因，為國(guó)產(chǎn)AI帶來(lái)了低成本、高性能的新機(jī)遇。

下面看看更新后的使用體驗(yàn)，大家關(guān)心的官網(wǎng)訪問問題，官方給出了答案。

打開官網(wǎng)發(fā)現(xiàn)，DeepSeek將App和網(wǎng)頁(yè)端的“深度思考（R1）”改為“深度思考”，官方證實(shí)模型已更新。

看看網(wǎng)友們的新奇玩法。

推特X上有AI博主分析，新模型生成的小球跳動(dòng)效果更符合物理定律，還能調(diào)節(jié)重力、摩擦、旋轉(zhuǎn)速度、彈跳等參數(shù)。

有人用DeepSeek V3.1制作振動(dòng)編碼，變身VJ。

還有網(wǎng)友讓V3.1繪制自畫像，畫風(fēng)獨(dú)特。

不過，社區(qū)中部分用戶吐槽翻譯和寫作存在問題，SYSTEM PROMPT需現(xiàn)場(chǎng)寫指令，中英夾雜和錯(cuò)詞偶有出現(xiàn)。

感興趣的朋友可前往官網(wǎng)體驗(yàn)。

每次DeepSeek更新都讓人期待下一次，它幾乎成為國(guó)產(chǎn)AI的精神象征，讓我們一起期待DeepSeek R2的到來(lái)。

本文來(lái)自微信公眾號(hào)“科技狐”（ID：kejihutv），作者：老狐，36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

網(wǎng)約車平臺(tái)抽成下調(diào)，最低降至22.5%

黃文威：冠軍是新奮斗的起點(diǎn)

上海專家助力，在家門口攻克大病難題

不刷牙睡覺與不刷牙吃早餐，哪個(gè)危害大？答案意想不到

每日一冷NO.4528 精彩冷知識(shí)與吐槽集合

<label id="8jtfg"></label>

<span id="8jtfg"></span>