亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

DeepSeek-V3.2-Exp模型發(fā)布開源,API價格大幅降低

09-30 06:24

在新的價格政策下,開發(fā)者調(diào)用DeepSeek API的成本將降低50%以上。

9月29日,DeepSeek-V3.2-Exp模型正式發(fā)布,并在Huggingface與魔搭開源。目前,官方App、網(wǎng)頁端、小程序均已同步更新為DeepSeek-V3.2-Exp,同時API大幅度降價。

據(jù)官方介紹,DeepSeek-V3.2-Exp模型是一個實驗性版本。作為邁向新一代架構(gòu)的中間步驟,V3.2-Exp在V3.1-Terminus的基礎(chǔ)上引入了DeepSeek Sparse Attention(一種稀疏注意力機制),針對長文本的訓(xùn)練和推理效率進行了探索性的優(yōu)化和驗證。

具體來說,DeepSeek Sparse Attention(DSA)首次實現(xiàn)了細粒度稀疏注意力機制,在幾乎不影響模型輸出效果的前提下,實現(xiàn)了長文本訓(xùn)練和推理效率的大幅提升。

據(jù)“華為計算”微信公眾號消息,9月29日,DeepSeek-V3.2-Exp發(fā)布并開源,引入稀疏Attention架構(gòu)。昇騰已快速基于vLLM/SGLang等推理框架完成適配部署,實現(xiàn)DeepSeek-V3.2-Exp 0day支持,并面向開發(fā)者開源所有推理代碼和算子實現(xiàn)。

DeepSeek還表示,在新模型的研究過程中,需要設(shè)計和實現(xiàn)很多新的GPU算子。官方使用高級語言TileLang進行快速原型開發(fā),以支持更深入的探索。在最后階段,以TileLang作為精度基線,逐步使用底層語言實現(xiàn)更高效的版本。因此,本次開源的主要算子包含TileLang與CUDA兩種版本。官方建議社區(qū)在進行研究性實驗時,使用基于TileLang的版本以方便調(diào)試和快速迭代。

得益于新模型服務(wù)成本的大幅降低,官方API價格也相應(yīng)下調(diào)。在新的價格政策下,開發(fā)者調(diào)用DeepSeek API的成本將降低50%以上。

DeepSeek于8月21日正式發(fā)布DeepSeek-V3.1,本次升級包含以下主要變化:一是混合推理架構(gòu),一個模型同時支持思考模式與非思考模式;二是更高的思考效率,相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短時間內(nèi)給出答案;三是更強的Agent能力,通過Post-Training優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。

9月22日,DeepSeek-V3.1更新至DeepSeek-V3.1-Terminus版本,此次更新在保持模型原有能力的基礎(chǔ)上,針對用戶反饋的問題進行了改進,包括:語言一致性方面,緩解了中英文混雜、偶發(fā)異常字符等情況;Agent能力方面,進一步優(yōu)化Code Agent與Search Agent的表現(xiàn)。官方表示,DeepSeek-V3.1-Terminus的輸出效果相比前一版本更加穩(wěn)定。

為了嚴(yán)謹(jǐn)?shù)卦u估引入稀疏注意力帶來的影響,官方特意把DeepSeek-V3.2-Exp的訓(xùn)練設(shè)置與V3.1-Terminus進行了嚴(yán)格的對齊。在各領(lǐng)域的公開評測集上,DeepSeek-V3.2-Exp的表現(xiàn)與V3.1-Terminus基本持平。

本文來自“界面新聞”,記者:陳小同,36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com