Claude Sonnet 4.5重磅發(fā)布,編程界新王者登場
今天凌晨,Claude Sonnet 4.5震撼發(fā)布!這款新模型在編碼、計算機使用、推理、長任務能力以及安全對齊等方面的水平大幅提升,成為新一代編程模型的王者。新一輪圍繞編程的百模大戰(zhàn)即將打響,Claude Sonnet 4.5將成為大家競相參照的新標桿。

北京時間今天凌晨,Anthropic正式推出了Claude Sonnet 4.5。

這一版本被Claude定義為全球最強的代碼模型,同時在智能體構(gòu)建、計算機使用、推理和數(shù)學能力上有顯著突破。

代碼無處不在,它驅(qū)動著應用程序、表格和各種工具。現(xiàn)代工作的關(guān)鍵在于運用這些工具解決復雜問題,而Sonnet 4.5讓這一切變得更高效、更可靠。
全新功能與產(chǎn)品升級
伴隨Sonnet 4.5的發(fā)布,Anthropic對Claude全線產(chǎn)品進行了大規(guī)模更新:
Claude Code新增了備受期待的「檢查點」(Checkpoints)功能,可隨時保存進度并一鍵回滾到之前狀態(tài);同時更新了終端界面,還推出了原生VS Code插件。
ClaudeAPI增加了上下文編輯功能和記憶工具,使智能體能夠運行更久,處理更復雜的任務。
Claude apps現(xiàn)在支持在對話中直接執(zhí)行代碼、生成文件(包括表格、幻燈片和文檔)。
Claude for Chrome擴展向之前等待名單中的Max用戶開放。
開發(fā)者社區(qū)也迎來了新的核心資源:Claude AgentSDK。這套工具包開放了驅(qū)動Claude Code的底層基礎(chǔ)設施,為所有人打造智能體提供了基礎(chǔ)能力。
前沿性能與基準成績
Sonnet 4.5在多項權(quán)威測試中表現(xiàn)優(yōu)異:
SWE - bench Verified:在真實軟件編碼能力測試中達到最新的最優(yōu)水平,能在復雜的多步驟任務中保持超過30小時的專注執(zhí)行。

OSWorld:在模擬真實計算機任務的基準中,以61.4%的成績位居首位,而四個月前Sonnet 4的成績還停留在42.2%。
有視頻展示了Claude for Chrome的模擬操作計算機任務能力。
推理與數(shù)學:在一系列公共評測中大幅領(lǐng)先,特別是在金融、法律、醫(yī)學和STEM等專業(yè)領(lǐng)域的知識與推理上,遠超此前的Opus 4.1。




這些進展不僅體現(xiàn)在數(shù)據(jù)中,也得到了提前體驗的專業(yè)用戶們的高度認可:
Claude Code能自主編程30小時以上,幫助工程師在極短時間內(nèi)完成原本要花費數(shù)月的架構(gòu)工作?!猄ean Ward, iGent AI CEO
replit內(nèi)部代碼編輯測試中,錯誤率從Sonnet 4的9%直接降至0%。——Michele Catasta, replit President



更強的對齊,更安全
Sonnet 4.5是迄今為止對齊性最好的Claude模型。通過改進能力和廣泛的安全訓練,模型在減少迎合、欺騙、權(quán)力追求和虛妄鼓勵等行為方面成效顯著。
在智能體和計算機使用場景中,團隊特別加強了對提示注入攻擊的防御。這些改進已在系統(tǒng)卡(System Card)中以詳細評估形式公開,其中首次引入了可解釋性技術(shù)來驗證安全性。

Sonnet 4.5按照AISafety Level 3(ASL - 3)框架發(fā)布,包含一系列防護措施,例如針對化學、生物、放射和核相關(guān)內(nèi)容的分類器過濾機制。雖然這些過濾器可能偶爾誤判正常內(nèi)容,但與Sonnet 4相比,誤報率已降低十倍,并將在未來繼續(xù)優(yōu)化。
Claude Agent SDK
在過去半年里,Claude團隊不斷迭代Claude Code,探索了智能體設計中的核心挑戰(zhàn),包括長時任務的內(nèi)存管理、權(quán)限體系的平衡,以及子代理的協(xié)同方式。如今,這些能力通過Claude AgentSDK向開發(fā)者全面開放。SDK不僅適用于編碼,還能支持更廣泛的應用場景,為構(gòu)建復雜任務的自主智能體提供了與Anthropic內(nèi)部工具相同的基礎(chǔ)設施。
研究預覽:「Imagine with Claude」
作為額外的實驗,Anthropic發(fā)布了一個臨時研究預覽——「Imagine with Claude」。在這一體驗中,Claude會實時生成軟件,沒有預設功能或預寫代碼,用戶可以直接看到Claude在交互過程中即時創(chuàng)造與適配的過程。該功能向Max訂閱用戶開放5天,可在claude.ai/imagine上體驗。
API新特性
Sonnet 4.5在API層面也有重要更新:
記憶工具(Beta):支持在上下文窗口外存儲和調(diào)用信息,幫助跨會話維持知識和狀態(tài)。
上下文編輯:通過自動清理舊的工具調(diào)用和結(jié)果來避免上下文溢出。
新的停止原因提示:增加了model_context_window_exceeded,更清晰地標識因上下文限制而中止生成。
工具參數(shù)改進:修復了字符串參數(shù)尾部換行被截斷的問題,保證格式精確傳遞。
Token計數(shù)優(yōu)化:系統(tǒng)會自動添加優(yōu)化Token,但用戶不會為這些系統(tǒng)注入的部分付費。
定價與使用渠道
價格保持與Sonnet 4一致:
輸入:3美元/百萬Tokens
輸出:15美元/百萬Tokens

Sonnet 4.5可通過以下渠道使用:
Claude API:claude - sonnet - 4 - 5 - 20250929
Amazon Bedrock:anthropic.claude - sonnet - 4 - 5 - 20250929 - v1:0
Google Cloud Vertex AI:claude - sonnet - 4 - 5@20250929
同時也在Claude.ai與Claude Code平臺上線。

升級指南
當前使用Sonnet 4的開發(fā)者,只需將模型名稱更新為claude - sonnet - 4 - 5 - 20250929即可完成遷移。所有現(xiàn)有API調(diào)用依然有效。建議同時啟用新特性,例如記憶工具和上下文清理,以充分發(fā)揮模型性能。需要注意的是,Sonnet 4.5不再允許同時指定temperature和top_p參數(shù),用戶應選擇其一。

新一輪的AI編程大戰(zhàn)即將來臨
Claude Sonnet 4.5在編碼、智能體能力、計算機使用和安全性方面實現(xiàn)了全面提升。它既是開發(fā)者工具箱中的新利器,也是一個能在金融、醫(yī)學、科研等領(lǐng)域提供專業(yè)支持的強大平臺。Anthropic通過這一版本,繼續(xù)推動AI在前沿能力和安全性上的平衡發(fā)展。編程新王降臨,新一輪圍繞編程展開的百模大戰(zhàn)即將開啟,Claude Sonnet 4.5將成為大家爭相對標的新對象。
參考資料:
https://www.anthropic.com/news/claude - sonnet - 4 - 5
https://docs.claude.com/en/docs/about - claude/models/whats - new - sonnet - 4 - 5
https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude - Sonnet - 4 - 5 - System - Card.pdf
本文來自微信公眾號“新智元”,作者:新智元,編輯:艾倫,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com






