亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

<label id="m9wbq"></label>

<rt id="m9wbq"></rt>

<label id="m9wbq"></label>

<track id="uewzd"></track>

<menu id="uewzd"></menu>

Claude Sonnet 4.5重磅發(fā)布，編程界新王者登場

10-01 06:36

今天凌晨，Claude Sonnet 4.5震撼發(fā)布！這款新模型在編碼、計算機使用、推理、長任務能力以及安全對齊等方面的水平大幅提升，成為新一代編程模型的王者。新一輪圍繞編程的百模大戰(zhàn)即將打響，Claude Sonnet 4.5將成為大家競相參照的新標桿。

北京時間今天凌晨，Anthropic正式推出了Claude Sonnet 4.5。

這一版本被Claude定義為全球最強的代碼模型，同時在智能體構(gòu)建、計算機使用、推理和數(shù)學能力上有顯著突破。

代碼無處不在，它驅(qū)動著應用程序、表格和各種工具。現(xiàn)代工作的關(guān)鍵在于運用這些工具解決復雜問題，而Sonnet 4.5讓這一切變得更高效、更可靠。

全新功能與產(chǎn)品升級

伴隨Sonnet 4.5的發(fā)布，Anthropic對Claude全線產(chǎn)品進行了大規(guī)模更新：

Claude Code新增了備受期待的「檢查點」（Checkpoints）功能，可隨時保存進度并一鍵回滾到之前狀態(tài)；同時更新了終端界面，還推出了原生VS Code插件。

ClaudeAPI增加了上下文編輯功能和記憶工具，使智能體能夠運行更久，處理更復雜的任務。

Claude apps現(xiàn)在支持在對話中直接執(zhí)行代碼、生成文件（包括表格、幻燈片和文檔）。

Claude for Chrome擴展向之前等待名單中的Max用戶開放。

開發(fā)者社區(qū)也迎來了新的核心資源：Claude AgentSDK。這套工具包開放了驅(qū)動Claude Code的底層基礎(chǔ)設施，為所有人打造智能體提供了基礎(chǔ)能力。

前沿性能與基準成績

Sonnet 4.5在多項權(quán)威測試中表現(xiàn)優(yōu)異：

SWE - bench Verified：在真實軟件編碼能力測試中達到最新的最優(yōu)水平，能在復雜的多步驟任務中保持超過30小時的專注執(zhí)行。

OSWorld：在模擬真實計算機任務的基準中，以61.4%的成績位居首位，而四個月前Sonnet 4的成績還停留在42.2%。

有視頻展示了Claude for Chrome的模擬操作計算機任務能力。

推理與數(shù)學：在一系列公共評測中大幅領(lǐng)先，特別是在金融、法律、醫(yī)學和STEM等專業(yè)領(lǐng)域的知識與推理上，遠超此前的Opus 4.1。

這些進展不僅體現(xiàn)在數(shù)據(jù)中，也得到了提前體驗的專業(yè)用戶們的高度認可：

Claude Code能自主編程30小時以上，幫助工程師在極短時間內(nèi)完成原本要花費數(shù)月的架構(gòu)工作?！猄ean Ward, iGent AI CEO
replit內(nèi)部代碼編輯測試中，錯誤率從Sonnet 4的9%直接降至0%。——Michele Catasta, replit President

更強的對齊，更安全

Sonnet 4.5是迄今為止對齊性最好的Claude模型。通過改進能力和廣泛的安全訓練，模型在減少迎合、欺騙、權(quán)力追求和虛妄鼓勵等行為方面成效顯著。

在智能體和計算機使用場景中，團隊特別加強了對提示注入攻擊的防御。這些改進已在系統(tǒng)卡（System Card）中以詳細評估形式公開，其中首次引入了可解釋性技術(shù)來驗證安全性。

Sonnet 4.5按照AISafety Level 3（ASL - 3）框架發(fā)布，包含一系列防護措施，例如針對化學、生物、放射和核相關(guān)內(nèi)容的分類器過濾機制。雖然這些過濾器可能偶爾誤判正常內(nèi)容，但與Sonnet 4相比，誤報率已降低十倍，并將在未來繼續(xù)優(yōu)化。

Claude Agent SDK

在過去半年里，Claude團隊不斷迭代Claude Code，探索了智能體設計中的核心挑戰(zhàn)，包括長時任務的內(nèi)存管理、權(quán)限體系的平衡，以及子代理的協(xié)同方式。如今，這些能力通過Claude AgentSDK向開發(fā)者全面開放。SDK不僅適用于編碼，還能支持更廣泛的應用場景，為構(gòu)建復雜任務的自主智能體提供了與Anthropic內(nèi)部工具相同的基礎(chǔ)設施。

研究預覽：「Imagine with Claude」

作為額外的實驗，Anthropic發(fā)布了一個臨時研究預覽——「Imagine with Claude」。在這一體驗中，Claude會實時生成軟件，沒有預設功能或預寫代碼，用戶可以直接看到Claude在交互過程中即時創(chuàng)造與適配的過程。該功能向Max訂閱用戶開放5天，可在claude.ai/imagine上體驗。

API新特性

Sonnet 4.5在API層面也有重要更新：

記憶工具（Beta）：支持在上下文窗口外存儲和調(diào)用信息，幫助跨會話維持知識和狀態(tài)。

上下文編輯：通過自動清理舊的工具調(diào)用和結(jié)果來避免上下文溢出。

新的停止原因提示：增加了model_context_window_exceeded，更清晰地標識因上下文限制而中止生成。

工具參數(shù)改進：修復了字符串參數(shù)尾部換行被截斷的問題，保證格式精確傳遞。

Token計數(shù)優(yōu)化：系統(tǒng)會自動添加優(yōu)化Token，但用戶不會為這些系統(tǒng)注入的部分付費。

定價與使用渠道

價格保持與Sonnet 4一致：

輸入：3美元/百萬Tokens

輸出：15美元/百萬Tokens

Sonnet 4.5可通過以下渠道使用：

Claude API：claude - sonnet - 4 - 5 - 20250929

Amazon Bedrock：anthropic.claude - sonnet - 4 - 5 - 20250929 - v1:0

Google Cloud Vertex AI：claude - sonnet - 4 - 5@20250929

同時也在Claude.ai與Claude Code平臺上線。

升級指南

當前使用Sonnet 4的開發(fā)者，只需將模型名稱更新為claude - sonnet - 4 - 5 - 20250929即可完成遷移。所有現(xiàn)有API調(diào)用依然有效。建議同時啟用新特性，例如記憶工具和上下文清理，以充分發(fā)揮模型性能。需要注意的是，Sonnet 4.5不再允許同時指定temperature和top_p參數(shù)，用戶應選擇其一。

新一輪的AI編程大戰(zhàn)即將來臨

Claude Sonnet 4.5在編碼、智能體能力、計算機使用和安全性方面實現(xiàn)了全面提升。它既是開發(fā)者工具箱中的新利器，也是一個能在金融、醫(yī)學、科研等領(lǐng)域提供專業(yè)支持的強大平臺。Anthropic通過這一版本，繼續(xù)推動AI在前沿能力和安全性上的平衡發(fā)展。編程新王降臨，新一輪圍繞編程展開的百模大戰(zhàn)即將開啟，Claude Sonnet 4.5將成為大家爭相對標的新對象。

參考資料：

https://www.anthropic.com/news/claude - sonnet - 4 - 5

https://docs.claude.com/en/docs/about - claude/models/whats - new - sonnet - 4 - 5

https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude - Sonnet - 4 - 5 - System - Card.pdf

本文來自微信公眾號“新智元”，作者：新智元，編輯：艾倫，36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請及時與我們聯(lián)系進行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

初創(chuàng)企業(yè)戰(zhàn)略指南：兩大問題，四條路徑抉擇

湘潭文廟開展祭孔大典活動

吉林“雪趣”閃耀新馬

開票啦！蒙超四分之一決賽第二回合，鄂爾多斯市對決通遼市

荊門市掇刀區(qū)人口第一戰(zhàn)略新聞發(fā)布會成果顯著

<menu id="hz50o"><legend id="hz50o"></legend></menu>

<track id="hz50o"></track>