探尋AI寫代碼新高度:Claude Opus 4.1模型亮相
IT之家8月6日消息,Anthropic公司于今日(8月6日)發(fā)布公告,宣布推出Claude Opus 4.1模型。相較于今年5月推出的Claude 4系列模型,該模型主要在編碼、推理和執(zhí)行指令的能力方面有所改進(jìn)。
Anthropic表示,Claude Opus 4.1在SWE - bench Verified(用于評(píng)估軟件工程準(zhǔn)確性)上的準(zhǔn)確率提升到了74.5%。作為對(duì)比,Claude Sonnet 3.7的準(zhǔn)確率為62.3%,Claude Opus 4的準(zhǔn)確率為72.5%。具體而言,更新后的模型在“深度研究和數(shù)據(jù)分析技能,尤其是在細(xì)節(jié)追蹤和代理搜索方面”表現(xiàn)更為出色。

與Opus 4相比,Opus 4.1在大多數(shù)功能上都有提升,特別是在多文件代碼重構(gòu)方面表現(xiàn)突出。IT之家附上相關(guān)數(shù)據(jù)如下:

Rakuten Group發(fā)現(xiàn),Opus 4.1不會(huì)進(jìn)行不必要的調(diào)整,也不會(huì)引入新的錯(cuò)誤,能夠精確地在大型代碼庫(kù)中定位并修正錯(cuò)誤。
Windsurf報(bào)告稱,Opus 4.1在其初級(jí)開發(fā)者基準(zhǔn)測(cè)試中,比Opus 4的表現(xiàn)提高了標(biāo)準(zhǔn)差的一個(gè)單位,這一性能提升幅度與從Sonnet 3.7到Sonnet 4的提升相當(dāng)。
從今日起,最新的模型面向Claude客戶開放,用戶可以通過Claude Code、Anthropic的API、亞馬遜Bedrock和谷歌云的Vertex AI使用該模型。

同時(shí),Anthropic在社交媒體上表示,計(jì)劃在未來幾周內(nèi)發(fā)布“對(duì)我們模型的重大改進(jìn)”,因此可以期待Claude系列模型有更多升級(jí)。此外,OpenAI也預(yù)計(jì)將在本周發(fā)布新消息。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com