▲Claude Opus 4.1 。(圖/Anthropic)
記者吳立言/綜合報導
AI開發公司Anthropic今(6日)宣布推出升級版模型Claude Opus 4.1,相較前一代Opus 4,在多項關鍵領域如代理任務(agentic tasks)、真實世界程式編寫與推理能力上皆有顯著進展。
目前,Opus 4.1已全面開放給付費用戶使用,並同步整合至Claude Code、API平台、Amazon Bedrock及Google Cloud 的Vertex AI,價格則維持不變。
根據官方數據,Claude Opus 4.1在SWE-bench Verified編碼評測中取得了74.5%的成績,顯示其在大型程式碼重構、精準錯誤修正與多檔案管理等任務中具備更高效能。GitHub指出,新版本在大多數能力上均優於前代,特別是在跨檔案程式重構任務上表現亮眼。
日本樂天集團(Rakuten Group)技術團隊評價,Claude Opus 4.1能在大型程式碼庫中精準找出錯誤,避免不必要的改動與潛在漏洞,特別適合日常除錯作業。Windsurf團隊則表示,該模型在其「初階開發者能力基準測試」中表現較前代提升一個標準差,與從Sonnet 3.7跨越到Sonnet 4的幅度相當。
Anthropic表示,未來數週內還將釋出更大規模的模型升級,並鼓勵用戶儘早從Opus 4過渡至4.1,以獲得最佳體驗。開發者可透過API模型名稱「claude-opus-4-1-20250805」使用新版模型。
官方亦同步更新了Opus 4.1的系統卡、模型頁面、價格頁與技術文件,供開發者參考。Anthropic強調,未來將持續根據用戶回饋持續精進模型能力。