
記者吳立言/綜合報導
Anthropic 於今(29 日)正式推出新一代模型 Claude Opus 4.8,並同步開放至 Claude Code 平台。官方表示,新版本延續 Opus 4.7 的能力基礎,進一步提升程式開發、推理判斷與長時間代理任務表現,同時維持與前代相同價格。
根據 Anthropic 與開發團隊公布資訊,Opus 4.8 最關鍵變化之一,在於模型更傾向主動揭露不確定性,而非直接給出缺乏依據的結論。官方指出,這次更新主要針對 AI 常見的「過度自信回答」問題進行改善。
SWE-bench Pro 成績提升至 69.2%
在程式開發能力方面,Anthropic 公布 Opus 4.8 於 SWE-bench Pro 測試取得 69.2% 成績,高於 Opus 4.7 的 64.3%。官方同時表示,內部評估顯示,Opus 4.8 對於自己產生的程式碼錯誤更容易主動指出問題,出現缺陷卻未察覺的情況約比 Opus 4.7 減少四倍。
新增 Effort 控制 可調整思考深度
此次另一項重點更新,是新增更細緻的「Effort」控制功能。使用者可依照任務需求選擇不同推理深度,高階模式會投入更多 Token 與運算資源,藉此提升複雜任務表現;若希望降低成本或加快回應速度,也能選擇較低思考強度模式。
Claude 開發團隊表示,Opus 4.8 預設已採用較高思考強度(High Effort),在維持類似 Token 消耗下,可獲得比 Opus 4.7 更好的程式開發效果。
強化長時間代理任務能力
Anthropic 近幾個版本持續強調 Agent 工作流發展,而 Opus 4.8 也被定位為更適合執行長時間、多步驟任務的模型。官方指出,新版本特別強化 Long-Horizon Work 能力,能在較長執行週期內持續完成規劃、程式修改、測試與驗證等工作。
同時,Anthropic 也推出 Dynamic Workflows 研究預覽功能,讓 Claude 能透過多個平行 Agent 協作執行大型任務,完成後再進行結果驗證與整合。
Claude Code 提供遷移工具
對於已使用 Claude Code 的開發者,Anthropic 也同步更新模型遷移指引。官方建議執行「/claude-api migrate」,系統將自動更新模型名稱,並提供更適合 Opus 4.8 的 Prompt 建議與最佳化設定。
從今年 4 月推出 Opus 4.7,到如今發布 Opus 4.8,Anthropic 旗艦模型更新週期明顯縮短。除了 Opus 4.8 外,Anthropic 也透露更高階的 Claude Mythos 模型預計未來數周內進一步擴大開放。
