Claude Opus 4.8上線 主打更誠實、更會寫程式、可長時間自主執行任務

▲▼Claude Opus 4.8上線。(圖/Anthropic)

記者吳立言/綜合報導

Anthropic 於今(29 日)正式推出新一代模型 Claude Opus 4.8,並同步開放至 Claude Code 平台。官方表示,新版本延續 Opus 4.7 的能力基礎,進一步提升程式開發、推理判斷與長時間代理任務表現,同時維持與前代相同價格。

根據 Anthropic 與開發團隊公布資訊,Opus 4.8 最關鍵變化之一,在於模型更傾向主動揭露不確定性,而非直接給出缺乏依據的結論。官方指出,這次更新主要針對 AI 常見的「過度自信回答」問題進行改善。

SWE-bench Pro 成績提升至 69.2%

[廣告]請繼續往下閱讀...

在程式開發能力方面,Anthropic 公布 Opus 4.8 於 SWE-bench Pro 測試取得 69.2% 成績,高於 Opus 4.7 的 64.3%。官方同時表示,內部評估顯示,Opus 4.8 對於自己產生的程式碼錯誤更容易主動指出問題,出現缺陷卻未察覺的情況約比 Opus 4.7 減少四倍。

新增 Effort 控制 可調整思考深度

此次另一項重點更新,是新增更細緻的「Effort」控制功能。使用者可依照任務需求選擇不同推理深度,高階模式會投入更多 Token 與運算資源,藉此提升複雜任務表現;若希望降低成本或加快回應速度,也能選擇較低思考強度模式。

Claude 開發團隊表示,Opus 4.8 預設已採用較高思考強度(High Effort),在維持類似 Token 消耗下,可獲得比 Opus 4.7 更好的程式開發效果。

強化長時間代理任務能力

Anthropic 近幾個版本持續強調 Agent 工作流發展,而 Opus 4.8 也被定位為更適合執行長時間、多步驟任務的模型。官方指出,新版本特別強化 Long-Horizon Work 能力,能在較長執行週期內持續完成規劃、程式修改、測試與驗證等工作。

同時,Anthropic 也推出 Dynamic Workflows 研究預覽功能,讓 Claude 能透過多個平行 Agent 協作執行大型任務,完成後再進行結果驗證與整合。

Claude Code 提供遷移工具

對於已使用 Claude Code 的開發者,Anthropic 也同步更新模型遷移指引。官方建議執行「/claude-api migrate」,系統將自動更新模型名稱,並提供更適合 Opus 4.8 的 Prompt 建議與最佳化設定。

從今年 4 月推出 Opus 4.7,到如今發布 Opus 4.8,Anthropic 旗艦模型更新週期明顯縮短。除了 Opus 4.8 外,Anthropic 也透露更高階的 Claude Mythos 模型預計未來數周內進一步擴大開放。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

孫淑媚北流開唱 公布「醫生」真面目

孫淑媚北流開唱 公布「醫生」真面目

周迅.金高銀驚喜同框 中文羞澀告白:我很喜歡妳

周迅.金高銀驚喜同框 中文羞澀告白:我很喜歡妳

黃仁勳跳〈GOLDEN〉 這真的不是AI嗎!

黃仁勳跳〈GOLDEN〉 這真的不是AI嗎!

【福利給好給滿!】韓國追星追到黃仁勳 現場尖叫+歡呼聲超熱鬧XD

【福利給好給滿!】韓國追星追到黃仁勳 現場尖叫+歡呼聲超熱鬧XD

孫淑媚.丁寧.鍾欣凌挑戰〈GO!〉 站上跑步機唱跳拚了!

孫淑媚.丁寧.鍾欣凌挑戰〈GO!〉 站上跑步機唱跳拚了!

讀者迴響

用AI可以生成影片嗎?

可以。像Pika、Runway、Veo等工具能根據文字或圖片自動產生影片,長度多為數秒到一分鐘。這些影片支援動態畫面、配樂、過場效果,適合社群短片製作、創意發想或故事展示。

最夯影音

更多

熱門快報

回到網頁頂端