緊咬Anthropic!OpenAI同日推GPT-5.3-Codex 跑分碾壓Opus 4.6

▲▼ChatGPT,Gemini,Grok,Claude,Perplexity,App,AI工具。(圖/記者吳立言攝)

▲緊咬Anthropic!OpenAI同日推出GPT-5.3-Codex。(圖/記者吳立言攝)

記者吳立言/綜合報導

兩大 AI 巨頭 Anthropic 與 OpenAI 於今日接連發布重大更新。Anthropic 首先發表 Claude Opus 4.6,主打極長文本處理能力;OpenAI 一小時後隨即宣布推出 GPT-5.3-Codex,並公布數據顯示其在編碼實戰測試中展現出顯著的領先優勢。

Claude Opus 4.6:導入深度思考機制與多代理協作

[廣告]請繼續往下閱讀...

Anthropic 此次更新重點聚焦於大規模資訊處理與邏輯穩定性。Claude Opus 4.6 將上下文視窗(Context Window)擴展至 100 萬 Token,相較於前代版本提升 5 倍之多。技術層面上,該模型導入了「思考決策點」功能,使模型能辨識問題複雜度,自主決定是否啟動深度推理流程。

此外,Opus 4.6 強化了多代理(Multi-agent)協作能力,並在長文本記憶留存率上提升近 4 倍,旨在解決長對話中常見的指令遺忘與邏輯斷層問題,針對大型專案的架構分析提供了更穩定的基礎。

GPT-5.3-Codex:優化生成效率與 OS 層級操控

面對 Anthropic 的挑戰,OpenAI 推出的 GPT-5.3-Codex 則在編碼基準測試中交出了亮眼成績。數據顯示,該模型在 SWE-bench Pro(57%)、TerminalBench 2.0(76%) 及 OSWorld(64%) 等測試中,皆取得目前業界最高水準。

除了跑分優勢,GPT-5.3-Codex 在開發體驗上有兩項核心突破:

中途干預能力(Mid-task Steerability): 支持任務執行過程中的即時引導與動態更新,大幅降低複雜開發任務的錯誤成本。

效能密度提升: 生成相同內容所需 Token 數降至 5.2-Codex 的一半以下,且每 Token 生成速率提升超過 25%,顯著優化了推理成本與延遲。

這兩款模型的發布顯示出兩家公司發展策略的差異化:Claude 傾向於成為具備超長記憶與深度邏輯的「數位大腦」;而 GPT-5.3-Codex 則朝向具備系統操作能力、高效率且可高度受控的「執行工具」進化。

隨著 GPT-5.3-Codex 正式上線,開發者將有機會直接對比這兩款頂尖模型在實際工作流中的表現差異。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

【89猴湊一對】男違停路中比中指譙三字經 金髮女上車前眼抽筋瞪5秒

【89猴湊一對】男違停路中比中指譙三字經 金髮女上車前眼抽筋瞪5秒

【一抽入魂】爸爸代抽兵種抽中海軍陸戰隊!全場驚呆

【一抽入魂】爸爸代抽兵種抽中海軍陸戰隊!全場驚呆

直播遭私生連環叩 aespa寧藝卓:別再打了!

直播遭私生連環叩 aespa寧藝卓:別再打了!

球友看WBC熱血噴發即刻開打 ,靠普拿疼肌立快速擊退酸痛

球友看WBC熱血噴發即刻開打 ,靠普拿疼肌立快速擊退酸痛

陳子強爆感情風波後首露面 回應「一切交給公司處理」

陳子強爆感情風波後首露面 回應「一切交給公司處理」

讀者迴響

AI怎麼畫圖?

只要輸入簡單描述文字(例如「水晶風格的貓」),AI 工具如Midjourney、DALL·E、Bing Image Creator就能依據提示生成對應圖像。這類工具靠大量圖像資料訓練,能理解物件、風格與組合邏輯。

最夯影音

更多

熱門快報

回到網頁頂端