GPT-5.4登場 OpenAI:目前最強專業工作AI模型

▲ChatGPT GPT-5.4 thinking。(圖/OpenAI)

記者吳立言/綜合報導

OpenAI 今(6日)正式發布新一代 AI 模型 GPT-5.4,並在 ChatGPT、API 與 Codex 開發平台同步推出。官方表示,這是目前最適合「專業工作場景」的模型之一,整合推理、程式開發與自動化代理能力,目標是讓 AI 不只回答問題,而是能直接完成實際工作。

新版模型同時推出 GPT-5.4 Thinking(推理版本)與 GPT-5.4 Pro(高性能版本),針對需要處理複雜任務的企業與開發者提供更強大的能力。

強化知識工作能力

[廣告]請繼續往下閱讀...

OpenAI 表示,GPT-5.4 的設計重點之一,是提升 AI 在日常知識工作的表現,例如撰寫報告、製作簡報、整理文件與建立試算表。 在名為 GDPval 的評測中,GPT-5.4 在 44 種職業任務中,有 83% 的結果達到或超過業界專業人士水準,比前一代 GPT-5.2 的 70.9% 明顯提升。 例如在投資銀行常見的試算表建模測試中,GPT-5.4 的平均得分達 87.3%,大幅高於 GPT-5.2 的 68.4%。

在人類評測者比較生成簡報時,也有 68% 的情況更偏好 GPT-5.4 的結果。

AI 開始能操作電腦

另一項重要升級是「原生電腦操作能力」。 GPT-5.4 成為 OpenAI 首個具備完整「電腦使用能力」的通用模型,能透過螢幕畫面、滑鼠與鍵盤操作,執行跨軟體任務。 例如 AI 可以:

• 在網站中填寫資料

• 操作瀏覽器完成任務

• 發送 Email、安排行事曆

• 在不同應用程式之間處理工作流程

在OSWorld-Verified 測試中,GPT-5.4 的成功率達 75%,不僅遠高於 GPT-5.2 的 47%,甚至略高於人類平均表現。

程式開發能力進一步提升

GPT-5.4 同時整合了 GPT-5.3-Codex 的程式能力,讓模型在長時間開發任務中表現更穩定。 在軟體工程評測 SWE-Bench Pro 中,GPT-5.4 的表現已接近專門程式模型,同時維持更低的延遲。官方也表示,新模型在前端開發與介面設計方面的成果更加美觀與完整。 OpenAI 還推出一項實驗功能 Playwright Interactive,讓 AI 在寫程式時可以同步測試網頁或應用程式,甚至自動進行多輪測試與修正。

AI 代理與工具使用能力加強

GPT-5.4 的另一個重點是強化 AI 代理(Agent)能力,讓模型在多工具環境中能更有效率地完成複雜任務。例如在 Toolathlon 測試中,AI 需要完成一整套工作流程,包括讀取 Email、下載附件、上傳作業、批改內容,並將結果整理進試算表。

OpenAI 表示,相較前一代模型,GPT-5.4 不僅成功率更高,也能以更少步驟完成整個流程。 同時,OpenAI 也加入名為 「工具搜尋(Tool Search)」 的新機制。當系統中存在大量工具時,AI 可以先搜尋需要的工具,再載入相關定義,而不是一次讀取所有工具資訊。官方測試顯示,這項設計能在保持相同準確度的情況下,將 token 使用量降低約 47%,進一步提升效率。

回答更準確、錯誤更少

在可靠性方面,OpenAI 表示 GPT-5.4 也針對降低「幻覺」的問題進行優化。根據測試,在一組由使用者標記錯誤的資料集中,新模型在單一事實陳述上的錯誤率降低了 33%,整體回答出現錯誤的機率也下降約 18%。 官方認為,這項改善將有助於提升 AI 在文件撰寫、報告生成與分析任務中的可信度,讓模型在專業工作場景中更具實用價值。

ChatGPT 與 API 逐步推出

目前 GPT-5.4 已開始在多個產品中逐步推出。ChatGPT 的 Plus、Team 與 Pro 訂閱用戶將可使用 GPT-5.4 Thinking 推理版本,而 Pro 與 Enterprise 方案則提供性能更高的 GPT-5.4 Pro。 在開發者端,OpenAI 也已透過 API 提供 gpt-5.4 與 gpt-5.4-pro 兩種模型。同時,舊版的 GPT-5.2 Thinking 將維持約三個月過渡期,預計於 2026 年 6 月 5 日正式退役。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

孫安佐被傳國中還在喝母乳 狄鶯開嗆:我還有奶嗎?

孫安佐被傳國中還在喝母乳 狄鶯開嗆:我還有奶嗎?

【垃圾車亂倒餿水】台中環保局清潔隊員被民眾當場抓到:下次不會了

【垃圾車亂倒餿水】台中環保局清潔隊員被民眾當場抓到:下次不會了

不爽被棄單!外送員私吞剉冰、手搖飲全丟了 慘被詐欺罪送辦

不爽被棄單!外送員私吞剉冰、手搖飲全丟了 慘被詐欺罪送辦

【被酒醉爸纏住】原本很熱情的歐告直接「保持安全距離」XD

【被酒醉爸纏住】原本很熱情的歐告直接「保持安全距離」XD

小S感謝老公「堅持約飯局」 看具俊曄「眼裡漸漸有光」

小S感謝老公「堅持約飯局」 看具俊曄「眼裡漸漸有光」

讀者迴響

ChatGPT能免費使用嗎?

有免費版本,適合多數基本用途。若升級付費(如 ChatGPT Plus),可使用更強大的GPT-4模型,回應速度快、理解力更好、支援圖片與檔案分析。免費用戶功能有限,無法使用進階工具。

最夯影音

更多

熱門快報

回到網頁頂端