▲GPT-5將在今夏登場。(圖/OpenAI)
記者吳立言/綜合報導
OpenAI執行長山姆・奧特曼(Sam Altman)近日在官方Podcast中確認,下一代語言模型GPT-5將於2025年夏季正式推出。這項更新不僅代表效能上的進化,更象徵OpenAI正式邁向「單一模型、多任務整合」的新階段,目標是讓使用者只需透過一個統一的模型,就能完成從文字生成、語音辨識到圖像與影片處理等多項任務。
目前ChatGPT使用者在進行不同任務時,需在多個模型間切換,例如處理文字使用GPT-4,圖像生成依賴DALL·E,語音互動則呼叫Whisper模組。GPT-5預計將打破這樣的分工,成為真正「多模態整合」的單一模型。外媒報導指出,未來的使用者介面將不再出現「模型選擇器」,所有操作將統一由GPT-5負責。
這也意味著使用體驗將更流暢一致,不論是輸入一段語音、要求生成圖片或翻譯影片字幕,用戶都無需考慮背後模型運作細節。OpenAI開發者體驗負責人Romain Huet表示「GPT-5將繼承並強化歷代模型的優點,變得更強大、更簡單、更具擴展性。」
除了多模態整合外,GPT-5也將在記憶能力與互動個性化方面帶來顯著突破。根據OpenAI公開資訊,GPT-5將支援更長的上下文窗口,能記住使用者長時間的對話歷程,適應更複雜的應用情境,例如技術客服、腳本創作、科學研究輔助等。此外,模型將也具備「行為學習」能力,能根據使用者過去的偏好與提問方式調整回答風格與內容,強化個人化體驗。這項功能預期將首先應用在付費訂閱用戶與企業級應用之中。
奧特曼在談話中強調,GPT-5的定位不僅是聊天機器人升級版,而是一個可以「執行任務」的AI系統。這類任務可能涵蓋排程管理、行銷文案、影片摘要、專案追蹤、甚至與其他AI系統協作執行多步驟指令。
外界普遍認為,這代表OpenAI正逐步實現「AI助理即平台」的策略,讓語言模型成為企業與個人使用者日常數位操作的中樞。這種整合式 AI 將對現有工作流程、資訊搜尋與決策支援產生深遠影響。
儘管OpenAI尚未公布GPT-5的具體收費模式,先前已有內部代表指出「開發成本極高」,暗示高階版本價格可能不菲。不過,也有消息指出GPT-5將提供不同層級的存取方式,包括免費版、Plus版與企業API接入選項,讓使用者可依需求與預算彈性選用。
對企業與開發者而言,GPT-5的發布預期將掀起一波應用升級潮。具備統一API、多模態處理與可延伸工作流程的GPT-5,有望在客服、教育、媒體、法務與醫療等領域創造更多元、更高效率的應用實例。