GPT-5.5 Instant正式上線!預設模型全面升級 幻覺率大降、回答更像真人

▲GPT-5.5 Instant正式上線。(圖/OpenAI)

記者吳立言/綜合報導

OpenAI 今(6日)宣布推出全新預設模型「GPT-5.5 Instant」,即日起逐步取代原本的 GPT-5.3 Instant,成為 ChatGPT 的預設模型。新版本主打「更聰明、更準確、更個人化」,不只回答更精簡,也更擅長理解上下文與過往對話內容。

根據 OpenAI 公告,GPT-5.5 Instant 已開始向所有 ChatGPT 用戶推送,API 端則會以「chat-latest」形式提供。付費用戶仍可在接下來 3 個月內繼續使用 GPT-5.3 Instant,之後將正式退役。

幻覺率明顯下降 數學與科學能力同步提升

[廣告]請繼續往下閱讀...

OpenAI 指出,新模型在「高風險領域」的準確率有顯著進步,包括醫療、法律、金融等主題。內部測試顯示,GPT-5.5 Instant 在高風險提示中的幻覺內容比 GPT-5.3 Instant 減少 52.5%,而在曾被用戶標記為「容易出現事實錯誤」的困難對話中,不準確內容也降低 37.3%。 官方同時展示一組數學案例,兩代模型都能察覺使用者的代數解答有問題,但 GPT-5.5 Instant 能進一步發現真正的計算錯誤並重新求解,而 GPT-5.3 Instant 則錯誤地直接得出「無實數解」。

除了推理能力外,多項 benchmark 成績也同步提升:

AIME 2025 數學競賽:65.4% → 81.2%

GPQA 博士級科學測驗:78.5% → 85.6%

MMMU-Pro 多模態推理:69.2% → 76.0%

CharXiv 圖表科學推理:75.0% → 81.6%

OpenAI 表示,新模型也更擅長圖片分析、文件理解,以及判斷何時該主動使用網路搜尋來提升回答品質。

回答更短、更自然 減少「AI 味」

除了能力升級外,GPT-5.5 Instant 也強調「更像真人對話」。 新模型會減少不必要的追問、過度格式化與冗長說明,讓回答更自然直接,同時保留一定程度的口語感與溫度。OpenAI 甚至特別提到,新模型會減少「多餘 emoji」與「過度條列式回覆」。

在官方展示的案例中,GPT-5.5 Instant 回答「如何叫同事不要一直講話」時,整體內容比 GPT-5.3 Instant 少了約 30% 字數,但仍保有實用性與情境感,語氣也更接近日常真人交流。

個人化能力升級 可引用過往聊天與 Gmail

GPT-5.5 Instant 另一個重點,是更深入的個人化功能。 OpenAI 表示,新模型能更有效利用過往聊天紀錄、上傳檔案,以及已連接的 Gmail 資料,提供更符合使用者習慣與偏好的回答。例如推薦餐廳、規劃行程或延續長期專案時,模型能更自然接續先前脈絡,而不用反覆重新說明。 官方也新增「Memory Sources」功能,讓用戶能查看哪些記憶或聊天內容被引用來生成答案,並可自行刪除或修改相關資訊。

OpenAI 強調,分享聊天室時不會同步顯示這些記憶來源,用戶也仍可使用暫存對話避免聊天內容被記錄。 目前 GPT-5.5 Instant 已開始向所有 ChatGPT 用戶推送,但完整的個人化功能仍會分階段開放。 

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

【質疑執法過當】重機騎士遇「持槍攔檢」警:符合比例原則

【質疑執法過當】重機騎士遇「持槍攔檢」警:符合比例原則

【最衰庇護島】慘遭第16撞...77歲BMW駕駛直接騎上去

【最衰庇護島】慘遭第16撞...77歲BMW駕駛直接騎上去

偉晉「缺席狼人殺」理由超誠實 被男球迷擦汗:把我當女的!

偉晉「缺席狼人殺」理由超誠實 被男球迷擦汗:把我當女的!

【會自動停車的狗狗肉】捷克狼犬聽主人指令秒去停好超聰明

【會自動停車的狗狗肉】捷克狼犬聽主人指令秒去停好超聰明

【請收下我的膝蓋】新北消防員「全副武裝」攻頂101 神猛畫面曝!網驚:太強大

【請收下我的膝蓋】新北消防員「全副武裝」攻頂101 神猛畫面曝!網驚:太強大

讀者迴響

Gemini和ChatGPT有什麼不同?

Gemini是Google開發的AI,擅長整合Gmail、Docs、YouTube等服務,適合重度Google用戶;而ChatGPT則由OpenAI開發,操作簡單、回應速度快,是多數人入門AI的首選。

最夯影音

更多

熱門快報

回到網頁頂端