GPT-4o「先推理再搜尋」現象頻傳　多模型切換機制疑正測試中

▲▼ 。（圖／OpenAI）

▲GPT-4o測試頻率升高　疑似驗證多模型路由系統啟動中。（圖／OpenAI）

記者吳立言／綜合報導

近期多名使用者觀察發現，GPT-4o模型在處理複雜問題時，行為模式出現微妙轉變，明顯趨向「先進行推理、再觸發搜尋」，顯示其內部極可能正在測試整合多模型的動態路由系統。搭配系統端頻繁出現的小規模測試更新，外界推測這或許是為下一波重大功能升級預作暖身。

Gpt 4o is reasoning before searching, this is strong indication that they are testing the routing system between combined models.

Lots of new frequent small testing is becoming more frequent as we close in on the big,

GPT 5 pic.twitter.com/SsgJyWbBSc

[廣告]請繼續往下閱讀...

— Chris (@chatgpt21) June 8, 2025

根據資深用戶實測，GPT-4o在處理包含事實查詢、程式推理與視覺解釋等任務時，輸出邏輯顯得更加清晰、有層次，推論能力優於先前版本，但卻未必第一時間啟用搜尋工具（如內建瀏覽器或文件查詢模組），顯示系統可能先由語言模型進行初步判斷，再決定是否需要補強資訊。

ChatGPT 4o is now thinking first before searching, as well as in some other cases.

Silent updates ???? https://t.co/9S2PSDeUxW pic.twitter.com/lBqEUvG37h
— TestingCatalog News ???? (@testingcatalog) June 8, 2025

此現象呼應先前OpenAI內部研究中提及的「多模型協同架構（Multi-Model Routing System）」，即透過路由模組依任務類型自動選擇最適模型，包括高效率處理簡單任務的輕量模型、深度推理專用的GPT-4核心以及接收來自搜尋引擎、檔案或圖像分析的外部資料模組。除了模型行為的微調，社群亦觀察到GPT-4o系統端近期頻繁出現以下異動：

◆回應風格不一致（可能源自多模型切換）
◆單次會話內表現突變（如某些問題明顯變慢或變快）
◆工具觸發條件疑似改動（例如code interpreter被更頻繁啟用）
這些訊號都與典型A/B測試（又稱拆分測試）、路由策略測試的行為模式一致，顯示OpenAI極可能正在內部逐步開放這類機制，並觀察其對生成品質與延遲的影響。

隨著GPT-4o成為ChatGPT的新預設主模型，外界普遍預期OpenAI將在2025下半年正式推出具備「多模型切換」、「更強語音對話」與「持續記憶」的新一代AI系統框架。這些目前仍在內部測試階段的改動，極可能就是下一波AI平台變革的前兆。