
記者吳立言/綜合報導
DeepSeek 再度加速技術迭代,於今(2日)宣布推出兩款全新模型 DeepSeek-V3.2 與 DeepSeek-V3.2-Speciale。官方強調,新版本在多項推理測試中已能與 OpenAI 旗艦 GPT-5 相媲美,並首次將「思考模式(thinking mode)」與工具使用深度整合,成為下一階段 AI 代理策略的核心。
[廣告] 請繼續往下閱讀.
DeepSeek 說明,V3.2 最大的變化是具備更像人類的推理邏輯,並能在需要時自動啟用搜尋引擎、計算工具或程式碼執行器。這是該公司首次讓模型在「思考」與「非思考」兩種模式間自由切換,使推理鏈(chain of thought)與工具使用自然融為一體。官方的技術評估指出,V3.2 在多項推理測試中與 GPT-5 及 Kimi-k2-thinking 的成績相近。
同時亮相的 V3.2-Speciale 則鎖定更高難度領域,包括數學、長鏈推理與複雜計算任務。DeepSeek 表示,Speciale 在國際數學奧林匹亞(IMO)與國際資訊奧林匹亞(IOI)等標準化測試上的表現已達到金牌水準,並明確把 Google 最新 Gemini-3 Pro 視為主要對手。公司強調,這款版本的目的,就是把「開源推理能力推到可見邊界」。
DeepSeek 也透露,他們建立了一套新的 AI 代理訓練流程,讓模型能在更少人工介入的情況下自主探索、分析並做出決策。就在前一週,公司才發表具定理證明能力的 DeepSeekMath-V2,被外界視為其推理型技術的一次跳躍。
在技術報告《DeepSeek-V3.2:Pushing the Frontier of Open Large Language Models》中,DeepSeek 直言 V3.2「在多項推理測試中,達到與 GPT-5 及 Kimi-k2-thinking 接近的表現」。
隨著 V3.2 系列正式登場,DeepSeek 再度將開源推理模型的討論推向新一輪熱點。面對 GPT-5、Gemini-3 等國際旗艦級對手,DeepSeek 此次不僅在推理性能上強調「接近主流最高水準」,也藉由思考模式、工具鏈整合與全新的 agent 訓練框架,試圖在下一階段 AI 競爭中找到自身位置。外界關注的,將不只是這套模型的技術指標,更是其能否在實際應用場景中證明開源推理能力的可行性與持續性。
[廣告] 請繼續往下閱讀..