
▲DeepSeek-V4預覽版正式上線。(圖/記者吳立言攝)
記者吳立言/綜合報導
DeepSeek 正式推出新一代大語言模型「DeepSeek-V4 預覽版」,不僅全面開源,更將百萬超長上下文記憶列為官方服務標配。官方強調,V4 模型在代理能力、世界知識與邏輯推理效能上,皆已具備挑戰全球頂尖閉源模型的實力。
雙版本齊發:旗艦 Pro 迎戰國際大廠、Flash 主打極速經濟
本次發布的 DeepSeek-V4 依據模型大小分為「Pro」與「Flash」雙版本,滿足不同的運算與開發需求,且兩者皆同時支援「思考」與「非思考」模式。
DeepSeek-V4-Pro: 主打極致效能。在世界知識評測中,表現僅微幅落後頂尖閉源模型 Gemini-Pro-3.1;而在數學、STEM 及競賽型程式碼測試中,更超越目前所有公開評測的開源模型。官方透露,Pro 版在內部開發用以編寫程式碼的體驗,已超越 Sonnet 4.5。
DeepSeek-V4-Flash: 主打輕量與高性價比。雖然世界知識儲備略遜於 Pro 版,但擁有高度接近的推理能力。因其所需的運算資源較小,能提供開發者更快速、經濟的 API 服務。在簡單任務上表現與 Pro 版相當,僅在高難度任務時有些微差距。
創新架構降低硬體門檻 主流代理深度支援
DeepSeek-V4 最大的技術亮點在於開創了全新的注意力機制。透過在 Token 維度進行壓縮,並結合 DSA 稀疏注意力(DeepSeek Sparse Attention)技術,V4 在實現全球領先長文本能力的同時,大幅降低了對運算算力與顯示卡記憶體(VRAM)的需求。
此外,新模型已針對 Claude Code、OpenCode 等主流代理產品進行深度支援與最佳化,大幅提升程式碼與文件生成的能力。官方建議,面對複雜的應用場景時可開啟思考模式,並將思考強度參數調至最高(max)。
開發者注意!舊版 API 三個月後全面停用
針對開發者,DeepSeek API 服務已同步更新,只需將 model_name 更改為 deepseek-v4-pro 或 deepseek-v4-flash 即可調用。
官方特別提醒,原有的兩個模型名稱 deepseek-chat 與 deepseek-reasoner 將進入為期三個月的過渡期,並於 2026 年 7 月 24 日 正式停用。目前這兩個舊名稱將暫時導向 deepseek-v4-flash 的非思考模式與思考模式,建議開發者盡速完成程式碼遷移。一般使用者即日起也可登入 DeepSeek 官網或官方 App,直接體驗最新 V4 模型的百萬字對話能力。
