DeepSeek-V4預覽版正式上線並同步開源!百萬字上下文成標配

▲▼gemini,grok,deepseek,chatgpt。(圖/記者吳立言攝)

▲DeepSeek-V4預覽版正式上線。(圖/記者吳立言攝)

記者吳立言/綜合報導

DeepSeek 正式推出新一代大語言模型「DeepSeek-V4 預覽版」,不僅全面開源,更將百萬超長上下文記憶列為官方服務標配。官方強調,V4 模型在代理能力、世界知識與邏輯推理效能上,皆已具備挑戰全球頂尖閉源模型的實力。

雙版本齊發:旗艦 Pro 迎戰國際大廠、Flash 主打極速經濟

[廣告]請繼續往下閱讀...

本次發布的 DeepSeek-V4 依據模型大小分為「Pro」與「Flash」雙版本,滿足不同的運算與開發需求,且兩者皆同時支援「思考」與「非思考」模式。

DeepSeek-V4-Pro: 主打極致效能。在世界知識評測中,表現僅微幅落後頂尖閉源模型 Gemini-Pro-3.1;而在數學、STEM 及競賽型程式碼測試中,更超越目前所有公開評測的開源模型。官方透露,Pro 版在內部開發用以編寫程式碼的體驗,已超越 Sonnet 4.5。

DeepSeek-V4-Flash: 主打輕量與高性價比。雖然世界知識儲備略遜於 Pro 版,但擁有高度接近的推理能力。因其所需的運算資源較小,能提供開發者更快速、經濟的 API 服務。在簡單任務上表現與 Pro 版相當,僅在高難度任務時有些微差距。

創新架構降低硬體門檻 主流代理深度支援

DeepSeek-V4 最大的技術亮點在於開創了全新的注意力機制。透過在 Token 維度進行壓縮,並結合 DSA 稀疏注意力(DeepSeek Sparse Attention)技術,V4 在實現全球領先長文本能力的同時,大幅降低了對運算算力與顯示卡記憶體(VRAM)的需求。

此外,新模型已針對 Claude Code、OpenCode 等主流代理產品進行深度支援與最佳化,大幅提升程式碼與文件生成的能力。官方建議,面對複雜的應用場景時可開啟思考模式,並將思考強度參數調至最高(max)。

開發者注意!舊版 API 三個月後全面停用

針對開發者,DeepSeek API 服務已同步更新,只需將 model_name 更改為 deepseek-v4-pro 或 deepseek-v4-flash 即可調用。

官方特別提醒,原有的兩個模型名稱 deepseek-chat 與 deepseek-reasoner 將進入為期三個月的過渡期,並於 2026 年 7 月 24 日 正式停用。目前這兩個舊名稱將暫時導向 deepseek-v4-flash 的非思考模式與思考模式,建議開發者盡速完成程式碼遷移。一般使用者即日起也可登入 DeepSeek 官網或官方 App,直接體驗最新 V4 模型的百萬字對話能力。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

【質疑執法過當】重機騎士遇「持槍攔檢」警:符合比例原則

【質疑執法過當】重機騎士遇「持槍攔檢」警:符合比例原則

【最衰庇護島】慘遭第16撞...77歲BMW駕駛直接騎上去

【最衰庇護島】慘遭第16撞...77歲BMW駕駛直接騎上去

偉晉「缺席狼人殺」理由超誠實 被男球迷擦汗:把我當女的!

偉晉「缺席狼人殺」理由超誠實 被男球迷擦汗:把我當女的!

【會自動停車的狗狗肉】捷克狼犬聽主人指令秒去停好超聰明

【會自動停車的狗狗肉】捷克狼犬聽主人指令秒去停好超聰明

【請收下我的膝蓋】新北消防員「全副武裝」攻頂101 神猛畫面曝!網驚:太強大

【請收下我的膝蓋】新北消防員「全副武裝」攻頂101 神猛畫面曝!網驚:太強大

讀者迴響

ChatGPT能免費使用嗎?

有免費版本,適合多數基本用途。若升級付費(如 ChatGPT Plus),可使用更強大的GPT-4模型,回應速度快、理解力更好、支援圖片與檔案分析。免費用戶功能有限,無法使用進階工具。

最夯影音

更多

熱門快報

回到網頁頂端