阿里巴巴發布Qwen3模型　正面對決DeepSeek與OpenAI

▲▼QWEN3。（圖／官方部落格）

▲阿里巴巴今日發布Qwen3挑戰DeepSeek與OpenAI頂尖模型。（圖／官方部落格）
記者吳立言／綜合報導
阿里巴巴旗下的阿里雲，今（29日）正式發布中國首款混合推理模型「Qwen3系列」，並全面開源。這次推出的Qwen3不只性能強悍，還首創將「快思考」與「慢思考」兩種推理模式整合到同一個模型中，大幅提升回應速度與深度，同時有效節省運算資源。

Qwen3的預訓練資料量達到驚人的「36萬兆個token」，支援多達119種語言與方言，包括爪哇語、海地語等地方性語種，真正做到「全球通用」。在數學推理、程式碼生成與綜合能力等基準測試上，Qwen3同樣表現出色。
Qwen3主打「自動切換思考模式」，簡單問題能瞬間回覆，節省計算資源；複雜問題則會深度推理，提升回答的準確性與專業度。部署需求也同步降低。阿里雲表示，旗艦版Qwen3-235B-A22B只需要「4張H20顯示卡」就能本地部署，部署成本比DeepSeek R1下降超過六成，對企業或開發者而言，門檻大幅降低。

此外，Qwen3全面支援MCP（Multi-Agent Communication Protocol）協議，使得開發AI代理（Agent）能力也獲得大幅強化，尤其是在程式碼能力方面，成為台灣與中國地區許多開發者期待的新利器。

這次Qwen3一口氣開源了8款模型，包括：

[廣告]請繼續往下閱讀...

2款MoE（混合專家）模型：旗艦版 Qwen3-235B-A22B（總參數2350億，啟用參數220億）、小型版Qwen3-30B-A3B（總參數300億，啟用參數30億），適合一般高階顯示卡部署。

6款Dense（密集型）模型：分別為 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B

最小的0.6B模型甚至可以直接在手機端運行，讓AI無所不在。

所有模型皆採用Apache 2.0開源授權，方便商業應用及二次開發。根據阿里雲公布的資料，Qwen3在數學推理、程式碼理解與綜合智力測試中取得領先成績，全面超越DeepSeek-R1、OpenAI o1與o3-mini、Grok3等競品。不僅如此，Qwen3在訓練資料來源上更加多元，不僅涵蓋了網路資料，還大量吸收PDF文件、大量合成程式碼片段，讓知識基礎更為堅實。
隨著Qwen3的發布與全系列開源，阿里巴巴在大模型領域展現出強勁的技術實力。隨著更多企業與開發者投入應用，全球AI競爭格局勢必迎來新一輪變化。