阿里巴巴發布Qwen3模型 正面對決DeepSeek與OpenAI

▲▼QWEN3。(圖/官方部落格)

▲阿里巴巴今日發布Qwen3挑戰DeepSeek與OpenAI頂尖模型。(圖/官方部落格)
記者吳立言/綜合報導
阿里巴巴旗下的阿里雲,今(29日)正式發布中國首款混合推理模型「Qwen3系列」,並全面開源。這次推出的Qwen3不只性能強悍,還首創將「快思考」與「慢思考」兩種推理模式整合到同一個模型中,大幅提升回應速度與深度,同時有效節省運算資源。

Qwen3的預訓練資料量達到驚人的「36萬兆個token」,支援多達119種語言與方言,包括爪哇語、海地語等地方性語種,真正做到「全球通用」。在數學推理、程式碼生成與綜合能力等基準測試上,Qwen3同樣表現出色。
Qwen3主打「自動切換思考模式」,簡單問題能瞬間回覆,節省計算資源;複雜問題則會深度推理,提升回答的準確性與專業度。部署需求也同步降低。阿里雲表示,旗艦版Qwen3-235B-A22B只需要「4張H20顯示卡」就能本地部署,部署成本比DeepSeek R1下降超過六成,對企業或開發者而言,門檻大幅降低。

此外,Qwen3全面支援MCP(Multi-Agent Communication Protocol)協議,使得開發AI代理(Agent)能力也獲得大幅強化,尤其是在程式碼能力方面,成為台灣與中國地區許多開發者期待的新利器。

這次Qwen3一口氣開源了8款模型,包括:

[廣告]請繼續往下閱讀...

2款MoE(混合專家)模型:旗艦版 Qwen3-235B-A22B(總參數2350億,啟用參數220億)、小型版Qwen3-30B-A3B(總參數300億,啟用參數30億),適合一般高階顯示卡部署。

6款Dense(密集型)模型:分別為 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B

最小的0.6B模型甚至可以直接在手機端運行,讓AI無所不在。

所有模型皆採用Apache 2.0開源授權,方便商業應用及二次開發。根據阿里雲公布的資料,Qwen3在數學推理、程式碼理解與綜合智力測試中取得領先成績,全面超越DeepSeek-R1、OpenAI o1與o3-mini、Grok3等競品。不僅如此,Qwen3在訓練資料來源上更加多元,不僅涵蓋了網路資料,還大量吸收PDF文件、大量合成程式碼片段,讓知識基礎更為堅實。
隨著Qwen3的發布與全系列開源,阿里巴巴在大模型領域展現出強勁的技術實力。隨著更多企業與開發者投入應用,全球AI競爭格局勢必迎來新一輪變化。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

孫藝真兒子幫媽咪慶生 奶音狂催促:趕快吹蠟燭!

孫藝真兒子幫媽咪慶生 奶音狂催促:趕快吹蠟燭!

Rain抵台!黑大衣帥翻 不停揮手打招呼超親民

Rain抵台!黑大衣帥翻 不停揮手打招呼超親民

【再不帶肉肉】女職員3天沒進公司!遭8個月大阿金撲倒在地XD

【再不帶肉肉】女職員3天沒進公司!遭8個月大阿金撲倒在地XD

龍千玉淚憶曹西平 「生生世世繼續結緣」

龍千玉淚憶曹西平 「生生世世繼續結緣」

費德勒看到ACE球大笑 周杰倫秒喪氣:好糗

費德勒看到ACE球大笑 周杰倫秒喪氣:好糗

讀者迴響

我可以用AI畫卡通嗎?

可以!只要在提示詞中加入anime、cartoon、pixar等字樣,就會產生可愛卡通風格。

最夯影音

更多

熱門快報

回到網頁頂端