▲兩款gpt-oss模型。(圖/OpenAI)
記者吳立言/綜合報導
OpenAI今(6)日宣布推出兩款開放權重的語言模型「gpt-oss-120b」與「gpt-oss-20b」,以Apache 2.0授權開源,並強調其在推理能力、安全性與可部署性方面皆有突破性進展。這兩款模型皆由開源社群參與開發回饋,是OpenAI首度針對「推理能力」進行強化訓練的開源模型。
根據OpenAI公布的資料,gpt-oss-120b模型在主要基準測試中表現等同於自家商用模型o4-mini,並在特定領域如競技數學與健康相關問題上表現更佳。該模型能在單張80GB GPU或高階筆電上運行。而規模較小的gpt-oss-20b則可在「僅有16GB記憶體」的設備上順利執行,效能相當於或超過o3-mini模型。
兩款模型皆支援「agentic workflows」,包括函數呼叫、網頁搜尋、Python執行,並提供完整的思維鍊(chain-of-thought)推理過程,有助於開發者建立能主動執行任務的AI系統。
gpt-oss-120b matches OpenAI o4-mini on core benchmarks and exceeds it in narrow domains like competitive math or health-related questions, all while fitting on a single 80GB GPU (or high-end laptop).
— OpenAI (@OpenAI) August 5, 2025
gpt-oss-20b fits on devices as small as 16GB, while matching or exceeding… pic.twitter.com/Zn2wDiWcNb
在對話風格與安全性方面,OpenAI表示模型採用了「Harmony格式」進行後訓練,並對照官方「OpenAI Model Spec」規範校準,使模型能更清楚展現思考過程,同時具備更強的工具使用能力。
安全層面上,OpenAI引入「深思熟慮對齊」訓練法與「指令層級階層」,防止模型接受危險指令、抵禦提示注入(prompt injection),並結合預訓練與敵對微調等技術,設下開源語言模型的新安全門檻。
儘管進行過完整的敵對性安全測試,OpenAI仍指出gpt-oss-120b未能達到《風險預備框架》中的「高能力」級別,顯示即便是開放模型,其風險控管仍有侷限。OpenAI表示此一研究流程已經獲得外部專家審查,將作為未來開放權重模型風險評估的新標準。
目前這兩款模型已可在Hugging Face上免費下載,並支援原生MXFP4量化技術,提升運算效率。OpenAI官方部落格也已列出首波支援平台與部署說明,歡迎開發者前往查看。