OpenAI再放震撼彈!釋出兩款gpt-oss推理模型 免費開源下載中

▲▼             。(圖/OpenAI)

▲兩款gpt-oss模型。(圖/OpenAI)

記者吳立言/綜合報導

OpenAI今(6)日宣布推出兩款開放權重的語言模型「gpt-oss-120b」與「gpt-oss-20b」,以Apache 2.0授權開源,並強調其在推理能力、安全性與可部署性方面皆有突破性進展。這兩款模型皆由開源社群參與開發回饋,是OpenAI首度針對「推理能力」進行強化訓練的開源模型。

[廣告] 請繼續往下閱讀.

根據OpenAI公布的資料,gpt-oss-120b模型在主要基準測試中表現等同於自家商用模型o4-mini,並在特定領域如競技數學與健康相關問題上表現更佳。該模型能在單張80GB GPU或高階筆電上運行。而規模較小的gpt-oss-20b則可在「僅有16GB記憶體」的設備上順利執行,效能相當於或超過o3-mini模型。

兩款模型皆支援「agentic workflows」,包括函數呼叫、網頁搜尋、Python執行,並提供完整的思維鍊(chain-of-thought)推理過程,有助於開發者建立能主動執行任務的AI系統。

在對話風格與安全性方面,OpenAI表示模型採用了「Harmony格式」進行後訓練,並對照官方「OpenAI Model Spec」規範校準,使模型能更清楚展現思考過程,同時具備更強的工具使用能力。

[廣告] 請繼續往下閱讀..

安全層面上,OpenAI引入「深思熟慮對齊」訓練法與「指令層級階層」,防止模型接受危險指令、抵禦提示注入(prompt injection),並結合預訓練與敵對微調等技術,設下開源語言模型的新安全門檻。

儘管進行過完整的敵對性安全測試,OpenAI仍指出gpt-oss-120b未能達到《風險預備框架》中的「高能力」級別,顯示即便是開放模型,其風險控管仍有侷限。OpenAI表示此一研究流程已經獲得外部專家審查,將作為未來開放權重模型風險評估的新標準。

目前這兩款模型已可在Hugging Face上免費下載,並支援原生MXFP4量化技術,提升運算效率。OpenAI官方部落格也已列出首波支援平台與部署說明,歡迎開發者前往查看。