AI模型終於打折了!OpenAI推出「便宜但慢」的Flex模式

記者吳立言/綜合報導

▲OpenAI。(圖/OpenAI)

▲OpenAI推出全新API選項「Flex 處理模式(Flex processing )」。(圖/OpenAI)
為了在與Google等強大競爭對手的AI戰場上取得優勢,OpenAI推出全新API選項「Flex 處理模式(Flex processing )」,用戶可透過接受較慢的回應速度與「資源偶爾無法使用」的情況,換取更便宜的模型使用費。Flex處理目前已開放beta測試,支援OpenAI最新釋出的o3 和 o4-mini推理模型。官方表示,這項功能主要針對優先級較低、非生產環境的工作負載設計,例如模型評估、資料增補與非同步運算等。

啟用Flex模式後,API成本可減半:

◆o3 模型的Flex價格為每百萬輸入tokens(約 75 萬字)5美元、輸出tokens為20美元,相較標準價格分別為10美元與40美元。
◆o4-mini模型則從原本每百萬輸入tokens 1.10美元與輸出tokens 4.40美元,降至0.55美元與2.20美元。
在前沿AI成本持續攀升的背景下,這項新方案正面回應市場對於更高性價比的需求。就在同一天,Google也推出了Gemini 2.5 Flash,一款推理效能媲美甚至優於DeepSeek R1的新模型,但輸入token成本更低。

[廣告]請繼續往下閱讀...

OpenAI在發給開發者的通知信中表示,若用戶屬於使用階層(tier)1 至 3,需完成新推出的身份驗證流程,才能存取 o3 模型,這項要求同樣適用於其他模型的推理摘要功能與串流 API 支援。對此,OpenAI說明,推行身份驗證的主要目的是為了防止惡意用戶違反平台使用政策。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

【屏東佛心房東】月砸2萬「免費供早餐、飲料」 百名房客月省3千

【屏東佛心房東】月砸2萬「免費供早餐、飲料」 百名房客月省3千

【最後提醒隊員要小心...】基隆消防小隊長詹能傑殉職 叮囑「衣服堆得像山」

【最後提醒隊員要小心...】基隆消防小隊長詹能傑殉職 叮囑「衣服堆得像山」

【哽咽送別】詹能傑「同年同月同日生」兄弟想罵他:你太衝了...

【哽咽送別】詹能傑「同年同月同日生」兄弟想罵他:你太衝了...

【主打一個舒適】烏龜悠哉仰躺水面敲享受~

【主打一個舒適】烏龜悠哉仰躺水面敲享受~

趙雨凡爸媽現身AAA後台! 到高雄看兒子「緊緊擁抱」

趙雨凡爸媽現身AAA後台! 到高雄看兒子「緊緊擁抱」

讀者迴響

Gemini和ChatGPT有什麼不同?

Gemini是Google開發的AI,擅長整合Gmail、Docs、YouTube等服務,適合重度Google用戶;而ChatGPT則由OpenAI開發,操作簡單、回應速度快,是多數人入門AI的首選。

最夯影音

更多

熱門快報

回到網頁頂端