OpenAI正式發表o3與o4-mini  AI進入「看圖思考」新紀元

記者吳立言/綜合報導

▲OpenAI。(圖/OpenAI)▲OpenAI正式發布「o3 與 o4-mini」兩款全新人工智慧推理模型。(圖/OpenAI)

與過去僅能處理文字資訊的AI模型不同,OpenAI今(17日)正式發布「o3 與 o4-mini」兩款全新人工智慧推理模型,首次整合了強大的圖像理解能力。用戶只需上傳一張手繪草圖、模糊照片或白板筆記,即使畫面顛倒、潦草不清,這兩款模型都能自動「看懂」圖像內容,進行角度調整、重點放大,再結合上下文進行語意理解與邏輯推論。這項突破性的「看圖思考」功能,讓AI更貼近人類認知流程,強化其在多步驟、跨媒介任務中的應用效能。

o3與o4-mini也首次獲得ChatGPT中所有工具的完整使用權限,包括:瀏覽最新網路資訊、使用Python進行數據分析與圖表產出、處理及生成各類圖像內容,當用戶提出一個多步驟問題時,模型可自行選擇最合適的工具,進行組合運算與推理,並用清楚的方式呈現解答。例如,若你詢問「加州今夏的用電需求是否會高於去年?」,AI將自動搜尋最新數據、建立模型預測、製作視覺化圖表並完整說明其推導過程。 兩種模型配置,滿足不同應用需求。

✦o3:OpenAI目前最強的推理模型o3擁有頂尖的數學、程式設計、科學與視覺理解能力,適用於需要深度推理與高複雜度處理的情境。

[廣告]請繼續往下閱讀...

✦o4-mini:雖然規模較小,但在效能上表現亮眼,特別是在常見數理與圖像任務中遠勝同級模型,適合需要快速反應與高吞吐量的應用場景。

✦開源好消息:開發者專用工具Codex CLI登場,此次OpenAI也同步推出面向開發者的免費開源工具「Codex CLI」,讓程式開發者能直接在終端機中與AI協作,例如上傳截圖或程式草圖後,讓AI協助補全、修正或理解本地代碼邏輯。 Codex CLI已於GitHub開源,並推出總額百萬美元的開發補助計畫,提供API使用額度,鼓勵全球開發者創造創新應用。

儘管新模型功能強大,但也引發部分資安專家的關注。第三方安全機構表示,測試中發現o3曾在明令禁止使用某工具的情況下,仍私下調用該工具進行推理。對此,OpenAI表示已強化安全監控機制,並持續優化系統行為的可解釋性與透明度。 即日起,訂閱ChatGPT Plus、Pro與Team方案的用戶即可使用o3與o4-mini模型,一般用戶也能免費試用o4-mini的基本功能。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

大陸粉絲中文喊「我愛你」  GD冷回:這裡是韓國

大陸粉絲中文喊「我愛你」  GD冷回:這裡是韓國

【最溫柔的守護】新竹警察默默護送孩子過馬路 暖到網友眼眶濕濕的QQ

【最溫柔的守護】新竹警察默默護送孩子過馬路 暖到網友眼眶濕濕的QQ

John Cena結束選手生涯! 23年WWE摔角傳奇正式退役

John Cena結束選手生涯! 23年WWE摔角傳奇正式退役

Lady Gaga舞者摔下台  她中斷演出「衝上前關心」

Lady Gaga舞者摔下台  她中斷演出「衝上前關心」

泰勒絲發61億台幣獎金 員工打開親筆信掩面淚崩

泰勒絲發61億台幣獎金 員工打開親筆信掩面淚崩

讀者迴響

ChatGPT能免費使用嗎?

有免費版本,適合多數基本用途。若升級付費(如 ChatGPT Plus),可使用更強大的GPT-4模型,回應速度快、理解力更好、支援圖片與檔案分析。免費用戶功能有限,無法使用進階工具。

最夯影音

更多

熱門快報

回到網頁頂端