Gemini API「URL Context 工具」正式開放　支援PDF、圖片與程式碼文件

2025年08月19日 16:08

▲Gemini API的URL Context工具正式開放使用。（圖／Google）

記者吳立言／綜合報導

Google宣布，旗下Gemini API的URL Context工具正式開放一般使用，並全面支援PDF、圖片與多種資料格式。該工具讓開發者能透過網址直接提供內容給模型分析，而不必再額外上傳檔案，進一步擴展生成式AI的應用場景。

[廣告] 請繼續往下閱讀.

Google表示，Gemini模型雖具備龐大知識庫，但並無直接上網功能，一般需透過Google Search檢索最新資料。URL Context工具則可深入讀取指定網頁或檔案的完整內容，搭配搜尋結果，形成更完整的上下文支援，有助於進行多步驟推理與任務處理。

此次更新後，工具支援範圍大幅擴充，包括：

PDF文件：可解析文字、表格與結構，適用於報告、學術論文與手冊。

圖片：支援PNG、JPEG、BMP、WebP，可理解圖表與示意圖。

[廣告] 請繼續往下閱讀..

資料與程式檔案：涵蓋HTML、JSON、XML、CSV、RTF、CSS、JavaScript等格式。

Google 強調，URL Context工具已準備好大規模商用，費用依不同Gemini模型的輸入Token計算，成本透明可控。

目前已有多個平台導入測試，包括：

Gemini CLI：透過web-fetch指令快速抓取網頁內容，支援摘要、翻譯與資訊抽取。

[廣告] 請繼續往下閱讀...

Gladly.ai：客戶服務平台將用戶網站連結交由Gemini分析，讓客服人員能即時提供更準確的產品與服務資訊。

Google也同步釋出Python範例程式碼，並於Google AI Studio「Tools」選單提供操作入口，方便開發者快速上手。