Gemini API「URL Context 工具」正式開放 支援PDF、圖片與程式碼文件

▲▼             。(圖/Google)

▲Gemini API的URL Context工具正式開放使用 。(圖/Google)

記者吳立言/綜合報導

Google宣布,旗下Gemini API的URL Context工具正式開放一般使用,並全面支援PDF、圖片與多種資料格式。該工具讓開發者能透過網址直接提供內容給模型分析,而不必再額外上傳檔案,進一步擴展生成式AI的應用場景。

[廣告] 請繼續往下閱讀.

Google表示,Gemini模型雖具備龐大知識庫,但並無直接上網功能,一般需透過Google Search檢索最新資料。URL Context工具則可深入讀取指定網頁或檔案的完整內容,搭配搜尋結果,形成更完整的上下文支援,有助於進行多步驟推理與任務處理。

此次更新後,工具支援範圍大幅擴充,包括:

PDF文件:可解析文字、表格與結構,適用於報告、學術論文與手冊。

圖片:支援PNG、JPEG、BMP、WebP,可理解圖表與示意圖。

[廣告] 請繼續往下閱讀..

資料與程式檔案:涵蓋HTML、JSON、XML、CSV、RTF、CSS、JavaScript等格式。

Google 強調,URL Context工具已準備好大規模商用,費用依不同Gemini模型的輸入Token計算,成本透明可控。

目前已有多個平台導入測試,包括:

Gemini CLI:透過web-fetch指令快速抓取網頁內容,支援摘要、翻譯與資訊抽取。

[廣告] 請繼續往下閱讀...

Gladly.ai:客戶服務平台將用戶網站連結交由Gemini分析,讓客服人員能即時提供更準確的產品與服務資訊。

Google也同步釋出Python範例程式碼,並於Google AI Studio「Tools」選單提供操作入口,方便開發者快速上手。