精準修圖＋角色一致　Google Gemini 2.5影像模型正式登場

2025年08月27日 11:03

▲Google Gemini 2.5影像模型正式登場。（圖／Google）

記者吳立言／綜合報導

Google宣布推出最新影像生成與編輯模型Gemini 2.5 Flash Image（代號nano-banana），GoogleAI Studio負責人Logan Kilpatrick在社群平台X發文指出，Gemini 2.5 Flash Image不僅能保持角色外觀的一致性，還能進行創意編輯，並利用模型的世界知識生成更精準的結果。該模型已可在Gemini App與Google AI Studio免費試用，若透過API使用，費用與先前版本相同。

[廣告] 請繼續往下閱讀.

根據官方說明，Gemini 2.5 Flash Image每百萬輸出Token收費30美元，每張圖約1,290個輸出Token，折合每張圖約花費0.039美元。Google同時更新了AI Studio的建置模式，開發者可直接以自然語言快速打造影像應用，或將程式碼同步至GitHub。
新版模型特點包括：
角色一致性：可將同一角色或產品放入不同場景，確保外觀維持一致，適用於品牌素材或多角度展示。
語意編輯：使用者能以文字指令模糊背景、去除物件、改變姿勢或為黑白照片上色。
多圖融合：能理解並合併多張圖片，例如替商品換場景或改造空間設計。
世界知識：能理解手繪圖與現實語境，支援互動式教育與知識應用。
Google表示，所有生成或編輯的圖片都將內建SynthID隱形浮水印，以標示AI來源。合作夥伴包含OpenRouter.ai與fal.ai，讓該模型能更快觸及廣大開發者社群。
目前Gemini 2.5 Flash Image已開放預覽，預計數周後進入穩定版。