精準修圖+角色一致 Google Gemini 2.5影像模型正式登場

▲▼             。(圖/Google)

▲Google Gemini 2.5影像模型正式登場 。(圖/Google)

記者吳立言/綜合報導

Google宣布推出最新影像生成與編輯模型Gemini 2.5 Flash Image(代號nano-banana),GoogleAI Studio負責人Logan Kilpatrick在社群平台X發文指出,Gemini 2.5 Flash Image不僅能保持角色外觀的一致性,還能進行創意編輯,並利用模型的世界知識生成更精準的結果。該模型已可在Gemini App與Google AI Studio免費試用,若透過API使用,費用與先前版本相同。

[廣告] 請繼續往下閱讀.

根據官方說明,Gemini 2.5 Flash Image每百萬輸出Token收費30美元,每張圖約1,290個輸出Token,折合每張圖約花費0.039美元。Google同時更新了AI Studio的建置模式,開發者可直接以自然語言快速打造影像應用,或將程式碼同步至GitHub。
新版模型特點包括:
角色一致性:可將同一角色或產品放入不同場景,確保外觀維持一致,適用於品牌素材或多角度展示。
語意編輯:使用者能以文字指令模糊背景、去除物件、改變姿勢或為黑白照片上色。
多圖融合:能理解並合併多張圖片,例如替商品換場景或改造空間設計。
世界知識:能理解手繪圖與現實語境,支援互動式教育與知識應用。
Google表示,所有生成或編輯的圖片都將內建SynthID隱形浮水印,以標示AI來源。合作夥伴包含OpenRouter.ai與fal.ai,讓該模型能更快觸及廣大開發者社群。
目前Gemini 2.5 Flash Image已開放預覽,預計數周後進入穩定版。