Google推出最強模型Nano Banana Pro 4K+精準排字、專業視覺一次生成

▲▼Nano Banana Pro。(圖/Google DeepMind)

記者吳立言/綜合報導

Google 在美國時間20日宣布推出 Nano Banana Pro(Gemini 3 Pro Image),主打更高解析度與更精準的影像生成、編輯能力,提供開發者打造新一代多模態應用的工具。這款新模型延續今年稍早推出的 Nano Banana(Gemini 2.5 Flash Image),並大幅提升文字呈現、真實感與邏輯處理能力。

[廣告] 請繼續往下閱讀.

根據 Google DeepMind 公布的消息,Nano Banana Pro 目前已在 Google AI Studio 與 Vertex AI 以付費預覽形式逐步開放。官方指出,這款模型建立在 Gemini 3 Pro 架構之上,具備更強的世界知識推理能力,並支援與 Google Search 的 grounding 功能,能根據使用者 prompt 取回即時資訊,生成更貼近真實的影像內容。

在影像品質與控制力上,Nano Banana Pro 支援 2K、4K 解析度,並能精確調整光線、鏡頭、焦距、色調與構圖等參數,協助開發者製作近乎商規等級的視覺素材。官方強調,該模型可維持最多五位角色的高度一致性、支援多達十四張輸入圖整合,也能用於建立商品示意、廣告組合與多元素合成等情境。

文字渲染能力也是此次升級重點。相比先前的 2.5 Flash Image,新模型能更準確生成標示、LOGO 或漫畫分鏡中的文字,並忠實保留原始風格。同時,它也能處理語言在地化情境,例如翻譯包裝文字、菜單、海報資訊等,維持版面與風格不變。

[廣告] 請繼續往下閱讀..

在知識應用方面,Nano Banana Pro 能生成更貼近實物的科學圖像、歷史資訊圖表等內容,並支援以 prompt 自動建立教育資訊圖、教學用圖或內容行銷素材。此外,Google 也在模型中整合 SynthID 浮水印,確保所有生成內容具備清楚的 AI 來源標示。

Google 表示,開發者可透過一系列示範 App 體驗新模型,包括 UI 設計生成、漫畫製作器、商品視覺 Mockup、自動化資訊圖工具等,更可直接使用 Gemini API 進行整合。官方同時提供使用手冊、提示詞指南與討論區,方便開發者交流與調整使用方式。