Google推出最強模型Nano Banana Pro 4K+精準排字、專業視覺一次生成

▲▼Nano Banana Pro。(圖/Google DeepMind)

記者吳立言/綜合報導

Google 在美國時間20日宣布推出 Nano Banana Pro(Gemini 3 Pro Image),主打更高解析度與更精準的影像生成、編輯能力,提供開發者打造新一代多模態應用的工具。這款新模型延續今年稍早推出的 Nano Banana(Gemini 2.5 Flash Image),並大幅提升文字呈現、真實感與邏輯處理能力。

根據 Google DeepMind 公布的消息,Nano Banana Pro 目前已在 Google AI Studio 與 Vertex AI 以付費預覽形式逐步開放。官方指出,這款模型建立在 Gemini 3 Pro 架構之上,具備更強的世界知識推理能力,並支援與 Google Search 的 grounding 功能,能根據使用者 prompt 取回即時資訊,生成更貼近真實的影像內容。

▲▼Nano Banana Pro。(圖/Google DeepMind)

[廣告]請繼續往下閱讀...

在影像品質與控制力上,Nano Banana Pro 支援 2K、4K 解析度,並能精確調整光線、鏡頭、焦距、色調與構圖等參數,協助開發者製作近乎商規等級的視覺素材。官方強調,該模型可維持最多五位角色的高度一致性、支援多達十四張輸入圖整合,也能用於建立商品示意、廣告組合與多元素合成等情境。

▲▼Nano Banana Pro。(圖/Google DeepMind)

文字渲染能力也是此次升級重點。相比先前的 2.5 Flash Image,新模型能更準確生成標示、LOGO 或漫畫分鏡中的文字,並忠實保留原始風格。同時,它也能處理語言在地化情境,例如翻譯包裝文字、菜單、海報資訊等,維持版面與風格不變。

▲▼Nano Banana Pro。(圖/Google DeepMind)

在知識應用方面,Nano Banana Pro 能生成更貼近實物的科學圖像、歷史資訊圖表等內容,並支援以 prompt 自動建立教育資訊圖、教學用圖或內容行銷素材。此外,Google 也在模型中整合 SynthID 浮水印,確保所有生成內容具備清楚的 AI 來源標示。

Google 表示,開發者可透過一系列示範 App 體驗新模型,包括 UI 設計生成、漫畫製作器、商品視覺 Mockup、自動化資訊圖工具等,更可直接使用 Gemini API 進行整合。官方同時提供使用手冊、提示詞指南與討論區,方便開發者交流與調整使用方式。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

青龍獎/李光洙.李先彬青龍獎放閃 金宇彬忍不住笑場XD

青龍獎/李光洙.李先彬青龍獎放閃 金宇彬忍不住笑場XD

【盧秀燕怒了!】賓賓哥校園違規直播 怒批「白目」:永不錄用

【盧秀燕怒了!】賓賓哥校園違規直播 怒批「白目」:永不錄用

【沒人發現就不是偷喝】萌娃趁機狂吸飲料!高度超剛好

【沒人發現就不是偷喝】萌娃趁機狂吸飲料!高度超剛好

青龍獎/玄彬奪影帝!緊擁妻子放閃 孫藝真獲影后…甜喊他本名

青龍獎/玄彬奪影帝!緊擁妻子放閃 孫藝真獲影后…甜喊他本名

【大哥的女兒就是狂!】新娘不丟扇子改丟「玩具步槍」

【大哥的女兒就是狂!】新娘不丟扇子改丟「玩具步槍」

讀者迴響

Midjourney是什麼?

Midjourney是AI影像生成工具,只需輸入文字就能畫出照片級圖片,適合創作、設計參考使用。

最夯影音

更多

熱門快報

回到網頁頂端