
▲Nano Banana2搭載Gemini3.1 Flash Image核心架構。(示意圖/取自免費圖庫Pexels)
記者楊庭蒝/綜合報導
Google在本周正式發表全新影像生成模型Nano Banana2,搭載Gemini3.1 Flash Image核心架構,旨在以更快的生成速度與更精細的畫質,全面取代現有的Pro版本。這款新模型不僅承襲了先前Nano Banana Pro強大的世界知識與推理能力,更將生成效率提升至閃電等級,標誌著Google在AI圖像領域的戰略重心轉向普及化與高效率。
Nano Banana2在技術規格上有顯著突破,支援最高4K解析度輸出,並顯著強化了細節紋理與指令遵循能力,確保生成的最終影像能精確符合使用者的構想。最引人注目的新功能為「多角色一致性」,可在單一工作流程中維持最多5個角色的外觀特徵一致,這對於需要製作分鏡腳本或連貫視覺故事的創作者而言,是極具競爭力的應用。此外,該模型大幅優化了文字渲染能力,能精確生成行銷素材或賀卡所需的文字排版,並具備「圖像中定位」功能,允許使用者在圖片中生成或直接翻譯多種語言文字。
為了滿足專業開發者的需求,Nano Banana2提供了更多操控空間,使用者可根據任務複雜度調整模型的推理等級,從預設的最小化推理到高動態推理模式,並支援4:1、1:4、8:1與1:8等多元的圖像長寬比。在解析度選擇上,除了標準的1K至4K外,也新增了512px的支援,讓應用彈性更為廣泛。
在商業策略與部署方面,Nano Banana2展現了極高的性價比。其圖像輸出成本僅為每百萬個token60美元,相較於前代Nano Banana Pro的120美元,成本直接大幅削減50%。以單張4K圖片計算,產製費用從0.24美元降至0.151美元。目前Nano Banana2已全面部署於Google旗下生態系,包括Gemini App、Google搜尋的AI模式、Google Lens、Flow AI及Google Ads等。開發人員則可透過Google AI Studio的API或Vertex AI平台進行存取,同時支援Google Antigravity與Firebase等後端開發環境。
透過將頂規引擎整合進輕量化的Flash架構,Google試圖解決過去Pro模型運算成本高昂且生成速度緩慢的痛點。Nano Banana2的問世不僅象徵著AI繪圖工具進入「速度與畫質兼具」的新時代,也預示著高階影像生成技術將全面走入大眾市場,成為日常創意與商務應用的核心動力。
