
▲實測Nano Banana Pro漫畫翻譯。(圖/Gemini生成)
記者吳立言/綜合報導
Google 今(21日)正式發布最新影像模型 Nano Banana Pro。官方稱這款模型具備「世界知識」與「邏輯推理」能力,不再只是單純的繪圖工具。為了驗證其真實實力,記者進行了多項實測,涵蓋漫畫翻譯、文化設計到商務合約處理,結果令人驚艷。
[廣告] 請繼續往下閱讀.
語言與視覺的完美融合:漫畫翻譯與 Logo 替換
過去,AI 在處理圖片中文字時,常面臨「破壞畫面」的問題。在此次實測中,我們提供了一頁英文漫畫,並要求模型將其翻譯為中文。Nano Banana Pro 不僅準確地翻譯了對話內容,還自動去除了原文,並選擇與漫畫風格相符的字體進行嵌字,確保氣泡框和背景完好無損。
此外,我們還測試了常見的電商需求:「將帽子上的英文 Logo 替換為韓文及日文」。模型成功識別了帽子布料的紋理及光影變化,生成的日韓文 Logo 看起來就像是原本繡在帽子上一樣,毫無修圖痕跡。
[廣告] 請繼續往下閱讀..
知識庫與設計力的結合:植物圖卡與紅樓夢人物關係圖
除了圖像處理,Nano Banana Pro 的「識別能力」也表現出色。記者上傳家中「圓葉山烏龜(Stephania erecta)」的照片,並要求生成介紹圖卡。模型不僅準確識別了植物品種,還自動生成了包含產地及照護方式的資訊圖表,排版美觀,節省了設計師尋找資料及排版的時間。
[廣告] 請繼續往下閱讀...
在更具挑戰性的文化測試中,我們要求生成「符合《紅樓夢》風格的人物關係圖」。這項指令考驗了 AI 對《紅樓夢》文本的理解及複雜圖表的邏輯構成。結果顯示,AI 成功捕捉了原著人物的神韻與服飾細節,人物之間的關聯線條也清晰、合乎邏輯。
商務應用的實用工具:合約簽名提取
對於行政人員而言,這項功能無疑是一大助力。在實測中,我們要求模型「識別便條紙上的簽名並提取,放置於另一份供貨人合約欄位」。Nano Banana Pro 精準地將手寫簽名從背景中分離,並完美地融合進新合約的簽名欄中,邊緣處理乾淨俐落,顯著提高了文書處理的效率。
Nano Banana Pro 展現了從「生成」進化到「精準編輯」與「理解」的強大能力。目前該模型已在全球 Gemini 應用程式中陸續推出。
一般用戶:享有免費試用額度。
學生優惠:台灣大學生即日起至 12 月 9 日可申請 Google AI Pro 學生方案,享一年免費試用。
專業訂閱:Google AI Ultra 用戶生成的圖像將自動移除浮水印,適合商業使用。
這款工具的出現,無疑將為設計師、電商賣家以及文書工作者帶來前所未有的效率革命。儘管 Nano Banana Pro 展示出強大的圖像處理和文本識別能力,但在實際應用中,使用者仍須高度重視版權及隱私保護。在處理涉及第三方創作或受保護內容的圖片和文件時,必須遵守相關法律法規,確保未侵犯他人著作權或個人隱私。