照片一鍵變短片！Veo 3升級上線　支援音效描述並全球同步開放

2025年07月11日 10:39

▲Veo3模型。（圖／Google）

記者吳立言／綜合報導

Google宣布旗下AI影片生成模型Veo 3正式支援「影像轉影片（image-to-video）」功能，並透過Gemini App向全球超過150個國家的用戶開放使用，進一步擴展AI創作應用的場景。

[廣告] 請繼續往下閱讀.

Veo 3是Google於5 月I/O開發者大會發表的最新影片生成模型，能將文字、影像等多模態輸入轉換為具時間性與空間感的短片。此次新增的影像轉影片功能，允許Gemini Ultra與Pro用戶上傳單張照片，搭配提示詞與音效描述，即可生成長度約8秒的動畫影片。用戶完成後可選擇下載或直接分享至社群平台。

操作流程簡單直覺，用戶僅需在Gemini App的工具選單中選擇「影片」項目，接著上傳一張照片並輸入場景敘述與背景聲音提示，系統即會以Veo 3模型進行生成。Google鼓勵用戶發揮創意，不僅能讓日常物件或自然風景動起來，也能賦予繪畫、童話故事或幻想概念全新動態詮釋。官方舉例指出，有用戶創作了如「模擬切開冷卻熔岩聲音的ASMR影片」等作品，顯示AI在創意應用上的多樣可能性。

[廣告] 請繼續往下閱讀..

根據Google統計，自Veo 3上線七週以來，Gemini App與旗下Flow影片創作工具已合計生成超過4,000萬支影片。該項功能現已在Flow工具同步支援，為創作者提供更多跨平台操作彈性。

為保障內容可信度與生成透明性，所有透過Veo 3產出的影片均會加註可見「Veo」浮水印，並嵌入由DeepMind開發的SynthID數位水印技術。Google也透過內部「紅隊測試」機制，主動辨識潛在風險情境，並持續調整政策以防止濫用。用戶可對生成影片給予按讚或倒讚等回饋，作為未來系統優化的重要依據。

目前每位用戶每日最多可生成3支影像影片，未使用之額度不會累積。Google表示，未來將持續拓展使用場域，並強化安全機制與創作體驗。