照片一鍵變短片!Veo 3升級上線 支援音效描述並全球同步開放

▲▼Veo3。(圖/Google)

▲Veo3模型。(圖/Google)

記者吳立言/綜合報導

Google宣布旗下AI影片生成模型Veo 3正式支援「影像轉影片(image-to-video)」功能,並透過Gemini App向全球超過150個國家的用戶開放使用,進一步擴展AI創作應用的場景。

[廣告] 請繼續往下閱讀.

Veo 3是Google於5 月I/O開發者大會發表的最新影片生成模型,能將文字、影像等多模態輸入轉換為具時間性與空間感的短片。此次新增的影像轉影片功能,允許Gemini Ultra與Pro用戶上傳單張照片,搭配提示詞與音效描述,即可生成長度約8秒的動畫影片。用戶完成後可選擇下載或直接分享至社群平台。

操作流程簡單直覺,用戶僅需在Gemini App的工具選單中選擇「影片」項目,接著上傳一張照片並輸入場景敘述與背景聲音提示,系統即會以Veo 3模型進行生成。Google鼓勵用戶發揮創意,不僅能讓日常物件或自然風景動起來,也能賦予繪畫、童話故事或幻想概念全新動態詮釋。官方舉例指出,有用戶創作了如「模擬切開冷卻熔岩聲音的ASMR影片」等作品,顯示AI在創意應用上的多樣可能性。

[廣告] 請繼續往下閱讀..

根據Google統計,自Veo 3上線七週以來,Gemini App與旗下Flow影片創作工具已合計生成超過4,000萬支影片。該項功能現已在Flow工具同步支援,為創作者提供更多跨平台操作彈性。

為保障內容可信度與生成透明性,所有透過Veo 3產出的影片均會加註可見「Veo」浮水印,並嵌入由DeepMind開發的SynthID數位水印技術。Google也透過內部「紅隊測試」機制,主動辨識潛在風險情境,並持續調整政策以防止濫用。用戶可對生成影片給予按讚或倒讚等回饋,作為未來系統優化的重要依據。

目前每位用戶每日最多可生成3支影像影片,未使用之額度不會累積。Google表示,未來將持續拓展使用場域,並強化安全機制與創作體驗。