▲Veo 3.1正式登場。(圖/Google DeepMind)
記者吳立言/綜合報導
Google 於今(16日)正式發布 Veo 3.1,為旗下 AI 影片生成技術帶來全新進化,強化敘事理解、真實紋理捕捉與圖像轉影片能力。官方表示,新版本可生成更具「電影感」的畫面,並首度支援聲音生成,讓使用者能以更高自由度控制角色、場景與鏡頭延伸。
根據 Google DeepMind 產品團隊說明,Veo 3.1 在提示詞理解與視覺真實度上皆有顯著提升,能精準重現材質、光影與運動細節,從靜態圖片生成影片的表現也更穩定。這項升級同時導入多項強大功能,包括:
圖像生成影片(Ingredients to Video):可上傳多張參考圖片,指定不同角色、物體與風格,系統將整合成完整場景並自動生成聲音。
場景延展(Extend):可生成長達一分鐘以上的連續鏡頭,保持人物與背景一致,讓故事自然銜接。
首尾影格生成(Frames to Video):使用者只需提供開場與結尾影格,AI 即可自動補足中間畫面,實現自然過渡。
Veo 3.1 現已支援「多人物、多物件參考圖」整合生成,能將多張圖片合併成一個完整場景並自動加入聲音。
同時,系統新增的「場景擴展」功能,可根據前一剪輯的最後一秒自動延續動作與背景,讓影片連貫如同專業導演的鏡頭設計。另一項「A 到 B 過渡」功能則能依首尾畫面自動生成中間片段,實現自然流暢的敘事節奏。
目前,Veo 3.1 已整合至 Gemini API、Vertex AI 與 Gemini App,提供開發者與企業用戶使用。Google 強調,這是 Veo 系列迄今最強版本,標誌著 AI 影片創作正式邁入「聲畫合一」的新時代。