
▲Google I/O 前夕再有 Veo4 爆料。(圖/X)
記者吳立言/綜合報導
Google I/O 2026 大會前夕,網路上再度流出關於新一代影片生成模型「Veo 4」與「Gemini Omni」的資訊。根據曝光內容,Google 似乎正進一步強化 AI 影片生成能力,目標不再只是單一鏡頭短片,而是朝向更完整、多視角的場景生成發展。
消息指出,Veo 4 最大升級之一,可能是支援「動態鏡頭切換」。AI 可在同一段影片中,自然切換不同攝影機視角,同時維持人物、場景與動作的一致性,讓生成內容更接近電影或真人拍攝效果。
AI 影片開始邁向「導演級」運鏡
流出的展示內容顯示,Veo 4 能在短短數秒內,自動完成多角度鏡頭切換,包括近景、遠景與不同方向的運鏡轉換,且人物外觀與場景結構大致保持穩定。這也代表 AI 影片技術,正逐漸從「單鏡頭動畫」進化為具備敘事能力的影片生成系統。
除了畫面外,音訊部分也傳出有大幅提升。洩密內容提到,新模型可能已能原生生成同步對話、環境音效與背景音樂,不再需要後製額外合成。部分展示甚至出現人物口型與語音同步的效果。
Google I/O leaks: Veo 4 / Gemini Omni
— Pankaj Kumar (@pankajkumar_dev) May 16, 2026
- Veo 4 is pushing beyond simple single camera AI clips into full multi-angle scene generation
- Biggest upgrade seems to be dynamic camera switching where scenes can change perspectives naturally while maintaining overall coherence
- Audio… pic.twitter.com/kmEiasXdH4
影片長度可能提升至 9 秒
另一項曝光資訊則顯示,Veo 4 生成影片長度可能提升至約 9 秒,解析度則為 720p。雖然與傳統影片相比仍偏短,但相較前代模型已有明顯進步。
不過,流出的範例仍可看到部分連續性問題,例如角色動作偶爾出現不自然變化,或場景細節在鏡頭切換後略有偏差。但整體而言,多鏡頭同步生成能力仍被不少觀察者視為目前 AI 影片領域的重要突破。
若洩密資訊屬實,Veo 4 將可能成為目前市場上少數具備「多鏡頭敘事生成」能力的模型之一。外界預期,Google 可能會在即將登場的 Google I/O 2026 上,正式公開更多 Veo 4/Gemini Omni 細節。
