Gemini Omni登場!主打「萬物生成」、影片生成支援語音互動編輯

▲▼Google I/O 2026。(圖/Google)

記者吳立言/綜合報導

 Google DeepMind 執行長哈薩比斯(Demis Hassabis)在 Google I/O 2026 活動現場正式揭曉全新影片生成模型「Gemini Omni」,並強調未來目標是實現「任何輸入生成任何輸出(anything from any input)」的多模態 AI 系統。

Gemini Omni 建立於 Google 長期投入的「世界模型(world models)」技術之上,除了支援影片生成,也導入更進一步的語音互動式編輯能力,使用者可直接透過對話修改角色、背景與畫面元素。首款版本「Gemini Omni Flash」預計今年夏季推出。

主打語音編輯 影片內容可直接對話修改

[廣告]請繼續往下閱讀...

Google 展示的內容顯示,Gemini Omni 不再只是單純文字生成影片,而是進一步整合語音、多模態理解與場景控制能力。使用者可透過口語指令,即時調整影片中的人物、背景甚至鏡頭內容,朝更自然的 AI 創作流程邁進。


哈薩比斯再談 AGI 稱距離只剩幾年

活動中,哈薩比斯再度提到 AGI(通用人工智慧)發展時程,表示距離真正的 AGI 已「只剩幾年」。這也是他近年多次公開重申的觀點。Google 近來持續加碼多模態 AI 與影片生成技術,從 Gemini、Veo 系列到此次的 Omni,皆顯示其希望建立可理解現實世界、具備長時序推理能力的 AI 模型架構。

不過,目前展示影片雖然流暢,但實際開放使用後的效果仍有待驗證。去年 Veo 發表初期,就曾出現官方展示與一般用戶實測品質落差的情況。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

孫淑媚北流開唱 公布「醫生」真面目

孫淑媚北流開唱 公布「醫生」真面目

周迅.金高銀驚喜同框 中文羞澀告白:我很喜歡妳

周迅.金高銀驚喜同框 中文羞澀告白:我很喜歡妳

黃仁勳跳〈GOLDEN〉 這真的不是AI嗎!

黃仁勳跳〈GOLDEN〉 這真的不是AI嗎!

【福利給好給滿!】韓國追星追到黃仁勳 現場尖叫+歡呼聲超熱鬧XD

【福利給好給滿!】韓國追星追到黃仁勳 現場尖叫+歡呼聲超熱鬧XD

【要收保護費!】半夜看見浪貓在約會 牠發現人類馬上來討吃XD

【要收保護費!】半夜看見浪貓在約會 牠發現人類馬上來討吃XD

讀者迴響

ChatGPT是什麼?

ChatGPT是OpenAI推出的AI聊天機器人,可幫你寫作、翻譯、寫履歷甚至陪聊天。操作簡單,適合各年齡層使用。

最夯影音

更多

熱門快報

回到網頁頂端