Google Genie 3實測曝光 世界模型如何讓使用者走進AI生成世界

▲▼Google展示Genie 3實測截圖。(圖/Google)

▲Google 展示 Genie 3 效果截圖。(圖/Google)

記者吳立言/綜合報導

Google 今(30日)宣布開放旗下世界模型 Google Genie 3 的實際體驗後,多段操作影片也已在社群平台流傳。不同於過往僅能生成圖片或影片的 AI 模型,Genie 3 展現的是可即時互動、具備空間與物理邏輯的「生成世界」,也讓「世界模型」概念被大量討論。

從多名用戶分享的畫面來看,Genie 3 能即時生成可操作的 3D 場景,使用者可控制角色移動、鏡頭視角,並與環境產生連續互動。角色在場景中的位置、動作與物件關係能被持續保留,不會因畫面更新而重置,顯示模型已具備基本的世界狀態記憶能力。

[廣告]請繼續往下閱讀...

為何被稱為「世界模型」

所謂世界模型,並非單次生成畫面,而是 AI 在內部維持一套持續運作的世界結構,包含空間配置、物理規則與角色狀態。這使模型能在使用者不斷輸入操作時,即時更新世界狀態,而非每一影格重新生成。

從目前曝光的 Genie 3 體驗來看,角色移動、跳躍與碰撞皆遵循一致的物理邏輯,場景也能在數分鐘內維持穩定,這正是其與傳統 AI 影片模型最大的差異。

建模與物理表現是關鍵進展

除一般用戶外,學界與產業人士也對 Genie 3 表達關注。美國賓州大學華頓商學院教授 Ethan Mollick 指出,Genie 3 在世界建模與物理模擬上的表現,是生成式 AI 的明顯進步,但仍屬早期階段,尚有可優化空間。

Google Labs 也在官方 X 發文介紹 Project Genie 的設計方向,強調其核心在於讓使用者探索由 AI 即時生成、可不斷延展的虛擬世界。Google Labs 相關負責人 Josh Woodward 亦表示,Genie 3 仍是實驗性工具,但已展現生成式 AI 從內容製作走向互動體驗的可能性。

不只是影片生成 AI 開始「模擬世界」

Genie 3 之所以受到關注,並不在於畫面精緻度,而在於 AI 開始具備「持續模擬世界」的能力。這類世界模型被外界視為未來互動遊戲、虛擬訓練與沉浸式內容的重要基礎技術,也可能成為生成式 AI 下一階段的競爭重點。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

讀者迴響

Midjourney是什麼?

Midjourney是AI影像生成工具,只需輸入文字就能畫出照片級圖片,適合創作、設計參考使用。

最夯影音

更多

熱門快報

回到網頁頂端