
▲Google 展示 Genie 3 效果截圖。(圖/Google)
記者吳立言/綜合報導
Google 今(30日)宣布開放旗下世界模型 Google Genie 3 的實際體驗後,多段操作影片也已在社群平台流傳。不同於過往僅能生成圖片或影片的 AI 模型,Genie 3 展現的是可即時互動、具備空間與物理邏輯的「生成世界」,也讓「世界模型」概念被大量討論。
從多名用戶分享的畫面來看,Genie 3 能即時生成可操作的 3D 場景,使用者可控制角色移動、鏡頭視角,並與環境產生連續互動。角色在場景中的位置、動作與物件關係能被持續保留,不會因畫面更新而重置,顯示模型已具備基本的世界狀態記憶能力。
Because your pet already thinks the universe revolves around them… why not create one that actually does?
— Google Labs (@GoogleLabs) January 29, 2026
With Project Genie, upload a picture of your pet and have them explore infinitely diverse worlds.
Learn more: https://t.co/4BFYHSj8C3 pic.twitter.com/Guvq1krONM
為何被稱為「世界模型」
所謂世界模型,並非單次生成畫面,而是 AI 在內部維持一套持續運作的世界結構,包含空間配置、物理規則與角色狀態。這使模型能在使用者不斷輸入操作時,即時更新世界狀態,而非每一影格重新生成。
從目前曝光的 Genie 3 體驗來看,角色移動、跳躍與碰撞皆遵循一致的物理邏輯,場景也能在數分鐘內維持穩定,這正是其與傳統 AI 影片模型最大的差異。
建模與物理表現是關鍵進展
除一般用戶外,學界與產業人士也對 Genie 3 表達關注。美國賓州大學華頓商學院教授 Ethan Mollick 指出,Genie 3 在世界建模與物理模擬上的表現,是生成式 AI 的明顯進步,但仍屬早期階段,尚有可優化空間。
Google Labs 也在官方 X 發文介紹 Project Genie 的設計方向,強調其核心在於讓使用者探索由 AI 即時生成、可不斷延展的虛擬世界。Google Labs 相關負責人 Josh Woodward 亦表示,Genie 3 仍是實驗性工具,但已展現生成式 AI 從內容製作走向互動體驗的可能性。
不只是影片生成 AI 開始「模擬世界」
Genie 3 之所以受到關注,並不在於畫面精緻度,而在於 AI 開始具備「持續模擬世界」的能力。這類世界模型被外界視為未來互動遊戲、虛擬訓練與沉浸式內容的重要基礎技術,也可能成為生成式 AI 下一階段的競爭重點。
