
▲Google推出Project Genie實驗模型。(圖/Google)
記者吳立言/綜合報導
Google 今(30日)推出名為 Project Genie 的實驗性研究原型,這是一款由其世界模型 Genie 3 驅動的互動式系統,能依照使用者提示,即時生成可探索的虛擬世界。官方指出,Project Genie 即日起率先開放給美國地區、年滿 18 歲的 Google AI Ultra 訂閱用戶體驗。
根據官方說明,Project Genie 建立在 Google DeepMind 近年持續投入的「世界模型(world model)」研究之上,目標是讓 AI 能理解並模擬真實世界的動態變化,進一步支援通用人工智慧(AGI)的長期發展。
世界模型即時生成 強調互動與物理模擬
Google 表示,與過去多半停留在靜態 3D 場景或預先生成內容不同,Genie 3 能在使用者移動與互動的同時,即時生成前方路徑與環境變化,並嘗試模擬現實世界中的物理行為與物件互動。這類能力被視為未來 AI 應用於機器人、動畫製作、虛擬場景建模與歷史情境重建的重要基礎。
官方也指出,建構能「在多樣真實環境中行動」的系統,是邁向 AGI 不可或缺的一環,而世界模型正是其中的核心技術。
三大核心功能 從生成到重混虛擬世界
Project Genie 目前以網頁應用形式提供,整合 Genie 3、Nano Banana Pro 與 Gemini,主打三項核心功能。首先是「世界草圖(World Sketching)」,使用者可透過文字提示,搭配生成或上傳的圖片,建立角色與場景,並在進入世界前調整視角,例如第一人稱或第三人稱。
第二是「世界探索(World Exploration)」,系統會隨著使用者的行動即時生成可行走、騎乘、飛行或駕駛的環境,並允許動態調整攝影機角度。第三則是「世界重混(World Remixing)」,使用者可在既有世界的提示基礎上延伸創作,或從官方提供的範例與隨機世界中取得靈感,完成後也能下載探索過程的影片。
實驗階段限制仍在 官方強調負責任開發
Google 也坦言,Project Genie 仍屬早期研究原型,目前生成的世界可能無法完全貼近現實,對提示的遵循度與物理模擬仍有改善空間,角色操控偶爾會出現延遲,單次生成體驗也限制在 60 秒內。此外,去年預告的部分進階功能,例如可隨探索過程改變世界狀態的事件系統,尚未納入此次原型。
官方表示,透過先行開放給進階訂閱用戶,團隊希望蒐集實際使用回饋,理解人們如何在 AI 研究與生成式媒體等領域中運用世界模型,並在未來逐步擴展至更多地區與使用者。
