
▲官方帳號示範 。(圖/Sora 2生成)
記者吳立言/綜合報導
OpenAI 今(1日)凌晨正式推出新一代影片生成模型「Sora 2」,在擬真度與功能上全面升級,首次支援「聲音生成」,為生成式 AI 開啟影音合一的新時代。
[廣告] 請繼續往下閱讀.
Sora 2 承接去年 2 月發布的初代版本。當時雖能生成高品質影片,但在物理動作上仍顯生硬,例如籃球反彈不自然。此次 Sora 2 對物理模擬進行了大幅優化,生成畫面更流暢、更接近真實世界。
最大亮點在於,Sora 2 不再只是「會拍影片」的 AI,它能同時生成聲音,讓內容呈現更完整。雖然 OpenAI 坦言模型仍不完善,偶有錯誤,但成果顯示更大規模的影片訓練,正在逐步逼近真實世界的完整模擬。
考量到濫用風險,OpenAI 表示所有透過 Sora 生成的影片,都會內建水印與元資料標識,並限制人像的使用必須經過本人授權。系統也會在生成階段即攔截色情、恐怖主義、自殘等不良內容,並計畫擴充人工審核團隊。
OpenAI 將 Sora 2 定位為「通往通用世界模擬器的重要一步」。公司認為,影片生成模型的進化將結合機器人智能體,加速人類社會的變革。
[廣告] 請繼續往下閱讀..