
▲YouTube。(圖/取自免費圖庫Pexels)
記者吳立言/綜合報導
AI 訓練資料版權爭議持續升溫。最新消息指出,蘋果、亞馬遜與 OpenAI 遭多個 YouTube 創作者提起集體訴訟,指控三家公司涉嫌繞過 YouTube 的反爬蟲與技術保護措施,大規模下載平台影片內容,並進一步用於訓練自家生成式 AI 影音模型,案件焦點直指美國《數位千禧年著作權法》(DMCA)中的反規避條款。
根據外媒報導,Ted Entertainment、MrShortGameGolf 與 Golfholics 等三個 YouTube 頻道已分別向美國法院提出訴訟,並希望以集體訴訟形式,代表所有遭遇相同情況的創作者共同求償。原告指出,相關證據來自蘋果研究團隊先前公開的論文,文中提及其影片生成模型曾使用 Panda-70M 資料集進行訓練,而這也成為本案最關鍵的證據之一。
Panda-70M 成為訴訟核心
本次爭議的核心,落在 Panda-70M 這套大型影片資料集。根據訴訟與相關公開資料,Panda-70M 由約 380 萬支 YouTube 影片拆分成超過 7,000 萬個片段組成,並搭配文字描述,用於訓練文字轉影片模型。
原告主張,雖然資料集表面上更像是一套索引與片段對照系統,但每一次擷取特定片段,都必須重新存取 YouTube 原始影片,並依照時間戳記截取指定內容。換句話說,只要取得一個新片段,就可能構成一次新的技術規避與下載行為,因此不只是單純引用網址,而是實際涉及對平台保護機制的繞過。
訴訟文件更指出,原告頻道內容在資料集中被大量收錄,其中 Ted Entertainment 旗下內容被標記於 438 部影片中,Golfholics 也有 62 部影片遭納入,顯示其內容已被系統性地納入 AI 訓練流程。
原告要求禁制令與最高額賠償
此次訴訟主張的重點,不僅是未經授權使用影片內容,更聚焦於被告涉嫌故意規避 YouTube 技術保護措施。根據美國 DMCA 第 1201 與 1203 條,即便影片本身可被公開觀看,只要透過非授權方式繞過平台的技術限制,仍可能構成違法。  因此,原告除要求法院正式認定案件為集體訴訟外,也請求法官確認蘋果、亞馬遜與 OpenAI 屬於故意侵權,並爭取法定最高額賠償、律師費與訴訟成本。
同時,原告也進一步要求法院頒布臨時與永久禁制令,禁止三家公司持續使用相關 YouTube 影片內容進行 AI 模型訓練,並停止任何協助、縱容或延伸使用這批資料的行為。
若法院最終支持這項禁制令,可能直接衝擊三家公司未來在影片生成模型上的資料來源與訓練流程。
AI 影音訓練資料戰線再擴大
值得注意的是,這起案件並非單一事件。相同原告近月來已陸續對 Meta Platforms, Inc.、NVIDIA Corporation、ByteDance Ltd. 與 Snap Inc. 提出類似訴訟,形成一波針對 AI 影音訓練資料來源的法律攻勢。
這也代表生成式 AI 的版權爭議,正從過去聚焦於「合理使用」的文字與圖片訓練,進一步延伸到影音資料與平台技術保護措施層面。若法院最終站在創作者一方,未來科技公司使用公開影音內容訓練 AI 時,將更難以僅靠「公開可見」作為抗辯理由,而必須更嚴格處理授權與資料取得流程。
隨著文字生成、圖片生成進一步走向影片生成,AI 模型對高品質影音資料的需求正快速放大,而 YouTube 無疑是最具價值的內容來源之一。此次蘋果、亞馬遜與 OpenAI 同時遭到點名,不僅讓 Panda-70M 成為業界焦點,也讓 AI 訓練資料是否合法取得,再次成為全球科技產業必須正面回應的核心問題。這場訴訟結果,極可能成為未來 AI 影音模型發展的重要法律分水嶺。
