
▲大英百科全書向OpenAI提起訴訟。(圖/取自免費圖庫Pexels)
記者吳立言/綜合報導
知名出版機構《大英百科全書》與《韋氏字典》近日正式對 OpenAI 提起訴訟,指控其在未經授權情況下,大量使用受版權保護的內容訓練大型語言模型(LLM),構成「大規模侵權」。
根據訴狀內容,《大英百科全書》表示其擁有近 10 萬篇線上文章的版權,這些內容疑似遭到抓取並用於 AI 訓練資料,且未取得任何授權或支付費用。
生成內容涉「逐字重現」引發爭議
除了訓練資料來源外,訴訟也指出,OpenAI 在生成回應時,可能出現「完整或部分逐字重現」原始內容的情況,進一步侵犯著作權。同時,《大英百科全書》也質疑 OpenAI 在 ChatGPT 使用的 RAG(檢索增強生成)技術中,會即時抓取並利用其資料庫內容,認為此舉同樣違反相關法規。
幻覺錯誤與商標法問題浮現
訴訟另指出,AI 常見的「幻覺(hallucination)」問題,也可能涉及法律風險。OpenAI 被指控有時會生成錯誤資訊,卻錯誤標註來源為其內容,這可能違反美國《蘭哈姆法案》(Lanham Act),涉及商標與品牌誤導。
指 AI 衝擊內容產業收益
訴狀中強調,ChatGPT 類服務會直接回應使用者問題,導致使用者不再造訪原始網站,進而影響出版商的流量與營收。同時《大英百科全書》也警告,若 AI 持續取代原始內容來源,可能削弱社會對高品質資訊的取得能力。
多家媒體接連提告 法律仍未定論
這起訴訟並非個案。包括《紐約時報》及多家北美媒體與出版集團,近期也陸續對 OpenAI 提出類似的版權訴訟。
目前法律界仍未對「使用版權內容訓練 AI 是否違法」建立明確共識。不過,先前 Anthropic 曾在類似案件中成功主張訓練用途具「轉化性(transformative use)」,但仍因未合法取得資料來源,最終達成高達 15 億美元的集體和解。
