
▲面對AI造成的流量雪崩,創用CC罕見表態支持「付費爬取」。未來AI機器人抓資料恐得先付費,盼藉此幫創作者找回營收,避免優質內容枯竭。(圖/pixabay)
記者萬玟伶/綜合報導
隨著AI熱潮席捲台灣,從ChatGPT到各類生成式AI工具已成為許多人工作與生活的必備幫手。然而,當大眾習慣直接向AI詢問答案時,原本辛苦產出內容的部落客、新聞網站與創作者卻面臨「流量雪崩」的危機。為了不讓網路內容枯竭,一直以來提倡「開放共享」的國際組織「創用CC」(Creative Commons),近期罕見表態支持一項新技術,那就是讓AI機器人(如網路爬蟲)「付費」才能讀取網站內容。
網站流量被AI「白嫖」?
根據外媒報導,過去在Google搜尋引擎稱霸的時代,網站與爬蟲機器人之間有一種默契,網站免費讓爬蟲抓取資料,換取在搜尋結果曝光,進而賺取點擊與廣告費。
但現在情況不同了。當用戶問AI問題,AI讀完資料後直接吐出懶人包,使用者根本不需要點進原始網站。這種「只取不予」的模式,讓許多依賴流量生存的網站面臨倒閉風險,或者被迫築起高牆(付費牆)鎖住內容。
什麼是「付費爬取」?
為了扭轉這個劣勢,創用CC宣布「審慎支持」一種被稱為「付費爬取」(pay-to-crawl)的新機制。
簡單來說,這就像是在網站入口設了一個收費站。由Cloudflare等網路公司主導的這項技術,目標是當AI公司的爬蟲程式想要進來「學習」或「抓資料」訓練模型時,必須先付費才能通過。
創用CC在官方部落格中坦言,如果能負責任地實施,這套機制或許能讓網站經營者獲得收入,維持內容產出,避免所有好文章最後都因為沒錢賺而消失,或是被鎖在昂貴的付費會員制背後。
不只救大媒體,也要幫小部落客
目前,像OpenAI這樣的AI巨頭,已經私下與《紐約時報》、康泰納仕(Condé Nast)等大型媒體集團簽署了昂貴的授權合約。但對於成千上萬的中小型網站、個人部落客來說,根本沒有籌碼去跟AI公司談判。
「付費爬取」系統的出現,就是希望建立一套標準化的市集,讓小型發布商也能自動化地收到AI的「過路費」,彌補流量下滑的損失。
創用CC的底線「不能擋住做研究的人」
不過,一向提倡知識共享的創用CC也提出了警告,支持收費不代表支持壟斷。他們強調,這套系統必須遵守幾個原則:
1. 不能變成預設值:不應強迫所有網站都必須收費。
2. 保留公益通道:對於研究人員、非營利組織、教育工作者,應該要能免費存取資料,不能因為沒錢就被擋在門外。
3. 要有彈性:系統應該允許限制流量(throttling),而不是只有「完全封鎖」或「完全開放」兩種極端。
科技巨頭與新創紛紛進場
目前市場上已經動作頻頻,除了Cloudflare,微軟(Microsoft)也正在打造給出版商的AI市集,一些新創公司如ProRata.ai和TollBit也開始提供類似服務。
此外,科技界也推出了一種名為「真簡易授權」(RSL)的新標準,獲得了Yahoo等大公司的支持,這套標準可以更精細地規定爬蟲「可以看哪裡、不能看哪裡」,而不是粗暴地直接封鎖。創用CC也已宣布支持這項標準,希望能為AI時代的版權大戰,找到一條共存的出路。
