
▲全球洪水事件分布密度圖:紅色點為 GDACS 記錄的洪水事件。(圖/Google)
記者吳立言/綜合報導
Google Research 今(13日)宣布推出 Groundsource,這是一套利用 AI 模型 Gemini 從全球新聞報導中提取資訊、並轉換為可分析資料的技術框架。
Google 同時釋出首個開放資料集,內容聚焦於都市型突發洪水(urban flash floods),共收錄 260 萬筆事件紀錄,涵蓋 150 多個國家。研究團隊表示,這些資料可用於改進災害預測模型,提升各地對自然災害的預警能力。
全球洪水資料不足 成為預測難題
Google 指出,與地震等災害不同,洪水等水文氣象災害缺乏統一的全球觀測網路。
現有資料來源例如:
Global Flood Database(GFD)
Dartmouth Flood Observatory(DFO)
Global Disaster Alert and Coordination System(GDACS)
雖然能提供重要資訊,但仍存在限制,例如衛星觀測頻率、雲層遮蔽,以及多數資料僅記錄大型或持續時間較長的災害。GDACS 的資料庫約只有 1 萬筆事件紀錄,相較於 AI 模型訓練所需的大規模資料仍顯不足,特別是對於發生迅速、範圍較小的突發洪水。
Gemini 分析 80 種語言新聞
為解決資料缺口,Groundsource 會分析全球新聞、政府報告與地方公告等公開資料,將非結構化資訊轉為可用數據。
整體流程包括:
文本提取:系統透過 Google Read Aloud user-agent 取得新聞主要內容,並從 80 種語言轉換為英文。
AI 事件判定:Gemini 模型會分析報導內容,判斷是否為實際發生的洪水事件,而非僅是預測或政策討論。
時間判定:AI 會將「上週二」等相對時間與文章發布日期比對,以確定災害發生時間。
地點定位:系統辨識街區與行政區資訊,並透過 Google Maps Platform 將位置轉換為地理座標。
260 萬筆洪水紀錄 大幅超越既有資料
Groundsource 已建立 260 萬筆洪水事件紀錄,時間跨度從 2000 年至今。在人工驗證測試中,60% 的事件在時間與位置上完全準確;82% 的資料對實際研究已具實用價值。研究團隊也指出,與 GDACS 的資料比對後,Groundsource 能捕捉 85% 至 100% 的重大洪水事件,同時補足許多小型或地方性災害的紀錄。
強化洪水預測 提前 24 小時預警
透過這些新的歷史資料,研究團隊已能建立模型,在洪水發生前約 24 小時提供都市突發洪水預測。相關預測功能將整合進 Google Flood Hub 平台,擴大洪水監測與預警範圍。
Google 也指出,Groundsource 方法未來可能應用於例如乾旱、土石流、雪崩等災害,藉由將全球新聞轉換為結構化資料,研究人員希望填補長期存在的「災害資料缺口」,進而提升全球對自然災害的預測與應對能力。
