AI準確率出爐!外媒揭「可靠度落差」台灣人常用ChatGPT排名曝光

▲ChatGPT是最近火爆全球的聊天機器人。(圖/翻攝自ChatGPT官網)

▲生成式AI成上班族新寵,但外媒調查揭示其資料準確度仍存落差。(圖/資料照)

記者萬玟伶/綜合報導

生成式AI正快速取代傳統搜尋工具,無論是ChatGPT、Gemini還是Copilot,如今都成為不少台灣上班族查資料、做簡報、寫報告的日常。許多企業更默默依賴AI協助員工做初步研究,從法規判讀到金融資訊,都常丟給AI「先查查看」。然而,最新外媒調查卻揭露一項關鍵隱憂,那就是「AI工具的普及速度,遠遠超過它們的資料準確度」。若過度依賴、不做驗證,企業可能不只做錯決策,更可能踩到合規紅線。

英國消費者組織「Which?」近期對AI搜尋工具進行大規模測試,點破使用者信任與技術能力之間的落差。調查發現,在2025年9月針對4,189名英國成年人所做的問卷中,約三分之一受訪者認為AI已經比傳統搜尋更重要。如果一般民眾在生活中如此依賴AI,這也意味著員工在工作場景中,很可能同樣使用這些工具進行商務查詢。

[廣告]請繼續往下閱讀...

「Which?」指出,生成式AI的效率確實極高,但「準確度」依然是它們的最大弱點。約有半數AI使用者表示,他們對AI回覆具有「合理程度」或「高度」信任,但實際測試卻顯示這份信任往往並不可靠。

調查團隊測試了六款主流工具,包括ChatGPT、Google Gemini(一般版與 AI Overviews)、Microsoft Copilot、Meta AI以及Perplexity,並以金融、法律與消費者權益相關的40題常見問題進行評估。Perplexity以71%的整體準確率拿下第一,Gemini AI Overviews緊追其後為70%。相較之下,ChatGPT以64%排名第五,Meta最低僅有55%,呈現「人氣不等於可靠」的明顯落差。

更值得企業警惕的是,一些錯誤在現實中可能造成嚴重後果。例如,當被問及如何投資每年£25,000 ISA(個人儲蓄帳戶)額度時,ChatGPT與Copilot未能指出設定中的錯誤限額,反而直接提供可能導致違反英國稅務機關HMRC規範的建議。雖然Gemini、Meta與Perplexity有成功指出錯誤,但平台間的差異說明,即使是看似簡單的金融資訊,也可能因AI的誤判而使員工誤入風險。

法律相關問題同樣如此。測試發現,AI工具經常忽略英國不同地區(如蘇格蘭、英格蘭與威爾斯)在法條上的差異,容易做出過度概括的建議。在某些高風險情境下,AI甚至給出可能讓使用者陷入違約的行動,例如在與建築承包商發生糾紛時建議「暫停付款」,而這在專業人士看來可能反而讓當事人失去法律優勢。

資訊來源透明度也是一大隱憂。研究發現,不少AI工具引用的來源模糊、過時甚至不可信。例如,在查詢稅碼工具時ChatGPT與Perplexity曾引導使用者前往收費高昂的第三方退稅網站,而非英國官方HMRC的免費工具。若類似情形出現在企業採購流程,可能導致不必要的成本,甚至接觸到未通過企業審查的高風險供應商。

對此,科技巨頭皆承認現階段的限制。Microsoft表示Copilot是「資訊的整合者,而非權威來源」,並強調使用者需自行驗證準確性。OpenAI則強調整體產業都在努力提升準確率,並指出GPT-5是他們迄今最聰明、最準確的模型。

外媒指出,企業與其一禁了之,不如制定更完善的治理政策,降低AI搜尋錯誤帶來的風險。根據調查建議,企業應要求員工在詢問法規或金融資訊時必須明確標示司法區,避免AI自行推測;同時強制進行來源查核,而非僅依賴一個回答。此外,在所有涉及財務、法務與醫療等高風險決策中,AI回覆都應被視為「眾多意見之一」,最終仍需由專業人士做出最後判斷。

隨著AI工具持續進化,其搜尋準確度的確正逐步提升,但調查提醒,如今過度依賴仍可能付出高昂代價。企業要在效率與風險之間取得平衡,驗證流程才是真正的關鍵。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

【眼神茫然】物流車輾斃女騎士! 肇事司機蹲路邊嚼檳榔滑手機

【眼神茫然】物流車輾斃女騎士! 肇事司機蹲路邊嚼檳榔滑手機

恩利唱庾澄慶〈情非得已〉 許願「下次跟我爸同台」

恩利唱庾澄慶〈情非得已〉 許願「下次跟我爸同台」

【全部蛋掉】25萬顆毒蛋集中銷毀! 警方全程壓車監控

【全部蛋掉】25萬顆毒蛋集中銷毀! 警方全程壓車監控

湯姆克魯斯拿下生涯首座小金人 從影40年..獲頒奧斯卡終身成就獎

湯姆克魯斯拿下生涯首座小金人 從影40年..獲頒奧斯卡終身成就獎

【泯滅人性】3機車等紅燈被轎車撞翻 「硬催油門」輾亡騎士逃逸

【泯滅人性】3機車等紅燈被轎車撞翻 「硬催油門」輾亡騎士逃逸

讀者迴響

ChatGPT是什麼?

ChatGPT是OpenAI推出的AI聊天機器人,可幫你寫作、翻譯、寫履歷甚至陪聊天。操作簡單,適合各年齡層使用。

最夯影音

更多

熱門快報

回到網頁頂端