AI為何總愛亂掰?OpenAI揭祕幻覺成因 原來是被獎勵「裝懂」

▲▼openAI。(圖/OpenAI)

▲OpenAI:改變評估方式,才能減少幻覺。(圖/OpenAI)

記者吳立言/綜合報導

OpenAI與喬治亞理工學院最新研究指出,AI語言模型之所以會出現「幻覺」,也就是一本正經地亂講話,主要原因在於訓練和評估方式本身。

研究團隊發現,目前語言模型的訓練環境偏向獎勵「有答案」而不是「承認不知道」。在這種情況下,模型在遇到不確定的問題時,選擇亂猜往往比不回答更容易獲得高分。久而久之,AI便養成了習慣,寧可冒險輸出錯誤答案,也不願保持沉默。

[廣告]請繼續往下閱讀...

研究者形容,這就像學生考試時遇到不會的題目,硬猜還可能得分,但空白就一定是零分。這種制度讓模型更傾向自信作答,即使答案不正確。

論文進一步解釋,AI幻覺並不是惡意捏造,而是統計分類上的自然錯誤。當資料不足或知識超出訓練範圍時,這種錯誤就更容易發生。要改善問題,必須重新設計評估方式,讓模型在表示不確定時也能獲得合理評價,而不是單純被懲罰。

研究強調,如果能改變目前的獎勵制度,讓AI在不確定的時候能更誠實表達,未來語言模型的可信度將能明顯提升。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

【救護車分秒必針】保時捷駕駛「硬擋不讓」...騎士出手網讚爆!

【救護車分秒必針】保時捷駕駛「硬擋不讓」...騎士出手網讚爆!

蔡依林唱〈假裝〉忘詞XD 自嘲:巧虎熬夜不漂亮了

蔡依林唱〈假裝〉忘詞XD 自嘲:巧虎熬夜不漂亮了

我看完演唱會的精神狀態#李多慧

我看完演唱會的精神狀態#李多慧

【暴雨轟炸】台中瞬間淹水!北屯馬路成黃河

【暴雨轟炸】台中瞬間淹水!北屯馬路成黃河

【主業車行...副業銀行】客拿硬幣買車,老闆數出新技能XD

【主業車行...副業銀行】客拿硬幣買車,老闆數出新技能XD

讀者迴響

聊天AI哪個支援中文最好?

目前ChatGPT、Claude、Gemini都支援繁體中文,回覆自然,初學者建議從ChatGPT開始。

最夯影音

更多

熱門快報

回到網頁頂端