AI棋賽!馬斯克Grok決賽出包 OpenAI o3直落四完封稱霸

(示意圖/pixabay)

▲西洋棋。(示意圖/pixabay)

圖文/CTWANT

OpenAI與馬斯克(Elon Musk)旗下xAI的人工智慧模型Grok,首次在西洋棋賽場上正面交鋒,最終由OpenAI的o3大型語言模型以4比0擊敗Grok 4,奪下由Google平台Kaggle舉辦的AI Exhibition Tournament冠軍。這場為期三天的比賽於5日至7日舉行,參賽陣容包括Anthropic、Google、DeepSeek、Moonshot AI等多家開發商的模型。

根據《獨立報》報導,Grok 4在決賽中多次出現重大失誤,包括關鍵時刻連續失去皇后,最終被o3以四連勝的方式擊敗。

[廣告]請繼續往下閱讀...

Chess.com撰稿人平哈塔(Pedro Pinhata)形容,Grok在準決賽前一直被視為奪冠熱門,但最後一天完全失去節奏;反觀o3的平均準確率高達91%,在多數情況下毫不留情地抓住對手失誤。

報導中也提到,這場冠軍對決其實帶有濃厚的個人色彩。OpenAI執行長阿特曼(Sam Altman)與馬斯克十年前共同創辦OpenAI,後者之後離開並成立xAI。

後續阿特曼曾指控馬斯克試圖收購ChatGPT開發公司未果,並稱他是「惡霸」。馬斯克則在X平台發文淡化比賽結果,聲稱xAI幾乎未在西洋棋領域投入資源,並表示Grok 4的棋力僅是「副產品」。

Google的Gemini模型在季軍戰中以3.5比0.5擊敗o4-mini,奪下第三名。DeepSeek與Moonshot AI則在八強賽止步。本次比賽旨在檢驗大型語言模型於複雜策略遊戲中的推理與決策能力,像西洋棋、圍棋等規則嚴謹的遊戲,被視為測試AI學習與完成目標的重要工具。

馬斯克在賽前已對外發表評論,而西洋棋界人士同樣關注這場AI對決。現任世界排名第一的棋手馬卡爾森(Magnus Carlsen)曾於7月的線上賽擊敗ChatGPT,且未損一子。他在賽後評估,Grok的棋力等級分約800,o3約在1200左右,遠低於他巔峰時的2882分。當有X平台用戶詢問時,Grok自評的等級分則在1600至1800之間。

自1997年IBM的深藍(Deep Blue)在六局比賽中擊敗世界冠軍卡斯帕洛夫(Garry Kasparov)以來,電腦戰勝人類頂尖棋手已非新鮮事。後續Google DeepMind等團隊更研發出能以超人水準自我訓練的棋類AI。

這次Kaggle舉辦的比賽,是自2022年ChatGPT問世以來,首次專為通用型大型語言模型舉行的大型西洋棋賽事。Take Take Take公司執行長克里斯蒂安森(Mats André Kristiansen)形容,此類比賽的價值在於深入觀察AI的推理與思考模式。

延伸閱讀
拜拜憲哥1/綜藝大哥吳宗憲與女兒「斷絕關係」 背後原因曝光
獨家/「大師兄」林智勝引退賽許願成功 天后張惠妹大巨蛋獻唱致敬
原始連結

關鍵字: 周刊王AI

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

【有聖光!】花蓮光復救災回程 列車長幽默廣播感謝超人們

【有聖光!】花蓮光復救災回程 列車長幽默廣播感謝超人們

【苦中作樂】救災一半怪手開玩搶球遊戲

【苦中作樂】救災一半怪手開玩搶球遊戲

【神級刀工】花蓮義煮團太神!不看菜就能光速狂切!一個個都是職人啊

【神級刀工】花蓮義煮團太神!不看菜就能光速狂切!一個個都是職人啊

【我們來了】長長隊伍走進阿陶莫部落!互喊加油振奮士氣:來了

【我們來了】長長隊伍走進阿陶莫部落!互喊加油振奮士氣:來了

【一輩子的心血都沒了】房屋被拆掉花蓮阿公淚「什麼都沒了」 阿嬤暖心一句話太洋蔥QQ

【一輩子的心血都沒了】房屋被拆掉花蓮阿公淚「什麼都沒了」 阿嬤暖心一句話太洋蔥QQ

讀者迴響

聊天AI哪個支援中文最好?

目前ChatGPT、Claude、Gemini都支援繁體中文,回覆自然,初學者建議從ChatGPT開始。

最夯影音

更多

熱門快報

回到網頁頂端