AI棋賽!馬斯克Grok決賽出包 OpenAI o3直落四完封稱霸

(示意圖/pixabay)

▲西洋棋。(示意圖/pixabay)

圖文/CTWANT

OpenAI與馬斯克(Elon Musk)旗下xAI的人工智慧模型Grok,首次在西洋棋賽場上正面交鋒,最終由OpenAI的o3大型語言模型以4比0擊敗Grok 4,奪下由Google平台Kaggle舉辦的AI Exhibition Tournament冠軍。這場為期三天的比賽於5日至7日舉行,參賽陣容包括Anthropic、Google、DeepSeek、Moonshot AI等多家開發商的模型。

根據《獨立報》報導,Grok 4在決賽中多次出現重大失誤,包括關鍵時刻連續失去皇后,最終被o3以四連勝的方式擊敗。

[廣告]請繼續往下閱讀...

Chess.com撰稿人平哈塔(Pedro Pinhata)形容,Grok在準決賽前一直被視為奪冠熱門,但最後一天完全失去節奏;反觀o3的平均準確率高達91%,在多數情況下毫不留情地抓住對手失誤。

報導中也提到,這場冠軍對決其實帶有濃厚的個人色彩。OpenAI執行長阿特曼(Sam Altman)與馬斯克十年前共同創辦OpenAI,後者之後離開並成立xAI。

後續阿特曼曾指控馬斯克試圖收購ChatGPT開發公司未果,並稱他是「惡霸」。馬斯克則在X平台發文淡化比賽結果,聲稱xAI幾乎未在西洋棋領域投入資源,並表示Grok 4的棋力僅是「副產品」。

Google的Gemini模型在季軍戰中以3.5比0.5擊敗o4-mini,奪下第三名。DeepSeek與Moonshot AI則在八強賽止步。本次比賽旨在檢驗大型語言模型於複雜策略遊戲中的推理與決策能力,像西洋棋、圍棋等規則嚴謹的遊戲,被視為測試AI學習與完成目標的重要工具。

馬斯克在賽前已對外發表評論,而西洋棋界人士同樣關注這場AI對決。現任世界排名第一的棋手馬卡爾森(Magnus Carlsen)曾於7月的線上賽擊敗ChatGPT,且未損一子。他在賽後評估,Grok的棋力等級分約800,o3約在1200左右,遠低於他巔峰時的2882分。當有X平台用戶詢問時,Grok自評的等級分則在1600至1800之間。

自1997年IBM的深藍(Deep Blue)在六局比賽中擊敗世界冠軍卡斯帕洛夫(Garry Kasparov)以來,電腦戰勝人類頂尖棋手已非新鮮事。後續Google DeepMind等團隊更研發出能以超人水準自我訓練的棋類AI。

這次Kaggle舉辦的比賽,是自2022年ChatGPT問世以來,首次專為通用型大型語言模型舉行的大型西洋棋賽事。Take Take Take公司執行長克里斯蒂安森(Mats André Kristiansen)形容,此類比賽的價值在於深入觀察AI的推理與思考模式。

延伸閱讀
拜拜憲哥1/綜藝大哥吳宗憲與女兒「斷絕關係」 背後原因曝光
獨家/「大師兄」林智勝引退賽許願成功 天后張惠妹大巨蛋獻唱致敬
原始連結

關鍵字: 周刊王AI

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

蕭煌奇老婆正面曝光 陪看五月天..貼心幫扶麥

蕭煌奇老婆正面曝光 陪看五月天..貼心幫扶麥

Jennie來了! 見接機人潮外套遮全身

Jennie來了! 見接機人潮外套遮全身

捲捲頭+桃紅羽絨服=阿嬤? 依依路上狂喊…結果是他XD

捲捲頭+桃紅羽絨服=阿嬤? 依依路上狂喊…結果是他XD

【喉嚨借過】店員自稱喝酒沒輸過 不用5秒喝完一杯嚇傻客人

【喉嚨借過】店員自稱喝酒沒輸過 不用5秒喝完一杯嚇傻客人

【被女兒套路】謊稱牛奶滿出來...爸怎麼喝都喝不到XD

【被女兒套路】謊稱牛奶滿出來...爸怎麼喝都喝不到XD

讀者迴響

哪些AI工具支援繁體中文?

目前較主流的ChatGPT、Claude、Gemini、Perplexity、Copilot等都支援繁體中文,回覆也愈來愈自然。不過圖像生成工具有些還是以英文提示詞為主,使用時可留意。

最夯影音

更多

熱門快報

回到網頁頂端