Re: [新聞] Grok 答不出〈柏德之門 3〉問題,馬斯克怒凍模型更新、抽調工程師緊急救火

看板Tech_Job (科技人)作者 (hips)時間3小時前 (2026/02/28 08:16), 編輯推噓1(101)
留言2則, 1人參與, 3小時前最新討論串2/2 (看更多)
這就說明現在的AI離AGI還很遙遠。 起碼要訓練成能自己去理解一個遊戲直到超越人類 研究出不同的打法,build等 就像圍棋,完全改變了人類傳統先角再邊的開局 當然,整理論壇的知識不能說沒用 但可能流於垃圾進垃圾出,缺乏實際理解。 ※ 引述《pl132 (pl132)》之銘言 : Grok 答不出〈柏德之門 3〉問題,馬斯克怒凍模型更新、抽調工程師緊急救火 : https://tinyurl.com/26njc4h2 : 伊隆‧馬斯克(Elon Musk)旗下 AI 公司 xAI 去年曾因聊天機器人 Grok 無法準確回答 : 〈柏德之門〉(Baldur’s Gate)遊戲細節問題,延遲數天推出模型更新。xAI 更緊急抽 : 調多名高級工程師放下手頭項目,專門協助改善 Grok 遊戲知識庫。 : 工程師臨時被抽調 遊戲問題觸發內部混亂 : Business Insider 深度調查報導披露,Elon Musk 對 Grok 回答〈柏德之門 3〉( : Baldur’s Gate 3)細節問題表現強烈不滿,下令延遲推出相關模型更新。他要求高級工 : 程師放下手頭項目,轉而處理遊戲知識不足問題。部分前 xAI 員工形容公司工作氛圍猶 : 如無休止消防演習 。xAI 位於帕羅奧圖(Palo Alto)總部設有多個作戰室,隨時應對各 : 種緊急情況 。Elon Musk 對遊戲知識執著程度不只於此。他同時要求工程師提升 Grok : 在〈英雄聯盟〉(League of Legends)遊戲能力,目標更是達到最高挑戰者( : Challenger)段位。 : Larian Studios 開發〈柏德之門 3〉,以龍與地下城(Dungeons & Dragons)為背景。 : 遊戲劇情複雜且機制豐富,廣受 RPG 玩家好評。由於網路上有大量相關攻略可供參考, : 業界對 Grok 當時連這款遊戲細節問題也答錯感到相當意外。 : Grok 成績大翻身 準確率現達 92% : 事發後 Grok 於〈柏德之門 3〉相關知識表現明顯改善。TechCrunch 於 2026 年 2 月報 : 導,Grok 現時已能準確回答〈柏德之門〉相關問題。有測試機構以 BaldurBench 為名, : 向 Grok、ChatGPT、Claude 及 Gemini 各提出 5 條〈柏德之門〉相關問題進行比較。結 : 果顯示 Grok 整體勝任,準確率據報達 92%。 : 四大 AI 風格各異 : 測試結果顯示各 AI 回答遊戲問題時風格截然不同。Grok 偏好以表格形式呈現資料,並 : 大量使用 save-scumming 及 DPS 等玩家術語,不熟悉遊戲用戶較難理解。ChatGPT 傾向 : 以重點列表簡潔作答 。Gemini 著重以粗體標示關鍵詞。Claude 則對劇透極為謹慎,建 : 議玩家自行探索遊戲。由於各 AI 大多從相同網上攻略資源汲取知識,回答風格差異比內 : 容差異更為明顯。 : 這次事件突顯 xAI 內部管理混亂。這同時反映 Elon Musk 對 Grok 能力有極高要求,最 : 終讓 Grok 遊戲知識領域能力得到大幅提升。 : 這難道是老馬玩遊戲時候,查詢AI結果得到錯誤答案,所以不爽才叫人修嗎 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.20.143.79 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1772237808.A.5E8.html

02/28 08:51, 3小時前 , 1F
遊戲沒開源 AI不能模擬玩家 應該永遠走
02/28 08:51, 1F

02/28 08:51, 3小時前 , 2F
不到AGI
02/28 08:51, 2F
文章代碼(AID): #1feZFmNe (Tech_Job)
文章代碼(AID): #1feZFmNe (Tech_Job)