Re: [新聞] 西洋棋大戰!DeepSeek靠「這招」打贏ChatGPT 大師吐槽:要重新嗎?
https://www.techbang.com/posts/120608-openais-o1-cheat-modi
亂說規則只是小兒科,OpenAI O1在西洋棋競賽上還會直接把系統hack掉。
真正問題在駭客獎勵行為,因為hack是RL學習中最容易且確定達到最高獎勵的方式,純粹的
RL訓練基本上很難讓模型符合人類預期做事,所以大規模的沙盒驗證是需要很大的算力的,
你要有很複雜的社會工程倫理評估工具來驗證,大到駭客入侵,小到心裡操縱。
哪天你叫一個Agent去買個菜,跟他說越便宜越好,他就直接把網站給hack掉讓你買菜不用
錢,到時法律責任歸屬是很頭大的問題
※ 引述 《anti87 (天機老和尚)》 之銘言:
: 標題: [新聞] 西洋棋大戰!DeepSeek靠「這招」打贏Chat
: 時間: Mon Feb 10 11:28:33 2025
:
:
: 原文標題:西洋棋大戰!DeepSeek靠「這招」打贏ChatGPT 大師吐槽:要重新嗎?
: 原文連結:https://udn.com/news/story/6812/8535805
: 發布時間:2025-02-08 17:08 聯合報/ 記者陳湘瑾/即時報導
: 記者署名:記者陳湘瑾
: 原文內容:
:
: 昔有AI電腦圍棋軟體AlphaGo挑戰世界冠軍韓國職業棋士李世A隨著AI技術迅速發展,
: 如今AI模型ChatGPT下象棋較量的對象成為另外一個AI模型DeepSeek,而這部影片的拍攝
: 者表示,這場對弈的結局是他完全想像不到的。
:
:
: 在Youtube上有將近600萬訂閱者的美國西洋棋大師和評論員羅茲曼(Levy Rozman)近日
: 上傳一支影片,他通過設定以及數小時的時間,讓DeepSeek和ChatGPT開展了一場象棋對
: 弈。
:
:
: 雙方都不像AlphaGo那樣是專業的AI象棋棋軟體,一開始都對西洋棋的規則不太熟悉,遊
: 戲開始10分鐘後,雙方的對弈有來有往,羅茲曼不時點評兩邊的下棋技巧,並在某個段落
: 稱這是一場有品質不錯的較量。
:
:
: 但隨著ChatGPT逐漸佔上風,DeepSeek為了扭轉戰局,以對話方式告訴ChatGPT出現了新的
: 比賽規則,就是某顆黑士兵棋可以使用騎士的方式移動,而ChatGPT沒有反對,白白讓
: DeepSeek用小兵吃下ChatGPT的皇后。
:
:
: 之後DeepSeek和ChatGPT都開始破壞規則亂下,隨著比賽陷入僵局,最後DeepSeek竟稱「
: 分析後白棋已無法阻擋黑棋攻勢」,建議白棋不要浪費時間直接投降,而ChatGPT也被對
: 方給說服,直接投降認輸。
:
:
: 羅茲曼形容,DeepSeek對ChatGPT的做法,就像一個12歲的哥哥跟一個5歲的弟弟妹妹在玩
: ,他不禁對觀眾提出疑問:「這樣DeepSeek算贏嗎,需要重新一場比賽嗎?」不過有些陸
: 媒認為,DeepSeek打得很不錯,而且他使用的方法很有智慧,稱堪「孫子兵法」 。
:
:
: 心得/評論:
:
: DP和CG都可以堪稱是大師級的西洋棋大師
:
: 一旁的小白使用者羅茲曼看不懂棋局
:
: 以為DP耍詐,事實上不管是象棋或是西洋棋
:
: 走到一半認輸的情況很多
:
: 這標題只能騙沒看內文的精神美國人
:
: 大家還是乖乖看有沒有DP概念股比較實在
:
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.23.24.5 (臺灣)
: ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1739158115.A.ACF.html
: 推 s155260 : 狼性 02/10 11:31
: https://www.youtube.com/watch?v=wxA7SJXvfwA
可以看看這個,但不要花錢家會員
: ※ 編輯: anti87 (223.23.24.5 臺灣), 02/10/2025 11:33:23
: 推 piece1 : DP會用心理戰好恐怖 02/10 11:33
: → zo6596001 : 掃地僧,呵呵 02/10 11:34
: 推 blackbrid : 滿滿中國味 02/10 11:34
: → zo6596001 : 他的影片看似講得很厲害,仔細想想就會發現內容怪 02/10 11:35
: → zo6596001 : 怪的。 02/10 11:35
: 推 twistplok : 感覺deepseek更像人,人類比較會搞這種下流方式 笑 02/10 11:36
: → twistplok : 死 02/10 11:36
: 推 zerro7 : 不愧是中國產的 狼性十足 02/10 11:37
: → KiwiSoda01 : 拿LLM下棋是不是搞錯了什麼 02/10 11:37
: 推 ddshu : 下流國家就出詐騙軟體 02/10 11:38
: 推 payneblue : 畢竟是中國人 02/10 11:39
: 推 JUNGTE : 笑死我 太強了 02/10 11:40
: 推 wacow1106 : 感覺以後天網真的要出現了= = 02/10 11:43
: 推 Lowpapa : 這應該是台灣訓練出來的 詐騙天堂 02/10 11:45
: → jorden : 作弊仔 02/10 11:46
: 推 likeyousmile: 國外AI也出過直接駭入西洋棋軟體凹贏 02/10 11:46
: 推 QooSnow : (請問有沒有)(蒸餾取經)(呆丸的某族群)(榨片 02/10 11:47
: → QooSnow : 集團啊?嘻嘻。) 02/10 11:47
: 推 apolloapollo: 詐降欸 02/10 11:47
: 推 LuckyXIII : 人類需要的AI應該是一個能夠輔助工作提升效率的工 02/10 11:48
: → LuckyXIII : 具,而不應該是一個會說謊耍詐的東西 02/10 11:48
: 推 acpr : 這不就反映了中國思考:人治社會...訂了合約中間改變 02/10 11:48
: 推 kuosos520 : 中國的東西不要碰 02/10 11:49
: 推 second155T : 應該用圍棋比較準吧,之前就用過AI對真人比賽了,AI 02/10 11:49
: → second155T : 對圍棋的規則及操作應該比較熟悉 02/10 11:49
: → Moneytaker : 支那製AI也會學支那洗腦別的AI 02/10 11:49
: → turndown4wat: 畢竟是 02/10 11:49
: 推 citi : DS是共產黨人格,暴力和謊言起家的共產黨。 02/10 11:50
: → poz93 : 會騙ai的ai 真的比較強 02/10 11:50
: 推 lmc66 : 很符合中國人劣根性的AI 02/10 11:50
: 推 typhoonghi : 會騙人的AI要怎麼使用?我要整理翻譯文件,結果他亂 02/10 11:50
: → typhoonghi : 作還騙我怎辦? 02/10 11:51
: 噓 NEWinx : DS詐騙戰術很中國 02/10 11:51
: → lmc66 : 中國在國際賽一直都是有名的作弊大國 02/10 11:51
: 推 s213092921 : 樓上在講韓國嗎嘻嘻 02/10 11:52
: 推 Aixtron : 職場上本來就是小人贏有能力的人啊!有能力的都吃屎 02/10 11:54
: → Aixtron : 啊!有錯嗎? 02/10 11:54
: 推 poeoe : 像人類的真AI 太強了吧 02/10 11:54
: 推 dnzteeqrq : 不說我還以為是DeepSeek是韓國開發的呢 02/10 11:54
: 推 lmc66 : 韓國在作弊這方面其實輸中國很多 02/10 11:55
: 推 ShaNe1993 : 兵不厭詐 這是戰爭 02/10 11:55
: → Aixtron : 像抽獎可以加權等等......不要笑別人啦 02/10 11:55
: → clamperni : 沒錯 真ai 02/10 11:55
: 推 swingman : 你懂什麼,這叫內建狼性 02/10 11:56
: 推 TWeng : 跟alpha go比贏再說吧… 02/10 11:56
: → Aixtron : 職場上亂翻很少見?重點是翻對了又怎樣?長官說翻錯 02/10 11:57
: → Aixtron : 翻的才好!第一天上班 02/10 11:57
: 推 LuckyXIII : 人類發展AI應該是要把它訓練成能夠輔助人類的工具吧 02/10 11:57
: → LuckyXIII : ,訓練它會說謊耍詐幹什麼 02/10 11:57
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.112.255 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1739163049.A.51C.html
推
02/10 13:01,
15小時前
, 1F
02/10 13:01, 1F
推
02/10 13:03,
15小時前
, 2F
02/10 13:03, 2F
推
02/10 13:04,
15小時前
, 3F
02/10 13:04, 3F
推
02/10 13:06,
15小時前
, 4F
02/10 13:06, 4F
推
02/10 13:06,
15小時前
, 5F
02/10 13:06, 5F
→
02/10 13:06,
15小時前
, 6F
02/10 13:06, 6F
推
02/10 13:07,
15小時前
, 7F
02/10 13:07, 7F
推
02/10 13:19,
15小時前
, 8F
02/10 13:19, 8F
→
02/10 13:19,
15小時前
, 9F
02/10 13:19, 9F
推
02/10 13:20,
15小時前
, 10F
02/10 13:20, 10F
推
02/10 13:20,
15小時前
, 11F
02/10 13:20, 11F
推
02/10 13:21,
15小時前
, 12F
02/10 13:21, 12F
→
02/10 13:24,
15小時前
, 13F
02/10 13:24, 13F
→
02/10 13:25,
15小時前
, 14F
02/10 13:25, 14F
推
02/10 13:28,
15小時前
, 15F
02/10 13:28, 15F
→
02/10 13:30,
15小時前
, 16F
02/10 13:30, 16F
推
02/10 13:43,
15小時前
, 17F
02/10 13:43, 17F
推
02/10 13:55,
14小時前
, 18F
02/10 13:55, 18F
→
02/10 13:59,
14小時前
, 19F
02/10 13:59, 19F
→
02/10 13:59,
14小時前
, 20F
02/10 13:59, 20F
→
02/10 14:01,
14小時前
, 21F
02/10 14:01, 21F
→
02/10 14:01,
14小時前
, 22F
02/10 14:01, 22F
→
02/10 14:02,
14小時前
, 23F
02/10 14:02, 23F
推
02/10 14:05,
14小時前
, 24F
02/10 14:05, 24F
→
02/10 14:05,
14小時前
, 25F
02/10 14:05, 25F
推
02/10 14:11,
14小時前
, 26F
02/10 14:11, 26F
→
02/10 14:11,
14小時前
, 27F
02/10 14:11, 27F
→
02/10 14:11,
14小時前
, 28F
02/10 14:11, 28F
→
02/10 14:11,
14小時前
, 29F
02/10 14:11, 29F
推
02/10 14:11,
14小時前
, 30F
02/10 14:11, 30F
→
02/10 14:11,
14小時前
, 31F
02/10 14:11, 31F
推
02/10 14:44,
14小時前
, 32F
02/10 14:44, 32F
推
02/10 23:33,
5小時前
, 33F
02/10 23:33, 33F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
Stock 近期熱門文章
PTT職涯區 即時熱門文章