PTT職涯區 / Stock (股票)

Re: [心得] 蘋果揭露人工智能並不思考

看板Stock (股票)作者pujos (lks)時間3周前 (2025/06/16 06:13)推噓9(10推 1噓 39→)

留言50則, 18人參與討論串4/14 (看更多)

這不是常識嗎？？？你用LLM最常看到的不就免責條款你有沒有想過為什麼那些免責條款需要存在僅僅是因為現在技術力不足？？？才不是... 1.LLM會不會思考 https://ibb.co/k2gjs7rv 2.為什麼看起來像會思考 https://ibb.co/d0mZrSnH 3.這號稱的推理能力哪裡來的？ https://ibb.co/LX6T1PBd 4.結論 https://ibb.co/dsLMGynj 延伸問題 1.LLM究竟有無可能走向自我糾錯不可能,其回答是立基於機率而非邏輯永遠都會有一個高機率答案 https://ibb.co/wZdjy8sD 2.未來可能方向 https://ibb.co/0pz2NbSp 所以這條路未來是不可能走向AGI 這是LLM底層架構、邏輯所決定的事哪需要揭露我還以為這是常識因此你只要問LLM可以驗證的問題它有很高機率回你個錯誤答案因為它是猜一個看起來對的答案給你而不是真的下去思考、計算例如 543.21*543.21=？？？上面這題 Gork、Gemini、GPT都可以是錯的這才是為什麼要很小心用LLM的理由整個思路、流程看起來都沒問題但答案極有可能是錯的結果錯在最智障的地方計算式你給我用猜的... ※ 引述《huabandd (我是阿肥巴你頭)》之銘言： : https://is.gd/U7lWC8 : 看到一個影片，非新聞報導，僅創作者想法 : 討論蘋果揭露關於人工智能當中的最大謊言 : 之前也看過一個影片指出 : AI無法產出指針在10:10以外的手錶 : （網路手錶圖片通常指針停留在10:10） : 自己嘗試過幾次確實是這樣 : 因為AI的訓練是基於現有大量資料 : 去產生一個與大量資料相似的產物給你 : 無法產生未曾有過資料的產物 : （以上為個人猜測，若錯誤請指正） : 雖然現在已有研究嘗試將AI接入人類神經元 : 未來思考的方式有可能因此改變 : 不再只是記憶，而是真正的推理 : （但是這好像也是一件滿恐怖的事情？） : 如果說給AI一個圍棋組，但不教他玩法 : 也不讓他參考棋類玩法，讓他自行摸索 : 就像嬰兒拿到玩具後自己亂玩那樣 : AI能夠自行生成玩法是不是就算是成功？ : 中文翻譯 : 蘋果剛剛揭露了人工智慧中最大的謊言，即「思考」的假象，證明了像 Claude、Deepseek- : R1 和 OpenAI 的 o3-mini 等推理模型實際上並不會思考。蘋果沒有重複使用舊有的數學問 : 題，而是創造了這些模型從未見過全新謎題。結果令人震驚。 : 對於簡單問題，標準 AI 模型表現優於昂貴的推理模型，同時消耗更少的資源。對於中等複 : 雜度問題，推理模型顯示出一些優勢，但對於模擬現實世界情境的高複雜度問題，兩種類型 : 的模型都崩潰到 0% 的準確度。 : 這是確鑿的證據：蘋果給予 AI 模型逐步的演算法，就像給某人食譜一樣，但它們仍在相同 : 的門檻下失敗了。這證明它們無法遵循邏輯指令。該研究沒有發現任何形式推理的證據，得 : 出結論認為其行為最好用複雜的模式匹配來解釋。 : 簡單地更改名稱和問題會顯著降低性能。蘋果測試了河內塔（Tower of Hanoi）謎題，模型 : 在超過 100 步的移動中成功了，但在新穎的渡河謎題中僅僅 4 步後就失敗了。它們是記憶 : 模式，而不是進行邏輯推理。 : 隨著問題變得越來越難，「思考」模型使用的 token 越來越少，放棄得更快，而不是更深 : 入地思考。即使無限的計算資源也無濟於事。這揭示了數十億美元的 AI 投資是建立在錯誤 : 前提上的。 : 公司將複雜的模式匹配宣傳為真正的推理，誤導消費者對 AI 能力的認知。我們離通用人工 : 智慧（AGI）的距離並沒有大家想像的那麼近；我們正在處理的是非常複雜的自動完成系統 : 。當先進的 AI 推理模型連遵循簡單指令都失敗時，我們是否正生活在一個建立在幻想之上 : 的 AI 炒作泡沫中？ : 英文原文 : Apple just exposed the biggest lie in AI with the illusion of "thinking," provin : g that reasoning models like Claude, Deepseek-R1, and OpenAI's o3-mini don't act : ually think. Instead of recycling math problems, Apple created brand new puzzles : these models had never seen. The results were shocking. : For simple problems, standard AI models outperformed expensive reasoning models : while using fewer resources. For medium complexity, reasoning models showed some : advantage, but for high complexity problems that mirror real-world scenarios, b : oth types collapsed to 0% accuracy. : Here's the damning evidence: Apple gave AI models step-by-step algorithms, like : giving someone a recipe, and they still failed at the same thresholds. This prov : es they can't follow logical instructions. The study found no evidence of formal : reasoning, concluding behavior is better explained by sophisticated pattern mat : ching. : Simply changing names and problems degraded performance dramatically. Apple test : ed Tower of Hanoi puzzles, where models succeeded with 100-plus moves but failed : at novel river crossing puzzles after just 4 moves. They memorized patterns rat : her than reasoned logically. : As problems got harder, "thinking" models used fewer tokens and gave up faster i : nstead of thinking deeper. Even unlimited computational resources couldn't help. : This exposes that billions in AI investment are based on false premises. : Companies market sophisticated pattern matching as genuine reasoning, misleading : consumers about AI capabilities. We are not as close to AGI as everyone thinks; : we're dealing with very sophisticated autocomplete systems. When advanced AI re : asoning models fail at following simple instructions, are we living in an AI hyp : e bubble built on illusions? ----- Sent from JPTT on my Xiaomi 23090RA98G. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.242.134.228 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1750025617.A.AA0.html ※ 編輯: pujos (27.242.134.228 臺灣), 06/16/2025 06:27:39

推

06/16 06:33, 3周前 , 1^F

06/16 06:33, 1^F

→

06/16 06:33, 3周前 , 2^F

06/16 06:33, 2^F

推

06/16 07:11, 3周前 , 3^F

06/16 07:11, 3^F

→

06/16 07:11, 3周前 , 4^F

06/16 07:11, 4^F

→

06/16 07:14, 3周前 , 5^F

06/16 07:14, 5^F

→

06/16 07:14, 3周前 , 6^F

06/16 07:14, 6^F

→

06/16 07:15, 3周前 , 7^F

06/16 07:15, 7^F

推

06/16 07:17, 3周前 , 8^F

06/16 07:17, 8^F

→

06/16 07:18, 3周前 , 9^F

06/16 07:18, 9^F

推

06/16 07:18, 3周前 , 10^F

06/16 07:18, 10^F

→

06/16 07:19, 3周前 , 11^F

06/16 07:19, 11^F

推

06/16 07:28, 3周前 , 12^F

06/16 07:28, 12^F

→

06/16 07:30, 3周前 , 13^F

06/16 07:30, 13^F

→

06/16 07:31, 3周前 , 14^F

06/16 07:31, 14^F

推

06/16 07:31, 3周前 , 15^F

06/16 07:31, 15^F

→

06/16 07:31, 3周前 , 16^F

06/16 07:31, 16^F

→

06/16 07:32, 3周前 , 17^F

06/16 07:32, 17^F

→

06/16 07:32, 3周前 , 18^F

06/16 07:32, 18^F

→

06/16 07:32, 3周前 , 19^F

06/16 07:32, 19^F

→

06/16 07:32, 3周前 , 20^F

06/16 07:32, 20^F

推

06/16 07:36, 3周前 , 21^F

06/16 07:36, 21^F

→

06/16 07:38, 3周前 , 22^F

06/16 07:38, 22^F

推

06/16 07:43, 3周前 , 23^F

06/16 07:43, 23^F

→

06/16 07:43, 3周前 , 24^F

06/16 07:43, 24^F

→

06/16 08:13, 3周前 , 25^F

06/16 08:13, 25^F

→

06/16 08:13, 3周前 , 26^F

06/16 08:13, 26^F

→

06/16 08:14, 3周前 , 27^F

06/16 08:14, 27^F

→

06/16 08:15, 3周前 , 28^F

06/16 08:15, 28^F

→

06/16 08:15, 3周前 , 29^F

06/16 08:15, 29^F

→

06/16 08:15, 3周前 , 30^F

06/16 08:15, 30^F

推

06/16 08:15, 3周前 , 31^F

06/16 08:15, 31^F

→

06/16 08:17, 3周前 , 32^F

06/16 08:17, 32^F

→

06/16 08:18, 3周前 , 33^F

06/16 08:18, 33^F

→

06/16 08:19, 3周前 , 34^F

06/16 08:19, 34^F

→

06/16 08:20, 3周前 , 35^F

06/16 08:20, 35^F

→

06/16 08:20, 3周前 , 36^F

06/16 08:20, 36^F

→

06/16 08:21, 3周前 , 37^F

06/16 08:21, 37^F

噓

06/16 08:23, 3周前 , 38^F

06/16 08:23, 38^F

→

06/16 08:23, 3周前 , 39^F

06/16 08:23, 39^F

→

06/16 08:23, 3周前 , 40^F

06/16 08:23, 40^F

→

06/16 08:24, 3周前 , 41^F

06/16 08:24, 41^F

推

06/16 08:28, 3周前 , 42^F

06/16 08:28, 42^F

→

06/16 09:53, 3周前 , 43^F

06/16 09:53, 43^F

→

06/16 09:53, 3周前 , 44^F

06/16 09:53, 44^F

→

06/16 09:53, 3周前 , 45^F

06/16 09:53, 45^F

→

06/16 10:14, 3周前 , 46^F

06/16 10:14, 46^F

→

06/16 10:24, 3周前 , 47^F

06/16 10:24, 47^F

→

06/16 10:24, 3周前 , 48^F

06/16 10:24, 48^F

→

06/16 12:48, 3周前 , 49^F

06/16 12:48, 49^F

→

06/16 14:08, 3周前 , 50^F

06/16 14:08, 50^F

‣ 返回看板[ Stock ] 學術

‣ 更多 pujos 的文章

文章代碼(AID): #1eJqMHgW (Stock)

討論串 (同標題文章)

完整討論串 (本文為第 4 之 14 篇)：

排序：最新先 | 最舊先 | 留言數

6

23

Re: [心得] 蘋果揭露人工智能並不思考

3周前, 06/16

12

31

Re: [心得] 蘋果揭露人工智能並不思考

3周前, 06/16

4

12

Re: [心得] 蘋果揭露人工智能並不思考

3周前, 06/16

4

13

Re: [心得] 蘋果揭露人工智能並不思考

3周前, 06/16

21

31

Re: [心得] 蘋果揭露人工智能並不思考

3周前, 06/16

4

16

Re: [心得] 蘋果揭露人工智能並不思考

3周前, 06/16

1

1

Re: [心得] 蘋果揭露人工智能並不思考

3周前, 06/16

5

10

Re: [心得] 蘋果揭露人工智能並不思考

3周前, 06/16

4

10

Re: [心得] 蘋果揭露人工智能並不思考

3周前, 06/16

26

88

Re: [心得] 蘋果揭露人工智能並不思考

3周前, 06/16

在新視窗開啟完整討論串 (共14篇)

Stock 近期熱門文章

2

11

Re: [新聞] 中國6月PPI年減3.6% 創下兩年來最大跌幅

6小時前, 07/12

19

40

[情報] 印度關稅可能低於20%

6小時前, 07/12

5

22

Re: [請益] 退休後用動態提領的方式穩嗎?

6小時前, 07/12

10

12

[心得] 美股 UPST.US 雲霄飛車跳車離席

7小時前, 07/12

71

126

[新聞] 中國6月PPI年減3.6% 創下兩年來最大跌幅

8小時前, 07/11

203

663

[新聞] 普發1萬恐喊卡！賴清德「1關鍵」能秒推翻

9小時前, 07/11

3

14

Re: [標的] 台新換新光的套利

9小時前, 07/11

17

72

[請益] 說好的9%呢？！這樣是不是就不會9%了

9小時前, 07/11

更多近期熱門文章 >>

PTT職涯區即時熱門文章

5

6

[請益] 客廳看出去斜前方是宗祠

7小時前, 07/12

2

11

[新聞] 微軟培訓AI人才擬砸40億美元

9小時前, 07/11

1

9

[請問] 上網突然斷網又恢復找不到原因

9小時前, 07/11

15

30

[新聞] 台中屋主真讓利？「13行政區」房價下修

9小時前, 07/11

49

159

Re: [心得] 如何擠出錢來？租房/買房：現金流規劃

9小時前, 07/11

5

17

[新聞] 敏感詞達35萬 DeepSeek使用率從50%跌至3%

10小時前, 07/11

4

5

[賣/台南/南區]整新2房一樓公寓

10小時前, 07/11

10

18

[情報] 永豐月月pay活動登錄

10小時前, 07/11

更多即時熱門文章 >>

‣ 返回看板[ Stock ] 學術

‣ 更多 pujos 的文章

文章代碼(AID): #1eJqMHgW (Stock)