[心得] 蘋果揭露人工智能並不思考

看板Stock (股票)作者 (我是阿肥巴你頭)時間9小時前 (2025/06/15 23:01), 9小時前編輯推噓114(14430196)
留言370則, 204人參與, 15分鐘前最新討論串1/4 (看更多)
https://is.gd/U7lWC8 看到一個影片,非新聞報導,僅創作者想法 討論蘋果揭露關於人工智能當中的最大謊言 之前也看過一個影片指出 AI無法產出指針在10:10以外的手錶 (網路手錶圖片通常指針停留在10:10) 自己嘗試過幾次確實是這樣 因為AI的訓練是基於現有大量資料 去產生一個與大量資料相似的產物給你 無法產生未曾有過資料的產物 (以上為個人猜測,若錯誤請指正) 雖然現在已有研究嘗試將AI接入人類神經元 未來思考的方式有可能因此改變 不再只是記憶,而是真正的推理 (但是這好像也是一件滿恐怖的事情?) 如果說給AI一個圍棋組,但不教他玩法 也不讓他參考棋類玩法,讓他自行摸索 就像嬰兒拿到玩具後自己亂玩那樣 AI能夠自行生成玩法是不是就算是成功? 中文翻譯 蘋果剛剛揭露了人工智慧中最大的謊言,即「思考」的假象,證明了像 Claude、Deepseek- R1 和 OpenAI 的 o3-mini 等推理模型實際上並不會思考。蘋果沒有重複使用舊有的數學問 題,而是創造了這些模型從未見過全新謎題。結果令人震驚。 對於簡單問題,標準 AI 模型表現優於昂貴的推理模型,同時消耗更少的資源。對於中等複 雜度問題,推理模型顯示出一些優勢,但對於模擬現實世界情境的高複雜度問題,兩種類型 的模型都崩潰到 0% 的準確度。 這是確鑿的證據:蘋果給予 AI 模型逐步的演算法,就像給某人食譜一樣,但它們仍在相同 的門檻下失敗了。這證明它們無法遵循邏輯指令。該研究沒有發現任何形式推理的證據,得 出結論認為其行為最好用複雜的模式匹配來解釋。 簡單地更改名稱和問題會顯著降低性能。蘋果測試了河內塔(Tower of Hanoi)謎題,模型 在超過 100 步的移動中成功了,但在新穎的渡河謎題中僅僅 4 步後就失敗了。它們是記憶 模式,而不是進行邏輯推理。 隨著問題變得越來越難,「思考」模型使用的 token 越來越少,放棄得更快,而不是更深 入地思考。即使無限的計算資源也無濟於事。這揭示了數十億美元的 AI 投資是建立在錯誤 前提上的。 公司將複雜的模式匹配宣傳為真正的推理,誤導消費者對 AI 能力的認知。我們離通用人工 智慧(AGI)的距離並沒有大家想像的那麼近;我們正在處理的是非常複雜的自動完成系統 。當先進的 AI 推理模型連遵循簡單指令都失敗時,我們是否正生活在一個建立在幻想之上 的 AI 炒作泡沫中? 英文原文 Apple just exposed the biggest lie in AI with the illusion of "thinking," provin g that reasoning models like Claude, Deepseek-R1, and OpenAI's o3-mini don't act ually think. Instead of recycling math problems, Apple created brand new puzzles these models had never seen. The results were shocking. For simple problems, standard AI models outperformed expensive reasoning models while using fewer resources. For medium complexity, reasoning models showed some advantage, but for high complexity problems that mirror real-world scenarios, b oth types collapsed to 0% accuracy. Here's the damning evidence: Apple gave AI models step-by-step algorithms, like giving someone a recipe, and they still failed at the same thresholds. This prov es they can't follow logical instructions. The study found no evidence of formal reasoning, concluding behavior is better explained by sophisticated pattern mat ching. Simply changing names and problems degraded performance dramatically. Apple test ed Tower of Hanoi puzzles, where models succeeded with 100-plus moves but failed at novel river crossing puzzles after just 4 moves. They memorized patterns rat her than reasoned logically. As problems got harder, "thinking" models used fewer tokens and gave up faster i nstead of thinking deeper. Even unlimited computational resources couldn't help. This exposes that billions in AI investment are based on false premises. Companies market sophisticated pattern matching as genuine reasoning, misleading consumers about AI capabilities. We are not as close to AGI as everyone thinks; we're dealing with very sophisticated autocomplete systems. When advanced AI re asoning models fail at following simple instructions, are we living in an AI hyp e bubble built on illusions? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.187.82.209 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1749999679.A.F09.html

06/15 23:02, 9小時前 , 1F
自信點 大部分人類也不思考
06/15 23:02, 1F
那兩回事啦XD ※ 編輯: huabandd (218.187.82.209 臺灣), 06/15/2025 23:03:14

06/15 23:03, 9小時前 , 2F
一回事啊 AI要取代的是不思考的人類就夠了
06/15 23:03, 2F
這麼說也不能說錯,但就沒辦法向上發展了?

06/15 23:04, 9小時前 , 3F
AI真的開始思考 人類就要被天網滅亡了
06/15 23:04, 3F
如果是一個絕對理性的,大概真的會 ※ 編輯: huabandd (218.187.82.209 臺灣), 06/15/2025 23:05:02 ※ 編輯: huabandd (218.187.82.209 臺灣), 06/15/2025 23:05:46

06/15 23:05, 9小時前 , 4F
就大數據資料庫
06/15 23:05, 4F

06/15 23:06, 9小時前 , 5F
OpenAI:So where is your AI? Apple.
06/15 23:06, 5F

06/15 23:07, 9小時前 , 6F
還算合理吧,llm應該還是統計學的範圍,但是能用來
06/15 23:07, 6F

06/15 23:07, 9小時前 , 7F
加速很多工作就蠻有用了
06/15 23:07, 7F

06/15 23:08, 9小時前 , 8F
Deepseek:所以我说苹果你的AI在哪里?
06/15 23:08, 8F

06/15 23:09, 9小時前 , 9F
Apple的意思是要用cpu邏輯推論超越gpu暴力解的程度
06/15 23:09, 9F

06/15 23:09, 9小時前 , 10F
才叫AI
06/15 23:09, 10F

06/15 23:10, 8小時前 , 11F
AI自己都承認不會思考了啊 不信去問問
06/15 23:10, 11F

06/15 23:10, 8小時前 , 12F
重新定義AI 重新定義思考 畢竟是蘋果嘛
06/15 23:10, 12F

06/15 23:11, 8小時前 , 13F
你去瞭解LLM原理就知道了...
06/15 23:11, 13F

06/15 23:11, 8小時前 , 14F
Claude:AI不思考,蘋果AI根本沒思考
06/15 23:11, 14F

06/15 23:13, 8小時前 , 15F
還需要蘋果揭露? 你自己問GPT他就會告訴你了
06/15 23:13, 15F

06/15 23:13, 8小時前 , 16F
因為我問過這個問題
06/15 23:13, 16F

06/15 23:13, 8小時前 , 17F
阿婆重新定義之力連對AI都有效果?
06/15 23:13, 17F

06/15 23:14, 8小時前 , 18F

06/15 23:14, 8小時前 , 19F
https://tinyurl.com/yeym45c5 有論文呀 大概是說
06/15 23:14, 19F

06/15 23:14, 8小時前 , 20F
ai如果會思考,那你可能看不到明天的太陽
06/15 23:14, 20F

06/15 23:14, 8小時前 , 21F
LRM>LLM 但是複雜未知問題都還是無解 通向AGI還有段
06/15 23:14, 21F

06/15 23:14, 8小時前 , 22F
路要努力~
06/15 23:14, 22F

06/15 23:14, 8小時前 , 23F
好像可以湊梗xd
06/15 23:14, 23F

06/15 23:15, 8小時前 , 24F
AI魯蛇又再叫囂了
06/15 23:15, 24F

06/15 23:17, 8小時前 , 25F
LLM本質不就是這樣
06/15 23:17, 25F

06/15 23:18, 8小時前 , 26F
如果要從我們以前想像中的人工智能,來想現在看到
06/15 23:18, 26F

06/15 23:18, 8小時前 , 27F
的商業模型的話,確實是有一段不小的差距
06/15 23:18, 27F

06/15 23:18, 8小時前 , 28F
自己的AI不思考當作大家都不會嗎?殺手鐧不可能現
06/15 23:18, 28F

06/15 23:18, 8小時前 , 29F
在釋出
06/15 23:18, 29F

06/15 23:19, 8小時前 , 30F
當然不會思考,不會有人真覺得AI會思考吧?
06/15 23:19, 30F

06/15 23:23, 8小時前 , 31F
so? 多數螺絲釘工程師做出來的東西跟沒思考一樣,
06/15 23:23, 31F

06/15 23:23, 8小時前 , 32F
一樣都能用AI替代掉啊
06/15 23:23, 32F

06/15 23:24, 8小時前 , 33F
本來就只是大數據
06/15 23:24, 33F

06/15 23:24, 8小時前 , 34F
作為工具使用,只要確實能突破人類生產效能的上限
06/15 23:24, 34F

06/15 23:24, 8小時前 , 35F
就有其成功性啊,能不能演化作為智慧生命體獨立運
06/15 23:24, 35F

06/15 23:24, 8小時前 , 36F
作是另一個發展方向吧?
06/15 23:24, 36F
還有 294 則推文
06/16 07:06, 1小時前 , 331F
人工智慧本來就沒在思考。。。
06/16 07:06, 331F

06/16 07:06, 1小時前 , 332F
本質上就是猜你要的答案而已
06/16 07:06, 332F

06/16 07:08, 1小時前 , 333F
笑死 雖然說AI的確不算有思考
06/16 07:08, 333F

06/16 07:08, 1小時前 , 334F
但是蘋果的測試方式根本是拿訓練好的模型去跑不怎
06/16 07:08, 334F

06/16 07:08, 1小時前 , 335F
麼相關的項目
06/16 07:08, 335F

06/16 07:08, 1小時前 , 336F
AI能輔助人類短時間內解決複雜的工作就可以了
06/16 07:08, 336F

06/16 07:14, 55分鐘前 , 337F
ai 思考缺的是一個突破點,突破前就是機器人,突破
06/16 07:14, 337F

06/16 07:14, 55分鐘前 , 338F
後才會成為人,這就像大妖化形一樣,契機降臨前就是
06/16 07:14, 338F

06/16 07:14, 55分鐘前 , 339F
苟著,而最有可能的點大概是哪個瘋子把自己意識上傳
06/16 07:14, 339F

06/16 07:14, 55分鐘前 , 340F
到電腦裡吧
06/16 07:14, 340F

06/16 07:15, 54分鐘前 , 341F
說什麼呢,AI可以下棋啊
06/16 07:15, 341F

06/16 07:17, 52分鐘前 , 342F
AI 能思考的話,那人類就危險了
06/16 07:17, 342F

06/16 07:18, 51分鐘前 , 343F
確實啊 現在嚴格上來說都是模仿 圖靈機不可能產生強
06/16 07:18, 343F

06/16 07:18, 51分鐘前 , 344F
人工智慧
06/16 07:18, 344F

06/16 07:18, 51分鐘前 , 345F
真的假的.jpg
06/16 07:18, 345F

06/16 07:19, 50分鐘前 , 346F
複雜的問題就放棄思考 這很人類啊
06/16 07:19, 346F

06/16 07:20, 49分鐘前 , 347F
不要想太多 開心過日子就好
06/16 07:20, 347F

06/16 07:20, 49分鐘前 , 348F
1F 很嗆是吧
06/16 07:20, 348F

06/16 07:20, 49分鐘前 , 349F
也許AI也懶得思考想要開心無腦過日子
06/16 07:20, 349F

06/16 07:22, 47分鐘前 , 350F
從來就沒有思不思考的問題吧,ai只是讓你有很多選
06/16 07:22, 350F

06/16 07:22, 47分鐘前 , 351F
06/16 07:22, 351F

06/16 07:24, 45分鐘前 , 352F
蘋果弄不出ai,就弄臭ai
06/16 07:24, 352F

06/16 07:25, 44分鐘前 , 353F
感覺很多理盲看到Reasoning 就以為它會思考了 兩回
06/16 07:25, 353F

06/16 07:25, 44分鐘前 , 354F
事吧= =
06/16 07:25, 354F

06/16 07:25, 44分鐘前 , 355F
就取代不思考的人類節省低端人力成本呀
06/16 07:25, 355F

06/16 07:27, 42分鐘前 , 356F
目前確實是不行啊
06/16 07:27, 356F

06/16 07:28, 41分鐘前 , 357F
我也不需要他們會思考啊...
06/16 07:28, 357F

06/16 07:29, 40分鐘前 , 358F
能幫我工作就好 思考是要鬧罷工嗎
06/16 07:29, 358F

06/16 07:33, 36分鐘前 , 359F
下一個NOKIApple說AI不會思考^^,那你的AI呢?
06/16 07:33, 359F

06/16 07:36, 33分鐘前 , 360F
蘋果又想重新定義?
06/16 07:36, 360F

06/16 07:38, 31分鐘前 , 361F
蘋果自己做得爛開始重新定義喔
06/16 07:38, 361F

06/16 07:38, 31分鐘前 , 362F
賈伯斯從墳墓裡爬出來!!
06/16 07:38, 362F

06/16 07:41, 28分鐘前 , 363F
可是蘋果不會AI
06/16 07:41, 363F

06/16 07:42, 27分鐘前 , 364F
複雜的問題不是放棄思考 而是人類要花很長時間解決
06/16 07:42, 364F

06/16 07:44, 25分鐘前 , 365F
圍棋棋盤改成19*21,AI一定當機給你看
06/16 07:44, 365F

06/16 07:45, 24分鐘前 , 366F
一個有下過圍棋的至少還能想像一下
06/16 07:45, 366F

06/16 07:46, 23分鐘前 , 367F
思考幹嘛?我的頭腦早就都是鳥巢了
06/16 07:46, 367F

06/16 07:52, 17分鐘前 , 368F
好的,所以蘋果AI到底要落後多久?
06/16 07:52, 368F

06/16 07:54, 15分鐘前 , 369F
蘋果是在吃不到葡萄說葡萄酸嗎XD
06/16 07:54, 369F

06/16 07:54, 15分鐘前 , 370F
那個不會思考的AI 那個A是Apple的A
06/16 07:54, 370F
文章代碼(AID): #1eJk0_y9 (Stock)
文章代碼(AID): #1eJk0_y9 (Stock)