[新聞]楊立昆解讀 DeepSeek:不是中國AI超越美國,而是開源模型超越專有模型

看板Tech_Job (科技人)作者 (pl132)時間22小時前 (2025/01/26 18:25), 編輯推噓4(5128)
留言34則, 11人參與, 2小時前最新討論串1/1
楊立昆解讀 DeepSeek:不是中國 AI 超越美國,而是開源模型超越專有模型 https://tinyurl.com/2c26ddpl 中國 AI 公司 DeepSeek 釋出 DeepSeek-R1 模型正式版,基準測試結果可說是追平 OpenAI o1,開發成本卻遠遠低於 OpenAI、Google 等所開發的模型,震驚 AI 業界。 圖靈獎得主、主導 Meta AI 研究的首席科學家楊立昆(Yann LeCun)認為,DeepSeek 成 功的最大收穫並非中國競爭對其他國家帶來更大威脅,而是 AI 開源(open-source)的 價值使任何人都能受益。 「對那些看到 DeepSeek 表現並認為『中國在 AI 領域正超越美國』的人而言,你的解讀 錯了」,楊立昆在 Threads 寫道,「正確解讀應是『開源模型正超越專有模型』」 DeepSeek-R1 開源釋出,Meta Llama 也類似這種做法。OpenAI 成立使命是以 AGI( Artificial General Intelligence,通用人工智慧)造福全人類,起初採取開源做法, 近年來已轉向閉源(closed-source),不對外分享。 OpenAI 執行長奧特曼(Sam Altman)去年 11 月在 Reddit AMA(Ask Me Anything)活 動曾表示,閉源做法為 OpenAI 提供一種更容易達到安全門檻的方法,同時補充說,希望 OpenAI 將來開源釋出更多東西。 「DeepSeek 從開放研究和開源獲益良多(如同 PyTorch 和 Llama),他們提出新想法, 並從其他人的工作基礎加以建構。」楊立昆也寫道,「他們發布且採開源,所以每個人都 能從中受益,這就是開放研究和開源的力量。」 https://is.gd/DsPOuR -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.26.136.149 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1737887132.A.1D8.html

01/26 19:18, 21小時前 , 1F
這個解釋 很中肯
01/26 19:18, 1F

01/26 19:57, 20小時前 , 2F
LeCun 你去跟你家老闆說啊...
01/26 19:57, 2F

01/26 21:14, 19小時前 , 3F
樓上是要他說什麼?llamma 就已經開
01/26 21:14, 3F

01/26 21:14, 19小時前 , 4F
源了啊
01/26 21:14, 4F

01/26 22:07, 18小時前 , 5F
我只是不小心把內積換成卷積
01/26 22:07, 5F

01/26 22:46, 18小時前 , 6F
避重就輕,DeepSeek不開源就做不出
01/26 22:46, 6F

01/26 22:46, 18小時前 , 7F
來嗎?
01/26 22:46, 7F

01/27 00:01, 16小時前 , 8F
米國沒有輸!
01/27 00:01, 8F

01/27 00:07, 16小時前 , 9F
那你家Llama有贏嗎?
01/27 00:07, 9F

01/27 00:11, 16小時前 , 10F
阿就用開源的模型為基礎發展出來的
01/27 00:11, 10F

01/27 00:11, 16小時前 , 11F
這麼說沒錯吧
01/27 00:11, 11F

01/27 00:33, 16小時前 , 12F
llama只開源模型"權重"。deepseek是
01/27 00:33, 12F

01/27 00:33, 16小時前 , 13F
開源,訓練資料,訓練方法,模型權
01/27 00:33, 13F

01/27 00:33, 16小時前 , 14F
重,量化方式。
01/27 00:33, 14F

01/27 00:37, 16小時前 , 15F
而且llama系列模型是 llama license
01/27 00:37, 15F

01/27 00:37, 16小時前 , 16F
商用有限制。deepseek是MIT licens
01/27 00:37, 16F

01/27 00:37, 16小時前 , 17F
e,完全自由。開源程度差太多了。
01/27 00:37, 17F

01/27 02:03, 14小時前 , 18F
你家? 也不太對 對LeCun來說llama
01/27 02:03, 18F

01/27 02:04, 14小時前 , 19F
團隊是跟他的world model爭資源的
01/27 02:04, 19F

01/27 02:04, 14小時前 , 20F
競爭團隊
01/27 02:04, 20F

01/27 02:04, 14小時前 , 21F
lecun從頭到尾就沒看好過LLM
01/27 02:04, 21F

01/27 09:15, 7小時前 , 22F
gitGub上有 deepseek-R1 的paper
01/27 09:15, 22F

01/27 10:59, 5小時前 , 23F
World Models又不是LLM,整天在那
01/27 10:59, 23F

01/27 10:59, 5小時前 , 24F
抬槓
01/27 10:59, 24F

01/27 11:32, 5小時前 , 25F
又來一篇?大過年的!KPI那麼難達
01/27 11:32, 25F

01/27 11:32, 5小時前 , 26F
成?
01/27 11:32, 26F

01/27 14:13, 2小時前 , 27F
llama從頭到尾leCun團隊就沒參與
01/27 14:13, 27F

01/27 14:14, 2小時前 , 28F
所以你硬說是他家他應該也滿頭問號
01/27 14:14, 28F

01/27 14:14, 2小時前 , 29F
他之前還抱怨過llama佔用太多資源
01/27 14:14, 29F

01/27 14:16, 2小時前 , 30F
Meta祖說 跟美AI差距小 呼籲政府減
01/27 14:16, 30F

01/27 14:16, 2小時前 , 31F
少對企業限制
01/27 14:16, 31F

01/27 14:18, 2小時前 , 32F
抗中保美的戲碼
01/27 14:18, 32F

01/27 14:19, 2小時前 , 33F
所以才說他跟他家老闆講話不同調
01/27 14:19, 33F

01/27 14:20, 2小時前 , 34F
除非你覺得Meta AI 跟 Meta 沒關係
01/27 14:20, 34F
文章代碼(AID): #1dbWsS7O (Tech_Job)
文章代碼(AID): #1dbWsS7O (Tech_Job)