[新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
看板Stock (股票)作者Lushen (pttlushen)時間9小時前 (2025/01/24 19:13)推噓319(348推 29噓 700→)留言1077則, 235人參與討論串1/4 (看更多)
原文標題:
Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
原文連結:https://www.jiqizhixin.com/articles/2025-01-24-2
發布時間:2025/01/24
記者署名:機器之心
原文內容:
「工程師正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。」
DeepSeek 開源大模型的陽謀,切切實實震撼著美國 AI 公司。
最先陷入恐慌的,似乎是同樣推崇開源的 Meta。
最近,有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到,國內 AI 新創公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌,因為在前者的低成本高歌猛進下,後者無法解釋自己的超高預算的合理性。
原文如下:
這一切始於 DeepSeek-V3,它在基準測試中就已經讓 Llama 4 落後。更糟的是那個「擁有 550 萬訓練預算的不知名中國公司」。
工程師們正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。這一點都不誇張。
管理階層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的每個「領導」的薪資都比訓練整個 DeepSeek-V3 的成本還要高,而我們有好幾十個這樣的「領導」時,他們要如何面對高層?
DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息,但這些很快就會公開。
這本來應該是一個以工程為重點的小型組織,但是因為很多人想要參與進來分一杯羹,人為地膨脹了組織的招聘規模,結果每個人都成了輸家。
https://i.imgur.com/hKZ6h5W.png
貼文中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 2025 年 1 月 20 日。
其中,DeepSeek-V3 在發佈時提到,該模型在多項評測成績超越了Qwen2.5-72B 和Llama-3.1-405B 等其他開源模型,並在性能和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet 不分伯仲。
不過,更引人注目的是,這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美元。具體來說,它的預訓練過程竟然只用了 266.4 萬 H800 GPU Hours,再加上上下文擴展與後訓練的訓練,總共也只有 278.8 H800 GPU Hours。相比之下,Meta 的 Llama 3 系列模型的計算預算則多達 3930 萬 H100 GPU Hours—— 如此計算量足可訓練 DeepSeek-V3 至少 15 次。
https://i.imgur.com/mJn5POl.png
而最近發布的 DeepSeek-R1 效能更猛 —— 在數學、程式碼、自然語言推理等任務上,它的效能比肩 OpenAI o1 正式版。而且模型在發布的同時,權重同步開源。很多人驚呼,原來 DeepSeek 才是真正的 OpenAI。 UC Berkeley 教授 Alex Dimakis 則認為, DeepSeek 現在已經處於領先位置,美國公司可能需要迎頭趕上了。
https://i.imgur.com/NLhp4Nj.png
看到這裡,我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有點硬本事,他們「開源之光」的地位岌岌可危。
有人指出,其實該慌的不只 Meta,OpenAI、Google、Anthropic 又何嘗沒有受到挑戰。 「這是一件好事,我們可以即時看到公開競爭對創新的影響。」
https://i.imgur.com/gQ5fHDH.png
還有人擔心起了英偉達的股價,表示「如果 DeeSeek 的創新是真的,那麼 AI 公司是否真的需要那麼多顯示卡?」
https://i.imgur.com/HIFcTx6.png
不過,也有人質疑,DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝?有人回覆說,這可以從他們的發布的技術報告中找到答案。
https://i.imgur.com/HIFcTx6.png
目前,我們還無法確定貼文的真實性。
不知道 Meta 後續會如何回應,即將到來的 Llama 4 又會達到怎樣的表現。
心得/評論:
Meta工程師在TeamBlind(一個匿名的職涯討論區,需要經過公司Email驗證)爆料中國的DeepSeek對內部影響很大
DeepSeek R1訓練成本550萬美元 可能比一個Meta大頭的年薪還便宜
DeepSeek 這件事情也不光是中國自己在吹噓
看了一下 Twitter/Reddit 美國AI工業界、學術界反響非常大
DeekSeek 的母公司幻方量化產出 DeepSeek 的故事也在 Twitter 廣受討論
https://i.imgur.com/NLhp4Nj.png
DeepSeek R1 開源+論文公開應該會推進一波AI界的發展
DeepSeek 後續發展值得關注一下
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.55.152 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737717185.A.FD4.html
推
01/24 19:14,
9小時前
, 1F
01/24 19:14, 1F
DeepSeek 訓練成本低+跑起來的成本極低(硬體需求)
自己實際使用體感不覺得他贏 OpenAI
不過以成本場景來說真的是巨大的創新
美國知名的 AI 分析機構 Artificial Analysis
對 DeepSeek 的成本分析
https://i.imgur.com/0GRkj6Q.png
→
01/24 19:15,
9小時前
, 2F
01/24 19:15, 2F
推
01/24 19:15,
9小時前
, 3F
01/24 19:15, 3F
→
01/24 19:15,
9小時前
, 4F
01/24 19:15, 4F
推
01/24 19:16,
9小時前
, 5F
01/24 19:16, 5F
噓
01/24 19:16,
9小時前
, 6F
01/24 19:16, 6F
推
01/24 19:18,
9小時前
, 7F
01/24 19:18, 7F
推
01/24 19:18,
9小時前
, 8F
01/24 19:18, 8F
→
01/24 19:18,
9小時前
, 9F
01/24 19:18, 9F
→
01/24 19:19,
9小時前
, 10F
01/24 19:19, 10F
推
01/24 19:19,
9小時前
, 11F
01/24 19:19, 11F
推
01/24 19:19,
9小時前
, 12F
01/24 19:19, 12F
推
01/24 19:20,
9小時前
, 13F
01/24 19:20, 13F
推
01/24 19:20,
9小時前
, 14F
01/24 19:20, 14F
→
01/24 19:20,
9小時前
, 15F
01/24 19:20, 15F
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:25:15
推
01/24 19:22,
9小時前
, 16F
01/24 19:22, 16F
→
01/24 19:22,
9小時前
, 17F
01/24 19:22, 17F
→
01/24 19:22,
9小時前
, 18F
01/24 19:22, 18F
推
01/24 19:22,
9小時前
, 19F
01/24 19:22, 19F
推
01/24 19:22,
9小時前
, 20F
01/24 19:22, 20F
推
01/24 19:22,
9小時前
, 21F
01/24 19:22, 21F
→
01/24 19:22,
9小時前
, 22F
01/24 19:22, 22F
→
01/24 19:22,
9小時前
, 23F
01/24 19:22, 23F
推
01/24 19:23,
9小時前
, 24F
01/24 19:23, 24F
推
01/24 19:23,
9小時前
, 25F
01/24 19:23, 25F
推
01/24 19:24,
8小時前
, 26F
01/24 19:24, 26F
推
01/24 19:24,
8小時前
, 27F
01/24 19:24, 27F
→
01/24 19:24,
8小時前
, 28F
01/24 19:24, 28F
推
01/24 19:25,
8小時前
, 29F
01/24 19:25, 29F
網景公司創始人(美國公司;世界第一個廣泛使用的瀏覽器)
Facebbok、eBay、HP 董事會成員
風投
Marc Andreessen
幫你整理了重點
https://i.imgur.com/SmUbN8M.png
Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen — and as open source, a profound gift to the world.
DeepSeek 翻譯:
https://i.imgur.com/5zX1uf2.png
推
01/24 19:26,
8小時前
, 30F
01/24 19:26, 30F
推
01/24 19:26,
8小時前
, 31F
01/24 19:26, 31F
推
01/24 19:27,
8小時前
, 32F
01/24 19:27, 32F
推
01/24 19:27,
8小時前
, 33F
01/24 19:27, 33F
推
01/24 19:28,
8小時前
, 34F
01/24 19:28, 34F
→
01/24 19:29,
8小時前
, 35F
01/24 19:29, 35F
還有 1002 則推文
還有 14 段內文
→
01/25 00:57,
3小時前
, 1038F
01/25 00:57, 1038F
推
01/25 00:58,
3小時前
, 1039F
01/25 00:58, 1039F
→
01/25 00:58,
3小時前
, 1040F
01/25 00:58, 1040F
→
01/25 00:58,
3小時前
, 1041F
01/25 00:58, 1041F
推
01/25 00:59,
3小時前
, 1042F
01/25 00:59, 1042F
→
01/25 01:00,
3小時前
, 1043F
01/25 01:00, 1043F
推
01/25 01:00,
3小時前
, 1044F
01/25 01:00, 1044F
→
01/25 01:03,
3小時前
, 1045F
01/25 01:03, 1045F
→
01/25 01:03,
3小時前
, 1046F
01/25 01:03, 1046F
→
01/25 01:04,
3小時前
, 1047F
01/25 01:04, 1047F
推
01/25 01:05,
3小時前
, 1048F
01/25 01:05, 1048F
→
01/25 01:06,
3小時前
, 1049F
01/25 01:06, 1049F
→
01/25 01:06,
3小時前
, 1050F
01/25 01:06, 1050F
→
01/25 01:06,
3小時前
, 1051F
01/25 01:06, 1051F
→
01/25 01:09,
3小時前
, 1052F
01/25 01:09, 1052F
→
01/25 01:11,
3小時前
, 1053F
01/25 01:11, 1053F
→
01/25 01:12,
3小時前
, 1054F
01/25 01:12, 1054F
→
01/25 01:12,
3小時前
, 1055F
01/25 01:12, 1055F
→
01/25 01:13,
3小時前
, 1056F
01/25 01:13, 1056F
→
01/25 01:15,
3小時前
, 1057F
01/25 01:15, 1057F
→
01/25 01:15,
3小時前
, 1058F
01/25 01:15, 1058F
→
01/25 01:16,
3小時前
, 1059F
01/25 01:16, 1059F
→
01/25 01:16,
3小時前
, 1060F
01/25 01:16, 1060F
推
01/25 01:18,
3小時前
, 1061F
01/25 01:18, 1061F
→
01/25 01:21,
3小時前
, 1062F
01/25 01:21, 1062F
推
01/25 01:34,
2小時前
, 1063F
01/25 01:34, 1063F
推
01/25 01:44,
2小時前
, 1064F
01/25 01:44, 1064F
推
01/25 01:55,
2小時前
, 1065F
01/25 01:55, 1065F
推
01/25 01:55,
2小時前
, 1066F
01/25 01:55, 1066F
→
01/25 01:56,
2小時前
, 1067F
01/25 01:56, 1067F
→
01/25 01:57,
2小時前
, 1068F
01/25 01:57, 1068F
→
01/25 01:58,
2小時前
, 1069F
01/25 01:58, 1069F
→
01/25 01:58,
2小時前
, 1070F
01/25 01:58, 1070F
推
01/25 02:16,
2小時前
, 1071F
01/25 02:16, 1071F
→
01/25 02:23,
2小時前
, 1072F
01/25 02:23, 1072F
→
01/25 02:38,
1小時前
, 1073F
01/25 02:38, 1073F
噓
01/25 02:58,
1小時前
, 1074F
01/25 02:58, 1074F
→
01/25 03:13,
1小時前
, 1075F
01/25 03:13, 1075F
→
01/25 03:13,
1小時前
, 1076F
01/25 03:13, 1076F
→
01/25 03:13,
1小時前
, 1077F
01/25 03:13, 1077F
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 4 篇):
Stock 近期熱門文章
PTT職涯區 即時熱門文章