[新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預算難以解釋

看板Stock (股票)作者Lushen (pttlushen)時間9小時前 (2025/01/24 19:13)推噓319(348推 29噓 700→)

留言1077則, 235人參與討論串1/4 (看更多)

原文標題： Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預算難以解釋原文連結：https://www.jiqizhixin.com/articles/2025-01-24-2 發布時間：2025/01/24 記者署名：機器之心原文內容：「工程師正在瘋狂地分析 DeepSeek，試圖從中複製任何可能的東西。」 DeepSeek 開源大模型的陽謀，切切實實震撼著美國 AI 公司。最先陷入恐慌的，似乎是同樣推崇開源的 Meta。最近，有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到，國內 AI 新創公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌，因為在前者的低成本高歌猛進下，後者無法解釋自己的超高預算的合理性。原文如下：這一切始於 DeepSeek-V3，它在基準測試中就已經讓 Llama 4 落後。更糟的是那個「擁有 550 萬訓練預算的不知名中國公司」。工程師們正在瘋狂地分析 DeepSeek，試圖從中複製任何可能的東西。這一點都不誇張。管理階層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的每個「領導」的薪資都比訓練整個 DeepSeek-V3 的成本還要高，而我們有好幾十個這樣的「領導」時，他們要如何面對高層？ DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息，但這些很快就會公開。這本來應該是一個以工程為重點的小型組織，但是因為很多人想要參與進來分一杯羹，人為地膨脹了組織的招聘規模，結果每個人都成了輸家。 https://i.imgur.com/hKZ6h5W.png

貼文中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 2025 年 1 月 20 日。其中，DeepSeek-V3 在發佈時提到，該模型在多項評測成績超越了Qwen2.5-72B 和Llama-3.1-405B 等其他開源模型，並在性能和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet 不分伯仲。不過，更引人注目的是，這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美元。具體來說，它的預訓練過程竟然只用了 266.4 萬 H800 GPU Hours，再加上上下文擴展與後訓練的訓練，總共也只有 278.8 H800 GPU Hours。相比之下，Meta 的 Llama 3 系列模型的計算預算則多達 3930 萬 H100 GPU Hours—— 如此計算量足可訓練 DeepSeek-V3 至少 15 次。 https://i.imgur.com/mJn5POl.png

而最近發布的 DeepSeek-R1 效能更猛 —— 在數學、程式碼、自然語言推理等任務上，它的效能比肩 OpenAI o1 正式版。而且模型在發布的同時，權重同步開源。很多人驚呼，原來 DeepSeek 才是真正的 OpenAI。 UC Berkeley 教授 Alex Dimakis 則認為， DeepSeek 現在已經處於領先位置，美國公司可能需要迎頭趕上了。 https://i.imgur.com/NLhp4Nj.png

看到這裡，我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有點硬本事，他們「開源之光」的地位岌岌可危。有人指出，其實該慌的不只 Meta，OpenAI、Google、Anthropic 又何嘗沒有受到挑戰。「這是一件好事，我們可以即時看到公開競爭對創新的影響。」 https://i.imgur.com/gQ5fHDH.png

還有人擔心起了英偉達的股價，表示「如果 DeeSeek 的創新是真的，那麼 AI 公司是否真的需要那麼多顯示卡？」 https://i.imgur.com/HIFcTx6.png

不過，也有人質疑，DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝？有人回覆說，這可以從他們的發布的技術報告中找到答案。 https://i.imgur.com/HIFcTx6.png

目前，我們還無法確定貼文的真實性。不知道 Meta 後續會如何回應，即將到來的 Llama 4 又會達到怎樣的表現。心得/評論： Meta工程師在TeamBlind(一個匿名的職涯討論區，需要經過公司Email驗證)爆料中國的DeepSeek對內部影響很大 DeepSeek R1訓練成本550萬美元可能比一個Meta大頭的年薪還便宜 DeepSeek 這件事情也不光是中國自己在吹噓看了一下 Twitter/Reddit 美國AI工業界、學術界反響非常大 DeekSeek 的母公司幻方量化產出 DeepSeek 的故事也在 Twitter 廣受討論 https://i.imgur.com/NLhp4Nj.png

DeepSeek R1 開源+論文公開應該會推進一波AI界的發展 DeepSeek 後續發展值得關注一下 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.55.152 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737717185.A.FD4.html

推

pmes9866

01/24 19:14, 9小時前 , 1^F

01/24 19:14, 1^F

DeepSeek 訓練成本低+跑起來的成本極低(硬體需求) 自己實際使用體感不覺得他贏 OpenAI 不過以成本場景來說真的是巨大的創新美國知名的 AI 分析機構 Artificial Analysis 對 DeepSeek 的成本分析 https://i.imgur.com/0GRkj6Q.png

→

agassi001

01/24 19:15, 9小時前 , 2^F

01/24 19:15, 2^F

推

wts4832

01/24 19:15, 9小時前 , 3^F

01/24 19:15, 3^F

→

moom50302

01/24 19:15, 9小時前 , 4^F

01/24 19:15, 4^F

推

Plumpy

01/24 19:16, 9小時前 , 5^F

01/24 19:16, 5^F

噓

s1612316

01/24 19:16, 9小時前 , 6^F

01/24 19:16, 6^F

推

kenbbc12321

01/24 19:18, 9小時前 , 7^F

01/24 19:18, 7^F

推

lpmybig

01/24 19:18, 9小時前 , 8^F

01/24 19:18, 8^F

DeepSeek R1 程式碼、論文都開源+公開了 https://github.com/deepseek-ai/DeepSeek-R1 https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

→

appledick

01/24 19:18, 9小時前 , 9^F

01/24 19:18, 9^F

→

appledick

01/24 19:19, 9小時前 , 10^F

01/24 19:19, 10^F

推

lc85301

01/24 19:19, 9小時前 , 11^F

01/24 19:19, 11^F

推

zhi5566

01/24 19:19, 9小時前 , 12^F

01/24 19:19, 12^F

推

kuosos520

01/24 19:20, 9小時前 , 13^F

01/24 19:20, 13^F

推

aegis43210

01/24 19:20, 9小時前 , 14^F

01/24 19:20, 14^F

→

aegis43210

01/24 19:20, 9小時前 , 15^F

01/24 19:20, 15^F

※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:25:15

推

KrisNYC

01/24 19:22, 9小時前 , 16^F

01/24 19:22, 16^F

→

furbyyeh

01/24 19:22, 9小時前 , 17^F

01/24 19:22, 17^F

→

KrisNYC

01/24 19:22, 9小時前 , 18^F

01/24 19:22, 18^F

推

stlinman

01/24 19:22, 9小時前 , 19^F

01/24 19:22, 19^F

推

rrazer

01/24 19:22, 9小時前 , 20^F

01/24 19:22, 20^F

推

momochacha

01/24 19:22, 9小時前 , 21^F

01/24 19:22, 21^F

→

KrisNYC

01/24 19:22, 9小時前 , 22^F

01/24 19:22, 22^F

→

KrisNYC

01/24 19:22, 9小時前 , 23^F

01/24 19:22, 23^F

推

Lowpapa

01/24 19:23, 9小時前 , 24^F

01/24 19:23, 24^F

推

godog

01/24 19:23, 9小時前 , 25^F

01/24 19:23, 25^F

推

aegis43210

01/24 19:24, 8小時前 , 26^F

01/24 19:24, 26^F

推

iamsosmart

01/24 19:24, 8小時前 , 27^F

01/24 19:24, 27^F

→

iamsosmart

01/24 19:24, 8小時前 , 28^F

01/24 19:24, 28^F

推

huabandd

01/24 19:25, 8小時前 , 29^F

01/24 19:25, 29^F

網景公司創始人(美國公司;世界第一個廣泛使用的瀏覽器) Facebbok、eBay、HP 董事會成員風投 Marc Andreessen 幫你整理了重點 https://i.imgur.com/SmUbN8M.png

Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen — and as open source, a profound gift to the world. DeepSeek 翻譯: https://i.imgur.com/5zX1uf2.png