PTT職涯區 / Tech_Job (科技人)

Re: [新聞] 曾害輝達市值一夜噴掉17兆！ DeepSeek 使用率雪崩近6成慘兮兮

看板Tech_Job (科技人)作者sxy67230 (charlesgg)時間2周前 (2025/05/17 19:21)推噓6(8推 2噓 16→)

留言26則, 13人參與討論串2/2 (看更多)

很多國外新聞這幾天比較專業的都是關注在DeepSeek的新論文，詳細列出了很多DeepSeek技術細節如何省流的數據，像是KV Cache的成本還有透過軟體整合協同提升硬體的使用效率（ 3F S無疑是工藝品的等級），揭露了未來減少GPU、Disk跟CPU之間的通訊無疑是下一個軟硬整合加速指標。當前開源生態甚至是Gemini都已經將DeepSeek的GRPO當作模型對齊Reasoning的新範式了，實際也是證明很好用有效又省錢，最近也是蠻多篇Paper探討Reward作為一種弱監督信號為什麼有用又不會像DPO一樣會過度擬合訓練數據的好處。題外話，連NVIDIA 的Nemotron最新一代也採用這樣的Post training 新範式。然後文章沒揭露的是很多閉源模型當前為了alignment最新的時事資料或基於用戶反饋的校正成本，實際上谷歌、Claude跟OpenAI在這塊的維護上每年都要虧損十幾億美金，這東西是很多小企業維護不來的。然後GPU的Infra群集這幾年也是不斷在往上增加，反而訓練的成本才是往下掉的。谷歌跟Op enAI為了維持服務響應花費的不比訓練建構的群集還要少。我個人認為這種文章針對性蠻強的，重點也不是在DeepSeek系統架構上的缺失，真的要我說的話，當前DeepSeek比較大的問題是市場上具有Reasoning的LLM競品在DS開源方法以後開始暴增，但DeepSeek沒有資源來調優當前自己的R1模型(畢竟公司多數都是研究員，可以看出團隊會更想把精力花費在研究上）。然後實際上普通人對Reasoning的需求就不大（吉卜力會爆紅顯示普通人對AI的期望會更像有趣的玩具），企業有資源的會選擇自己建構，沒資源的會採用Agent方式讓多個響應比較快的模型建構特定場景的任務替代Reasoning LLM。差不多4醬 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.109.14 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1747480919.A.242.html

→

05/17 19:37, 2周前 , 1^F

05/17 19:37, 1^F

推

05/17 19:43, 2周前 , 2^F

05/17 19:43, 2^F

→

05/17 19:43, 2周前 , 3^F

05/17 19:43, 3^F

※ 編輯: sxy67230 (101.10.109.14 臺灣), 05/17/2025 20:08:25

→

05/17 21:45, 2周前 , 4^F

05/17 21:45, 4^F

→

05/17 22:10, 2周前 , 5^F

05/17 22:10, 5^F

→

05/17 22:10, 2周前 , 6^F

05/17 22:10, 6^F

→

05/17 22:14, 2周前 , 7^F

05/17 22:14, 7^F

→

05/17 22:14, 2周前 , 8^F

05/17 22:14, 8^F

推

05/17 22:42, 2周前 , 9^F

05/17 22:42, 9^F

噓

05/17 23:25, 2周前 , 10^F

05/17 23:25, 10^F

推

05/17 23:25, 2周前 , 11^F

05/17 23:25, 11^F

推

05/18 01:22, 2周前 , 12^F

05/18 01:22, 12^F

推

05/18 07:42, 2周前 , 13^F

05/18 07:42, 13^F

→

05/18 07:43, 2周前 , 14^F

05/18 07:43, 14^F

推

05/18 13:12, 2周前 , 15^F

05/18 13:12, 15^F

→

05/18 13:12, 2周前 , 16^F

05/18 13:12, 16^F

→

05/18 13:12, 2周前 , 17^F

05/18 13:12, 17^F

噓

05/18 16:50, 2周前 , 18^F

05/18 16:50, 18^F

→

05/18 16:50, 2周前 , 19^F

05/18 16:50, 19^F

文組網軍有夠可憐的，談技術不懂技術難怪年薪不到百萬:) ※ 編輯: sxy67230 (101.10.109.14 臺灣), 05/18/2025 18:06:11 ※ 編輯: sxy67230 (101.10.109.14 臺灣), 05/18/2025 18:07:48

推

05/18 21:59, 2周前 , 20^F

05/18 21:59, 20^F

→

05/18 22:00, 2周前 , 21^F

05/18 22:00, 21^F

推

05/19 19:12, 2周前 , 22^F

05/19 19:12, 22^F

→

05/19 19:12, 2周前 , 23^F

05/19 19:12, 23^F

→

05/19 19:15, 2周前 , 24^F

05/19 19:15, 24^F

→

05/19 19:15, 2周前 , 25^F

05/19 19:15, 25^F

→

05/19 19:15, 2周前 , 26^F

05/19 19:15, 26^F

‣ 返回看板[ Tech_Job ] 工作

‣ 更多 sxy67230 的文章

文章代碼(AID): #1eA75N92 (Tech_Job)

討論串 (同標題文章)

完整討論串 (本文為第 2 之 2 篇)：

排序：最舊先 | 最新先 | 留言數

42

153

[新聞] 曾害輝達市值一夜噴掉17兆！ DeepSeek

2周前, 05/17

6

26

Re: [新聞] 曾害輝達市值一夜噴掉17兆！ DeepSeek

2周前, 05/17

在新視窗開啟完整討論串 (共2篇)

Tech_Job 近期熱門文章

6

30

Re: [轉錄] 日本人：日本科技已經完全落後於中國

4小時前, 06/07

1

1

[新聞]中華電信率先完成50G PON驗證 2026年引進

4小時前, 06/07

7

17

[討論] GUC是低調強的公司嗎？

9小時前, 06/06

1

14

[新聞] 谷歌Gemini 2.5升級「全能王」推理、程

12小時前, 06/06

40

169

[討論] 為什麼台灣人健忘沒在台達跳樓事件生效？

13小時前, 06/06

8

23

Re: [討論] 年薪200，朝九晚五，該換工作嗎已刪文

13小時前, 06/06

72

288

[討論] 年薪200，朝九晚五，該換工作嗎

19小時前, 06/06

12

22

Re: [轉錄] 日本人：日本科技已經完全落後於中國

20小時前, 06/06

更多近期熱門文章 >>

PTT職涯區即時熱門文章

5

5

[閒聊] 貸款問題導致建商因週轉GG

3小時前, 06/07

15

27

Re: [新聞] 谷歌Gemini 2.5升級「全能王」推理、程

3小時前, 06/07

5

22

[閒聊] 青埔在地建商要破產了？

4小時前, 06/07

27

53

[新聞] 川普稱馬斯克「可憐的傢伙」:這段時間不

5小時前, 06/07

33

72

[新聞] 與馬斯克鬧翻白宮官員：川普可能轉讓特

6小時前, 06/06

36

66

[新聞] 川習破冰通話互邀訪！難脫稀土依賴川

6小時前, 06/06

7

34

[請益] 台銀公教房貸對保請益

6小時前, 06/06

8

31

Re: [閒聊] 生育率跟房價有顯著相關吧？

6小時前, 06/06

更多即時熱門文章 >>

‣ 返回看板[ Tech_Job ] 工作

‣ 更多 sxy67230 的文章

文章代碼(AID): #1eA75N92 (Tech_Job)