PTT職涯區 / Stock (股票)

Re: [新聞] 成本低廉中國AI初創DeepSeek震撼矽谷

看板Stock (股票)作者kinda (天天)時間2天前 (2025/01/27 18:56)推噓1(1推 0噓 2→)

留言3則, 3人參與討論串2/2 (看更多)

前文恕刪 : 據報導，DeepSeek僅用2048片H800顯示卡 (GPU)、耗時兩個月，就訓練出了一個6710億參 : 數的DeepSeek-V3。相較於Meta訓練參數量4050億的Llama 3，用了1萬6384片更強的H100 : 顯示卡，花了54天。DeepSeek的訓練效率提升了11倍。這比法很不公平 12/6 Meta 免費放出蒸餾過的 llama 3.3 70B 很多項目效能接近llama 3.1 405B 12/27 Deepseek V3 公開看起來 deepseek V3 快速導入了新開源模型變強是因為Meta幫他訓練+蒸餾大模型中文強是因為蒸餾了阿里巴巴Qwen2.5模型訓練量少只是因為不用訓練大模型隨便搜一下專家系統 MoE 1994年就有論文(MIT) 蒸餾模型 2015年的論文(Google) 專家系統 + 蒸餾模型2022年有論文(Microsoft) 都不是什麼新東西新聞中跟gpt-4o和llama 3.1 405B比只是行銷手段如果跟llama 3.3 70B比兩者效能相當預測花費約少30% deepseek v3就只是優化/特化的小改版資料來源： DeepSeek-V3 vs GPT-4o vs Llama 3.3 70B https://tinyurl.com/46b2anf7 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.34.251 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737975363.A.0B7.html

推

01/27 18:58, 2天前 , 1^F

01/27 18:58, 1^F

→

01/27 19:09, 2天前 , 2^F

01/27 19:09, 2^F

→

01/27 19:48, 2天前 , 3^F

01/27 19:48, 3^F

‣ 返回看板[ Stock ] 學術

‣ 更多 kinda 的文章

文章代碼(AID): #1dbsP32t (Stock)

討論串 (同標題文章)

本文引述了以下文章的的內容：

92

227

[新聞] 成本低廉中國AI初創DeepSeek震撼矽谷

2天前, 01/27

完整討論串 (本文為第 2 之 2 篇)：

排序：最舊先 | 最新先 | 留言數

92

227

[新聞] 成本低廉中國AI初創DeepSeek震撼矽谷

2天前, 01/27

1

3

Re: [新聞] 成本低廉中國AI初創DeepSeek震撼矽谷

2天前, 01/27

在新視窗開啟完整討論串 (共2篇)

Stock 近期熱門文章

84

245

[新聞] 美準商務部長稱「美國太依賴台灣」

2小時前, 01/30

7

15

[請益] 接下來換 Qwen 2.5 Max?

3小時前, 01/30

5

51

Re: [請益] 為什麼中國越來越強？

3小時前, 01/30

74

160

[情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G

3小時前, 01/30

50

90

[新聞] 〈財報〉特斯拉Q4獲利營收均遜於預期汽

3小時前, 01/30

20

73

Re: [請益] 為什麼中國越來越強？

3小時前, 01/30

9

46

Re: [新聞] OpenAI：已掌握DeepSeek盜用模型證據

4小時前, 01/30

40

105

Re: [新聞] OpenAI：已掌握DeepSeek盜用模型證據

4小時前, 01/30

更多近期熱門文章 >>

PTT職涯區即時熱門文章

23

32

[閒聊] 過年會被家人親戚問買房了沒嗎？

3小時前, 01/30

29

156

[閒聊] 00後會不會不買房也不租房啊

5小時前, 01/30

3

11

Re: [閒聊] 永豐DAWAY已開過卡APP又顯示立即開卡m

11小時前, 01/30

3

9

［請問］問一個看不懂中國用語

11小時前, 01/30

5

6

[請益] 美股 ETF 個股資金分配

[ Foreign_Inv ]

11小時前, 01/30

19

110

[請益] 到底是預售還是中古先跌？

12小時前, 01/30

6

20

Re: [請益] 海關台北關最新輪班方式

[ PublicServan ]

13小時前, 01/30

29

140

Re: [閒聊] 如果高階晶片需求趨緩，台積房會gg嗎

14小時前, 01/29

更多即時熱門文章 >>

‣ 返回看板[ Stock ] 學術

‣ 更多 kinda 的文章

文章代碼(AID): #1dbsP32t (Stock)