看板 [ Stock ]
討論串[新聞] DeepSeek 遇大規模網路攻擊,暫時只支援中國手機用戶註冊
共 6 篇文章
首頁
上一頁
1
2
下一頁
尾頁

推噓7(8推 1噓 11→)留言20則,0人參與, 5月前最新作者gn02118620時間5月前 (2025/01/29 17:42), 編輯資訊
0
2
0
內容預覽:
這場表面上是中美AI之爭. 但其實是開源模型對閉源模型之爭. NV是賣鏟子的,市面上數據中心他的鏟子佔比是90% 基本上就是一家屌打所有人,也就是你要做AI幾乎就綁定只能用他家的鏟子. DeepSeek如果真的能夠如同他們所提的,能大幅降低訓練成本,那直白來說就是提升效率(更少的投入成本或是更少的投
(還有273個字)

推噓18(18推 0噓 14→)留言32則,0人參與, 5月前最新作者chesterhe (chesterhe)時間5月前 (2025/01/29 17:26), 5月前編輯資訊
0
1
0
內容預覽:
Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到. DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破. 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。. 訓練過程中涉及大量的知識蒸餾(disti
(還有705個字)

推噓13(16推 3噓 66→)留言85則,0人參與, 5月前最新作者lon0623 (broaden)時間5月前 (2025/01/29 15:08), 編輯資訊
0
0
0
內容預覽:
看了DS的討論,我反而覺得有些商機. 1.DS訓練成本是低,只有557萬美金,但訓練要快兩個月。如果稍微多花一點錢,租高階GPU來跑,那是不是可以接受?反正增加兩三倍成本也不貴。. 2.這樣有多了一個議題,究竟是高階需求會下降,還是低階?畢竟並不全然是省錢就好,搶市場也很重要。. 3.這557萬美金
(還有106個字)

推噓48(71推 23噓 276→)留言370則,0人參與, 5月前最新作者gn02118620時間5月前 (2025/01/29 08:59), 5月前編輯資訊
0
2
0
內容預覽:
來看看大神Andrej Karpathy是怎麼評論的. Andrej Karpathy. https://i.imgur.com/WYEHc65.jpeg. 首先要打臉的是第二點. DeepSeek告訴大家,他是利用2048片H800 GPU, 經過兩個月的時間,訓練出來的,訓練費用是550萬鎂.
(還有416個字)

推噓186(214推 28噓 664→)留言906則,0人參與, 5月前最新作者WinNOKIA (海神)時間5月前 (2025/01/29 07:51), 5月前編輯資訊
0
0
0
內容預覽:
1. DeepSeek創辦人梁文鋒,少年股神變AI大神. 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦. 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的十分之一成本,這個費用也差不多是一位 AI 主管的年薪而
(還有108個字)
首頁
上一頁
1
2
下一頁
尾頁