看板 [ Stock ]
討論串[新聞] DeepSeek 遇大規模網路攻擊,暫時只支援中國手機用戶註冊
共 6 篇文章
首頁
上一頁
1
2
下一頁
尾頁

推噓96(118推 22噓 170→)留言310則,0人參與, 5小時前最新作者GMTB (Gene mutation the black)時間1天前 (2025/01/29 06:49), 編輯資訊
0
1
1
內容預覽:
https://pse.is/73a9sp. DeepSeek 遇大規模網路攻擊,暫時只支援中國手機用戶註冊. 作者 林 妤柔 | 發布日期 2025 年 01 月 28 日. https://img.technews.tw/wp-content/uploads/2025/01/22135827/D
(還有865個字)

推噓186(214推 28噓 664→)留言906則,0人參與, 1天前最新作者WinNOKIA (海神)時間1天前 (2025/01/29 07:51), 1天前編輯資訊
2
0
0
內容預覽:
1. DeepSeek創辦人梁文鋒,少年股神變AI大神. 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦. 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的十分之一成本,這個費用也差不多是一位 AI 主管的年薪而
(還有108個字)

推噓48(71推 23噓 276→)留言370則,0人參與, 1天前最新作者gn02118620時間1天前 (2025/01/29 08:59), 1天前編輯資訊
0
2
0
內容預覽:
來看看大神Andrej Karpathy是怎麼評論的. Andrej Karpathy. https://i.imgur.com/WYEHc65.jpeg. 首先要打臉的是第二點. DeepSeek告訴大家,他是利用2048片H800 GPU, 經過兩個月的時間,訓練出來的,訓練費用是550萬鎂.
(還有416個字)

推噓13(16推 3噓 66→)留言85則,0人參與, 1天前最新作者lon0623 (broaden)時間1天前 (2025/01/29 15:08), 編輯資訊
1
0
0
內容預覽:
看了DS的討論,我反而覺得有些商機. 1.DS訓練成本是低,只有557萬美金,但訓練要快兩個月。如果稍微多花一點錢,租高階GPU來跑,那是不是可以接受?反正增加兩三倍成本也不貴。. 2.這樣有多了一個議題,究竟是高階需求會下降,還是低階?畢竟並不全然是省錢就好,搶市場也很重要。. 3.這557萬美金
(還有106個字)

推噓18(18推 0噓 14→)留言32則,0人參與, 1天前最新作者chesterhe (chesterhe)時間1天前 (2025/01/29 17:26), 1天前編輯資訊
0
1
0
內容預覽:
Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到. DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破. 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。. 訓練過程中涉及大量的知識蒸餾(disti
(還有705個字)
首頁
上一頁
1
2
下一頁
尾頁