看板
[ Stock ]
討論串[新聞] DeepSeek 遇大規模網路攻擊,暫時只支援中國手機用戶註冊
共 6 篇文章
內容預覽:
https://pse.is/73a9sp. DeepSeek 遇大規模網路攻擊,暫時只支援中國手機用戶註冊. 作者 林 妤柔 | 發布日期 2025 年 01 月 28 日. https://img.technews.tw/wp-content/uploads/2025/01/22135827/D
(還有865個字)
內容預覽:
1. DeepSeek創辦人梁文鋒,少年股神變AI大神. 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦. 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的十分之一成本,這個費用也差不多是一位 AI 主管的年薪而
(還有108個字)
內容預覽:
來看看大神Andrej Karpathy是怎麼評論的. Andrej Karpathy. https://i.imgur.com/WYEHc65.jpeg. 首先要打臉的是第二點. DeepSeek告訴大家,他是利用2048片H800 GPU, 經過兩個月的時間,訓練出來的,訓練費用是550萬鎂.
(還有416個字)
內容預覽:
看了DS的討論,我反而覺得有些商機. 1.DS訓練成本是低,只有557萬美金,但訓練要快兩個月。如果稍微多花一點錢,租高階GPU來跑,那是不是可以接受?反正增加兩三倍成本也不貴。. 2.這樣有多了一個議題,究竟是高階需求會下降,還是低階?畢竟並不全然是省錢就好,搶市場也很重要。. 3.這557萬美金
(還有106個字)
內容預覽:
Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到. DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破. 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。. 訓練過程中涉及大量的知識蒸餾(disti
(還有705個字)