[新聞] 研究稱DeepSeek的AI 訓練成本也很貴 至少430億台幣

看板Stock (股票)作者 (飛56)時間5小時前 (2025/02/03 11:37), 編輯推噓44(561270)
留言138則, 95人參與, 1小時前最新討論串1/1
原文標題:研究稱DeepSeek的AI 訓練成本也很貴 至少430億台幣 原文連結:https://reurl.cc/Q5odeM 發布時間:21:49 2025/02/01 記者署名:中時新聞網 江飛宇 原文內容:https://i.imgur.com/hN2WEH9.jpeg
半導體行業分析公司指出,DeepSeek的基礎成本、伺服器搭建成本至少要13億美元。(圖 /shutterstock/達志) 最近上線的中國大陸AI軟體DeepSeek引發業界震撼,大陸聲稱建構DeepSeek的基礎成本很 低,僅是OpenAI的零頭,最廣為流傳的說法之一,是DeepSeek V3 的訓練成本約為 600萬 美元(1.9億新台幣)。不過這個說法被半導業行業研究公司 SemiAnalysis質疑,他們認為 DeepSeek的成本應該至少有13億美元(約430億新台幣)。 有趣的工程(Interesting Engineering)報導,SemiAnalysis 指出,它未能解釋幾個關鍵 因素。600 萬美元的估算,只考慮了 GPU 預訓練費用,忽略了公司在研發、基礎設施和 其他必要成本方面的大量投資。報告強調,DeepSeek 的總伺服器資本支出,就高達13億 美元。 根據報導,DeepSeek使用了大約 5萬張Hopper GPU(微架構的),這導致業界產生了一些誤 解。以為這就等於5萬張輝達H100 GPU(Nvidia Hopper H100 GPU)。 SemiAnalysis 澄清說,輝達的GPU 有多種型號,包括 H800、H100 以及 NVIDIA 為應對 美國出口限製而生產的 H20。也是中國大陸可以獲得的類型。 該報告稱,與一些較大的人工智慧實驗室不同,DeepSeek資料中心採用精簡模型,來提高 其靈活性和效率。這算是一種不錯的適應能力,分析顯示 DeepSeek 的 R1模型,表現出 與 OpenAI 的 o1 相當的推理能力。 然而,這不意味著DeepSeek在所有指標都性能領先。 雖然 DeepSeek 的定價策略引起了關注和讚譽,但有一個重要的警告:功能相似的 Google Gemini Flash 2.0 ,在API 服務存取時更加經濟。這使得 DeepSeek 處於一個十 字路口,平衡效能和成本是其未來成功的關鍵。 但是,DeepSeek的多頭潛在注意力(Multi-Head Latent Attention,MLA),是個頗具突 破性的創新,這種方法透過減少鍵值 (KV) 快取的使用,顯著降低了 93.3% 的推理成本 。不過, DeepSeek 帶來的創新,也很可能會被渴望保持競爭力的西方人工智慧實驗室迅 速採用。 報告推測,DeepSeek可能產生不錯的競爭環境,令其他同行也必須具有更快的適應能力。 總之,SemiAnalysis 描繪了 DeepSeek 在 AI 領域的當前地位。它的成本結構、GPU 利 用率,和創新能力,確實成為一名強大的AI參與者。 心得/評論: 上週由於Deepseek的橫空出世,宣稱能夠降低98%成本 殺得許多美股科技大頭血流成河,今天台股開盤也被連累 若到頭來低成本只是"號稱",又只能產出審查閹割後的不實內容 牛皮吹破被看破手腳的後果..... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.164.83.160 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738553847.A.69B.html

02/03 11:38, 5小時前 , 1F
繼續壯膽XD
02/03 11:38, 1F

02/03 11:38, 5小時前 , 2F
這兩天有用一下網頁版的看看,他有把思考過程寫出
02/03 11:38, 2F

02/03 11:38, 5小時前 , 3F
來比open 的好很多
02/03 11:38, 3F

02/03 11:39, 5小時前 , 4F
講實話會讓鹿港仔不開心
02/03 11:39, 4F

02/03 11:39, 5小時前 , 5F
OpenAI一堆大老出走 想也知道有問題
02/03 11:39, 5F

02/03 11:39, 5小時前 , 6F
500萬鎂本來就只有一次的訓練成本 啥硬體人事都沒
02/03 11:39, 6F

02/03 11:39, 5小時前 , 7F
納進去
02/03 11:39, 7F

02/03 11:39, 5小時前 , 8F
Open一樣有思考過程啊 第一天用嗎?☺
02/03 11:39, 8F

02/03 11:39, 5小時前 , 9F
訓練成本就是訓練成本 全世界算法一樣
02/03 11:39, 9F

02/03 11:40, 5小時前 , 10F
ㄟ 連公司基礎設施都要算進去?
02/03 11:40, 10F

02/03 11:40, 5小時前 , 11F
好了啦……
02/03 11:40, 11F

02/03 11:40, 5小時前 , 12F
拿其他成本是要混搖什麼視聽
02/03 11:40, 12F

02/03 11:40, 5小時前 , 13F
open ai 最近的一個版本不是也有邏輯推導
02/03 11:40, 13F

02/03 11:41, 5小時前 , 14F
原來如此,難怪中國人現在過這麼慘
02/03 11:41, 14F

02/03 11:41, 5小時前 , 15F
連員工成長過程的成本都沒算到吧
02/03 11:41, 15F

02/03 11:41, 5小時前 , 16F
笑死 那麼下一次發新模型要說0成本嗎
02/03 11:41, 16F

02/03 11:41, 5小時前 , 17F
喔喔 那他API定價怎麼這麼低
02/03 11:41, 17F

02/03 11:41, 5小時前 , 18F
是套了多少 真的可悲
02/03 11:41, 18F

02/03 11:41, 5小時前 , 19F
浮木又來了0.0
02/03 11:41, 19F

02/03 11:44, 5小時前 , 20F
把openai的那些成本一起拿進來比阿==
02/03 11:44, 20F

02/03 11:44, 5小時前 , 21F
好了喇
02/03 11:44, 21F

02/03 11:45, 5小時前 , 22F
顯著降低了 93.3% 的推理成本
02/03 11:45, 22F

02/03 11:45, 5小時前 , 23F
青鳥浮木 笑死
02/03 11:45, 23F

02/03 11:45, 5小時前 , 24F
要這樣算 openai只會更貴
02/03 11:45, 24F

02/03 11:47, 5小時前 , 25F
華爾街懂玩
02/03 11:47, 25F

02/03 11:48, 5小時前 , 26F
XDDDDDDDDDDDDDDD
02/03 11:48, 26F

02/03 11:48, 5小時前 , 27F
中時造反??
02/03 11:48, 27F

02/03 11:48, 5小時前 , 28F
才430億?麵線的系統造價便宜
02/03 11:48, 28F

02/03 11:48, 5小時前 , 29F
該不會下一步就要說是解放軍出資吧?
02/03 11:48, 29F

02/03 11:48, 5小時前 , 30F
ds思考過程超長的
02/03 11:48, 30F

02/03 11:49, 5小時前 , 31F
百分百正確
02/03 11:49, 31F

02/03 11:49, 5小時前 , 32F
那很便宜欸?
02/03 11:49, 32F

02/03 11:49, 5小時前 , 33F
現在就估值破口….容易懷疑資本支出..
02/03 11:49, 33F

02/03 11:50, 5小時前 , 34F
這樣第一個模型就超貴 後面模型就可以大幅降低成本
02/03 11:50, 34F

02/03 11:50, 5小時前 , 35F
超聰明的
02/03 11:50, 35F

02/03 11:50, 5小時前 , 36F
照同樣標準計算,CloseAI只會更貴XDD
02/03 11:50, 36F

02/03 11:51, 4小時前 , 37F
CloseAI之前就在內鬥
02/03 11:51, 37F

02/03 11:52, 4小時前 , 38F
對 DS超爛 還不快彎腰撿鑽石
02/03 11:52, 38F

02/03 11:52, 4小時前 , 39F
訓練成本和建置成本好像不同
02/03 11:52, 39F
還有 59 則推文
02/03 12:42, 4小時前 , 99F
低93% lol
02/03 12:42, 99F

02/03 12:42, 4小時前 , 100F
玩文字遊戲騙87
02/03 12:42, 100F

02/03 12:47, 4小時前 , 101F
東拼西湊的$$去跟人家亂比較 ㄎㄎ
02/03 12:47, 101F

02/03 12:48, 4小時前 , 102F
gpt思考過程最近才有的哦,第一天用的嗎?
02/03 12:48, 102F

02/03 12:49, 4小時前 , 103F
現在是川普利空
02/03 12:49, 103F

02/03 12:50, 4小時前 , 104F
semianalysis 不是之前出AMD和NV 效能比較的報告
02/03 12:50, 104F

02/03 12:50, 4小時前 , 105F
嗎 應該還滿專業的吧
02/03 12:50, 105F

02/03 12:51, 3小時前 , 106F
繼續吹下去可能說是5萬萬張 H100
02/03 12:51, 106F

02/03 12:51, 3小時前 , 107F
會員費600台幣變60塊就屌打了
02/03 12:51, 107F

02/03 12:52, 3小時前 , 108F
難怪a股向下噴出 用腳投票
02/03 12:52, 108F

02/03 12:53, 3小時前 , 109F
吹一堆多猛結果沒人買中國
02/03 12:53, 109F

02/03 12:56, 3小時前 , 110F
現在實測所需資源就是少很多
02/03 12:56, 110F

02/03 12:58, 3小時前 , 111F
500萬是ㄧ次 但還是低於同業
02/03 12:58, 111F

02/03 12:59, 3小時前 , 112F
就算13億美...也是很便宜阿...
02/03 12:59, 112F

02/03 13:01, 3小時前 , 113F
員工從小到大吃的奶粉錢算了沒?
02/03 13:01, 113F

02/03 13:01, 3小時前 , 114F
吹哨壯膽
02/03 13:01, 114F

02/03 13:01, 3小時前 , 115F
Deepseek的算力是租的。只算租金。有點像半導體代工
02/03 13:01, 115F

02/03 13:01, 3小時前 , 116F
分散成本
02/03 13:01, 116F

02/03 13:05, 3小時前 , 117F
不過即使真的算機台設備。還是成本比較低
02/03 13:05, 117F

02/03 13:11, 3小時前 , 118F
嗯 nvdia 和微軟都沒你懂
02/03 13:11, 118F

02/03 13:12, 3小時前 , 119F
DS的算力來源目前不可得 租的是指他們的算法結合
02/03 13:12, 119F

02/03 13:12, 3小時前 , 120F
租金得出來的成本接近它們聲稱的成本
02/03 13:12, 120F

02/03 13:16, 3小時前 , 121F
430億台幣比起OpenAI…?
02/03 13:16, 121F

02/03 13:20, 3小時前 , 122F
才兩倍點麵線系統
02/03 13:20, 122F

02/03 13:26, 3小時前 , 123F
這個就在講幹話而已
02/03 13:26, 123F

02/03 13:27, 3小時前 , 124F
OpenAI零頭都不只
02/03 13:27, 124F

02/03 13:30, 3小時前 , 125F
果然 , 430億成本吹成500萬 歐印NVDA @v@
02/03 13:30, 125F

02/03 13:35, 3小時前 , 126F
哈哈,算模型把硬體成本也算入唷?
02/03 13:35, 126F

02/03 13:36, 3小時前 , 127F
全世界就是只算訓練成本啦
02/03 13:36, 127F

02/03 13:39, 3小時前 , 128F
好多五毛~ 沒有open ai 根本就不會有 deepseek
02/03 13:39, 128F

02/03 13:41, 3小時前 , 129F
一直笑人中吹的趕快買硬體啦
02/03 13:41, 129F

02/03 14:18, 2小時前 , 130F
好了啦 現實就是真的開殺了啊 是不是想騙我接刀
02/03 14:18, 130F

02/03 14:36, 2小時前 , 131F
有跌就是買
02/03 14:36, 131F

02/03 15:00, 1小時前 , 132F
人工費用美國比中國貴多少?
02/03 15:00, 132F

02/03 15:25, 1小時前 , 133F
還在那邊審查內容...人家程式碼都開源了 不是很
02/03 15:25, 133F

02/03 15:25, 1小時前 , 134F
想戰,但可以請你先google一下開源的意思嗎?deepse
02/03 15:25, 134F

02/03 15:25, 1小時前 , 135F
ek屌的不是他成本低,而是他號稱成本低的同時把程式
02/03 15:25, 135F

02/03 15:25, 1小時前 , 136F
碼丟出來,擺明了大家要抄來抄。這就是為啥各大廠都
02/03 15:25, 136F

02/03 15:25, 1小時前 , 137F
把他的模型導入,因為導入之後就能驗證是不是說大話
02/03 15:25, 137F

02/03 15:25, 1小時前 , 138F
02/03 15:25, 138F
文章代碼(AID): #1de3dtQR (Stock)
文章代碼(AID): #1de3dtQR (Stock)