Re: [請益] Deepseek v3 對台積電有影響嗎
我覺得評比指標什麼都是後話
使用體驗太差
https://i.meee.com.tw/CafPIov.png
你看看這樣怎麼稱霸世界呢?
你的進線參數與資料量就比別人少了,
雖然不是一個主要因素,就deepseek就是在數據上有篩選過,
你要跟人比,好歹訓練資料要在同一起跑點上吧。
不過中國人常作弊,可能搞不懂什麼叫做同一起跑點。
更何況deepseek使用MoE的模型
MoE稀疏模型成本本來就比一般模型密度低
這邊怕你看不懂,
就是一個禿頭的人跟髮量正常的人說,嘿嘿我們都有頭髮耶,你懂這個意思嗎?
股點就是,如果美國未來持續加嚴對中國的科技限制,
不要以為拿RTX 顯卡來訓練Model這件事不會發生,
大膽一點想,會不會又爆發缺卡潮?
※ 引述《icrose (人本良心)》之銘言:
: deepseek在多語言編程指標中有自己的優異表現,很多指標優於chatgpt,最好是偷偷調用別人的API啦
: Codeforce領先所有模型,思維鏈的應用上,諸如數學能力的 AIME 2024 CNMO 2024測試也是領先全球的
: 而且已經可以本地部署測試,成本降低是可見的,原理也是業界認可的
: 你以爲這兩個小例子能推翻什麽嗎XD
: 由於低成本和硬件限制,有缺陷是非常有可能的,但是只要原理通,未來非常可期。
: ※ 引述《jackliao1990 (j)》之銘言:
: : 沒想到吹沒多久
: : 當問DeepSeek-V3:"你是什麼模型"
: : DeepSeek-V3竟然回答:"我是chatgpt"
: : https://imgur.com/wcgo1TC
: : 叫它講個笑話
: : 它講的笑話也跟ChatGPT一樣:
: : https://imgur.com/Zo1PKXw
: : 難道DeepSeek-V3訓練成本這麼低是因為用chatgpt訓練的??
: : Sam altman迅速發推嘲諷:
: : https://x.com/sama/status/1872664379608727589
: : "複製你知道有效的東西是(相對)容易的。"
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.204.6.114 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1735489958.A.23D.html
→
12/30 01:01,
3天前
, 1F
12/30 01:01, 1F
→
12/30 01:03,
3天前
, 2F
12/30 01:03, 2F
推
12/30 01:32,
3天前
, 3F
12/30 01:32, 3F
→
12/30 01:32,
3天前
, 4F
12/30 01:32, 4F
→
12/30 01:32,
3天前
, 5F
12/30 01:32, 5F
推
12/30 01:49,
3天前
, 6F
12/30 01:49, 6F
推
12/30 05:02,
2天前
, 7F
12/30 05:02, 7F
噓
12/30 07:22,
2天前
, 8F
12/30 07:22, 8F
推
12/30 08:11,
2天前
, 9F
12/30 08:11, 9F
→
12/30 08:11,
2天前
, 10F
12/30 08:11, 10F
推
12/30 09:39,
2天前
, 11F
12/30 09:39, 11F
推
12/30 09:58,
2天前
, 12F
12/30 09:58, 12F
→
12/30 09:58,
2天前
, 13F
12/30 09:58, 13F
→
12/30 09:58,
2天前
, 14F
12/30 09:58, 14F
推
12/30 11:26,
2天前
, 15F
12/30 11:26, 15F
噓
12/30 11:29,
2天前
, 16F
12/30 11:29, 16F
→
12/30 12:14,
2天前
, 17F
12/30 12:14, 17F
推
12/31 01:14,
2天前
, 18F
12/31 01:14, 18F
討論串 (同標題文章)
Stock 近期熱門文章
PTT職涯區 即時熱門文章