Re: [請益] Deepseek v3 對台積電有影響嗎

看板Stock (股票)作者 (12吋蘋果)時間3天前 (2024/12/30 00:32), 編輯推噓6(828)
留言18則, 12人參與, 2天前最新討論串6/6 (看更多)
我覺得評比指標什麼都是後話 使用體驗太差 https://i.meee.com.tw/CafPIov.png
你看看這樣怎麼稱霸世界呢? 你的進線參數與資料量就比別人少了, 雖然不是一個主要因素,就deepseek就是在數據上有篩選過, 你要跟人比,好歹訓練資料要在同一起跑點上吧。 不過中國人常作弊,可能搞不懂什麼叫做同一起跑點。 更何況deepseek使用MoE的模型 MoE稀疏模型成本本來就比一般模型密度低 這邊怕你看不懂, 就是一個禿頭的人跟髮量正常的人說,嘿嘿我們都有頭髮耶,你懂這個意思嗎? 股點就是,如果美國未來持續加嚴對中國的科技限制, 不要以為拿RTX 顯卡來訓練Model這件事不會發生, 大膽一點想,會不會又爆發缺卡潮? ※ 引述《icrose (人本良心)》之銘言: : deepseek在多語言編程指標中有自己的優異表現,很多指標優於chatgpt,最好是偷偷調用別人的API啦 : Codeforce領先所有模型,思維鏈的應用上,諸如數學能力的 AIME 2024 CNMO 2024測試也是領先全球的 : 而且已經可以本地部署測試,成本降低是可見的,原理也是業界認可的 : 你以爲這兩個小例子能推翻什麽嗎XD : 由於低成本和硬件限制,有缺陷是非常有可能的,但是只要原理通,未來非常可期。 : ※ 引述《jackliao1990 (j)》之銘言: : : 沒想到吹沒多久 : : 當問DeepSeek-V3:"你是什麼模型" : : DeepSeek-V3竟然回答:"我是chatgpt" : : https://imgur.com/wcgo1TC
: : 叫它講個笑話 : : 它講的笑話也跟ChatGPT一樣: : : https://imgur.com/Zo1PKXw
: : 難道DeepSeek-V3訓練成本這麼低是因為用chatgpt訓練的?? : : Sam altman迅速發推嘲諷: : : https://x.com/sama/status/1872664379608727589 : : "複製你知道有效的東西是(相對)容易的。" -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.204.6.114 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1735489958.A.23D.html

12/30 01:01, 3天前 , 1F
moe類似姆斯,訂製賽道之神
12/30 01:01, 1F

12/30 01:03, 3天前 , 2F
做不到通用,誰管你ai星海多強圍棋多厲害
12/30 01:03, 2F

12/30 01:32, 3天前 , 3F

12/30 01:32, 3天前 , 4F

12/30 01:32, 3天前 , 5F

12/30 01:49, 3天前 , 6F
他們會串mac mini
12/30 01:49, 6F

12/30 05:02, 2天前 , 7F
它應該不是篩選輸入資料,而是針對輸出過濾
12/30 05:02, 7F

12/30 07:22, 2天前 , 8F
你這問題問的有夠政治
12/30 07:22, 8F

12/30 08:11, 2天前 , 9F
等別人都做出來,轟動世界。再說這個我也會,早就會
12/30 08:11, 9F

12/30 08:11, 2天前 , 10F
12/30 08:11, 10F

12/30 09:39, 2天前 , 11F
你這問題太粗暴了
12/30 09:39, 11F

12/30 09:58, 2天前 , 12F
噓問題問的政治 但這模型受限於政治因素導致輸入輸
12/30 09:58, 12F

12/30 09:58, 2天前 , 13F
出的資料被篩選過 這種模型訓練出來就只會是垃圾而
12/30 09:58, 13F

12/30 09:58, 2天前 , 14F
已啊
12/30 09:58, 14F

12/30 11:26, 2天前 , 15F

12/30 11:29, 2天前 , 16F
它可能知道答案,但被屏蔽關鍵字阿.這不代表它差.
12/30 11:29, 16F

12/30 12:14, 2天前 , 17F

12/31 01:14, 2天前 , 18F
GIGO其他不用多說
12/31 01:14, 18F
文章代碼(AID): #1dSNcc8z (Stock)
文章代碼(AID): #1dSNcc8z (Stock)