看板 [ Stock ]
討論串[請益] Deepseek v3 對台積電有影響嗎
共 6 篇文章
首頁
上一頁
1
2
下一頁
尾頁

推噓41(46推 5噓 58→)留言109則,0人參與, 5天前最新作者Latte7 (nonono)時間6天前 (2024/12/28 19:08), 編輯資訊
2
0
1
內容預覽:
https://www.ettoday.net/amp/amp_news.php7?news_id=2882228&ref=mw&from=google.com. 中國展示了他們的新模型. 重點在它極低的成本. 好奇這樣是不是代表科技巨頭們不需要這麼多晶片?. 會對台積電的晶片需求有影響嗎. --.

推噓-21(17推 38噓 16→)留言71則,0人參與, 3天前最新作者icrose (人本良心)時間5天前 (2024/12/29 11:55), 5天前編輯資訊
0
0
1
內容預覽:
2024是韓國經濟20年最差的時間點. 但很快人們發現,2024也會是台灣半導體的頂點. 成熟製程的後路已經斷了,中國機器狗落地上的的優異表現和deepseek的出現,都是對OPENAI-NV-TSM的重擊應用優勢不在美方,新的算法改進造成算力需求驟降的風險隨時發生,舊的算法如果固定化NV通用GPU
(還有160個字)

推噓3(3推 0噓 5→)留言8則,0人參與, 5天前最新作者MacBookAir12 (New Mac Water)時間5天前 (2024/12/29 19:24), 編輯資訊
0
5
1
內容預覽:
的確會讓人好奇DeepSeek-V3的訓練方式,. 但成本降低如此之多,另外一個思考點,是不是除了科技巨頭外,. 更多公司願意投入資本支出來建立自己的模型?. 而且隨著技術發展,模型建立的成本一定會快速下降。. DeepSeek-V3比較的 Claude.ai/Qwen2.5/LLaMA3.1. 這
(還有554個字)

推噓9(10推 1噓 9→)留言20則,0人參與, 4天前最新作者jackliao1990 (j)時間5天前 (2024/12/29 21:46), 5天前編輯資訊
1
3
2
內容預覽:
https://x.com/giffmana/status/1872586401436627211. 沒想到吹沒多久. 當問DeepSeek-V3:"你是什麼模型". DeepSeek-V3竟然回答:"我是chatgpt". https://imgur.com/wcgo1TC. 叫它講個笑話. 它講
(還有361個字)

推噓-13(4推 17噓 11→)留言32則,0人參與, 3天前最新作者icrose (人本良心)時間5天前 (2024/12/29 22:19), 5天前編輯資訊
1
2
1
內容預覽:
deepseek在多語言編程指標中有自己的優異表現,很多指標優於chatgpt,最好是偷偷調用別人的API啦. Codeforce領先所有模型,思維鏈的應用上,諸如數學能力的 AIME 2024 CNMO 2024測試也是領先全球的. 而且已經可以本地部署測試,成本降低是可見的,原理也是業界認可的.
(還有257個字)
首頁
上一頁
1
2
下一頁
尾頁