Re: [請益] Deepseek v3 對台積電有影響嗎

看板Stock (股票)作者 (New Mac Water)時間3天前 (2024/12/29 19:24), 編輯推噓3(305)
留言8則, 6人參與, 2天前最新討論串3/6 (看更多)
的確會讓人好奇DeepSeek-V3的訓練方式, 但成本降低如此之多,另外一個思考點,是不是除了科技巨頭外, 更多公司願意投入資本支出來建立自己的模型? 而且隨著技術發展,模型建立的成本一定會快速下降。 DeepSeek-V3比較的 Claude.ai/Qwen2.5/LLaMA3.1 這些模型都已經訓練一段時間,而且也在很多領域展開應用, 這裡面一定會使用到舊有的演算法機制,效能可能沒新的好。 而DeepSeek-V3是重新開發的,當然可以用現在更好的演算法, 簡單說,就是站在巨人的肩膀上看的更遠,其實不需要太驚訝。 最後講個政治不正確的東西, DeepSeek-V3 會受到中國的有關單位進行監管, 論文中沒有明確指出數據集的篩選標準, 但可以推測,DeepSeek-V3的訓練數據集可能經過一定程度的篩選, 以符合中國的監管要求。 可能會降低數據集的多樣性, 當然也能提高數據的來源品質和一致性, 訓練速度速度與成本肯定更快更低。 所以模型應該有可能存在偏差,而且某些政治敏感問題無法回答。 例如你問他64天安門,這模型會不會無法回答? 你問他習近平的的智商,這模型搞不好吹高大尚? 先不用太擔心這個啦,不過中文領域的部分,應該毫無競爭對手, 中國市場大資料量龐大,要訓練通用型中文AI絕對是一把手。 ※ 引述《Latte7 (nonono)》之銘言: : https://www.ettoday.net/amp/amp_news.php7?news_id=2882228&ref=mw&from=google.c : om : 中國展示了他們的新模型 : 重點在它極低的成本 : 好奇這樣是不是代表科技巨頭們不需要這麼多晶片? : 會對台積電的晶片需求有影響嗎 -- 桃園之光 https://i.imgur.com/ZGzxwgN.jpg
https://i.imgur.com/uoh8K51.jpg
https://i.imgur.com/zgbMzHp.png
https://i.imgur.com/kIwwW5e.png
https://i.imgur.com/0VNzKh4.png
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.181.186.182 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1735471496.A.C5A.html

12/29 19:26, 3天前 , 1F
推桃園之光
12/29 19:26, 1F

12/29 20:00, 3天前 , 2F
現在論文爆炸 大家都是找熱門有用的堆料
12/29 20:00, 2F

12/29 20:00, 3天前 , 3F
Bert-VITS 這種有用的很快就被驗證
12/29 20:00, 3F

12/29 20:02, 3天前 , 4F
做自己的模型以外 還要關注一下其他熱門方向
12/29 20:02, 4F

12/29 20:21, 3天前 , 5F
LLM 只是AI模型的一種,其他還有很多類型。
12/29 20:21, 5F

12/29 20:35, 3天前 , 6F
最近比較紅的是可以理解物理的視覺模型
12/29 20:35, 6F

12/29 20:47, 3天前 , 7F
目前是理論熱,等到應用熱潮才是變現階段
12/29 20:47, 7F

12/29 23:18, 2天前 , 8F
就不會有人跟他競爭中文模型
12/29 23:18, 8F
文章代碼(AID): #1dSJ68nQ (Stock)
文章代碼(AID): #1dSJ68nQ (Stock)