[請益] Deepseek v3 對台積電有影響嗎

看板Stock (股票)作者 (nonono)時間14小時前 (2024/12/28 19:08), 編輯推噓36(39350)
留言92則, 45人參與, 7小時前最新討論串1/1
https://www.ettoday.net/amp/amp_news.php7?news_id=2882228&ref=mw&from=google.c om 中國展示了他們的新模型 重點在它極低的成本 好奇這樣是不是代表科技巨頭們不需要這麼多晶片? 會對台積電的晶片需求有影響嗎 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.70.92 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1735384105.A.C87.html

12/28 19:10, 14小時前 , 1F
所以微軟、谷歌、Meta、亞馬遜、馬斯克,他們都是
12/28 19:10, 1F

12/28 19:10, 14小時前 , 2F
傻瓜,中國這間最聰明,是這樣嗎?
12/28 19:10, 2F

12/28 19:10, 14小時前 , 3F
建議你放空美股七巨頭和台積電,一定賺大錢的
12/28 19:10, 3F

12/28 19:11, 14小時前 , 4F
樓上這想法很危險
12/28 19:11, 4F

12/28 19:13, 14小時前 , 5F
26的AI是真有點東西,這個看論文可以知道,但也僅
12/28 19:13, 5F

12/28 19:13, 14小時前 , 6F
就這樣
12/28 19:13, 6F

12/28 19:14, 14小時前 , 7F

12/28 19:15, 14小時前 , 8F
可以畫出屠殺最多中國人的人嗎?
12/28 19:15, 8F

12/28 19:16, 14小時前 , 9F
泡沫
12/28 19:16, 9F

12/28 19:17, 14小時前 , 10F
吹和gpt 4o一個等級是他們論文的數據,寫過論文的
12/28 19:17, 10F

12/28 19:17, 14小時前 , 11F
都知道這邊論文肯定是挑最好的擺,實際如何還得實
12/28 19:17, 11F

12/28 19:17, 14小時前 , 12F
際驗證,到時候chatbot arena 或者hugging face 看
12/28 19:17, 12F

12/28 19:17, 14小時前 , 13F
看?
12/28 19:17, 13F

12/28 19:18, 14小時前 , 14F
表示兩國AI競爭更激進,是利多
12/28 19:18, 14F

12/28 19:18, 14小時前 , 15F
是不是剛聽完股癌XD
12/28 19:18, 15F

12/28 19:21, 14小時前 , 16F
抖音的世界線核融合能電池都已經誕生了
12/28 19:21, 16F

12/28 19:25, 14小時前 , 17F
那這種再靠gb200跑不就爽到飛天
12/28 19:25, 17F

12/28 19:28, 14小時前 , 18F
等其他人複現出來再說吧 都忘記超導的論文了嗎
12/28 19:28, 18F

12/28 19:31, 14小時前 , 19F
那張圖?
12/28 19:31, 19F

12/28 19:35, 14小時前 , 20F
AI已死
12/28 19:35, 20F

12/28 19:37, 13小時前 , 21F
能實際運用再說…
12/28 19:37, 21F

12/28 19:43, 13小時前 , 22F
要跑很久
12/28 19:43, 22F

12/28 19:43, 13小時前 , 23F
參數也比較少
12/28 19:43, 23F

12/28 19:54, 13小時前 , 24F
對岸的碼農工作時數應該抵美國五個
12/28 19:54, 24F

12/28 19:56, 13小時前 , 25F
對,用 55nm 就跑得動,all in 力積電
12/28 19:56, 25F

12/28 19:57, 13小時前 , 26F
短期內不會有什麼影響...
12/28 19:57, 26F

12/28 19:57, 13小時前 , 27F
你是不是聽了今天的股癌
12/28 19:57, 27F

12/28 20:02, 13小時前 , 28F
對普通人夠用了,scalling law比較重要
12/28 20:02, 28F

12/28 20:04, 13小時前 , 29F
很多人跳進去了 還有人在質疑ai
12/28 20:04, 29F

12/28 20:05, 13小時前 , 30F
西台灣因為算力不足,所以才需要模型剪枝,美國能用
12/28 20:05, 30F

12/28 20:05, 13小時前 , 31F
百萬顆GPU去硬幹,就不需要省成本
12/28 20:05, 31F

12/28 20:06, 13小時前 , 32F
西台灣是在為愈來愈難取得老黃的GPU做準備
12/28 20:06, 32F

12/28 20:08, 13小時前 , 33F
我記得 去年有人說 訓練大部分時間都在搬運
12/28 20:08, 33F

12/28 20:08, 13小時前 , 34F
所以時間差不了太多
12/28 20:08, 34F

12/28 20:09, 13小時前 , 35F
甚至有人開始考慮分散式訓練
12/28 20:09, 35F

12/28 20:10, 13小時前 , 36F
也才導致 後來出現HBM 記憶體 降低搬運
12/28 20:10, 36F

12/28 20:10, 13小時前 , 37F
重點是對岸每年有1200萬畢業的大學生 出來肝
12/28 20:10, 37F

12/28 20:10, 13小時前 , 38F
其他國家沒有
12/28 20:10, 38F

12/28 20:12, 13小時前 , 39F
對岸鮮肉多 還內卷....
12/28 20:12, 39F

12/28 20:14, 13小時前 , 40F
搞不好可以用手連線出ai
12/28 20:14, 40F

12/28 20:16, 13小時前 , 41F
介殼在馬來西亞就可以買到GB200了
12/28 20:16, 41F

12/28 20:18, 13小時前 , 42F
剪枝本身可能會加入人為bias 但不好說這模型變好壞
12/28 20:18, 42F

12/28 20:19, 13小時前 , 43F
這個deepseek 對政治有特定立場 可以去試試看 嘻嘻
12/28 20:19, 43F

12/28 20:19, 13小時前 , 44F
基本上是把黑的說成白的
12/28 20:19, 44F

12/28 20:32, 13小時前 , 45F
還不錯啊,就AI模型的戰爭
12/28 20:32, 45F

12/28 20:32, 13小時前 , 46F
但是都要晶片倒是真的
12/28 20:32, 46F

12/28 20:37, 12小時前 , 47F
你是不是聽股癌講的
12/28 20:37, 47F

12/28 20:40, 12小時前 , 48F
丸子,下週ai股一根
12/28 20:40, 48F

12/28 21:07, 12小時前 , 49F
inference time scale law
12/28 21:07, 49F

12/28 21:11, 12小時前 , 50F
7樓圖是真的嗎
12/28 21:11, 50F

12/28 21:17, 12小時前 , 51F
7樓是真的,但只代表訓練資料偷的,模型應該是真的
12/28 21:17, 51F

12/28 21:29, 12小時前 , 52F
股癌要獲利了結
12/28 21:29, 52F

12/28 21:31, 12小時前 , 53F
其實是中國網站轉問GPT然後再改的
12/28 21:31, 53F

12/28 21:48, 11小時前 , 54F
吹了半天 碼農跟中企還是乖乖架梯子想辦法弄GPT
12/28 21:48, 54F

12/28 21:51, 11小時前 , 55F
用GPT 出錯了可以怪GPT 用中國垃圾 出錯就準備被告
12/28 21:51, 55F

12/28 22:17, 11小時前 , 56F
我怎麼想都覺得這東西撼動不了hyperscaler ,
12/28 22:17, 56F

12/28 22:19, 11小時前 , 57F
看推文去聽股癌,感覺他講的沒什麼根據,歐美會拿
12/28 22:19, 57F

12/28 22:19, 11小時前 , 58F
中國的東西challenge 自己嗎… 他們應該覺得這超low
12/28 22:19, 58F

12/28 22:19, 11小時前 , 59F
吧..
12/28 22:19, 59F

12/28 22:35, 11小時前 , 60F
這個如果用先進製程會更猛 對面是沒先進製程只好這
12/28 22:35, 60F

12/28 22:35, 11小時前 , 61F
樣玩
12/28 22:35, 61F

12/28 22:38, 10小時前 , 62F
擔心這個不如擔心日本搞出2奈米
12/28 22:38, 62F

12/28 22:43, 10小時前 , 63F
他們不用考慮智慧財產權的話 訓練出來是真低猛
12/28 22:43, 63F

12/28 23:05, 10小時前 , 64F
阿就股癌想出貨了啊
12/28 23:05, 64F

12/28 23:07, 10小時前 , 65F
都開源的 因為知道其他人訓練不了
12/28 23:07, 65F

12/28 23:07, 10小時前 , 66F
xAI 開源當天 一堆人下載後發現要8張H100 就砍了
12/28 23:07, 66F

12/28 23:15, 10小時前 , 67F
xAI Grok-1 model size 310B , deepseek 670B
12/28 23:15, 67F

12/28 23:15, 10小時前 , 68F
看起來模型參數不小
12/28 23:15, 68F

12/28 23:18, 10小時前 , 69F
上面講出貨的….出貨要吹好的,不是吹壞的…
12/28 23:18, 69F

12/28 23:21, 10小時前 , 70F
股癌 蠻有道理的阿 有人拿既有的模型優化
12/28 23:21, 70F

12/28 23:21, 10小時前 , 71F
像是GPT 4o
12/28 23:21, 71F

12/28 23:22, 10小時前 , 72F
或是最新的openAI o3
12/28 23:22, 72F

12/28 23:22, 10小時前 , 73F
只要有人願意餵AI 中文資料 應該都樂見
12/28 23:22, 73F

12/28 23:23, 10小時前 , 74F
把四庫全書 龍藏經 一堆古文全部餵進去
12/28 23:23, 74F

12/28 23:23, 10小時前 , 75F
反正對岸 破壞價格也不是一天兩天
12/28 23:23, 75F

12/28 23:24, 10小時前 , 76F
手機 面板 記憶體 電動車 只要內卷後都爛大街
12/28 23:24, 76F

12/28 23:28, 10小時前 , 77F
不過 openAI 看起來更重視 AGI指數
12/28 23:28, 77F

12/28 23:28, 10小時前 , 78F
不用知道太多 但是要符合人性
12/28 23:28, 78F

12/28 23:33, 10小時前 , 79F
誰出貨是放利空== 有夠韭
12/28 23:33, 79F

12/28 23:44, 9小時前 , 80F
通用AI 以後應該會偏向AGI 困難的都不回答
12/28 23:44, 80F

12/28 23:44, 9小時前 , 81F
都會叫你去問專業的
12/28 23:44, 81F

12/28 23:45, 9小時前 , 82F
然後就要收錢了
12/28 23:45, 82F

12/28 23:45, 9小時前 , 83F
資料中心蓋了也不是只訓練 通用模型
12/28 23:45, 83F

12/28 23:45, 9小時前 , 84F
專業模型才是有錢賺 而且不開源
12/28 23:45, 84F

12/28 23:46, 9小時前 , 85F
蛋白質 和 化學組成
12/28 23:46, 85F

12/28 23:53, 9小時前 , 86F
整天妄想別人要出貨 真可悲
12/28 23:53, 86F

12/28 23:58, 9小時前 , 87F
看他的商業模式跟如何獲利,再看模型優劣是否為致
12/28 23:58, 87F

12/28 23:58, 9小時前 , 88F
命因素。
12/28 23:58, 88F

12/29 00:05, 9小時前 , 89F
現在在搞知識蒸餾 之後語言模型一定會變小
12/29 00:05, 89F

12/29 00:43, 8小時前 , 90F
這隻用moe才這麼省
12/29 00:43, 90F

12/29 01:39, 7小時前 , 91F
講出貨的是87是不是?哪個主力會想要在自己出貨前
12/29 01:39, 91F

12/29 01:39, 7小時前 , 92F
股價先崩啊,傻逼是不是啊
12/29 01:39, 92F
文章代碼(AID): #1dRzmfo7 (Stock)
文章代碼(AID): #1dRzmfo7 (Stock)