[新聞] DeepSeek 公布最新V3模型 意圖超越 OpenAI

看板Stock (股票)作者 (無法顯示人物名稱)時間13小時前 (2025/03/25 16:18), 編輯推噓58(64651)
留言121則, 85人參與, 6小時前最新討論串1/1
ETtoday新聞雲 2025年03月25日 16:10 DeepSeek 公布最新V3模型 意圖超越 OpenAI DeepSeek 昨日(24)針對其「DeepSeek V3-0324」模型悄悄發布了更新,雖非外界預期 的R2 模型,但仍然有不少亮點。 V3模型無預警地在本週的 Hugging Face 上發布,此次更新聲稱能夠「有效且準確地解決 現實世界中的挑戰」。今年一月,DeepSeek 一度超越 ChatGPT,成為蘋果美國應用程式 商店中最受歡迎的免費軟體。V3 模型是一款強大的混合專家(MoE)語言模型,擁有 6710 億個總參數,其中處理每個 token(即每個單詞或符號)時,模型會動態選擇並啟 動370億個參數來進行計算,這種方法使得模型能夠在保持高效運行的同時,利用大量參 數來提高預測的準確性和性能。在預訓練之後,V3 進行了知識蒸餾,從 DeepSeek-R1 模 型中提取知識,這一過程進一步提升了模型的性能和應用能力。 本次更新展示了 DeepSeek 在技術創新方面的持續努力,並預示著未來 AI 技術將更加高 效。隨著競爭的加劇,DeepSeek 的進步無疑將對全球 AI 產業產生深遠影響,更突顯了 這家中國 AI 新創公司保持領先競爭對手的意圖。 https://www.ettoday.net/news/20250325/2931329.htm 穩了? 昨天DeepSeek更新V3模型 雖然非預期的R2模型 V3擁有6710億個參數處理單詞或符號 模型會動態啟動370億個參數計算 V3使用知識蒸餾從DeepSeek R1提取知識 提升模型的性能和應用能力 -- https://i.imgur.com/hW5h5gU.gif
https://i.imgur.com/kJV8Xpi.gif
https://i.imgur.com/mus9aa2.jpeg
https://i.imgur.com/xsoSdOK.jpeg
https://i.imgur.com/Rq7dbDm.jpg
https://i.imgur.com/3JFrFUW.jpg
https://i.imgur.com/fpRblKK.jpeg
https://i.imgur.com/xxuciis.jpeg
https://i.imgur.com/sYpst6n.gif
https://i.imgur.com/DEKfHhV.jpeg
https://i.imgur.com/90i6C8z.jpg
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.218.53.138 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1742890703.A.C0F.html

03/25 16:21, 13小時前 , 1F
科技上能跟美國抗衡的看起來只剩中國了
03/25 16:21, 1F

03/25 16:22, 13小時前 , 2F
中國或許發明打不贏美國 但一定能捲贏美國
03/25 16:22, 2F

03/25 16:22, 13小時前 , 3F
老黃:買越多 越便宜..
03/25 16:22, 3F

03/25 16:22, 13小時前 , 4F
(一級棒!)
03/25 16:22, 4F

03/25 16:22, 13小時前 , 5F
反了吧,是美國能跟中國抗衡
03/25 16:22, 5F

03/25 16:23, 13小時前 , 6F
開捲了 好爽
03/25 16:23, 6F

03/25 16:23, 13小時前 , 7F
NV快沒呼吸了...99老黃
03/25 16:23, 7F

03/25 16:23, 13小時前 , 8F
中國AI就是吹
03/25 16:23, 8F

03/25 16:23, 13小時前 , 9F
還可以更便宜
03/25 16:23, 9F

03/25 16:24, 13小時前 , 10F
不如預期 崩
03/25 16:24, 10F

03/25 16:26, 13小時前 , 11F
中國多印點鈔投資半導體鴨 坐等顯卡白菜價
03/25 16:26, 11F

03/25 16:26, 13小時前 , 12F
新加坡又偷買了嗎
03/25 16:26, 12F

03/25 16:27, 13小時前 , 13F
越公布越虛弱…還要吹多久呢?
03/25 16:27, 13F

03/25 16:27, 13小時前 , 14F
不然美國幹嘛頃全力封鎖 不給台積電代工也不讓他們
03/25 16:27, 14F

03/25 16:27, 13小時前 , 15F
買先進的輝達 只要封鎖繼續中國基本上都很難追上
03/25 16:27, 15F

03/25 16:27, 13小時前 , 16F
除非他們真能自己練出光刻機還追上台積電 但就算能
03/25 16:27, 16F

03/25 16:27, 13小時前 , 17F
也是十年以上的事情了
03/25 16:27, 17F

03/25 16:27, 13小時前 , 18F
中又贏麻
03/25 16:27, 18F

03/25 16:28, 13小時前 , 19F

03/25 16:28, 13小時前 , 20F
讚讚!卷起來...免費仔蹭就好..等便宜的顯卡
03/25 16:28, 20F

03/25 16:28, 13小時前 , 21F
好棒!消費者的福音!
03/25 16:28, 21F

03/25 16:28, 13小時前 , 22F
蒸餾再蒸餾,以後就看誰蒸餾比較濃
03/25 16:28, 22F

03/25 16:29, 13小時前 , 23F
難不成要花大錢去買沒啥用的XX?
03/25 16:29, 23F

03/25 16:29, 13小時前 , 24F
越吹90卡越漲
03/25 16:29, 24F

03/25 16:30, 13小時前 , 25F
真的是追著Open AI打欸 這麼狠嗎
03/25 16:30, 25F

03/25 16:31, 13小時前 , 26F
心得除了「穩了」之外都是節錄文章內容,
03/25 16:31, 26F

03/25 16:31, 13小時前 , 27F
覺得你進桶比較穩
03/25 16:31, 27F

03/25 16:31, 13小時前 , 28F
中文世界以後就DS主主導!英美Open AI CC
03/25 16:31, 28F

03/25 16:32, 13小時前 , 29F
EUV有機會吧 如果是由華為主導負責
03/25 16:32, 29F

03/25 16:32, 13小時前 , 30F
便宜治百病 拒絕使用壟斷付費的AI
03/25 16:32, 30F

03/25 16:35, 13小時前 , 31F
有空生成這麼多圖不如好好研究心得怎麼寫
03/25 16:35, 31F

03/25 16:36, 13小時前 , 32F
DeepSeek現在就是用不同模型之間在互相調教
03/25 16:36, 32F

03/25 16:36, 13小時前 , 33F
他那個不是單純蒸餾而已
03/25 16:36, 33F

03/25 16:37, 12小時前 , 34F
又回答不出46
03/25 16:37, 34F

03/25 16:37, 12小時前 , 35F
隨便了啦
03/25 16:37, 35F

03/25 16:38, 12小時前 , 36F
若能弄到GB300,豈不飛天
03/25 16:38, 36F

03/25 16:38, 12小時前 , 37F
便宜真的治百病 各家公司都開始自己偷偷架DS玩
03/25 16:38, 37F

03/25 16:38, 12小時前 , 38F
中國只要靠便宜就贏了
03/25 16:38, 38F

03/25 16:39, 12小時前 , 39F
TSMC:還不是要用我的晶片?
03/25 16:39, 39F
還有 42 則推文
03/25 17:42, 11小時前 , 82F
同志仍須努力 中國爸爸不會忘記彎彎的
03/25 17:42, 82F

03/25 17:42, 11小時前 , 83F
過氣了吧 之前還出包
03/25 17:42, 83F

03/25 17:52, 11小時前 , 84F
人礦才是中國最強的地方
03/25 17:52, 84F

03/25 17:54, 11小時前 , 85F
蒸餾完畢
03/25 17:54, 85F

03/25 17:54, 11小時前 , 86F
徹底的蒸餾
03/25 17:54, 86F

03/25 17:54, 11小時前 , 87F
啊美國就沒用讓人一直偷啊
03/25 17:54, 87F

03/25 18:07, 11小時前 , 88F
股版邊酸邊用DS?
03/25 18:07, 88F

03/25 18:08, 11小時前 , 89F
把一顆大腦學習的精華去升級另一顆智商更高的大腦
03/25 18:08, 89F

03/25 18:10, 11小時前 , 90F
要就怪open AI要做close ,遇到開源的DS只能打價格
03/25 18:10, 90F

03/25 18:10, 11小時前 , 91F
戰了
03/25 18:10, 91F

03/25 18:10, 11小時前 , 92F
Grok比較好用,尤其是一些道德底線的問題。
03/25 18:10, 92F

03/25 18:12, 11小時前 , 93F
穩,OpenAI最近出那個貴死人的東西真的沒用
03/25 18:12, 93F

03/25 18:19, 11小時前 , 94F
蛤 gpt不是早看不到車尾燈了
03/25 18:19, 94F

03/25 18:26, 11小時前 , 95F
Gpt是訓練成本太高,目前稍勝DS一些
03/25 18:26, 95F

03/25 18:26, 11小時前 , 96F
但DS出世讓Gpt成本要回收很難,只能繼續燒錢
03/25 18:26, 96F

03/25 18:35, 11小時前 , 97F
中國本來就是卷死人的地方,但開源還真沒什麼好嫌
03/25 18:35, 97F

03/25 18:35, 11小時前 , 98F
03/25 18:35, 98F

03/25 18:37, 10小時前 , 99F
已反應 下去吧
03/25 18:37, 99F

03/25 18:38, 10小時前 , 100F
以後科技公司徵人都找待過酒廠的
03/25 18:38, 100F

03/25 19:00, 10小時前 , 101F
DS V3新模型效能相當Claude 3.7,重點是免費開源隨
03/25 19:00, 101F

03/25 19:00, 10小時前 , 102F
便用
03/25 19:00, 102F

03/25 19:01, 10小時前 , 103F
恭喜Google可以下去了
03/25 19:01, 103F

03/25 19:01, 10小時前 , 104F
03/25 19:01, 104F

03/25 19:15, 10小時前 , 105F
I dot car 用過其他模型 再回頭用deepseek 就會發
03/25 19:15, 105F

03/25 19:15, 10小時前 , 106F
現ds慢死了 優點只有便宜而已
03/25 19:15, 106F

03/25 19:22, 10小時前 , 107F
卷死你
03/25 19:22, 107F

03/25 19:26, 10小時前 , 108F
說真的GPT是真的難用,不說DEEPSEEK,用Claude3.7都覺
03/25 19:26, 108F

03/25 19:26, 10小時前 , 109F
得效用比他強(單論資料整理)
03/25 19:26, 109F

03/25 20:03, 9小時前 , 110F
難怪這幾天又拉資服
03/25 20:03, 110F

03/25 20:10, 9小時前 , 111F
感恩DS,不然Gemini,openAi,grok也不可能那麼快把一
03/25 20:10, 111F

03/25 20:10, 9小時前 , 112F
堆花錢貨給免錢玩lol
03/25 20:10, 112F

03/25 20:15, 9小時前 , 113F
你想用快的DS,那你可以自己建計算中心魔改DS
03/25 20:15, 113F

03/25 20:15, 9小時前 , 114F
都開源給你了,你厲害就不必用他的算力
03/25 20:15, 114F

03/25 20:19, 9小時前 , 115F
不買個DGX SPARK嗎 (x
03/25 20:19, 115F

03/25 20:39, 8小時前 , 116F
V3火箭
03/25 20:39, 116F

03/25 21:05, 8小時前 , 117F
因為文字的關係 台灣以後好用的AI服務應該要靠中國
03/25 21:05, 117F

03/25 21:05, 8小時前 , 118F
持續發展
03/25 21:05, 118F

03/25 21:24, 8小時前 , 119F
不要仰望惡鄰居
03/25 21:24, 119F

03/25 22:44, 6小時前 , 120F
剛剛使用真的編程能力強大
03/25 22:44, 120F

03/25 23:11, 6小時前 , 121F
意圖都出來了
03/25 23:11, 121F
文章代碼(AID): #1ducRFmF (Stock)
文章代碼(AID): #1ducRFmF (Stock)