[新聞] 時隔1年多...DeepSeek發布V4新模型 處理百萬字長文成標配

看板Stock (股票)作者 (I Need Some Sleep)時間1小時前 (2026/04/24 21:50), 編輯推噓7(16911)
留言36則, 33人參與, 14分鐘前最新討論串1/1
原文標題: 時隔1年多...DeepSeek發布V4新模型 處理百萬字長文成標配 原文連結: https://udn.com/news/story/7333/9462536 發布時間: 2026-04-24 16:22 記者署名: 陳宥菘 原文內容: 就在OpenAI發布GPT-5.5幾個小時後,大陸AI新創深度求索(DeepSeek)24日宣布,全新 系列模型DeepSeek-V4的預覽版本正式上線,並同步開源。最新模型具有能力處理長達百 萬字的超長上下文,在Agent能力、世界知識和推理性能上均實現大陸國內與開源領域的 領先。陸媒研判,新模型使用的是華為昇騰晶片。這距離DeepSeek去年1月的大版本更新 已時隔15個月。 上海第一財經報導,V4模型按大小分為Pro和Flash兩個版本,其中,Pro版參數為1.6兆, 啟動參數490億,預訓練資料量33兆;Flash版參數為2840億,啟動參數130億,預訓練資 料量32兆。 DeepSeek表示,Pro版本主打高性能,在Agentic Coding(智能體編程)評測中已達到目 前全球開源模型的最優水平,也已成為公司內部開發的首選工具;在數學、STEM及競賽型 代碼評估中,其表現已能與目前全球頂級閉源模型比肩。 Pro和Flash兩個版本的上下文都是1M(百萬),均同時支持「非思考模式」與「思考模式 」。「從現在開始,一百萬上下文將是 DeepSeek 所有官方服務的標配。」DeepSeek表示 ,V4開創了一種全新的注意力機制,在token維度進行壓縮,結合DeepSeek Sparse Attention(DSA,深度求索稀疏注意力機制,實現了全球領先的長上下文能力,並且相比 於傳統方法大幅降低了對計算和顯存的需求。 從價格看,DeepSeek指出,V4-Pro每百萬tokens輸入是1元(人民幣,單位下同,約新台 幣4.62元),輸出是12元,V4-Flash每百萬tokens輸入是0.2元,輸出是2元。有評論認為 ,價格仍相當普惠。 報導指出,業界一直在關注DeepSeek-V4是否會使用大陸國產算力,從推文來看確實是與 華為昇騰合作。DeepSeek表示,受限於高端算力,目前Pro的服務吞吐十分有限,預計下 半年昇騰950超節點批量上市後,Pro的價格會大幅下調。 相比前代模型, V4-Pro 的Agent能力顯著增強。在Agentic Coding(代理驅動的程式撰 寫)評測中,V4-Pro達到當前開源模型最佳水平。 在推理上,官方在論文中表示,總體約落後前沿閉源模型3至6個月。Proax(Max表示 最大推理能力模式)推理擴展後在標準推理基準上優於OpenAI的GPT.2、Gemini.0 ro,略遜於GPT.4、Gemini.1ro。 心得/評論: deepseek v4終於來了 並且完成和華為平台的適配 在下半年華為晶片出貨後 API價格還會繼續降價 雖然整體性能仍然略遜於閉源SOTA模型 但他實在太便宜了 這次還會有考古題嗎? -- 如何嘴砲 反駁對方的重點──◢◣確實指出人家論點的錯誤性 ψQSWEET> ◎ 駁斥────── 用引言指出對方錯誤或矛盾的地方( 優質論文) 在嘴砲王 相反的觀點──◢████◣列出相反的論點並以事實當證據( 辯論社) 應該出現矛盾────◢██████◣列出相反的論點但不加以證實( 論壇) 的元素 攻擊態度◢████████◣質疑對方的態度和口氣 ( 匿名版) 人身攻擊偏見▄▄▄▄▄▄▄▄▄▄▄攻擊身份和能耐幹你娘(小朋友) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.195.224.26 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1777038636.A.0CC.html

04/24 21:54, 1小時前 , 1F
沒人在乎
04/24 21:54, 1F

04/24 21:58, 1小時前 , 2F
來吧 需要一個大跌 一定二胎信貸全部接好接滿
04/24 21:58, 2F

04/24 21:58, 1小時前 , 3F
不要相信什麼百萬上下文 都馬用不到一半就開始幻覺
04/24 21:58, 3F

04/24 21:58, 1小時前 , 4F
現在上下文壓縮技術還是非常糟糕 無法信任
04/24 21:58, 4F

04/24 21:58, 1小時前 , 5F
用自已國產的晶片,這個厲害了
04/24 21:58, 5F

04/24 21:59, 1小時前 , 6F
現在一堆ai軟體了,誰還在意這咖.
04/24 21:59, 6F

04/24 21:59, 1小時前 , 7F
不重要 台股下星期繼續漲
04/24 21:59, 7F

04/24 22:01, 1小時前 , 8F
最好是百萬
04/24 22:01, 8F

04/24 22:03, 1小時前 , 9F
還有人會被騙?難用的要死!還要被限制蒸餾了….
04/24 22:03, 9F

04/24 22:04, 1小時前 , 10F
還停留在文字處理理解程度已經不行了,現在都要能
04/24 22:04, 10F

04/24 22:04, 1小時前 , 11F
自行應用程式自發設計分析
04/24 22:04, 11F

04/24 22:06, 1小時前 , 12F
八卦版吹這個吹很大
04/24 22:06, 12F

04/24 22:07, 1小時前 , 13F
只能騙一次 今年沒用了
04/24 22:07, 13F

04/24 22:07, 1小時前 , 14F
太神啦,deep最強!!
04/24 22:07, 14F

04/24 22:08, 1小時前 , 15F
我不相信長文,光日文網小連續幾章就能翻譯的連我
04/24 22:08, 15F

04/24 22:08, 1小時前 , 16F
都看的出來語無倫次
04/24 22:08, 16F

04/24 22:10, 1小時前 , 17F
還蠻好用的
04/24 22:10, 17F

04/24 22:12, 1小時前 , 18F
已無人在意
04/24 22:12, 18F

04/24 22:13, 1小時前 , 19F
誰愛用誰用
04/24 22:13, 19F

04/24 22:14, 1小時前 , 20F
收割完就被看穿手腳 不愧是中企
04/24 22:14, 20F

04/24 22:14, 1小時前 , 21F
沒有HBM 長上下文延遲會慢到很搞笑
04/24 22:14, 21F

04/24 22:16, 1小時前 , 22F
笑死 一年前還能騙一下
04/24 22:16, 22F

04/24 22:16, 1小時前 , 23F
沒人在乎
04/24 22:16, 23F

04/24 22:17, 1小時前 , 24F
中吹廢物最愛的 dickshit
04/24 22:17, 24F

04/24 22:17, 1小時前 , 25F
黑悟空2.0
04/24 22:17, 25F

04/24 22:21, 1小時前 , 26F
笑死 某族群崩潰到連一點風度都沒了ccccc
04/24 22:21, 26F

04/24 22:26, 58分鐘前 , 27F
04/24 22:26, 27F

04/24 22:26, 58分鐘前 , 28F
有人好氣氣,別人努力做出不錯的東西,只能妒忌
04/24 22:26, 28F

04/24 22:33, 51分鐘前 , 29F
沒第六代戰機喔?
04/24 22:33, 29F

04/24 22:37, 47分鐘前 , 30F
我只想問處理長文的應用場景是什麼 產AI網小文嗎
04/24 22:37, 30F

04/24 22:40, 44分鐘前 , 31F

04/24 22:41, 43分鐘前 , 32F
??
04/24 22:41, 32F

04/24 22:41, 43分鐘前 , 33F
放心,了不起後面放個小精靈修正就好了
04/24 22:41, 33F

04/24 22:47, 37分鐘前 , 34F
可以寫一篇跟六四有關的文章嗎?
04/24 22:47, 34F

04/24 22:53, 31分鐘前 , 35F
1百萬字標配是真的嗎
04/24 22:53, 35F

04/24 23:10, 14分鐘前 , 36F
上下文一百萬很多欸,標配喔?那可以加減來用
04/24 23:10, 36F
文章代碼(AID): #1fwtKi3C (Stock)
文章代碼(AID): #1fwtKi3C (Stock)