[新聞] 時隔1年多...DeepSeek發布V4新模型處理百萬字長文成標配

看板Stock (股票)作者pmes9866 (I Need Some Sleep)時間1小時前 (2026/04/24 21:50)推噓7(16推 9噓 11→)

留言36則, 33人參與討論串1/1

原文標題：時隔1年多...DeepSeek發布V4新模型處理百萬字長文成標配原文連結： https://udn.com/news/story/7333/9462536 發布時間： 2026-04-24 16:22 記者署名：陳宥菘原文內容：就在OpenAI發布GPT-5.5幾個小時後，大陸AI新創深度求索（DeepSeek）24日宣布，全新系列模型DeepSeek-V4的預覽版本正式上線，並同步開源。最新模型具有能力處理長達百萬字的超長上下文，在Agent能力、世界知識和推理性能上均實現大陸國內與開源領域的領先。陸媒研判，新模型使用的是華為昇騰晶片。這距離DeepSeek去年1月的大版本更新已時隔15個月。上海第一財經報導，V4模型按大小分為Pro和Flash兩個版本，其中，Pro版參數為1.6兆，啟動參數490億，預訓練資料量33兆；Flash版參數為2840億，啟動參數130億，預訓練資料量32兆。 DeepSeek表示，Pro版本主打高性能，在Agentic Coding（智能體編程）評測中已達到目前全球開源模型的最優水平，也已成為公司內部開發的首選工具；在數學、STEM及競賽型代碼評估中，其表現已能與目前全球頂級閉源模型比肩。 Pro和Flash兩個版本的上下文都是1M（百萬），均同時支持「非思考模式」與「思考模式」。「從現在開始，一百萬上下文將是 DeepSeek 所有官方服務的標配。」DeepSeek表示，V4開創了一種全新的注意力機制，在token維度進行壓縮，結合DeepSeek Sparse Attention（DSA，深度求索稀疏注意力機制，實現了全球領先的長上下文能力，並且相比於傳統方法大幅降低了對計算和顯存的需求。從價格看，DeepSeek指出，V4-Pro每百萬tokens輸入是1元（人民幣，單位下同，約新台幣4.62元），輸出是12元，V4-Flash每百萬tokens輸入是0.2元，輸出是2元。有評論認為，價格仍相當普惠。報導指出，業界一直在關注DeepSeek-V4是否會使用大陸國產算力，從推文來看確實是與華為昇騰合作。DeepSeek表示，受限於高端算力，目前Pro的服務吞吐十分有限，預計下半年昇騰950超節點批量上市後，Pro的價格會大幅下調。相比前代模型， V4-Pro 的Agent能力顯著增強。在Agentic Coding（代理驅動的程式撰寫）評測中，V4-Pro達到當前開源模型最佳水平。在推理上，官方在論文中表示，總體約落後前沿閉源模型3至6個月。Proax（Max表示最大推理能力模式）推理擴展後在標準推理基準上優於OpenAI的GPT.2、Gemini.0 ro，略遜於GPT.4、Gemini.1ro。心得/評論： deepseek v4終於來了並且完成和華為平台的適配在下半年華為晶片出貨後 API價格還會繼續降價雖然整體性能仍然略遜於閉源SOTA模型但他實在太便宜了這次還會有考古題嗎？ -- 如何嘴砲反駁對方的重點──◢◣█確實指出人家論點的錯誤性 ψQSWEET │＞ ◎ 駁斥──────◢ ◣█用引言指出對方錯誤或矛盾的地方( █優質論文）在嘴砲王相反的觀點──◢████◣█列出相反的論點並以事實當證據( █ 辯論社）應該出現⊙矛盾────◢██████◣█列出相反的論點但不加以證實( ██論壇) 的元素攻擊態度─◢████████◣█質疑對方的態度和口氣 ( ██匿名版) 人身攻擊↘偏見↗ ▄▄▄▄▄▄▄▄▄▄▄▄█攻擊身份和能耐█幹你娘(█ 小朋友) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.195.224.26 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1777038636.A.0CC.html

推

littlelaba

04/24 21:54, 1小時前 , 1^F

04/24 21:54, 1^F

推

edison106

04/24 21:58, 1小時前 , 2^F

04/24 21:58, 2^F

噓

strlen

04/24 21:58, 1小時前 , 3^F

04/24 21:58, 3^F