[新聞] 重磅!DeepSeek-R1升級版正式開源 性能直逼o3、o4 編程強到離譜!

看板Stock (股票)作者 (strlen)時間18小時前 (2025/05/29 21:55), 4小時前編輯推噓88(11123102)
留言236則, 125人參與, 18分鐘前最新討論串1/1
原文標題: 重磅!DeepSeek-R1升級版正式開源 性能直逼o3、o4 編程強到離譜! 原文連結: https://news.cnyes.com/news/id/5998991 發布時間: 2025-05-29 11:00 記者署名: 原文內容: 科技界對 DeepSeek 即將推出的 R2 模型充滿期待。然而,迄今為該模型的神秘面紗仍未 揭開。 DeepSeek 周三 (28 日) 突然宣布其 R1 車型已完成小版試升級,並將其權重上 傳至 HuggingFace。使用者可前往官方網頁、APP 及小程式進行測試,API 介面及使用方 式維持不變。 儘管 DeepSeek 並未詳細公佈此次版本更新的具體內容,但回顧今年 3 月,DeepSeek 曾 對 V3 模型進行小版本升級,並透過官方交流群提前發布了相關資訊。關於 R2 模型的傳 聞也不斷湧現,有消息指出其參數規模可能達到驚人的 1.2 兆,幾乎是前代 R1 模型 6710 億參數的兩倍。然而,這項說法至今仍未獲得官方確認。 此模型的性能幾乎與 o4-mini(Medium)相當,甚至在程式設計實測中超越了 Claude 4 Sonnet,贏得了網友們的廣泛讚譽,認為開源再次取得了重大勝利。 DeepSeek-R1-0528 模型的開源標誌著該專案經過四個月的超進化,編碼能力顯著提升, 思考時間延長。據悉,新模型基於 DeepSeek-V3-0324 進行訓練,參數達 660B。在經典 物理模擬測試中,DeepSeek-R1 的新舊版本表現出色,在 LiveCodeBench 基準測試中, 其性能幾乎與 o3-mini(High)和 o4-mini(Medium)相當,並一舉超越了 Gemini 2.5 Flash。 用戶們對 DeepSeek-R1 的深度推理能力表示讚賞,稱其能夠像谷歌模型一樣進行複雜的 思維鏈糾正,並且在創造性任務中表現出色。 新版模型的核心亮點包括文字生成優化,使生成的內容更加自然且格式優雅,獨特的推理 風格不僅快速且更為纈密,並支援長時間思考,單任務處理時長可達 30-60 分鐘。 在程式設計能力方面,DeepSeek-R1 展現出驚人的表現。使用者在實測中發現,該模型在 程式設計任務中表現優異,能夠一次產生高品質的程式碼,且無需進行任何編輯或重試。 這項特性在過去的模型中極為少見,使用者普遍認為 DeepSeek-R1 在前端編碼能力上超 越了 Claude 4 Sonnet。 此外,DeepSeek-R1 在處理複雜推理問題時表現同樣出色。針對一個涉及多步驟思考的經 典問題,模型能夠有效給出解決方案,展示了其強大的邏輯推理能力。使用者對其思考過 程的穩定性和準確性表示驚訝,認為模型在算力方面也有顯著提升,能夠在高峰測試期內 保持良好的表現。 整體來看,DeepSeek-R1 的發布不僅標誌著開源模型的重大勝利,也為後續的 AI 發展奠 定了堅實基礎。隨著更多用戶的實測回饋,DeepSeek-R2 的期待值也隨之上升,未來的模 式更新將更加令人期待。 心得/評論: 強到靠北der中國巨鯨又來喇 更低成本 更高效能 還很故意的在老黃財報當天發佈 又準備要來轟炸嗎? 啊怎麼好像no body car? 年初一堆酸仔 口口聲聲說高階算力需求會大減 GB200 GB300 GB1000通通沒人要惹 結果? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.169.0.196 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1748526948.A.B8E.html

05/29 21:56, 18小時前 , 1F
已經沒人氣了
05/29 21:56, 1F

05/29 21:56, 18小時前 , 2F
早上嗆DS新版本的不就來了嗎 正確說 幾天前就有惹
05/29 21:56, 2F

05/29 21:56, 18小時前 , 3F
大陸那邊本來就是人工智能的領導者
05/29 21:56, 3F

05/29 21:56, 18小時前 , 4F
過氣
05/29 21:56, 4F

05/29 21:57, 18小時前 , 5F
AI伺服器又要死了嗎?可以這樣死了又活活了又死的
05/29 21:57, 5F

05/29 21:57, 18小時前 , 6F
嗎?
05/29 21:57, 6F

05/29 21:57, 18小時前 , 7F
不會 現在nv要找接盤仔惹 中東好朋友
05/29 21:57, 7F

05/29 21:57, 18小時前 , 8F
不就蒸餾 性能只能直逼 永遠超越不了
05/29 21:57, 8F

05/29 21:57, 18小時前 , 9F
沒創新也就沒新功能
05/29 21:57, 9F

05/29 21:58, 18小時前 , 10F
坐等越獄版放出
05/29 21:58, 10F

05/29 21:58, 18小時前 , 11F
之前爆紅那段時間後,好像使用率就一直在降
05/29 21:58, 11F

05/29 21:58, 18小時前 , 12F
註定永遠贏不了CHATGPT
05/29 21:58, 12F

05/29 21:59, 18小時前 , 13F
這只是代表開源社群更強大,或許會有更多公司、甚至
05/29 21:59, 13F

05/29 21:59, 18小時前 , 14F
國家有建設自己算力的需求
05/29 21:59, 14F

05/29 21:59, 18小時前 , 15F
ai 只會越來越便宜,越來越好用,先行者未必有優勢
05/29 21:59, 15F

05/29 21:59, 18小時前 , 16F
用別人的成果去復刻 領導啥?
05/29 21:59, 16F

05/29 21:59, 18小時前 , 17F
支那從零到壹都沒辦法
05/29 21:59, 17F

05/29 22:00, 18小時前 , 18F
之後一堆非美國公司用DS搞自己的服務,對算力需求有
05/29 22:00, 18F

05/29 22:00, 18小時前 , 19F
增無減
05/29 22:00, 19F

05/29 22:00, 18小時前 , 20F
艾鴨鴨 其實主力什麼藉口都能漲跌 傻了才認真
05/29 22:00, 20F

05/29 22:00, 18小時前 , 21F
之後大規模AI Agent等套用這些LLM api應用應該才是
05/29 22:00, 21F

05/29 22:00, 18小時前 , 22F
重點,強大的一人公司只會越來越多
05/29 22:00, 22F

05/29 22:00, 18小時前 , 23F
等代銷出來說ai is over
05/29 22:00, 23F

05/29 22:02, 17小時前 , 24F
越是怕GPT被DS超越就越可能發生,到時候美股可能會
05/29 22:02, 24F

05/29 22:02, 17小時前 , 25F
再崩一次
05/29 22:02, 25F

05/29 22:02, 17小時前 , 26F
訓練一樣要n卡,需求只會越來越大
05/29 22:02, 26F

05/29 22:02, 17小時前 , 27F
中國的技術都要先打對折再來評估
05/29 22:02, 27F

05/29 22:03, 17小時前 , 28F
我川只好使用大絕招了 誰用英文字就課稅
05/29 22:03, 28F

05/29 22:03, 17小時前 , 29F
可以畫圖了嗎?
05/29 22:03, 29F

05/29 22:04, 17小時前 , 30F
算力輸 但他們能源大贏欸
05/29 22:04, 30F

05/29 22:04, 17小時前 , 31F
美國卡在能源超缺超級缺
05/29 22:04, 31F

05/29 22:06, 17小時前 , 32F
大場面來了嗎?
05/29 22:06, 32F

05/29 22:06, 17小時前 , 33F
繼續卷吧 不然sonet api好貴
05/29 22:06, 33F

05/29 22:06, 17小時前 , 34F
都被看破手腳了
05/29 22:06, 34F

05/29 22:07, 17小時前 , 35F
這一條清晨五點就有了 一整天沒人提 科科
05/29 22:07, 35F

05/29 22:07, 17小時前 , 36F
等著看這次被中國人搞垮要花多少時間?上次沒兩個
05/29 22:07, 36F

05/29 22:07, 17小時前 , 37F
月就被玩成白癡ai
05/29 22:07, 37F

05/29 22:08, 17小時前 , 38F
使用者普遍認為在前端編碼能力超越了 Claude 4 Son
05/29 22:08, 38F

05/29 22:08, 17小時前 , 39F
net 一看就是詐騙 怎麼不說它 SWE bench到底幾分?
05/29 22:08, 39F
還有 158 則推文
還有 3 段內文
05/30 07:50, 8小時前 , 198F
我朋友在DS出來就去儲值100了,說很便宜很好用,結
05/30 07:50, 198F

05/30 07:50, 8小時前 , 199F
果沒幾天就被斷服務不能用,錢白花了…簡單說就是算
05/30 07:50, 199F

05/30 07:50, 8小時前 , 200F
力不足,訓練加快,但最終要服務那麼多人(token)就
05/30 07:50, 200F

05/30 07:50, 8小時前 , 201F
是需要夠多的算力
05/30 07:50, 201F

05/30 07:59, 8小時前 , 202F
剛出就去儲值我是不信拉!剛剛免費用沒啥延遲CC
05/30 07:59, 202F

05/30 08:01, 8小時前 , 203F
不過好像是V3版不是最新版CC
05/30 08:01, 203F

05/30 08:16, 7小時前 , 204F
中國太強了,就乖乖用ds就夠用了,吾等沒有啥需求
05/30 08:16, 204F

05/30 08:16, 7小時前 , 205F
,用習慣的就好
05/30 08:16, 205F

05/30 08:28, 7小時前 , 206F
複製貼上的東西,沒搞頭了
05/30 08:28, 206F

05/30 08:33, 7小時前 , 207F
我朋友是那種中共萬歲中共制度凌駕民主的人,還有手
05/30 08:33, 207F

05/30 08:33, 7小時前 , 208F
機銀行帳戶,每年幾次中國遊的,剛出就儲值有何意外
05/30 08:33, 208F

05/30 08:33, 7小時前 , 209F
?才100RMB是又不是多少錢…
05/30 08:33, 209F

05/30 08:36, 7小時前 , 210F
到底誰在吹
05/30 08:36, 210F

05/30 08:40, 7小時前 , 211F
算了吧….被審查的東西沒搞頭
05/30 08:40, 211F

05/30 08:54, 7小時前 , 212F
看了發文原PO我嚇一跳,竟然是最討厭DS的strlen
05/30 08:54, 212F

05/30 08:59, 7小時前 , 213F
有競爭是好事
05/30 08:59, 213F

05/30 09:03, 6小時前 , 214F
DS的破壞力是提供自建模型,類似AI平權打破壟斷
05/30 09:03, 214F

05/30 09:04, 6小時前 , 215F
現在openAI的產品規劃都被中國模型打亂,開始拆分產
05/30 09:04, 215F

05/30 09:04, 6小時前 , 216F
品急就章
05/30 09:04, 216F

05/30 10:30, 5小時前 , 217F
05/30 10:30, 217F

05/30 10:33, 5小時前 , 218F
連中吹都沒在用,吹只是工作,生活還是要面對的
05/30 10:33, 218F

05/30 10:48, 5小時前 , 219F
可以用DS取代中吹的工作嗎?
05/30 10:48, 219F

05/30 10:50, 5小時前 , 220F
難用啊 gpt隨便屌打了
05/30 10:50, 220F

05/30 10:59, 5小時前 , 221F
別浪費時間,吹吹牛就被拐,用就用好的又不是沒得選
05/30 10:59, 221F
※ 編輯: strlen (118.169.0.196 臺灣), 05/30/2025 11:39:52

05/30 12:40, 3小時前 , 222F
推ali
05/30 12:40, 222F

05/30 13:07, 2小時前 , 223F
現在還有人在用狄波系科?
05/30 13:07, 223F

05/30 13:33, 2小時前 , 224F
老黃都不敢說DS很爛外行人拿AI當玩具倒是一路美吹CC
05/30 13:33, 224F

05/30 13:35, 2小時前 , 225F
不懂的東西當美吹就對了!反正GG也偷美國技術的CC
05/30 13:35, 225F

05/30 14:00, 2小時前 , 226F
繼續吹,難用的要死的東西
05/30 14:00, 226F

05/30 14:02, 1小時前 , 227F
老黃還把DS模型上架了反正美吹不懂這些每天吹吉普力
05/30 14:02, 227F

05/30 14:09, 1小時前 , 228F
稱其能夠像谷歌模型一樣,Gemini還是碾壓
05/30 14:09, 228F

05/30 14:11, 1小時前 , 229F
還有人在乎?
05/30 14:11, 229F

05/30 14:16, 1小時前 , 230F
台灣沒人在乎阿!反正沒能力開發跟軍武一樣CC
05/30 14:16, 230F

05/30 14:53, 1小時前 , 231F
只能狗吠火車狐假虎威無能狂怒了
05/30 14:53, 231F

05/30 14:53, 1小時前 , 232F
好了啦,根本大內宣
05/30 14:53, 232F

05/30 15:02, 59分鐘前 , 233F
根本沒人想用 = =
05/30 15:02, 233F

05/30 15:07, 54分鐘前 , 234F
05/30 15:07, 234F

05/30 15:42, 19分鐘前 , 235F
老實說很難用 而且回答常常沒有系統性整理
05/30 15:42, 235F

05/30 15:43, 18分鐘前 , 236F
除了中吹已經沒人care了
05/30 15:43, 236F
文章代碼(AID): #1eE6TakE (Stock)
文章代碼(AID): #1eE6TakE (Stock)