[新聞]DeepSeek-R1 模型升級新版本,推理能力接近 o3、Gemini 2.5 Pro

看板Tech_Job (科技人)作者 (pl132)時間1天前 (2025/05/30 15:47), 編輯推噓3(12913)
留言34則, 23人參與, 6小時前最新討論串1/1
DeepSeek-R1 模型升級新版本,推理能力接近 o3、Gemini 2.5 Pro https://tinyurl.com/2bkshvbp 中國 DeepSeek(深度求索)釋出 DeepSeek-R1-0528 模型新版本,使其免費開源模型在 推理能力能與 OpenAI o3、Google Gemini 2.5 Pro 等付費專有模型並駕齊驅。 DeepSeek-R1-0528 以 2024 年 12 月發表的 DeepSeek-V3-Base 為基礎,在後訓練( Post-Training)過程投入更多算力,提升新版模型思考深度與推理能力,有助於提升數 學、科學、商業及程式設計等複雜推理任務上的表現。 DeepSeek-R1-0528 在數學、程式設計及通用邏輯等多個基準測試取得優異成績,並在整 體表現上接近如 OpenAI o3、Google Gemini 2.5 Pro。 相較於舊版 DeepSeek-R1,新版模型在複雜推理任務的表現有所提升。例如 AIME 2025 測試,因推理過程中加強思考深度,新版模型準確率由舊版的 70% 提升至 87.5%。 同時,DeepSeek 蒸餾 DeepSeek-R1-0528 的 CoT(Chain of Thought)後訓練 Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。這款 8B 模型在數學測驗 AIME 2024 僅次於 DeepSeek-R1-0528、超越 Qwen3-8B,並與 Qwen3-235B 相當。DeepSeek 認 為,DeepSeek-R1-0528 的 CoT 對於學術界推理模型的研究和工業界針對小模型的發展皆 具意義。 https://is.gd/b5sIbD 與先前版本相同,DeepSeek-R1-0528 採用 MIT 授權條款,並上傳至開源機器學習社群平 台 Hugging Face,開發者能夠自由修改甚至進行商業部署。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.146.20 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1748591261.A.B02.html

05/30 16:38, 1天前 , 1F
z,,,, ,喔,,我,,,,
05/30 16:38, 1F

05/30 17:03, 1天前 , 2F
繼續吹吧 有open ai根本就不需要這
05/30 17:03, 2F

05/30 17:03, 1天前 , 3F
05/30 17:03, 3F

05/30 17:28, 1天前 , 4F
之前幻覺大概70%,現在大概20%以下
05/30 17:28, 4F

05/30 17:50, 1天前 , 5F
難用的東西 ,又慢 不能問的一堆
05/30 17:50, 5F

05/30 17:50, 1天前 , 6F
然後?會畫圖了嗎?
05/30 17:50, 6F

05/30 18:17, 1天前 , 7F
比人家慢推出性能還沒超過喔 不是很
05/30 18:17, 7F

05/30 18:17, 1天前 , 8F
秋?
05/30 18:17, 8F

05/30 19:17, 1天前 , 9F
nobody car 無人車
05/30 19:17, 9F

05/30 21:31, 1天前 , 10F
MIT我是真的服,META還要自己的LIC
05/30 21:31, 10F

05/30 21:37, 1天前 , 11F

05/30 22:16, 1天前 , 12F
難用
05/30 22:16, 12F

05/30 22:23, 1天前 , 13F
8964
05/30 22:23, 13F

05/30 22:35, 1天前 , 14F
這裡的風向和 reddit 也差太多
05/30 22:35, 14F

05/30 22:38, 1天前 , 15F
現在的風向不是 deepseek 才是真正
05/30 22:38, 15F

05/30 22:38, 1天前 , 16F
的 open ai,open ai 應該叫 closed
05/30 22:38, 16F

05/30 22:38, 1天前 , 17F
ai 嗎
05/30 22:38, 17F

05/30 22:44, 1天前 , 18F
開源
05/30 22:44, 18F

05/30 22:55, 1天前 , 19F
70 vs 68 中美AI的差距又縮小了 難
05/30 22:55, 19F

05/30 22:55, 1天前 , 20F
怪黃說中國AI沒有輸美國 一直緊跟
05/30 22:55, 20F

05/30 22:55, 1天前 , 21F
在後
05/30 22:55, 21F

05/30 23:10, 1天前 , 22F
風向啥的能吃嗎 就問你平常用哪個
05/30 23:10, 22F

05/30 23:10, 1天前 , 23F
該不會是deepseek八 嘻嘻
05/30 23:10, 23F

05/30 23:56, 1天前 , 24F
現在開源的都是試玩版 不知哪時才能
05/30 23:56, 24F

05/30 23:57, 1天前 , 25F
內建在本機系統裡?不然搞得好像韭菜
05/30 23:57, 25F

05/31 00:20, 1天前 , 26F
使用率這麼低還好意思吹
05/31 00:20, 26F

05/31 01:34, 22小時前 , 27F
過氣
05/31 01:34, 27F

05/31 03:43, 20小時前 , 28F
蒸餾人家永遠無法超車
05/31 03:43, 28F

05/31 03:44, 20小時前 , 29F
沒差繼續燒錢就跟電車暴雷一樣
05/31 03:44, 29F

05/31 09:17, 15小時前 , 30F
台灣只有藍白粉在推..
05/31 09:17, 30F

05/31 09:24, 15小時前 , 31F
樓上言論大可不必
05/31 09:24, 31F

05/31 15:56, 8小時前 , 32F
嘻嘻 我用deepseek
05/31 15:56, 32F

05/31 17:45, 6小時前 , 33F
開源來說還是很屌了 有錢的公司就自
05/31 17:45, 33F

05/31 17:45, 6小時前 , 34F
己組設備架在內部了
05/31 17:45, 34F
文章代碼(AID): #1eEMATi2 (Tech_Job)
文章代碼(AID): #1eEMATi2 (Tech_Job)