PTT職涯區 / Tech_Job (科技人)

[新聞]DeepSeek-R1 模型升級新版本，推理能力接近 o3、Gemini 2.5 Pro

看板Tech_Job (科技人)作者pl132 (pl132)時間1天前 (2025/05/30 15:47)推噓3(12推 9噓 13→)

留言34則, 23人參與討論串1/1

DeepSeek-R1 模型升級新版本，推理能力接近 o3、Gemini 2.5 Pro https://tinyurl.com/2bkshvbp 中國 DeepSeek（深度求索）釋出 DeepSeek-R1-0528 模型新版本，使其免費開源模型在推理能力能與 OpenAI o3、Google Gemini 2.5 Pro 等付費專有模型並駕齊驅。 DeepSeek-R1-0528 以 2024 年 12 月發表的 DeepSeek-V3-Base 為基礎，在後訓練（ Post-Training）過程投入更多算力，提升新版模型思考深度與推理能力，有助於提升數學、科學、商業及程式設計等複雜推理任務上的表現。 DeepSeek-R1-0528 在數學、程式設計及通用邏輯等多個基準測試取得優異成績，並在整體表現上接近如 OpenAI o3、Google Gemini 2.5 Pro。相較於舊版 DeepSeek-R1，新版模型在複雜推理任務的表現有所提升。例如 AIME 2025 測試，因推理過程中加強思考深度，新版模型準確率由舊版的 70% 提升至 87.5%。同時，DeepSeek 蒸餾 DeepSeek-R1-0528 的 CoT（Chain of Thought）後訓練 Qwen3-8B Base，得到了 DeepSeek-R1-0528-Qwen3-8B。這款 8B 模型在數學測驗 AIME 2024 僅次於 DeepSeek-R1-0528、超越 Qwen3-8B，並與 Qwen3-235B 相當。DeepSeek 認為，DeepSeek-R1-0528 的 CoT 對於學術界推理模型的研究和工業界針對小模型的發展皆具意義。 https://is.gd/b5sIbD 與先前版本相同，DeepSeek-R1-0528 採用 MIT 授權條款，並上傳至開源機器學習社群平台 Hugging Face，開發者能夠自由修改甚至進行商業部署。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.146.20 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1748591261.A.B02.html

推

05/30 16:38, 1天前 , 1^F

05/30 16:38, 1^F

噓

05/30 17:03, 1天前 , 2^F

05/30 17:03, 2^F

→

05/30 17:03, 1天前 , 3^F

05/30 17:03, 3^F

推

05/30 17:28, 1天前 , 4^F

05/30 17:28, 4^F

噓

05/30 17:50, 1天前 , 5^F

05/30 17:50, 5^F

噓

05/30 17:50, 1天前 , 6^F

05/30 17:50, 6^F

噓

05/30 18:17, 1天前 , 7^F

05/30 18:17, 7^F

→

05/30 18:17, 1天前 , 8^F

05/30 18:17, 8^F

推

05/30 19:17, 1天前 , 9^F

05/30 19:17, 9^F

推

05/30 21:31, 1天前 , 10^F

05/30 21:31, 10^F

推

05/30 21:37, 1天前 , 11^F

05/30 21:37, 11^F

噓

05/30 22:16, 1天前 , 12^F

05/30 22:16, 12^F

→

05/30 22:23, 1天前 , 13^F

05/30 22:23, 13^F

推

05/30 22:35, 1天前 , 14^F

05/30 22:35, 14^F

推

05/30 22:38, 1天前 , 15^F

05/30 22:38, 15^F

→

05/30 22:38, 1天前 , 16^F

05/30 22:38, 16^F

→

05/30 22:38, 1天前 , 17^F

05/30 22:38, 17^F

推

05/30 22:44, 1天前 , 18^F

05/30 22:44, 18^F

推

05/30 22:55, 1天前 , 19^F

05/30 22:55, 19^F

→

05/30 22:55, 1天前 , 20^F

05/30 22:55, 20^F

→

05/30 22:55, 1天前 , 21^F

05/30 22:55, 21^F

推

05/30 23:10, 1天前 , 22^F

05/30 23:10, 22^F

→

05/30 23:10, 1天前 , 23^F

05/30 23:10, 23^F

推

05/30 23:56, 1天前 , 24^F

05/30 23:56, 24^F

→

05/30 23:57, 1天前 , 25^F

05/30 23:57, 25^F

噓

05/31 00:20, 1天前 , 26^F

05/31 00:20, 26^F

→

05/31 01:34, 22小時前 , 27^F

05/31 01:34, 27^F

噓

05/31 03:43, 20小時前 , 28^F

05/31 03:43, 28^F

→

05/31 03:44, 20小時前 , 29^F

05/31 03:44, 29^F

噓

05/31 09:17, 15小時前 , 30^F

05/31 09:17, 30^F

噓

05/31 09:24, 15小時前 , 31^F

05/31 09:24, 31^F

推

05/31 15:56, 8小時前 , 32^F

05/31 15:56, 32^F

→

05/31 17:45, 6小時前 , 33^F

05/31 17:45, 33^F

→

05/31 17:45, 6小時前 , 34^F

05/31 17:45, 34^F

‣ 返回看板[ Tech_Job ] 工作

‣ 更多 pl132 的文章

文章代碼(AID): #1eEMATi2 (Tech_Job)

Tech_Job 近期熱門文章

3

10

[新聞] 科技業高管超綠!妻偷吃月薪2.8萬鮮肉鹹

4小時前, 05/31

33

63

[新聞] 台積端午分紅特大包離職率創新低

5小時前, 05/31

4

37

Re: [討論] 於新竹市起家的薪資

9小時前, 05/31

31

78

[請益] 中文系畢業考上資工所可以進gg mae嗎？

12小時前, 05/31

34

85

Re: [情報] GG技術員開獎 (Dcard)

13小時前, 05/31

5

31

[新聞] 科技男狂約女工程師「床上肉搏」！只為內推進台積電網

15小時前, 05/31

53

101

[情報] GG技術員開獎

16小時前, 05/31

4

15

[情報] 工研院獎金

16小時前, 05/31

更多近期熱門文章 >>

PTT職涯區即時熱門文章

8

18

[請益]政府如打房會沒選票是怎麼得出來的?

1小時前, 05/31

13

34

[請益] 川普任期之台幣的未來

1小時前, 05/31

12

20

[新聞] 洛馬強推F-35升級版執行長稱可選「無人

1小時前, 05/31

15

41

[請益] 如何製作自己的損益及淨值EXCEL圖表

1小時前, 05/31

17

31

[新聞] 川普出招再升級！鋼鐵關稅喊漲至50% 阮慕

1小時前, 05/31

78

138

[情報] 川普: 用匹茲堡的鋼鐵打造美國更好的未來

2小時前, 05/31

1

9

Re: [新聞] 中國歐盟商會：歐企對中國經商環境信心創歷史低點

2小時前, 05/31

1

6

[閒聊] 6月JCB悠遊聯名卡自動加值10%回饋

3小時前, 05/31

更多即時熱門文章 >>

‣ 返回看板[ Tech_Job ] 工作

‣ 更多 pl132 的文章

文章代碼(AID): #1eEMATi2 (Tech_Job)