PTT職涯區 / Stock (股票)

Re: [情報] 50美元訓練出媲美DeepSeek R1

看板Stock (股票)作者icrose (人本良心)時間5小時前 (2025/02/07 13:01)推噓3(4推 1噓 6→)

留言11則, 7人參與討論串8/8 (看更多)

我的信息源說是1000個樣本是通過gemini得到，但是又以通義千問為基底模型進行監督微調而來的神奇表現包括全球很多類似路綫都是藉鑒通義千問才能達到這樣的驚人效果，非李飛飛一家做到這才是最奇怪的。今日鼓點：大A乘風直上，就像哪吒2的票房 ※ 引述《DrTech (竹科管理處網軍研發人員)》之銘言： : ※ 引述《LimYoHwan (gosu mage)》之銘言： : 也是只看 fine-tune 1000題，一次的成本。 : 而且，試了不知道幾次， : 終於找到一次， : 可以在部分考卷上贏一個很爛的模型。 : 媒體文章中，忽略不計的成本，至少包含： : base模型訓練的成本(至少占成本99%) : 研究人員不斷試錯找1000題的成本。 : 多組1000題，再用 Gemini 模型，產生fine-tune資料的成本。 : 其他錯誤資訊，媒體的內文寫： : 研究人員表示，s1是通過蒸餾法由谷歌推理模型Gemini 2.0。 : 完全錯誤。原始論文寫： : 先準備 59000筆訓練資料，在不斷的用各種方式，選1000筆資料，再將1000筆 Gemini 2.0 Flash Thinking 改寫訓練資料。 : 最後再用這些資料fine-tune Qwen2.5-32B-Instruct模型。 ~~~~~~~~~~~~~~~~~~~~~~~~~ yes，u r right : 真的要亂寫，也要寫成蒸餾 Qwen2.5-32B的能力，而不是蒸餾 Gemini。 : 而且這種做法嚴格來說不叫蒸餾，叫fine-tune微調 : 結論： : 研究沒問題，找到了一種成本較低的流程，可產生可思考模型。但效果很一般。 : 一堆外行人，連論文都不看，在造假新聞。 : 媲美OpenAI-o1，deepseek-r1，連論文都沒這樣寫，純媒體造假。 -- 英國醫學網站：台灣丁丁長度，世界86國（地區）排第85，和東南亞一個水平，比東北亞短2cm -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 171.14.63.200 (中國) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738904509.A.C3D.html ※ 編輯: icrose (171.14.63.200 中國), 02/07/2025 13:06:09

→

02/07 13:05, 5小時前 , 1^F

02/07 13:05, 1^F

※ 編輯: icrose (171.14.63.200 中國), 02/07/2025 13:06:55

→

02/07 13:07, 5小時前 , 2^F

02/07 13:07, 2^F

推

02/07 13:20, 4小時前 , 3^F

02/07 13:20, 3^F

推

02/07 13:22, 4小時前 , 4^F

02/07 13:22, 4^F

→

02/07 13:27, 4小時前 , 5^F

02/07 13:27, 5^F

→

02/07 13:28, 4小時前 , 6^F

02/07 13:28, 6^F

→

02/07 13:28, 4小時前 , 7^F

02/07 13:28, 7^F

→

02/07 13:28, 4小時前 , 8^F

02/07 13:28, 8^F

推

02/07 13:29, 4小時前 , 9^F

02/07 13:29, 9^F

推

02/07 13:54, 4小時前 , 10^F

02/07 13:54, 10^F

噓

02/07 15:15, 3小時前 , 11^F

02/07 15:15, 11^F

‣ 返回看板[ Stock ] 學術

‣ 更多 icrose 的文章

文章代碼(AID): #1dfPEzmz (Stock)

討論串 (同標題文章)

本文引述了以下文章的的內容：

23

73

Re: [情報] 50美元訓練出媲美DeepSeek R1

10小時前, 02/07

完整討論串 (本文為第 8 之 8 篇)：

排序：最舊先 | 最新先 | 留言數

384

811

[情報] 50美元訓練出媲美DeepSeek R1

1天前, 02/06

33

79

Re: [情報] 50美元訓練出媲美DeepSeek R1

1天前, 02/06

47

204

Re: [情報] 50美元訓練出媲美DeepSeek R1

23小時前, 02/06

9

46

Re: [情報] 50美元訓練出媲美DeepSeek R1

21小時前, 02/06

13

15

Re: [情報] 50美元訓練出媲美DeepSeek R1已刪文

16小時前, 02/07

23

73

Re: [情報] 50美元訓練出媲美DeepSeek R1

10小時前, 02/07

Re: [情報] 50美元訓練出媲美DeepSeek R1已刪文

7小時前, 02/07

3

11

Re: [情報] 50美元訓練出媲美DeepSeek R1

5小時前, 02/07

在新視窗開啟完整討論串 (共8篇)

Stock 近期熱門文章

5

6

[新聞] 萬旭 1月合併營收1.34億元年增24.76%

3小時前, 02/07

19

33

[情報] 敦泰114年1月營收月減18.76%年減25.97%

3小時前, 02/07

1

3

[閒聊] 2025/02/07 盤後閒聊

4小時前, 02/07

26

44

[情報] 2891中信金 1月自結0.35

4小時前, 02/07

11

17

[新聞] 原相Q1仍看淡季循環，Q2起遊戲機受期待

4小時前, 02/07

9

14

Re: 3004 豐達科飛機飛上天需要維修多

4小時前, 02/07

3

11

Re: [情報] 50美元訓練出媲美DeepSeek R1

5小時前, 02/07

14

159

Re: [情報] 亞馬遜2025資本支出1000億美元

5小時前, 02/07

更多近期熱門文章 >>

PTT職涯區即時熱門文章

11

20

[新聞] 賣不掉再加價3億！七期貴婦SPA館養蚊1

3小時前, 02/07

4

28

[新聞] 台灣人為何這麼愛買房…很多租金其實比

3小時前, 02/07

8

21

Re: [新聞] 屏縣救市，房貸成數提高至85%

4小時前, 02/07

42

86

[情報] 桃園捷運青線連接桃園車站-小檜溪-青埔

5小時前, 02/07

0

63

[新聞] 抗DeepSeek 賴清德：速建構主權AI

5小時前, 02/07

0

6

Fw: [問題] 寫一個ssh client 連到ptt.cc

5小時前, 02/07

2

14

[新聞] 已婚裝單身!女遇台積電渣男工程師　「失

5小時前, 02/07

4

5

[問題] 玉山星宇卡海外消費認定

6小時前, 02/07

更多即時熱門文章 >>

‣ 返回看板[ Stock ] 學術

‣ 更多 icrose 的文章

文章代碼(AID): #1dfPEzmz (Stock)