[情報] 50美元訓練出媲美DeepSeek R1

看板Stock (股票)作者 (gosu mage)時間4小時前 (2025/02/06 16:56), 4小時前編輯推噓351(37221362)
留言755則, 377人參與, 45分鐘前最新討論串1/4 (看更多)
標題: 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 來源: Futu 網址: https://tinyurl.com/ydrtdbu8 內文: 李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的雲計算費用訓練了一個名 叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSe ek的R1等尖端推理模型類似。研究人員表示,s1是通過蒸餾法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提煉出來的。 https://i.imgur.com/kFg9GjU.jpeg
斯坦福大學以及華盛頓大學的研究團隊展示了一種極低成本的 AI 訓練方法,被稱為 S1 。 S1 僅使用 6 美元就能達到 OpenAI o1-preview 級別的推理性能!同時匹敵Deepseek R1 推理時間可控:S1 通過簡單的“Wait”機制,控制大模型的思考時間,提高推理能力。 S1 不是 OpenAI o1 或 DeepSeek R1 的直接復刻,但它揭示了在推理時微調 AI 的潛力 ,甚至可以媲美 Reinforcement Learning(強化學習)。 OpenAI 和 DeepSeek 早期研究發現,AI 在回答問題時“思考得更久”,往往能得出更好 的答案。但過去並沒有清楚解釋:如何在推理階段控制 AI 的思考時間? S1 的創新點: S1 論文提供了推理時間擴展(Inference Scaling)的具體實現方法: 核心思想: 如何在不改變 AI 訓練過程的情況下,提高 AI 解決複雜問題的能力? 方法:讓 AI 在推理時“多想幾秒”,自動檢查自己的答案,從而減少錯誤,提高正確率 ! 結果證明,這種方法比 OpenAI o1-preview 還要好! 最重要的是:而且只用了 1000 道題! 這比一般 AI 訓練的數據少了 800 倍,但效果仍 然很強! 此外,該模型可以在筆記本電腦上運行,並且其訓練成本僅為 6 美元。 論文下載 https://arxiv.org/pdf/2501.19393 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.195.108 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738832169.A.8EF.html ※ 編輯: LimYoHwan (42.72.195.108 臺灣), 02/06/2025 16:56:28

02/06 16:56, 4小時前 , 1F
好便宜!!!
02/06 16:56, 1F

02/06 16:56, 4小時前 , 2F

02/06 16:56, 4小時前 , 3F
02/06 16:56, 3F

02/06 16:57, 4小時前 , 4F
不用錢,我的腦就是R1
02/06 16:57, 4F

02/06 16:57, 4小時前 , 5F
完了 地動山搖
02/06 16:57, 5F

02/06 16:57, 4小時前 , 6F
R1很強
02/06 16:57, 6F

02/06 16:57, 4小時前 , 7F
Gamini 2.0不是剛出不到一天
02/06 16:57, 7F

02/06 16:58, 4小時前 , 8F
提煉再提煉
02/06 16:58, 8F

02/06 16:58, 4小時前 , 9F
你肥肥團隊
02/06 16:58, 9F

02/06 16:58, 4小時前 , 10F
哈哈 過一陣子 會不會出現0.5美元就可以搞定
02/06 16:58, 10F

02/06 16:58, 4小時前 , 11F
變伏特加了吧這個
02/06 16:58, 11F

02/06 16:58, 4小時前 , 12F
這啥 白菜價? 韭菜價?
02/06 16:58, 12F

02/06 16:58, 4小時前 , 13F
多想幾秒鐘 你可以不要...
02/06 16:58, 13F

02/06 16:59, 4小時前 , 14F
AI白菜價
02/06 16:59, 14F

02/06 16:59, 4小時前 , 15F
openai又要發作了嗎
02/06 16:59, 15F

02/06 16:59, 4小時前 , 16F
真的白菜價了
02/06 16:59, 16F

02/06 16:59, 4小時前 , 17F
要遍地AI了
02/06 16:59, 17F

02/06 17:00, 4小時前 , 18F
那誰要當第一個訓練的?
02/06 17:00, 18F

02/06 17:00, 4小時前 , 19F
然後發現 這AI我根本很少用到啊
02/06 17:00, 19F

02/06 17:00, 4小時前 , 20F
丸子 沒有最便宜 只有更便宜 ㄟ唉末日
02/06 17:00, 20F

02/06 17:01, 4小時前 , 21F
這很常見…不用大驚小怪
02/06 17:01, 21F

02/06 17:01, 4小時前 , 22F
結果最後大家都去別人的水桶裡面釣魚耶 笑死
02/06 17:01, 22F

02/06 17:01, 4小時前 , 23F
丸子 原來搞AI那麼便宜
02/06 17:01, 23F

02/06 17:02, 4小時前 , 24F
以後沒人想開源了 大家自己買nv晶片訓練大模型
02/06 17:02, 24F

02/06 17:02, 4小時前 , 25F
太唬爛了,能信嗎
02/06 17:02, 25F

02/06 17:02, 4小時前 , 26F
卷爛
02/06 17:02, 26F

02/06 17:02, 4小時前 , 27F
你釣他水桶裡的魚,我釣你水桶裡的魚,大隊接力
02/06 17:02, 27F

02/06 17:03, 4小時前 , 28F
看來ai普及速度極快,終端裝置準備大噴發QQ
02/06 17:03, 28F

02/06 17:03, 4小時前 , 29F
看不懂
02/06 17:03, 29F

02/06 17:03, 4小時前 , 30F
NV我們不要了
02/06 17:03, 30F

02/06 17:03, 4小時前 , 31F
你蒸餾我的蒸餾 近親繁殖?
02/06 17:03, 31F

02/06 17:03, 4小時前 , 32F
蹦蹦
02/06 17:03, 32F

02/06 17:03, 4小時前 , 33F
50鎂有點太唬爛了
02/06 17:03, 33F

02/06 17:04, 4小時前 , 34F
阿不就是都在巨頭開發模型基礎上才做得出來
02/06 17:04, 34F

02/06 17:04, 4小時前 , 35F
NV又要一根了嗎?
02/06 17:04, 35F

02/06 17:04, 4小時前 , 36F
這應該算微調嗎
02/06 17:04, 36F

02/06 17:05, 4小時前 , 37F
gemini :我的魚!!!!
02/06 17:05, 37F

02/06 17:05, 4小時前 , 38F
連顯卡都不用
02/06 17:05, 38F

02/06 17:05, 4小時前 , 39F
多想幾秒 連線請教GPT
02/06 17:05, 39F
還有 676 則推文
02/06 19:47, 1小時前 , 716F
我會了!蒸餾再蒸餾+問AI確定正確嗎?
02/06 19:47, 716F

02/06 19:47, 1小時前 , 717F
幹 超屌 反觀
02/06 19:47, 717F

02/06 19:53, 1小時前 , 718F
李飛飛大概就龍母等級 養很多隻龍 懂?
02/06 19:53, 718F

02/06 19:55, 1小時前 , 719F
AI 早就轉商了,只是台灣沒在用,連對岸都用ㄧ堆A
02/06 19:55, 719F

02/06 19:55, 1小時前 , 720F
I
02/06 19:55, 720F

02/06 19:59, 1小時前 , 721F
中又贏
02/06 19:59, 721F

02/06 20:00, 1小時前 , 722F
這個李飛飛不是普通人,應該是真的
02/06 20:00, 722F

02/06 20:00, 1小時前 , 723F
結果跌下神壇的是OpenAI 而不是輝達
02/06 20:00, 723F

02/06 20:01, 1小時前 , 724F
太扯惹
02/06 20:01, 724F

02/06 20:01, 1小時前 , 725F
操你妹的白癡新聞
02/06 20:01, 725F

02/06 20:02, 1小時前 , 726F
幹NV一直漲欸,還以為能跌到一百以下,結果就這?我
02/06 20:02, 726F

02/06 20:02, 1小時前 , 727F
還沒上車啊==
02/06 20:02, 727F

02/06 20:04, 1小時前 , 728F
以後誰要當第一個開發的?都給人白嫖欸
02/06 20:04, 728F

02/06 20:04, 1小時前 , 729F
OKLO 先崩一波
02/06 20:04, 729F

02/06 20:06, 1小時前 , 730F
青鳥:蒸餾法不就抄襲!
02/06 20:06, 730F

02/06 20:09, 1小時前 , 731F
DS不是蒸餾OpenAI的吧 畢竟OpenAI沒有開源啊 哪能
02/06 20:09, 731F

02/06 20:09, 1小時前 , 732F
蒸餾?頂多可能謊報訓練成本
02/06 20:09, 732F

02/06 20:10, 1小時前 , 733F
他們是不是對成本誤會了什麼?
02/06 20:10, 733F

02/06 20:10, 1小時前 , 734F
方法:請他再想兩下
02/06 20:10, 734F

02/06 20:13, 1小時前 , 735F
OPENAI有開放阿
02/06 20:13, 735F

02/06 20:13, 1小時前 , 736F
你是不是對於蒸餾有誤會 蒸餾就是一個問一個答學習
02/06 20:13, 736F

02/06 20:13, 1小時前 , 737F
而已 又不用代碼
02/06 20:13, 737F

02/06 20:14, 1小時前 , 738F
窮人思維 唯一支持200億台灣之光AI麵線外送APP
02/06 20:14, 738F

02/06 20:16, 1小時前 , 739F
這故事不就告訴你,大家互相蒸餾的結果就是算力大量
02/06 20:16, 739F

02/06 20:16, 1小時前 , 740F
缺乏
02/06 20:16, 740F

02/06 20:18, 1小時前 , 741F
有開源嗎?沒開源沒被檢視,看起來只是在吹而已
02/06 20:18, 741F

02/06 20:26, 1小時前 , 742F
Andrej Karpathy就是李飛飛的學生
02/06 20:26, 742F

02/06 20:27, 1小時前 , 743F
特斯拉的前FSD首席工程師
02/06 20:27, 743F

02/06 20:29, 1小時前 , 744F
真的完蛋了 科技股崩爛
02/06 20:29, 744F

02/06 20:41, 57分鐘前 , 745F
算力才是根本,繼續噴了啦
02/06 20:41, 745F

02/06 20:41, 57分鐘前 , 746F
還不是抄襲
02/06 20:41, 746F

02/06 20:42, 56分鐘前 , 747F
老黃哭爛、
02/06 20:42, 747F

02/06 20:45, 53分鐘前 , 748F
成本亂算一通,負責組電腦的人要不要算成本?根本只
02/06 20:45, 748F

02/06 20:45, 53分鐘前 , 749F
是為了壓低而都不算吧,吹牛也要有點邏輯吧
02/06 20:45, 749F

02/06 20:46, 52分鐘前 , 750F
CS231n 就是李飛飛的課程 入門幾乎必看
02/06 20:46, 750F

02/06 20:46, 52分鐘前 , 751F
明天電梯向
02/06 20:46, 751F

02/06 20:47, 51分鐘前 , 752F
今天電梯向
02/06 20:47, 752F

02/06 20:48, 50分鐘前 , 753F
李飛飛美國人啦==
02/06 20:48, 753F

02/06 20:48, 50分鐘前 , 754F
gemini不是很爛嗎
02/06 20:48, 754F

02/06 20:53, 45分鐘前 , 755F
居然有人不知道李飛飛
02/06 20:53, 755F
文章代碼(AID): #1df7afZl (Stock)
文章代碼(AID): #1df7afZl (Stock)