Re: [情報] 50美元訓練出媲美DeepSeek R1

看板Stock (股票)作者 (爺)時間5小時前 (2025/02/06 18:54), 編輯推噓40(411128)
留言170則, 37人參與, 3小時前最新討論串3/4 (看更多)
好的 google 要不要把昨天財報上的說750億設備支出 變成50美元支出? 李飛飛能直接表明蒸餾Google Google 最好不知道還給你研究所蒸餾 那昨天Google 財報2025還要支出750億呢? 還是明天台灣派人去蒸餾meta Google chatGPT? 看看他們要不要給蒸餾 ※ 引述《LimYoHwan》之銘言 : 標題: : 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 : 來源: : Futu : 網址: : https://tinyurl.com/ydrtdbu8 : 內文: : 李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的雲計算費用訓練了一個名 : 叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSe : ek的R1等尖端推理模型類似。研究人員表示,s1是通過蒸餾法由谷歌推理模型Gemini 2.0 : Flash Thinking Experimental提煉出來的。 : https://i.imgur.com/kFg9GjU.jpeg
: 斯坦福大學以及華盛頓大學的研究團隊展示了一種極低成本的 AI 訓練方法,被稱為 S1 : 。 : S1 僅使用 6 美元就能達到 OpenAI o1-preview 級別的推理性能!同時匹敵Deepseek R1 : 推理時間可控:S1 通過簡單的“Wait”機制,控制大模型的思考時間,提高推理能力。 : S1 不是 OpenAI o1 或 DeepSeek R1 的直接復刻,但它揭示了在推理時微調 AI 的潛力 : ,甚至可以媲美 Reinforcement Learning(強化學習)。 : OpenAI 和 DeepSeek 早期研究發現,AI 在回答問題時“思考得更久”,往往能得出更好 : 的答案。但過去並沒有清楚解釋:如何在推理階段控制 AI 的思考時間? : S1 的創新點: S1 論文提供了推理時間擴展(Inference Scaling)的具體實現方法: : 核心思想: : 如何在不改變 AI 訓練過程的情況下,提高 AI 解決複雜問題的能力? : 方法:讓 AI 在推理時“多想幾秒”,自動檢查自己的答案,從而減少錯誤,提高正確率 : ! : 結果證明,這種方法比 OpenAI o1-preview 還要好! : 最重要的是:而且只用了 1000 道題! 這比一般 AI 訓練的數據少了 800 倍,但效果仍 : 然很強! : 此外,該模型可以在筆記本電腦上運行,並且其訓練成本僅為 6 美元。 : 論文下載 : https://arxiv.org/pdf/2501.19393 ---- Sent from BePTT on my iPhone 16 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.141.220.124 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738839278.A.133.html

02/06 18:57, 5小時前 , 1F
看ptt就知道我的獲利都從哪些人手上來的了
02/06 18:57, 1F

02/06 19:00, 5小時前 , 2F
你有了解模型跟基礎設備的差異嗎…
02/06 19:00, 2F

02/06 19:01, 4小時前 , 3F
所以就是資本收割籌碼的手段,了解的就不會恐慌反
02/06 19:01, 3F

02/06 19:01, 4小時前 , 4F
而開心能補貨@@
02/06 19:01, 4F

02/06 19:02, 4小時前 , 5F
大家都等抄答案就好
02/06 19:02, 5F

02/06 19:02, 4小時前 , 6F
努力寫題的是白痴
02/06 19:02, 6F

02/06 19:03, 4小時前 , 7F
我比較喜歡李冰冰 唯一支持
02/06 19:03, 7F

02/06 19:03, 4小時前 , 8F
各位AI大師,要不要組ㄧ隊?
02/06 19:03, 8F

02/06 19:10, 4小時前 , 9F
李飛飛跟google很熟啦 都副總裁了 應該有講好吧
02/06 19:10, 9F

02/06 19:12, 4小時前 , 10F

02/06 19:13, 4小時前 , 11F
沒有一個頭後面要怎麼蒸餾,還是大家都在原地互相蒸
02/06 19:13, 11F

02/06 19:13, 4小時前 , 12F
02/06 19:13, 12F

02/06 19:16, 4小時前 , 13F
這波NV持續吃AI基建的大餅,因為目前AI發展除了大陸
02/06 19:16, 13F

02/06 19:16, 4小時前 , 14F
被鎖死,全部都用NV的CUDA,目前仍很難看到取代性。
02/06 19:16, 14F

02/06 19:16, 4小時前 , 15F
deep seek跟現在的開源鬼故事,反而是證明搞不好H10
02/06 19:16, 15F

02/06 19:16, 4小時前 , 16F
0那種5奈米晶片提供的算力及成本CP值就足夠了,怕是
02/06 19:16, 16F

02/06 19:16, 4小時前 , 17F
未必會一直需要增加晶體管密度。
02/06 19:16, 17F

02/06 19:17, 4小時前 , 18F
而且基建要算力、後續運作、實體終端也都要算力啊,
02/06 19:17, 18F

02/06 19:17, 4小時前 , 19F
又不是只有訓練需要
02/06 19:17, 19F

02/06 19:18, 4小時前 , 20F
我蒸餾你的蒸餾他的蒸餾 會不會後面變成閉環
02/06 19:18, 20F

02/06 19:19, 4小時前 , 21F
並不是單靠蒸餾,是新模型的架構以及訓練方法都開始
02/06 19:19, 21F

02/06 19:19, 4小時前 , 22F
跟2023年流行的原始方式不同,早期像GPT3、4根本就
02/06 19:19, 22F

02/06 19:19, 4小時前 , 23F
只是鸚鵡的增強版,而且還是很肥很胖要高額飼料錢的
02/06 19:19, 23F

02/06 19:19, 4小時前 , 24F
鸚鵡。
02/06 19:19, 24F

02/06 19:21, 4小時前 , 25F
我小時候也看過有人說pentium效能已經夠用了
02/06 19:21, 25F

02/06 19:21, 4小時前 , 26F
現在的進展就跟AlphaGo一開始需要人類老師手把手教
02/06 19:21, 26F

02/06 19:21, 4小時前 , 27F
後來自己跟自己下棋自己學是類似的情況,整天說蒸餾
02/06 19:21, 27F

02/06 19:21, 4小時前 , 28F
的根本搞不清楚狀況,笑死!
02/06 19:21, 28F

02/06 19:21, 4小時前 , 29F

02/06 19:24, 4小時前 , 30F
pentium本來就夠用了
02/06 19:24, 30F

02/06 19:24, 4小時前 , 31F
win xp再戰20年不是問題
02/06 19:24, 31F

02/06 19:24, 4小時前 , 32F
大多數文書處理電腦…那個不是pentium就夠用了
02/06 19:24, 32F

02/06 19:24, 4小時前 , 33F
晶體管密度越密價格越貴,除非台積電降價,要不然連
02/06 19:24, 33F

02/06 19:24, 4小時前 , 34F
蘋果都吃不消,以為台積電會一直得利的我倒不認為,
02/06 19:24, 34F

02/06 19:24, 4小時前 , 35F
因為技術發展也是要看CP值的,這點OpenAI就是不良示
02/06 19:24, 35F

02/06 19:24, 4小時前 , 36F
範,你要錢要過頭大家都受不了。
02/06 19:24, 36F

02/06 19:25, 4小時前 , 37F
不夠用單純就是某些軟體一直修改
02/06 19:25, 37F

02/06 19:25, 4小時前 , 38F
才搞得不夠用
02/06 19:25, 38F

02/06 19:25, 4小時前 , 39F
原本一個房間大的大型主機變成擺在桌上的小方塊 這
02/06 19:25, 39F
還有 91 則推文
02/06 19:59, 4小時前 , 131F
急著蒸出能塞進edge跟機器人的model 就是未來五年
02/06 19:59, 131F

02/06 19:59, 4小時前 , 132F
的贏家 以為機器人喊喊而已嗎?今年就是前哨站了
02/06 19:59, 132F

02/06 20:00, 4小時前 , 133F
美國AI這塊也很多是清華北大的學生,或是華裔
02/06 20:00, 133F

02/06 20:02, 3小時前 , 134F
所以我才說預估是4-6年可以搞出AGI,NV會一直吃AI基
02/06 20:02, 134F

02/06 20:02, 3小時前 , 135F
建大餅,我早就講過了,呵呵!
02/06 20:02, 135F

02/06 20:05, 3小時前 , 136F
跟台灣比較有關的是台積電會扮演什麼角色,台積電被
02/06 20:05, 136F

02/06 20:05, 3小時前 , 137F
川普點名下勢必要降價跟設廠才能繼續吃餅,要不然光
02/06 20:05, 137F

02/06 20:05, 3小時前 , 138F
川普亂搞就夠台積電受的了,萬一真的被我講中5nm就
02/06 20:05, 138F

02/06 20:05, 3小時前 , 139F
夠用,台積電的優勢就會慢慢縮小。
02/06 20:05, 139F

02/06 20:05, 3小時前 , 140F
台灣政府還不快買AI建設,真的要輸對岸了
02/06 20:05, 140F

02/06 20:05, 3小時前 , 141F
台灣還不快買硬體
02/06 20:05, 141F

02/06 20:07, 3小時前 , 142F
好了早就講過了預言家 我只問一句 你賺多少
02/06 20:07, 142F

02/06 20:09, 3小時前 , 143F
又一堆恐慌仔? 國年笑話還不夠?
02/06 20:09, 143F

02/06 20:09, 3小時前 , 144F
關你屁事?deep seek酸建議去等OpenAI股票上市去all
02/06 20:09, 144F

02/06 20:09, 3小時前 , 145F
in呀!笑死!
02/06 20:09, 145F

02/06 20:10, 3小時前 , 146F
台灣 AI 早就遠輸給中國了好嗎... AI 現在就是美中
02/06 20:10, 146F

02/06 20:10, 3小時前 , 147F
爭霸局面
02/06 20:10, 147F

02/06 20:10, 3小時前 , 148F
中國不能用google
02/06 20:10, 148F

02/06 20:11, 3小時前 , 149F
台灣只能玩地方包圍中央 edge晶片跟硬體至少我們系
02/06 20:11, 149F

02/06 20:11, 3小時前 , 150F
統廠還是有優勢
02/06 20:11, 150F

02/06 20:11, 3小時前 , 151F
台灣哪有那麼多閒錢自己研發
02/06 20:11, 151F

02/06 20:12, 3小時前 , 152F
硬體邊際效應下降之後,現在的AI競賽
02/06 20:12, 152F

02/06 20:12, 3小時前 , 153F
已經來到算法優化了。硬體當然也需要,
02/06 20:12, 153F

02/06 20:12, 3小時前 , 154F
但是溢價搶買的時光已經過去了,硬體越
02/06 20:12, 154F

02/06 20:12, 3小時前 , 155F
等越便宜,你在等硬體的時候,優化算法
02/06 20:12, 155F

02/06 20:12, 3小時前 , 156F
才是王道了
02/06 20:12, 156F

02/06 20:13, 3小時前 , 157F
接下來應用面白家爭鳴,QQQ接下來應
02/06 20:13, 157F

02/06 20:13, 3小時前 , 158F
該能跑贏現在貴森森的NV
02/06 20:13, 158F

02/06 20:13, 3小時前 , 159F
ASIC至少我們拿到的製程一定贏對面
02/06 20:13, 159F

02/06 20:13, 3小時前 , 160F
也不是沒有錢,就錢被拿去養動物了吧?動物園營收會
02/06 20:13, 160F

02/06 20:13, 3小時前 , 161F
看漲嗎?呵呵!
02/06 20:13, 161F

02/06 20:17, 3小時前 , 162F
“我早就說過了!我早就講過了!早就告訴你們了”
02/06 20:17, 162F

02/06 20:17, 3小時前 , 163F
真好奇這些人在股市賺多少 科科科
02/06 20:17, 163F

02/06 20:18, 3小時前 , 164F
COVID時我講拿台股賺的去美股繼續賺,我還真有說過
02/06 20:18, 164F

02/06 20:18, 3小時前 , 165F
,呵呵!
02/06 20:18, 165F

02/06 20:28, 3小時前 , 166F
以前用google時,有在限制只能搜尋甚麼嗎? 甚麼都找
02/06 20:28, 166F

02/06 20:28, 3小時前 , 167F
不認識李飛飛Google很難嗎? 看新聞不會自己Google查
02/06 20:28, 167F

02/06 20:28, 3小時前 , 168F
連中吹都不敢買陸股,哥也早就說過了
02/06 20:28, 168F

02/06 20:28, 3小時前 , 169F
證唷? 自己陰謀論瞎猜!
02/06 20:28, 169F

02/06 20:28, 3小時前 , 170F
才有市場,ai模型問甚麼都能答才好用
02/06 20:28, 170F
文章代碼(AID): #1df9Jk4p (Stock)
文章代碼(AID): #1df9Jk4p (Stock)