Re: [新聞] DeepSeek R1來了,追平o1!它現在不

看板Stock (股票)作者 (強森)時間1天前 (2025/01/27 20:36), 編輯推噓3(303)
留言6則, 5人參與, 1天前最新討論串1/1
https://reurl.cc/Q5gWM2 這篇有幫大家看過paper了 基本上就是在chain of thought inference 推理的時候 reinforcement跟supervised比例的嘗試 數理問題RL比重高點 需要文法的文字問題supervised比重多一點 感覺是training手法的不同 跟model的運算架構沒啥關係 我是覺得有點過譽辣 RL天馬行空不見得效率會一直比較好 最後還是得靠堆算力 但是deepseek的成功背後代表的事是 人類的思考框架永遠比想像中的蠢=_= 找一個蠢蛋去supervised 只會得到一個蠢蛋 ※ 引述《kobebrian》之銘言 : 先說 我完全不懂DS的算法 也不懂open ai的算法 : 但既然DS開源 那大家都能使用的情況下 未來AI迭代肯定加速 : 有人說我用1/50的算法就可以做到一樣的功能...是啊大家都可以用這套算法的情況下 那 : 還是得拼硬體 : 我用更強大的硬體可以推出更好的產品、服務 除非今天硬體本身的上限到了 沒辦法再有 : 更好的硬體來加速運算 : 不然這些大公司要怎麼贏過有同樣效率、算法的對手?我硬體先用到頂規 再來用軟體拼 : 贏 還是有人覺得這些大公司挖金礦敢用次級鏟子? : 就是那些小公司現在也「可能」有本錢下來市場玩 他們可能可以用次一等的鏟子來挖 推 : 出沒那麼好但便宜的產品 這會讓整個硬體的市場擴大 以前只能是最頂規的硬體跟AI有關 : 現在不是 : 而且也就是「可能」而已 : ----- : Sent from MeowPtt on my iPhone ---- Sent from BePTT on my iPhone 15 Pro -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.139.179.137 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737981406.A.5D5.html

01/27 20:37, 1天前 , 1F
看股市反應成這樣就知道人類真的是白癡
01/27 20:37, 1F

01/27 20:40, 1天前 , 2F
沒關係 你要當沒那麼白痴的那個(不是說你不是白痴
01/27 20:40, 2F

01/27 20:40, 1天前 , 3F
也不是罵你白痴
01/27 20:40, 3F

01/27 20:45, 1天前 , 4F
不是人很蠢 是你的大腦比想像中更強
01/27 20:45, 4F

01/27 20:48, 1天前 , 5F
看完了台股完蛋
01/27 20:48, 5F

01/27 21:46, 1天前 , 6F
這種手法會有專項偏頗的情況, 應該不容易廣泛適用
01/27 21:46, 6F
文章代碼(AID): #1dbttUNL (Stock)
文章代碼(AID): #1dbttUNL (Stock)