討論串(共3篇) - [新聞]不，你無法用 600 萬美元複製一個 DeepSeek R1 - 看板Tech_Job

看板 [ Tech_Job ]

討論串[新聞]不，你無法用 600 萬美元複製一個 DeepSeek R1

共 3 篇文章

排序：最舊先 | 最新先 | 留言數 | 推文總分

內容預覽：開啟 | 關閉 | 只限未讀

首頁

尾頁

[新聞]不，你無法用 600 萬美元複製一個 DeepSeek R1

推噓15(20推 )留言61則，0人參與作者pl132 (pl132)時間1天前 (2025/01/29 10:58)資訊

內容預覽:

不，你無法用 600 萬美元複製一個 DeepSeek R1. https://technews.tw/2025/01/28/you-cannot-copy-deepseekr1-with-6m/. 中國 AI 新創企業 DeepSeek 最新發布的 R1 模型震驚美國股市，關鍵在於其相對低廉的訓練

(還有1380個字)

Re: [新聞]不，你無法用 600 萬美元複製一個 DeepSeek R1

推噓7(8推 )留言34則，0人參與作者sxy67230 (charlesgg)時間1天前 (2025/01/29 15:33)資訊

內容預覽:

呃，這新聞是哪個平行時空新聞，當前一堆美國大學實驗室都已經成功用其他小型模型像llama或Qwen 復刻R1實驗了，而且也事實證明模型只要有辦法再訓練的時候盡可能要求模型更長更多輪的思考時間那就必然會讓模型依據上下文湧現出推理能力。無論模型大小或是否用deepseek的模型架構。. 一堆知名的框架也

(還有1155個字)

Re: [新聞]不，你無法用 600 萬美元複製一個 DeepSeek R1

推噓7(10推 )留言41則，0人參與作者KanzakiHAria (神崎・H・アリア)時間1天前 (2025/01/29 16:52)資訊

內容預覽:

建議先去看LATS 比較好理解什麼叫方法論. 簡單說R1是一套"如何讓LLM可以做深度思考"的方法論. 原本要讓LLM做深度思考之前的做法一律都是COT. 比如把每次LLM的輸入輸出當作一個節點. 把多個節點做評分最終選擇整條鏈評分最高的項目即MCTS概念. 這就像是alphago那樣每次棋

(還有1155個字)

首頁

尾頁