[心得] deepseek 相當於填鴨義務教育

看板Stock (股票)作者 (又又丸)時間2天前 (2025/01/28 18:08), 編輯推噓35(438306)
留言357則, 37人參與, 1天前最新討論串1/1
過去家庭教育的領域 一旦有人把教育小孩如何考上哈佛的策略寫出來 在市面上就會大賣 而許多家長也希望有這種小孩 因此他會跳過自己摸索培養的過程 直接採用這些成功學的方法論 也就是說,採用他的書單 看些什麼書,寫些什麼考卷 報名哪些興趣班 完全按照這個訓練集的成果來做 基於這個成果 用廉價的方式,避免重新培養 用低成本可複製的方式 得到一個標準作業流程可以預期的成果 而這個成果自然是利用成功模板的訓練集 也就是openAI的訓練成果 也就是說有錢人教育小孩 窮人複製方法 我認為這也是這次deepseek的概念 所以就教育量產化工業化培養的角度來說 這的確非常有義務教育考試填鴨教育的風格 當然未來補習班和書局教材講義的市場 也會大量產生 父母們再也不用特地去看書目裡面的書了 要念完多辛苦 只需要把經典的選文看完就可以了 當然 如果你要培養的是非通用的 或有自己獨立思考能力的 就需要從頭訓練起 deep seek相當於去詢問父母眼中的典範學生 透過回答的答案來反推思考他的價值觀和想法 模仿與效法 自然成本更低 大概是這個意思 來個股點 美股輝達和台積電 還好我手上前陣子都賣光了 不然真的會哭死 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.26.130.178 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738058937.A.1A7.html

01/28 18:10, 2天前 , 1F
你太靠北惹
01/28 18:10, 1F

01/28 18:11, 2天前 , 2F
非常貼切
01/28 18:11, 2F

01/28 18:13, 2天前 , 3F
文明進步本來就是這樣啊
01/28 18:13, 3F

01/28 18:14, 2天前 , 4F
當過去成本降低,才能創造新的東西
01/28 18:14, 4F

01/28 18:14, 2天前 , 5F
重點在最後一段
01/28 18:14, 5F

01/28 18:18, 2天前 , 6F

01/28 18:19, 2天前 , 7F

01/28 18:24, 2天前 , 8F
胡說八道
01/28 18:24, 8F

01/28 18:25, 2天前 , 9F
採用書單沒用吧 富人的小孩如果智商不高或是不想學
01/28 18:25, 9F

01/28 18:25, 2天前 , 10F
習也沒用
01/28 18:25, 10F

01/28 18:26, 2天前 , 11F
不懂就去看看別人論文寫什麼,不要不懂裝懂
01/28 18:26, 11F

01/28 18:30, 2天前 , 12F
你說的對^ _^
01/28 18:30, 12F

01/28 18:33, 2天前 , 13F
01/28 18:33, 13F

01/28 18:38, 2天前 , 14F
真要講起來 OpenAI比較像填鴨式
01/28 18:38, 14F

01/28 18:41, 2天前 , 15F
OpenAI建立的LLM訓練階段大致分成四個階段
01/28 18:41, 15F

01/28 18:42, 2天前 , 16F
預先訓練 監督微調 獎勵建模 強化學習
01/28 18:42, 16F

01/28 18:42, 2天前 , 17F
預先訓練就是先餵他大量文本 讓他學習語文
01/28 18:42, 17F

01/28 18:43, 2天前 , 18F
監督微調就是用人工貼label的方式 糾正AI的認知
01/28 18:43, 18F

01/28 18:43, 2天前 , 19F
之後建立獎勵模型, AI做對的時候就獎勵他
01/28 18:43, 19F

01/28 18:43, 2天前 , 20F
這樣也可以當股點喔
01/28 18:43, 20F

01/28 18:44, 2天前 , 21F
強化學習就是讓AI模型自己跟自己練習
01/28 18:44, 21F

01/28 18:44, 2天前 , 22F
這篇沒被砍以後我就都學你發廢文
01/28 18:44, 22F

01/28 18:44, 2天前 , 23F
OpenAI建立這個訓練模式之後 所有LLM模型都依照這個
01/28 18:44, 23F

01/28 18:44, 2天前 , 24F
方式訓練
01/28 18:44, 24F

01/28 18:44, 2天前 , 25F
DeepSeek這次的論文 就是抽掉了監督微調的部分
01/28 18:44, 25F

01/28 18:45, 2天前 , 26F
吃不到葡萄說葡萄酸
01/28 18:45, 26F

01/28 18:45, 2天前 , 27F
這個就跟原始的AlphaGo跟AlphaGo Zero一樣
01/28 18:45, 27F

01/28 18:46, 2天前 , 28F
AlphaGo是跟人類對弈訓練出來的, 他的棋路是人類告
01/28 18:46, 28F

01/28 18:46, 2天前 , 29F
訴他該怎麼走
01/28 18:46, 29F

01/28 18:46, 2天前 , 30F
但Zero是電腦跟電腦自己下出來的
01/28 18:46, 30F

01/28 18:47, 2天前 , 31F
所以 Zero 會走出人類覺得不能這樣走的棋路
01/28 18:47, 31F

01/28 18:47, 2天前 , 32F
DeepSeek把這個想法在LLM上實現
01/28 18:47, 32F

01/28 18:47, 2天前 , 33F
就DeepSeek的論文講, 因為沒有人類介入, 所以初期對
01/28 18:47, 33F

01/28 18:48, 2天前 , 34F
於推理能力的發展很慢, 但電腦跟電腦自己練習久了
01/28 18:48, 34F

01/28 18:49, 2天前 , 35F

01/28 18:52, 2天前 , 36F
突然就開竅了, 論文把這個稱為aha moment
01/28 18:52, 36F

01/28 18:53, 2天前 , 37F
簡單講 OpenAI訓練中期 是得有大量人類來告訴OpenAi
01/28 18:53, 37F

01/28 18:53, 2天前 , 38F
怎麼想才是對的
01/28 18:53, 38F

01/28 18:54, 2天前 , 39F
但DeepSeek不這麼做 他就是讓電腦自己跟自己一直練
01/28 18:54, 39F
還有 278 則推文
01/28 20:20, 2天前 , 318F
測試而已,沒打也是一樣的回答啦 XDDDDDDDDDDDD
01/28 20:20, 318F

01/28 20:20, 2天前 , 319F
<think></think>標籤是AI發展早期 要給人看他的推
01/28 20:20, 319F

01/28 20:20, 2天前 , 320F
理思路的時候 會把他推理的過程寫在<think></think
01/28 20:20, 320F

01/28 20:21, 2天前 , 321F
> 把最終要回覆的答案寫在<answer></answer>
01/28 20:21, 321F

01/28 20:21, 2天前 , 322F
這樣參與訓練的人就可以知道 這個答案是不是思路
01/28 20:21, 322F

01/28 20:21, 2天前 , 323F
是對的 還是其實思考方向根本不對 只是答案對
01/28 20:21, 323F

01/28 20:22, 2天前 , 324F
你去學AI標註要幹嘛 笑死我
01/28 20:22, 324F

01/28 20:23, 2天前 , 325F
這個思路標籤 也是DeepSeek的特色之一
01/28 20:23, 325F

01/28 20:23, 2天前 , 326F
測試怎麼繞過中國特色的言論審查阿 XDDDDDDD
01/28 20:23, 326F

01/28 20:23, 2天前 , 327F
你先繞過你自己腦子裡的審查吧XDDDDDDDDDDDDDDDDD
01/28 20:23, 327F

01/28 20:24, 2天前 , 328F
出了個DS 讓一堆人焦慮症發作是怎樣Xd
01/28 20:24, 328F

01/28 20:25, 2天前 , 329F
玩玩具而已,怎麼又在幻想別人焦慮了 XDDDDDDDDDD
01/28 20:25, 329F

01/28 20:27, 2天前 , 330F
只是玩具的話 幹嘛這麼焦慮 還跑來股版秀下限
01/28 20:27, 330F

01/28 20:28, 2天前 , 331F
從昨天柵欄就壞了
01/28 20:28, 331F

01/28 20:29, 2天前 , 332F
你還是趕快回柵欄裡取暖吧 這裡不適合你啊
01/28 20:29, 332F

01/28 20:30, 2天前 , 333F
我腦子裡的啥審查?又開始幻想了 XDDDDDDDDDDDDD
01/28 20:30, 333F

01/28 20:48, 2天前 , 334F
原來是沒點 R1 按鈕的關係,點了之後就跟 ChatGPT
01/28 20:48, 334F

01/28 20:48, 2天前 , 335F
XDDDDD
01/28 20:48, 335F

01/28 20:49, 2天前 , 336F
的回答比較接近,一樣回答一堆了,看來 R1 進步很多
01/28 20:49, 336F

01/28 20:49, 2天前 , 337F
突然多很多AI專家 不要再窯啦 還是其他人XD
01/28 20:49, 337F

01/28 20:49, 2天前 , 338F
XDDDDDDDD
01/28 20:49, 338F

01/28 20:50, 2天前 , 339F
胡扯
01/28 20:50, 339F

01/28 21:07, 2天前 , 340F
Deepseek R1 看來不太同意 IBIZA 的看法 XDDDDDDDDD
01/28 21:07, 340F

01/28 22:20, 2天前 , 341F
關鍵字審查是在軟體端,而不在模型本身,他模型已經
01/28 22:20, 341F

01/28 22:20, 2天前 , 342F
開源了,你對他client端不滿,可以到github下載他的
01/28 22:20, 342F

01/28 22:20, 2天前 , 343F
模型自己導入到本機使用,就像一堆線上產圖用的也是
01/28 22:20, 343F

01/28 22:20, 2天前 , 344F
開源模型,但因為在軟體端有限制,所以無法產色圖,
01/28 22:20, 344F

01/28 22:20, 2天前 , 345F
但同樣的模型在本機跑,要不要限制則是由你決定,一
01/28 22:20, 345F

01/28 22:20, 2天前 , 346F
直在跳針審查的大概是完全不懂
01/28 22:20, 346F

01/28 22:25, 2天前 , 347F
是喔?你這麼確定不是模型內建嗎?XDDDDDD
01/28 22:25, 347F

01/28 22:29, 2天前 , 348F
要想繞過限制方法很多,只是要多點想像力
01/28 22:29, 348F

01/28 22:30, 2天前 , 349F

01/28 22:33, 2天前 , 350F
自己去玩一下本地端LLM就知道了
01/28 22:33, 350F

01/28 22:39, 2天前 , 351F
怎麼變成 XDDDD 文了
01/28 22:39, 351F

01/28 23:08, 2天前 , 352F
好的 64天安門
01/28 23:08, 352F

01/28 23:21, 2天前 , 353F
一隻猴子攪亂c洽 一個算法攪亂股板 中國果然吹不得
01/28 23:21, 353F

01/29 08:33, 2天前 , 354F
IBIZA習慣躲在螢幕後,亂攻擊別人..現實中或許不太
01/29 08:33, 354F

01/29 08:33, 2天前 , 355F
如意哈
01/29 08:33, 355F

01/29 09:43, 2天前 , 356F
聽起來比較像是標準化 本身不是壞事
01/29 09:43, 356F

01/29 13:02, 1天前 , 357F
大家別慌 推文是電腦在訓練語言模型
01/29 13:02, 357F
文章代碼(AID): #1dcAov6d (Stock)
文章代碼(AID): #1dcAov6d (Stock)