Re: [請益] 費半成份股全線崩盤 怎麼辦?

看板Stock (股票)作者 (六西格瑪)時間1天前 (2025/01/27 15:59), 1天前編輯推噓215(22611726)
留言963則, 170人參與, 13小時前最新討論串6/6 (看更多)
既然有人提推論,我就講看看訓練端 DSv3 論文中最大亮點,可能也是目前看起來崩盤的主要是 $5.77 million 的訓練成本 和他對比的是喇叭哥曾經說 GPT4 花了超過 $100 million 訓練 未公開的 GPT5 據 WSJ 說,每一次六個月訓練週期需要花超過 $500 million 簡單用 GPT-4 : DSv3 = o1 : DSR1 估計 o1,但應該更多啦,不過低估在這邊不重要 整理一下目前已知+估計+rumor GPT-3 : ~$4.6 million DeepSeekV3 (DSv3): ~$5.576 million DeepSeekR1 (DSR1): ~$12 million GPT-4 : >$100 million OpenAI's o1 Model: ~$200 million GPT-5 : ~$500 million 也就是說目前市面上的訓練成本會下降 ~50 倍 (20 - 50 之間,看你拿誰當標準) 反過來說是同樣的預算下,若忽視模型設計和 tokenization 模型的迭代週期也會暴漲約 50 倍 我敢說現在 Meta, OpenAI, MS, Google 的伺服器裡面一定滿滿都是 DS 而且在未來六個月會不斷看到新聞是 某某模型訓練成本下降 10% 或加快 10% 或是 OpenAI 成功部屬更低成本的模型,赤字大幅下滑 這樣的新聞 另外 DSR1 也展現了更進化的 CoT,只是單單將推論過程暴露給 MoE 並允許退回驗證回答,這樣的 pipeline 就足以讓模型更好 而且只要 test-time 時間越長,成果就成線性的更好 其實這根本是簡單到不行的想法,效果卻好得嚇人 這些巨頭絕對有能力在短時間內複製出來 - 結論是 我覺得 DS 的出現不會讓資本資出減少,反而是開啟另一輪軍備競賽 只要巨頭們意識到其他巨頭正在複製 DS 的成功,而且甚至更有效率的方法 他們只能繼續加大支出,而且部分的巨頭可能可以轉虧為盈,譬如 OpenAI 加速 50 倍很多嗎?你加速 50 倍,我就要加速 100 倍 大家都加速一百倍的時候,我要加速五百倍,直到開發出 AGI 為止 因為現在所有人都相信 AGI 和 no AGI 就是 0 和 1 的差距 先得到聖杯的人贏者通吃 ※ 引述《LDPC (Channel Coding)》之銘言: : DeepSeek這塊有幾個看法 Training端就等之後瓜出來再吃 : 在Inference這塊 因為受限於MoE 所有推論成本可以降下來 但需求變高的是用記憶空間 : 和各個node之間的通訊開銷 以及軟體上cpu/gpu的load balance -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.193.249.136 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737964753.A.06E.html

01/27 16:02, 1天前 , 1F
不會通吃,AI模型沒有技術壁壘
01/27 16:02, 1F

01/27 16:03, 1天前 , 2F
頂尖團隊間就是幾個月的差距而已
01/27 16:03, 2F
AGI 絕對有技術壁壘,光是目前 OpenAI 和 Google 就差了至少半代 壁壘不只是演算法,可能是算力+演算法+資料

01/27 16:04, 1天前 , 3F
正確,但就股票而言短空是避免不了的
01/27 16:04, 3F
估值下滑是有可能的,但直到華爾街撿夠了又會噴了

01/27 16:05, 1天前 , 4F
很好 很積極的想法 再多來一點
01/27 16:05, 4F
不看訓練成本,光是看「越長的 CoT 結果會越好」 就想不到算力需求下降的可能

01/27 16:06, 1天前 , 5F
這波我還真覺得agi會早點到來..
01/27 16:06, 5F
沒錯,這就是更高強度軍備競賽的動機之一

01/27 16:07, 1天前 , 6F
本來只有兩大國可以玩的東西,現在發現其他國家也
01/27 16:07, 6F

01/27 16:07, 1天前 , 7F
能加入,ai軍備競賽提前降臨
01/27 16:07, 7F

01/27 16:07, 1天前 , 8F
AGI根本不重要
01/27 16:07, 8F
如果你的 AGI 和我的 AGI 定義一樣,怎麼會不重要呢?AGI 可以 解決能源、飢荒、疾病甚至軍事政治法律問題,當然重要 有這種東西怎麼可能不會盈利?

01/27 16:07, 1天前 , 9F
產品落地開始盈利才重要
01/27 16:07, 9F

01/27 16:07, 1天前 , 10F
而且投資者也會相信
01/27 16:07, 10F

01/27 16:07, 1天前 , 11F
方法開源了 剩下看硬體競賽了 還是不變道理
01/27 16:07, 11F

01/27 16:07, 1天前 , 12F
客製化特定任務AI比AGI更專業
01/27 16:07, 12F

01/27 16:08, 1天前 , 13F
你們以為老黃去中國自拍 來台灣簽名的喔
01/27 16:08, 13F
※ 編輯: Sixigma (123.193.249.136 臺灣), 01/27/2025 16:10:25

01/27 16:08, 1天前 , 14F
你這想法有點危險 美中競爭下全球市場分割
01/27 16:08, 14F

01/27 16:08, 1天前 , 15F
軍備競賽還是會一直持續下去,DS的出現只會加速全球
01/27 16:08, 15F

01/27 16:08, 1天前 , 16F
AI的推動,硬體規格的需求還是會大幅增加,這不是
01/27 16:08, 16F

01/27 16:08, 1天前 , 17F
很簡單的送分題嗎
01/27 16:08, 17F

01/27 16:09, 1天前 , 18F
現在GPU需求減少降規 美國難吃中國與開發中國家GPU
01/27 16:09, 18F

01/27 16:09, 1天前 , 19F
市場找理由回調,不然再繼續漲都要衝擊6600,最後
01/27 16:09, 19F

01/27 16:09, 1天前 , 20F
還是要跌
01/27 16:09, 20F

01/27 16:10, 1天前 , 21F
市場可能變小下 未來的營收獲利下降 股價都難維持
01/27 16:10, 21F

01/27 16:11, 1天前 , 22F
gpt的全名Generative Pre-Trained Transformers
01/27 16:11, 22F

01/27 16:11, 1天前 , 23F
訓練成本再低,應用推動還是要算力的啊,抄底NV!
01/27 16:11, 23F

01/27 16:11, 1天前 , 24F
股價主要連結EPS與估值 跟公司投資的關聯又不太大
01/27 16:11, 24F

01/27 16:11, 1天前 , 25F
transform architecture類似於attention model
01/27 16:11, 25F

01/27 16:12, 1天前 , 26F
DSv3不是還是用H800嗎?哪裡市場變小?
01/27 16:12, 26F

01/27 16:13, 1天前 , 27F
NV的營收都來自這些巨頭啊,怎麼關聯不大呢
01/27 16:13, 27F

01/27 16:13, 1天前 , 28F
DS的出現還是撼動不了NV的技術壁壘
01/27 16:13, 28F

01/27 16:13, 1天前 , 29F
你覺DS以後會買中國GPU還是繼續買NV?
01/27 16:13, 29F

01/27 16:14, 1天前 , 30F
中國哪來的GPU?
01/27 16:14, 30F

01/27 16:14, 1天前 , 31F
市場需求有限啦
01/27 16:14, 31F

01/27 16:14, 1天前 , 32F
如果出現只需要1/50的模型 市場會佈一樣多的算力?
01/27 16:14, 32F

01/27 16:15, 1天前 , 33F
華為跟寒武紀都有設計GPU 中芯也有製造
01/27 16:15, 33F
還有 890 則推文
還有 8 段內文
01/27 19:55, 1天前 , 924F
01/27 19:55, 924F

01/27 19:57, 1天前 , 925F
GPT類模型越強越能理解人的需求 成本越低 越是可以
01/27 19:57, 925F

01/27 19:57, 1天前 , 926F
搭配的Ai服務更有幫助 因為GPT模型幾乎是所有Ai服
01/27 19:57, 926F

01/27 19:57, 1天前 , 927F
務的第一線客服
01/27 19:57, 927F

01/27 19:58, 1天前 , 928F
DS這套就是死路,只能專用應用,通往AGI都是想太多
01/27 19:58, 928F

01/27 19:58, 1天前 , 929F
沒有這個東西 人要下指令給其他的服務你大概除了寫
01/27 19:58, 929F

01/27 19:58, 1天前 , 930F
程式根本沒機會調用資源去處理你要Ai做的事
01/27 19:58, 930F

01/27 19:58, 1天前 , 931F
唉 終點都清晰可見了 還在吹
01/27 19:58, 931F

01/27 19:58, 1天前 , 932F
什麼情況快破一千樓推文了
01/27 19:58, 932F

01/27 20:00, 1天前 , 933F
吹DS何必 老美又不是笨蛋 改良一下就有機會打下來
01/27 20:00, 933F

01/27 20:00, 1天前 , 934F
01/27 20:00, 934F

01/27 20:01, 1天前 , 935F
這個市場越多人競爭越好 有人在煉蠱 消費者更有機
01/27 20:01, 935F

01/27 20:01, 1天前 , 936F
會撿便宜
01/27 20:01, 936F

01/27 20:06, 1天前 , 937F
這個不是贏者全拿的市場嗎
01/27 20:06, 937F

01/27 20:06, 1天前 , 938F
我也覺得跌硬體是一件很白痴的事情 拉低算力成本後
01/27 20:06, 938F

01/27 20:06, 1天前 , 939F
結果會是大家一起cost down運算成本齊步發展 還是
01/27 20:06, 939F

01/27 20:06, 1天前 , 940F
每一家都套你這個算法 然後用更高的硬體去拼?
01/27 20:06, 940F

01/27 20:10, 1天前 , 941F
大陸是省略訓練的這一個階段!?難道這一段不是因為
01/27 20:10, 941F

01/27 20:10, 1天前 , 942F
其他 AI軟體先建構的關係嗎
01/27 20:10, 942F

01/27 20:18, 1天前 , 943F
反正到時候就知道結果了,覺得算力是王道就多買點
01/27 20:18, 943F

01/27 20:51, 1天前 , 944F
造你這個邏輯,DS開源是不是低能,他不開源不就贏
01/27 20:51, 944F

01/27 20:51, 1天前 , 945F
者獨拿了
01/27 20:51, 945F

01/27 21:44, 1天前 , 946F
任何的商業行為最終都要cash out的,所以不存在追
01/27 21:44, 946F

01/27 21:44, 1天前 , 947F
求無限算力這種東西
01/27 21:44, 947F

01/27 21:44, 1天前 , 948F
AI吹了這麼久,真正cash out的只有NV
01/27 21:44, 948F

01/27 21:45, 1天前 , 949F
當然還有台積
01/27 21:45, 949F

01/27 21:45, 1天前 , 950F
不過台積電投入的成本也很可觀就是,一但需求停滯
01/27 21:45, 950F

01/27 21:45, 1天前 , 951F
我很好奇財報會長怎樣
01/27 21:45, 951F

01/27 22:53, 1天前 , 952F
現在是便宜菜刀要賣到缺貨了嗎?
01/27 22:53, 952F

01/27 23:15, 1天前 , 953F
用抄的最省成本
01/27 23:15, 953F

01/27 23:32, 1天前 , 954F
AI 下降代表AI大幅應用的奇異點來了嗎
01/27 23:32, 954F

01/27 23:59, 1天前 , 955F
資本支出和算力長期不會減少 發展會倍速啊 大家都
01/27 23:59, 955F

01/27 23:59, 1天前 , 956F
不讀科技史嗎
01/27 23:59, 956F

01/28 00:56, 1天前 , 957F
其實DS開源就是你有我有大家有,當大家都在同起跑
01/28 00:56, 957F

01/28 00:56, 1天前 , 958F
線上,請問要比甚麼,比跑者誰的肌肉協調度跟出力
01/28 00:56, 958F

01/28 00:56, 1天前 , 959F
夠吧?那兩者之間會是誰是肌肉協調度好且出力夠的
01/28 00:56, 959F

01/28 00:56, 1天前 , 960F
呢?呢?
01/28 00:56, 960F

01/28 04:00, 1天前 , 961F
跟在後面的蒸餾模型成本本來就較低。最前端的大模型
01/28 04:00, 961F

01/28 04:00, 1天前 , 962F
需要人工資料,成本很難下降的
01/28 04:00, 962F

01/28 17:08, 13小時前 , 963F
終究還是要買鏟子
01/28 17:08, 963F
文章代碼(AID): #1dbppH1k (Stock)
文章代碼(AID): #1dbppH1k (Stock)