Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子

看板Stock (股票)作者 (zxwxz)時間2天前 (2025/01/28 02:00), 編輯推噓11(11018)
留言29則, 15人參與, 2天前最新討論串3/13 (看更多)
DeepSeek其實真正的創新在model的高效設計,其真正的關鍵在efficient MOE還有MLA設計 這其實是2024年初DeepSeek V2就發表的東西 R1是把這個高效model設計+O1推理模型的LLM+RL合併出來的效應 我覺得歐美廠商因為本錢大所以忽略了降本增效的飛輪效應,所以第二個推理模型反而是中 國公司出圈了,推理模型的Test Time Compute對模型效率的敏感性就非常強烈了,訓練中 大概會涵蓋超大量的推理成本,成本降低25倍相當於研發加速25倍,我想這是OpenAI沒預料 到的,現在應該很後悔公開Reasoning 的concept 我必須說AI HW相關廠商個股近期會被嚴重打折 華爾街是很現實的,短期內一定被認定供過於求 至少要等到下階段Agent有顯著實用性才會拉回 美國AI公司應該被嚇到,中國人cost down到極致又免費開源,雲端廠商應該會減緩硬體採 購,但其他大模型發展的公司會double down下去,因為成本降低表示應用會更快成型 要知道,這設計已經公開,大家都可以照做,所以應用端會更快有進展,而且是Transforme r 架構的優化,各種應用都會吃到將本增效的成果 長遠來說,中美競爭的槍聲響起 模型還是會一直長大 要跑完整版R1至少還是要10張H100 且R1的論文有說,大模型做RL再Distill 比小模型做RL有效的多,所以要突破智力上限,模型還是會越擴越大,但更大的模型應該就 有更多降本增效的設計機會 ※ 引述 《LaLFGF》 之銘言: : 標題: Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子 : 時間: Tue Jan 28 01:08:51 2025 :   :   : 想太多了 : deepseek是一個成本大降幅下降的gpt : 現在好像氣勢很旺 似乎帶給gpt極大的威脅 也讓nvda、tsm一起下去 : 但這只是投資者、投機者的視角 跟 驚恐過度反應 :   : deepseek除了成本下降 性能也跟著閹割 : 回頭看一下還沒被閹割的現況gpt : 日常有在中、重度以上gpt的人都不難知道 : 它的回覆有時候都可以讓user氣到想吐血了 : 完整版的都尚且如此了 更何況是閹割版的東西 :   : user包容gpt的百般錯誤 是因為在90%時機可以帶來便利 只得容忍10%腦殘 : 但當使用閹割版導致錯誤腦殘變成20%機率出現時 : 那還真的是 與其省那預算 不如乾脆不用 :   : 自動化與AI的應用 絕對是以正確性為唯一出路 : 閹割版只有死路一條 :   :   :   : ※ 引述《steven961302 (阿哲)》之銘言: : : 從DeepSeek騰空出世,在到今天Nvidia (以下簡稱NV) 等一票AI概念股的下殺,這輪的 : 科技 : : 股估值修正才正剛開始,誰能引爆華爾街炒作了整整一年的AI神話泡泡?或許DeepSeek : 就會 : : 是刺破本輪AI泡沫的那根釘子。 : : 記得2021 Nvidia顯卡被炒作的神話嗎?那時候以太幣漲到一顆4500,NV的RTX3060顯卡 : 從24 : : 99美元被炒作到6000美元以上,後來的故事大家都知道了,隨著2022那輪幣圈的泡沫暴 : 跌跟 : : 以太幣改為質押共識制,挖礦無利可圖,NV的顯卡在市場上直接暴跌,那些礦場大量的 : 顯卡 : : 甚至有打一折賣出的,NV的市值也從巔峰的340跌到100,將近70%的跌幅,然而2023年 : 的這 : : 波AI浪潮又讓算力的需求增加,NVDA無疑是這波賣鏟子中風口上最大的贏家,憑藉著市 : 場獨 : : 有的高階算力,股價整整翻了10倍。 : : NV之所以享有那麼高的估值,那就是AI浪潮暴發以來,美國這些科技巨頭走的就是依靠 : 硬體 : : 算力來提升AI的路線,而NV恰好壟斷了所以的高階算力硬體,所有的AI公司必須找NV購 : 買硬 : : 體,囤GPU,這就導致了NV的股價飆升,美國目前正利用政策等壟斷高階算力硬體的方 : 式來 : : 實現稱霸AI產業的目標,我們可以看到在這過程中,中國無疑是被排斥在外的,從2021 : 以來 : : 的各種的禁令也無疑是針對中國的。 : : 但Deepseek的出現,如果能證明「以優化算法搭配中低端硬體+少量高端硬體」的路線 : 是可 : : 行的,那麼美國自身的AI公司及其投資者,是不是會停止花那麼多錢來堆積高端算力硬 : 體? : : 這是否跟當年囤顯卡挖礦的場景有同樣的既視感? : : 假如NVDA市值的支撐是建立在高端算力硬體的壟斷上,那Deepseek 的影響就是巨大的 : ,代 : : 表市場根本不需要那麼多高端算力的GPU,這是徹底的Overbooking,包含其關聯的的供 : 應鏈 : : 公司都要遭到市場的本益比重新估值了。 : : NVDA -14% : : TSM -13% : : AMD -6% : : AVGO -15% :   : -- : ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.195.44.27 (臺灣) : ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737997733.A.F3B.html : 推 joggingwang : 重點是老美一直要封鎖老共,但老共一家幻方還是囤了 01/28 01:11 : → joggingwang : 5萬片NV晶片,不就打臉老美過去2年的政策失敗 01/28 01:11 : → chasegirl : 急了 01/28 01:11 : → qazsd : 聯想到一隻常當機出錯的手機或App,你會想用嗎 01/28 01:11 : → dferww55 : 而且還超級卡 01/28 01:11 : 推 ragochen : NFLXdeepseek的性能閹割到比肩o1? 01/28 01:11 : 推 soome : 這只是剛開始,不知道後面中國會卷出什麼東西 01/28 01:12 : 推 joggingwang : 一家幻方可以透過轉手買這麼多片,NV跟GG最好都不 01/28 01:12 : → joggingwang : 知,為了錢,商人無祖國,接下來就看川哥會不會對這 01/28 01:12 : → joggingwang : 2家下更重的禁令 01/28 01:12 : 推 CaTkinGG : 沒關係 開源後全世界會幫它弄得更好 01/28 01:13 : 噓 KISS1979 : 中吹者又在幻想了 台灣數位部還沒出手咧 01/28 01:14 : 推 Lebrono : 不就一堆重課大佬買了一堆頂裝 結果發現只比一個平 01/28 01:16 : → Lebrono : 民微課強一點點的崩潰感 01/28 01:16 : → shomingchang: 重點就不是deepseek好不好用 是可能可以用更少資源 01/28 01:17 : 推 yoshian886 : 蒸餾出來的東西也達不到AGI,還是參數再多其實也達 01/28 01:18 : → yoshian886 : 不到呢? 01/28 01:18 : 噓 speedman : 還在閹割版 01/28 01:18 : → zer0319 : 開源了你可以自己練啊 01/28 01:19 : 噓 s1612316 : 那是你個人的感受 所有人都要最強最完整的版本? 01/28 01:19 : 推 ksjr : 下禁令的話又要跌了 01/28 01:19 : → sa87a16 : 到現在還搞不清楚狀況 01/28 01:20 : 推 ImHoluCan : 短空長多,美股不能看空 01/28 01:20 : → s1612316 : 卡頓手機整個印度幾億支 你說呢? 01/28 01:20 : 推 bior1234 : 就是閹割版啊,MoE模型就是將模型能力線索到特定領 01/28 01:20 : → bior1234 : 域,追求在特定領域達到跟你接近的效能,跳脫專家 01/28 01:20 : → bior1234 : 領域就打回原形了 01/28 01:20 : → sa87a16 : 用最小成本能獨立訓練出來而且有一定成果你不用? 01/28 01:21 : → sa87a16 : 那你肯定NV買到150的天才 01/28 01:21 : 推 prestigejoM : https://i.imgur.com/eb9BUsn.jpeg
01/28 01:21 : 推 supereva : 以股價來說的確是泡沫啦 但我反而更期待的是應用 01/28 01:23 : → supereva : 的加速 自動駕駛和機器人會更早實現 如果真的強 01/28 01:23 : → supereva : 50倍的話 01/28 01:23 : 噓 sa87a16 : 準確度能訓練,現在是模型被屌打了,現在還搞不清 01/28 01:23 : → sa87a16 : 狀況 01/28 01:23 : → heavensun : 必然的阿 晶片用比較便宜 性能必然弱 01/28 01:23 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.112.255 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738000847.A.540.html

01/28 02:07, 2天前 , 1F
泡沫的是硬體廠不是AI本身
01/28 02:07, 1F

01/28 02:21, 2天前 , 2F
短空長多,不是真泡沫,大模型的優勢還在,重點是
01/28 02:21, 2F

01/28 02:21, 2天前 , 3F
更高效的大模型,可以把尺度推得更大
01/28 02:21, 3F

01/28 02:22, 2天前 , 4F
半導體業大概要跌一陣子了
01/28 02:22, 4F

01/28 02:27, 2天前 , 5F
正解
01/28 02:27, 5F

01/28 02:30, 2天前 , 6F
推這篇
01/28 02:30, 6F

01/28 02:34, 2天前 , 7F
只能說應用大戰的時代加速來臨
01/28 02:34, 7F

01/28 02:35, 2天前 , 8F
01/28 02:35, 8F

01/28 02:55, 2天前 , 9F
當初開源的時侯就應該想得到會有更強大的的對手出
01/28 02:55, 9F

01/28 02:55, 2天前 , 10F
現了吧 對於熱愛技術的人來說ds的出現應該是讓他們
01/28 02:55, 10F

01/28 02:55, 2天前 , 11F
興奮而不是煩惱?
01/28 02:55, 11F

01/28 02:56, 2天前 , 12F
同樣的DS也是開源應該也是基於此理由 應該吧
01/28 02:56, 12F

01/28 02:57, 2天前 , 13F
他們追求的是全世界的人才一起發展AI而不是商業壁
01/28 02:57, 13F

01/28 02:57, 2天前 , 14F
01/28 02:57, 14F

01/28 03:16, 2天前 , 15F
現在是有投資的在煩惱…
01/28 03:16, 15F

01/28 03:32, 2天前 , 16F
對於技術宅和科研宅來說 DS 的出現本來就讓他們更
01/28 03:32, 16F

01/28 03:32, 2天前 , 17F
興奮,去 Reddit 看英文討論就知道什麼是專業 --
01/28 03:32, 17F

01/28 03:32, 2天前 , 18F
反而 PTT 最熱門的反應是:DS 純粹是吹牛、DS 偷
01/28 03:32, 18F

01/28 03:32, 2天前 , 19F
接 OpenAI API、DS 不能問 8964 所以是垃圾、DS 是
01/28 03:32, 19F

01/28 03:32, 2天前 , 20F
中國做的我才不想碰,... 相比之下真的笑死人
01/28 03:32, 20F

01/28 04:15, 2天前 , 21F
加速ai costdown怎麼看都是利多 跌只是反應已經投
01/28 04:15, 21F

01/28 04:15, 2天前 , 22F
注多餘成本在model的公司上 既然開源 到時候大家還
01/28 04:15, 22F

01/28 04:15, 2天前 , 23F
是看誰算力多 買鏟子的不會輸
01/28 04:15, 23F

01/28 04:32, 2天前 , 24F
短空長多?
01/28 04:32, 24F

01/28 04:58, 2天前 , 25F
中肯
01/28 04:58, 25F

01/28 05:56, 2天前 , 26F
感謝DS,讓我有機會買到便宜的NV和TSM。拜託,再多
01/28 05:56, 26F

01/28 05:56, 2天前 , 27F
殺點,最好能腰斬,我一定買爆
01/28 05:56, 27F

01/28 07:39, 2天前 , 28F
推!終於有技術討論文了。台灣完全壓台積電的缺點浮
01/28 07:39, 28F

01/28 07:39, 2天前 , 29F
現出來。竹科很快就要大裁員了。
01/28 07:39, 29F
文章代碼(AID): #1dbydFL0 (Stock)
討論串 (同標題文章)
文章代碼(AID): #1dbydFL0 (Stock)