Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子
DeepSeek其實真正的創新在model的高效設計,其真正的關鍵在efficient MOE還有MLA設計
這其實是2024年初DeepSeek V2就發表的東西
R1是把這個高效model設計+O1推理模型的LLM+RL合併出來的效應
我覺得歐美廠商因為本錢大所以忽略了降本增效的飛輪效應,所以第二個推理模型反而是中
國公司出圈了,推理模型的Test Time Compute對模型效率的敏感性就非常強烈了,訓練中
大概會涵蓋超大量的推理成本,成本降低25倍相當於研發加速25倍,我想這是OpenAI沒預料
到的,現在應該很後悔公開Reasoning 的concept
我必須說AI HW相關廠商個股近期會被嚴重打折
華爾街是很現實的,短期內一定被認定供過於求
至少要等到下階段Agent有顯著實用性才會拉回
美國AI公司應該被嚇到,中國人cost down到極致又免費開源,雲端廠商應該會減緩硬體採
購,但其他大模型發展的公司會double down下去,因為成本降低表示應用會更快成型
要知道,這設計已經公開,大家都可以照做,所以應用端會更快有進展,而且是Transforme
r 架構的優化,各種應用都會吃到將本增效的成果
長遠來說,中美競爭的槍聲響起
模型還是會一直長大
要跑完整版R1至少還是要10張H100
且R1的論文有說,大模型做RL再Distill
比小模型做RL有效的多,所以要突破智力上限,模型還是會越擴越大,但更大的模型應該就
有更多降本增效的設計機會
※ 引述 《LaLFGF》 之銘言:
: 標題: Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子
: 時間: Tue Jan 28 01:08:51 2025
:
:
: 想太多了
: deepseek是一個成本大降幅下降的gpt
: 現在好像氣勢很旺 似乎帶給gpt極大的威脅 也讓nvda、tsm一起下去
: 但這只是投資者、投機者的視角 跟 驚恐過度反應
:
: deepseek除了成本下降 性能也跟著閹割
: 回頭看一下還沒被閹割的現況gpt
: 日常有在中、重度以上gpt的人都不難知道
: 它的回覆有時候都可以讓user氣到想吐血了
: 完整版的都尚且如此了 更何況是閹割版的東西
:
: user包容gpt的百般錯誤 是因為在90%時機可以帶來便利 只得容忍10%腦殘
: 但當使用閹割版導致錯誤腦殘變成20%機率出現時
: 那還真的是 與其省那預算 不如乾脆不用
:
: 自動化與AI的應用 絕對是以正確性為唯一出路
: 閹割版只有死路一條
:
:
:
: ※ 引述《steven961302 (阿哲)》之銘言:
: : 從DeepSeek騰空出世,在到今天Nvidia (以下簡稱NV) 等一票AI概念股的下殺,這輪的
: 科技
: : 股估值修正才正剛開始,誰能引爆華爾街炒作了整整一年的AI神話泡泡?或許DeepSeek
: 就會
: : 是刺破本輪AI泡沫的那根釘子。
: : 記得2021 Nvidia顯卡被炒作的神話嗎?那時候以太幣漲到一顆4500,NV的RTX3060顯卡
: 從24
: : 99美元被炒作到6000美元以上,後來的故事大家都知道了,隨著2022那輪幣圈的泡沫暴
: 跌跟
: : 以太幣改為質押共識制,挖礦無利可圖,NV的顯卡在市場上直接暴跌,那些礦場大量的
: 顯卡
: : 甚至有打一折賣出的,NV的市值也從巔峰的340跌到100,將近70%的跌幅,然而2023年
: 的這
: : 波AI浪潮又讓算力的需求增加,NVDA無疑是這波賣鏟子中風口上最大的贏家,憑藉著市
: 場獨
: : 有的高階算力,股價整整翻了10倍。
: : NV之所以享有那麼高的估值,那就是AI浪潮暴發以來,美國這些科技巨頭走的就是依靠
: 硬體
: : 算力來提升AI的路線,而NV恰好壟斷了所以的高階算力硬體,所有的AI公司必須找NV購
: 買硬
: : 體,囤GPU,這就導致了NV的股價飆升,美國目前正利用政策等壟斷高階算力硬體的方
: 式來
: : 實現稱霸AI產業的目標,我們可以看到在這過程中,中國無疑是被排斥在外的,從2021
: 以來
: : 的各種的禁令也無疑是針對中國的。
: : 但Deepseek的出現,如果能證明「以優化算法搭配中低端硬體+少量高端硬體」的路線
: 是可
: : 行的,那麼美國自身的AI公司及其投資者,是不是會停止花那麼多錢來堆積高端算力硬
: 體?
: : 這是否跟當年囤顯卡挖礦的場景有同樣的既視感?
: : 假如NVDA市值的支撐是建立在高端算力硬體的壟斷上,那Deepseek 的影響就是巨大的
: ,代
: : 表市場根本不需要那麼多高端算力的GPU,這是徹底的Overbooking,包含其關聯的的供
: 應鏈
: : 公司都要遭到市場的本益比重新估值了。
: : NVDA -14%
: : TSM -13%
: : AMD -6%
: : AVGO -15%
:
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.195.44.27 (臺灣)
: ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737997733.A.F3B.html
: 推 joggingwang : 重點是老美一直要封鎖老共,但老共一家幻方還是囤了 01/28 01:11
: → joggingwang : 5萬片NV晶片,不就打臉老美過去2年的政策失敗 01/28 01:11
: → chasegirl : 急了 01/28 01:11
: → qazsd : 聯想到一隻常當機出錯的手機或App,你會想用嗎 01/28 01:11
: → dferww55 : 而且還超級卡 01/28 01:11
: 推 ragochen : NFLXdeepseek的性能閹割到比肩o1? 01/28 01:11
: 推 soome : 這只是剛開始,不知道後面中國會卷出什麼東西 01/28 01:12
: 推 joggingwang : 一家幻方可以透過轉手買這麼多片,NV跟GG最好都不 01/28 01:12
: → joggingwang : 知,為了錢,商人無祖國,接下來就看川哥會不會對這 01/28 01:12
: → joggingwang : 2家下更重的禁令 01/28 01:12
: 推 CaTkinGG : 沒關係 開源後全世界會幫它弄得更好 01/28 01:13
: 噓 KISS1979 : 中吹者又在幻想了 台灣數位部還沒出手咧 01/28 01:14
: 推 Lebrono : 不就一堆重課大佬買了一堆頂裝 結果發現只比一個平 01/28 01:16
: → Lebrono : 民微課強一點點的崩潰感 01/28 01:16
: → shomingchang: 重點就不是deepseek好不好用 是可能可以用更少資源 01/28 01:17
: 推 yoshian886 : 蒸餾出來的東西也達不到AGI,還是參數再多其實也達 01/28 01:18
: → yoshian886 : 不到呢? 01/28 01:18
: 噓 speedman : 還在閹割版 01/28 01:18
: → zer0319 : 開源了你可以自己練啊 01/28 01:19
: 噓 s1612316 : 那是你個人的感受 所有人都要最強最完整的版本? 01/28 01:19
: 推 ksjr : 下禁令的話又要跌了 01/28 01:19
: → sa87a16 : 到現在還搞不清楚狀況 01/28 01:20
: 推 ImHoluCan : 短空長多,美股不能看空 01/28 01:20
: → s1612316 : 卡頓手機整個印度幾億支 你說呢? 01/28 01:20
: 推 bior1234 : 就是閹割版啊,MoE模型就是將模型能力線索到特定領 01/28 01:20
: → bior1234 : 域,追求在特定領域達到跟你接近的效能,跳脫專家 01/28 01:20
: → bior1234 : 領域就打回原形了 01/28 01:20
: → sa87a16 : 用最小成本能獨立訓練出來而且有一定成果你不用? 01/28 01:21
: → sa87a16 : 那你肯定NV買到150的天才 01/28 01:21
: 推 prestigejoM : https://i.imgur.com/eb9BUsn.jpeg
01/28 01:21
: 推 supereva : 以股價來說的確是泡沫啦 但我反而更期待的是應用 01/28 01:23
: → supereva : 的加速 自動駕駛和機器人會更早實現 如果真的強 01/28 01:23
: → supereva : 50倍的話 01/28 01:23
: 噓 sa87a16 : 準確度能訓練,現在是模型被屌打了,現在還搞不清 01/28 01:23
: → sa87a16 : 狀況 01/28 01:23
: → heavensun : 必然的阿 晶片用比較便宜 性能必然弱 01/28 01:23
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.112.255 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738000847.A.540.html
推
01/28 02:07,
2天前
, 1F
01/28 02:07, 1F
→
01/28 02:21,
2天前
, 2F
01/28 02:21, 2F
→
01/28 02:21,
2天前
, 3F
01/28 02:21, 3F
推
01/28 02:22,
2天前
, 4F
01/28 02:22, 4F
推
01/28 02:27,
2天前
, 5F
01/28 02:27, 5F
推
01/28 02:30,
2天前
, 6F
01/28 02:30, 6F
→
01/28 02:34,
2天前
, 7F
01/28 02:34, 7F
推
01/28 02:35,
2天前
, 8F
01/28 02:35, 8F
推
01/28 02:55,
2天前
, 9F
01/28 02:55, 9F
→
01/28 02:55,
2天前
, 10F
01/28 02:55, 10F
→
01/28 02:55,
2天前
, 11F
01/28 02:55, 11F
→
01/28 02:56,
2天前
, 12F
01/28 02:56, 12F
→
01/28 02:57,
2天前
, 13F
01/28 02:57, 13F
→
01/28 02:57,
2天前
, 14F
01/28 02:57, 14F
推
01/28 03:16,
2天前
, 15F
01/28 03:16, 15F
推
01/28 03:32,
2天前
, 16F
01/28 03:32, 16F
→
01/28 03:32,
2天前
, 17F
01/28 03:32, 17F
→
01/28 03:32,
2天前
, 18F
01/28 03:32, 18F
→
01/28 03:32,
2天前
, 19F
01/28 03:32, 19F
→
01/28 03:32,
2天前
, 20F
01/28 03:32, 20F
推
01/28 04:15,
2天前
, 21F
01/28 04:15, 21F
→
01/28 04:15,
2天前
, 22F
01/28 04:15, 22F
→
01/28 04:15,
2天前
, 23F
01/28 04:15, 23F
→
01/28 04:32,
2天前
, 24F
01/28 04:32, 24F
推
01/28 04:58,
2天前
, 25F
01/28 04:58, 25F
→
01/28 05:56,
2天前
, 26F
01/28 05:56, 26F
→
01/28 05:56,
2天前
, 27F
01/28 05:56, 27F
推
01/28 07:39,
2天前
, 28F
01/28 07:39, 28F
→
01/28 07:39,
2天前
, 29F
01/28 07:39, 29F
討論串 (同標題文章)
完整討論串 (本文為第 3 之 13 篇):
78
353
Stock 近期熱門文章
106
343
PTT職涯區 即時熱門文章
28
64