[心得] AI需求是供應商精心設計好的套路

看板Stock (股票)作者 (泰迪!走吧!)時間2小時前 (2026/03/22 01:32), 1小時前編輯推噓22(29785)
留言121則, 31人參與, 5分鐘前最新討論串1/4 (看更多)
我來說說,為甚麼說,AI需求是供應商精心設下的套路吧! 剛踏入AI的人 可能會覺得,AI的神經網路演算法(大規模平行矩陣運算), 好吃硬體資源啊,硬體規格的需求好大,幾乎看不到天花板。 所以,很多人會有"AI算力需求是永無止盡的"這種錯覺, 但用久了開始熟悉AI之後,你會發現, 其實AI龐大的硬體需求,是一種供應商精心鋪設好的套路 也是一種吹捧、誇大其辭的行銷手段。 為甚麼會這樣講? 第一,AI模型的節點不一定有經過優化(化繁為簡) 拿軟體來比喻,一個source code寫很爛的軟體,沒有經過優化, 如遞迴運算,消耗掉比正常高2~3倍以上的硬體資源。 會佔用大量的 GPU VRAM 和運算週期。 這時,你怪的不是AI模型爛,而是AI算力不夠? 第二,AI模型的運算流程可以分批次進行 一個步驟,可以切成4個子步驟進行,用For循環4次執行 如生成式繪圖,如果一張解析度非常大的圖像, 切割成4個區塊,用For循環做4個批次處理,再用TTP圖像拼接/重組, 將4個處理好的圖像做合併 "可以大幅減少AI在運算時VRAM的占用量。" 這部分算是AI行家才知道的機密,供應商絕對不會和消費者說。 因為要是讓你知道了,你就不會為了增大VRAM升級你的顯示卡或DRAM了。 前陣子,我在看GPU規格時,VRAM總是找不到16G以上的規格, 現在回想,果真是中了NVIDIA的市場行銷套路。 因為,輝達,配備VRAM 24G以上的唯獨最頂級90系列的GPU才有, 如: RTX 3090, RTX 4090, RTX 5090 現在回想,當時是差點中計了,浪費錢買RTX 5090是不必要的。 因為AI算法再怎麼吃資源,也是能透過優化和分批處理,來解決硬體配備不足的部分。 實測後,再高解析度的繪圖,12G的繪圖卡也能勝任。 也不需因為GPU記憶體的配置比較低而選用低精度的模型,fp16照樣可以跑得很順暢。 目前生成式AI的發展非常快,模型也漸趨成熟了, 只要巧妙地設置好AI的流程,好像也說不上,需要多高階的硬體規格來跑AI模型。 而且現在的AI模型不斷推陳出新,新的AI模型的容量也越來越小。 占用的GPU資源也明顯下降。 大部分舊模型低配要24G VRAM才能跑的,新模型只要16G甚至12G VRAM就能完美運行。 不管是文字圖片精修,影像P圖,視訊P圖,設好對的節點,低配的GPU也能完美優化。 現在那些號稱"專家"或"分析師"的傢伙 對於AI的硬體需求越開越高,到達浮濫的地步, 會有這種現象,很大程度上是供應商(輝達)精心設下的套路。 也是為了喊多股市的一種噱頭。 不過,很少用Photoshop是真的,AI模型很大程度上解決以往在影像修復上的難題。 圖片經過AI重新生成,容量也變小了 (原圖722KB,修復後268KB,減少將近63%。) 計算: (722-268)/268*100%=62.88% 試問各位的看法呢?怎麼看未來AI的硬體供貨需求? 記憶體族群的雜音最多,有人喊AI供貨短缺上看2030年 但Samsung開始跟客戶簽長約,有人說可能離市場飽和不遠了 以目前的記憶體類股的股價來看,是看多還是看空呢? ---- 書脊,修復前 https://ibb.co/1tzg824g 書脊,修復後 https://ibb.co/zWRrPqjr AI生成 - 虎兔狗 https://ibb.co/8n8MF5Kr https://ibb.co/5hwkq4ZB https://ibb.co/nN83j1XD -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.110.105.47 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1774114355.A.A23.html

03/22 01:40, 2小時前 , 1F
未來 一定是跟雲拿token 速度很重要
03/22 01:40, 1F

03/22 01:41, 2小時前 , 2F
推理速度跟顯卡位寬息息相關 君不見此次5090升級
03/22 01:41, 2F

03/22 01:42, 2小時前 , 3F
512 位元寬度 4090 跟 5090DD 還是384位元寬度
03/22 01:42, 3F

03/22 01:42, 2小時前 , 4F
決定位元寬度的東西 就是 顯存 所以顯存夯爆
03/22 01:42, 4F

03/22 01:44, 2小時前 , 5F
但股市 多空 看的是誰錢多誰錢少 由大盤決定多空
03/22 01:44, 5F
現在就是記憶體一直在瘋狂漲價,一直在喊多。堪稱目前需求龐大到看不到盡頭。

03/22 01:48, 2小時前 , 6F
文中2點都是資工系的基本議題
03/22 01:48, 6F

03/22 01:49, 1小時前 , 7F
第一點是演算法優化 用更高效的演算法得到相同結果
03/22 01:49, 7F

03/22 01:50, 1小時前 , 8F
第二點大數運算 資料超出常規記憶體時的演算法
03/22 01:50, 8F

03/22 01:51, 1小時前 , 9F
隨便一個資工系的都知道 只是目前大廠是求快拼結果
03/22 01:51, 9F

03/22 01:52, 1小時前 , 10F
確認具體任務後才是演算法優化
03/22 01:52, 10F

03/22 01:53, 1小時前 , 11F
之前火熱的DeepSeek就是一種優化 搶新聞版面
03/22 01:53, 11F

03/22 01:53, 1小時前 , 12F
AI算力需求、硬體限制、演算法優化都能分別進步的
03/22 01:53, 12F

03/22 01:54, 1小時前 , 13F
不太可能說演算法很好 你就沒有硬體需求
03/22 01:54, 13F

03/22 01:54, 1小時前 , 14F
呃 你能知道 那七巨頭工程師會不知道?
03/22 01:54, 14F

03/22 01:55, 1小時前 , 15F
總之這兩年記憶體需求都很熱 不需要懷疑
03/22 01:55, 15F

03/22 01:56, 1小時前 , 16F
DS再怎麼優化 也是始終落後人一步 而且優化完的模型
03/22 01:56, 16F

03/22 01:56, 1小時前 , 17F
給擁有最頂尖算力的人拿去用 不就更飛天?
03/22 01:56, 17F

03/22 01:58, 1小時前 , 18F
開源就是這樣啊 但就是不知道盡頭到底什麼模樣 是AG
03/22 01:58, 18F

03/22 01:58, 1小時前 , 19F
I達成就停還是可以繼續突破
03/22 01:58, 19F

03/22 01:58, 1小時前 , 20F
目前大廠還是拼新模型 優化現有模型是AI新創的市場
03/22 01:58, 20F

03/22 01:59, 1小時前 , 21F
幫客戶專門客製改良的AI模型
03/22 01:59, 21F

03/22 02:00, 1小時前 , 22F
AGI還早 說AGI的主要是行銷廣告用途
03/22 02:00, 22F
我現在最懷疑的就是,AI需求一定會到接近市場飽和,不可能會永無止盡, 製程節點是會隨著時間一直推進,但講真的價格貴,以成本來說,殺雞不須用牛刀, 如果非電動車(BSM電池管理)或配備AI自動駕駛的車用晶片不需大量使用先進製程。 到了市場需求接近飽和,價格也一定會逐漸下降。 ※ 編輯: teddy98 (123.110.105.47 臺灣), 03/22/2026 02:06:55

03/22 02:04, 1小時前 , 23F
你如果是電機的根本不會講這種話 個人data是有多
03/22 02:04, 23F

03/22 02:04, 1小時前 , 24F
大? 需要高階算力的不是你而是大型上市企業
03/22 02:04, 24F

03/22 02:05, 1小時前 , 25F
結論就是AI炒過頭了 萬一有個環節斷裂這整座吹出來
03/22 02:05, 25F

03/22 02:05, 1小時前 , 26F
的Ai大樓就會因為AI變現太慢而倒塌
03/22 02:05, 26F

03/22 02:06, 1小時前 , 27F
2020美聯儲瘋狂印鈔導致通膨失控,照某樓邏輯鮑爾也
03/22 02:06, 27F

03/22 02:06, 1小時前 , 28F
知道會失控所以是故意印鈔囉?
03/22 02:06, 28F

03/22 02:06, 1小時前 , 29F
反正需求無限多 現在ai根本應付不完
03/22 02:06, 29F

03/22 02:07, 1小時前 , 30F
光蝦皮隨便上架十件 就要做10個短視頻
03/22 02:07, 30F

03/22 02:07, 1小時前 , 31F
沒ai你要怎麼搞?找人幫你做嗎
03/22 02:07, 31F

03/22 02:08, 1小時前 , 32F
當年也是覺得5G跟VR 3D列印很有前景 結果現在變成這
03/22 02:08, 32F

03/22 02:08, 1小時前 , 33F
03/22 02:08, 33F

03/22 02:09, 1小時前 , 34F
那些炒作記憶體股的要留意 如果現在大家都在瘋狂的
03/22 02:09, 34F

03/22 02:09, 1小時前 , 35F
採購記憶體 會不會變成因為之前買太多 而後面又發現
03/22 02:09, 35F

03/22 02:09, 1小時前 , 36F
AI其實不那麼需要浮閘晶體管 導致之後幾年出現需求
03/22 02:09, 36F

03/22 02:09, 1小時前 , 37F
斷崖
03/22 02:09, 37F
還有 44 則推文
03/22 02:55, 53分鐘前 , 82F
沒料
03/22 02:55, 82F

03/22 03:00, 48分鐘前 , 83F
優化不如做新的快啊
03/22 03:00, 83F

03/22 03:02, 46分鐘前 , 84F
笑死
03/22 03:02, 84F

03/22 03:04, 44分鐘前 , 85F
你說得對 各大CSP應該請你去當總工程師
03/22 03:04, 85F

03/22 03:05, 43分鐘前 , 86F
強烈建議 去看黃仁勳 上ALL IN Podcast的影片
03/22 03:05, 86F

03/22 03:06, 42分鐘前 , 87F
他一再強調 不要將現實和虛幻 混在一起談
03/22 03:06, 87F

03/22 03:10, 38分鐘前 , 88F
DELL PRO MAX with GB300 and 750G LPDDR5 工作站
03/22 03:10, 88F

03/22 03:10, 38分鐘前 , 89F
750g 的記憶體阿!!!
03/22 03:10, 89F

03/22 03:10, 38分鐘前 , 90F
這是要賣去所有中小企業的工作站
03/22 03:10, 90F

03/22 03:11, 37分鐘前 , 91F
邏輯推理比一般GPT消耗多100倍的token
03/22 03:11, 91F

03/22 03:12, 36分鐘前 , 92F
然後agentic 又比邏輯推理多消耗100倍的token
03/22 03:12, 92F

03/22 03:12, 36分鐘前 , 93F
有人就誤會,NV的記憶體是老黃不給而不是他給不起,
03/22 03:12, 93F

03/22 03:12, 36分鐘前 , 94F
老黃刀法就是要削各位口袋裡的錢,呵呵!
03/22 03:12, 94F

03/22 03:12, 36分鐘前 , 95F
現在算力已經不足 , 所以open ai 降低影片Sora的
03/22 03:12, 95F

03/22 03:12, 36分鐘前 , 96F
消耗
03/22 03:12, 96F

03/22 03:13, 35分鐘前 , 97F
看看那個雪山救狐狸宇宙
03/22 03:13, 97F

03/22 03:13, 35分鐘前 , 98F
this is why ram costs $900
03/22 03:13, 98F

03/22 03:14, 34分鐘前 , 99F
因為agentic 開發已經確實在業界前端解決職務問題
03/22 03:14, 99F

03/22 03:14, 34分鐘前 , 100F
不是歐噴醬算力不足,而是歐噴醬錢錢快燒完了,歐噴
03/22 03:14, 100F

03/22 03:14, 34分鐘前 , 101F
醬再繼續亂燒錢就準備被股東踹下去了,可憐啊!凹凸
03/22 03:14, 101F

03/22 03:14, 34分鐘前 , 102F
慢,呵呵!
03/22 03:14, 102F

03/22 03:15, 33分鐘前 , 103F
然後公司願意為 職務上生產力 付出高額代價
03/22 03:15, 103F

03/22 03:15, 33分鐘前 , 104F
所以 黃仁勳 再All in有說 anthropic 的估值可能
03/22 03:15, 104F

03/22 03:16, 32分鐘前 , 105F
要再高10倍以上
03/22 03:16, 105F

03/22 03:19, 29分鐘前 , 106F
不對,你對AI的理解錯了
03/22 03:19, 106F

03/22 03:20, 28分鐘前 , 107F
300E 到2030年的一兆美金
03/22 03:20, 107F

03/22 03:21, 27分鐘前 , 108F
沒考慮到 所有應用到anthropic產品的 加值服務公司
03/22 03:21, 108F

03/22 03:22, 26分鐘前 , 109F
blender Autodesk adobe photoshop 都在用agentic
03/22 03:22, 109F

03/22 03:23, 25分鐘前 , 110F
開發自己的產品 讓這些產品 agentic化
03/22 03:23, 110F

03/22 03:23, 25分鐘前 , 111F
實務上 這些軟體公司 正在用前所未有的速度開發中
03/22 03:23, 111F

03/22 03:24, 24分鐘前 , 112F
AUTO CAD 以後agentic化更符合 ai建模開發
03/22 03:24, 112F

03/22 03:27, 21分鐘前 , 113F
他看機器人也很準
03/22 03:27, 113F

03/22 03:27, 21分鐘前 , 114F
黃仁勳說 用業界最先進的Prototype 到市售產品
03/22 03:27, 114F

03/22 03:28, 20分鐘前 , 115F
大概只要2~3個開發週期 3~5年
03/22 03:28, 115F

03/22 03:28, 20分鐘前 , 116F
機器人就會 進入家庭
03/22 03:28, 116F

03/22 03:30, 18分鐘前 , 117F
iron man jarvis 開發CAD 就是想像圖
03/22 03:30, 117F

03/22 03:31, 17分鐘前 , 118F
有道理
03/22 03:31, 118F

03/22 03:31, 17分鐘前 , 119F
全世界都缺勞工 機器人會補上缺口
03/22 03:31, 119F

03/22 03:41, 7分鐘前 , 120F
直接跟人類溝通的jarvis還太早 還是需要工程師
03/22 03:41, 120F

03/22 03:43, 5分鐘前 , 121F
工廠agentic化 可以直接 雲端丟g-code
03/22 03:43, 121F
文章代碼(AID): #1fljOpeZ (Stock)
文章代碼(AID): #1fljOpeZ (Stock)