Re: [新聞] 甲骨文股價暴跌超10%！訂單積壓越來越多 「燒錢」砸AI 風險令人擔憂

12/13 03:55, 2月前 , 6^F

12/13 03:55, 6^F

需要從更細致的視角去切入 SRAM也是記憶元件 HBM也是 Host DRAM(LPDDR)也是計算也一樣 tensor core是計算元件 systolic array也是計算元件近存運算也是計算元件所以「在哪裡計算，在哪裡儲存，如何搬運資料」從來就不是一個單一命題一切都要從架構與系統級的視角下去拆解，才會根據需求得出一個答案這也是為什麼邊緣層和雲端層會發展出不同的計算架構因為需求不同 ※ 編輯: minazukimaya (146.70.205.172 日本), 12/13/2025 03:59:39

推

ng101281

12/13 04:03, 2月前 , 7^F

12/13 04:03, 7^F

推

12/13 04:08, 2月前 , 8^F

12/13 04:08, 8^F

→

12/13 04:08, 2月前 , 9^F

12/13 04:08, 9^F

→

12/13 04:08, 2月前 , 10^F

12/13 04:08, 10^F

推

roseritter

12/13 04:59, 2月前 , 11^F

12/13 04:59, 11^F

→

roseritter

12/13 04:59, 2月前 , 12^F

12/13 04:59, 12^F

→

roseritter

12/13 04:59, 2月前 , 13^F

12/13 04:59, 13^F

研究(Model Refinement)時代和擴增(Scaling)時代是輪流出現的 Ilya Sutskever最近有一篇訪談可以看看正如他所說，接下來時代巨輪要轉回模型改進了不過，等到模型改進得差不多，又會重啟擴增時代這兩個時代的過度也是漸變的，不是一刀切「文明的本質就是計算」你如果看不懂這一大堆Big Tech誰會贏，那也沒差買2330 永遠是對的

推

tigerzz3

12/13 05:07, 2月前 , 14^F

12/13 05:07, 14^F

感謝GOOG爆噴一波，現在YTD 90%了(真是出乎我意料..11月初時我本來已經躺平了) https://i.imgur.com/NHJP572.png

不過我在11月底賣掉一部份GOOG撿了NVDA，作整體部位Rebalance 然後今天就吃了一根超~~~級大的，腳麻了，哭啊

推

shead1983

12/13 05:08, 2月前 , 15^F

12/13 05:08, 15^F

→

shead1983

12/13 05:08, 2月前 , 16^F

12/13 05:08, 16^F

嘻嘻其實這篇只是我得到的洞察的一小角而已真正重要的我沒說，不過這篇其實有很多引子比方說在模型最深層(最慢層)，需要非歐幾何的雙曲空間語義空間 (提示: Transfomer的語義空間是平面的) 這在Nested Learning論文裡是完全沒提的，是另幾篇資訊幾何學的研究

推

aegis43210

12/13 05:10, 2月前 , 17^F

12/13 05:10, 17^F

→

aegis43210

12/13 05:10, 2月前 , 18^F

12/13 05:10, 18^F

→

aegis43210

12/13 05:13, 2月前 , 19^F

12/13 05:13, 19^F

考慮一個五層結構，最淺兩層(L1~L2)在邊緣，三層(L3~L5)在雲端你猜猜看L1需要多少參數量? 答案可能出乎你意料的小完全不需要放在NAND 而且從最快層的「權重即時更新」需求來看，也不能可能放在NAND

推

tigerzz3

12/13 05:14, 2月前 , 20^F

12/13 05:14, 20^F

推

12/13 05:15, 2月前 , 21^F

12/13 05:15, 21^F

→

12/13 05:15, 2月前 , 22^F

12/13 05:15, 22^F

→

12/13 05:15, 2月前 , 23^F

12/13 05:15, 23^F

HBM的頻寬和速度很重要這敘述沒問題不過HBM的總需求是容量(Capcity)決定的猜猜看如果把最深層的語義空間從平面換成雙曲，參數量會變成多少? 有論文可以查的，查查看 ※ 編輯: minazukimaya (146.70.205.172 日本), 12/13/2025 05:44:36

推

12/13 05:53, 2月前 , 24^F

12/13 05:53, 24^F

→

12/13 05:53, 2月前 , 25^F

12/13 05:53, 25^F

→

12/13 05:53, 2月前 , 26^F

12/13 05:53, 26^F

→

12/13 05:53, 2月前 , 27^F

12/13 05:53, 27^F

→

12/13 05:53, 2月前 , 28^F

12/13 05:53, 28^F

我覺得你關注錯重點，HOPE架構的工程實作不是論文中最重要的部份數學表達才是，這篇論文就算把HOPE架構整個去掉純理論的部份就有相當於熱力學定律的價值這代表一種更接近「知識、記憶、推理」的物理本質的理論從而讓各大模型研究商能在巢狀學習的理論範式下，自由去探索各自的工程實現類比於你有了熱力學定律之後，各種形式的熱機都有理論依據了你看我前面對於未來模型的敘述(雲邊協同、不同語義空間的五層結構) 這和論文中簡化過的HOPE模型壓根就不是一回事對吧因為HOPE模型的設計只是要作為論文的實證用途而不是真正具備下一代模型的「工程可行性」&「商業可行性」的實作至於下一代實作「可能會長什麼樣子」那自然是不會在這裡解釋了... 反正即使我提了 99.99%的股板眾也是鴨子聽雷啊

推

waitrop

12/13 06:03, 2月前 , 29^F

12/13 06:03, 29^F

狗家員工內線消息我要是真信了你就是在內線交易囉!!! 就事論事 TPUv7沒有明顯針對Nested learning的痛點去優化 (當然也沒有明顯不能跑的理由，依然可以跑) 至於v8之後怎麼設計，現在也沒有公開消息比起雲端，我覺得現在是邊緣的計算架構沒跟上Nested Learning的需求

還有 376 則推文

還有 30 段內文

推

12/13 17:49, 2月前 , 406^F

12/13 17:49, 406^F

→

12/13 17:50, 2月前 , 407^F

12/13 17:50, 407^F

→

12/13 17:51, 2月前 , 408^F

12/13 17:51, 408^F

→

12/13 17:51, 2月前 , 409^F

12/13 17:51, 409^F

→

12/13 17:52, 2月前 , 410^F

12/13 17:52, 410^F

推

joewang85

12/13 17:58, 2月前 , 411^F

12/13 17:58, 411^F

※ 編輯: minazukimaya (146.70.205.172 日本), 12/13/2025 18:07:13

推

as6633208

12/13 18:06, 2月前 , 412^F

12/13 18:06, 412^F

→

as6633208

12/13 18:06, 2月前 , 413^F

12/13 18:06, 413^F

推

mudmud

12/13 18:28, 2月前 , 414^F

12/13 18:28, 414^F

推

12/13 18:28, 2月前 , 415^F

12/13 18:28, 415^F

→

12/13 18:29, 2月前 , 416^F

12/13 18:29, 416^F

→

12/13 18:30, 2月前 , 417^F

12/13 18:30, 417^F

推

lee198218

12/13 19:00, 2月前 , 418^F

12/13 19:00, 418^F

推

breathair

12/13 19:06, 2月前 , 419^F

12/13 19:06, 419^F

→

breathair

12/13 19:06, 2月前 , 420^F

12/13 19:06, 420^F

→

lavign

12/13 21:03, 2月前 , 421^F

12/13 21:03, 421^F

推

PTTMAXQQ

12/13 21:16, 2月前 , 422^F

12/13 21:16, 422^F

→

PTTMAXQQ

12/13 21:16, 2月前 , 423^F

12/13 21:16, 423^F

推

sustainer123

12/13 21:28, 2月前 , 424^F

12/13 21:28, 424^F

推

avans

12/13 22:49, 2月前 , 425^F

12/13 22:49, 425^F

→

njjroom

12/13 23:16, 2月前 , 426^F

12/13 23:16, 426^F

推

ksjr

12/13 23:39, 2月前 , 427^F

12/13 23:39, 427^F

※ avans:轉錄至看板 AI_Art 12/14 00:12

推

12/14 02:00, 2月前 , 428^F

12/14 02:00, 428^F

→

12/14 02:01, 2月前 , 429^F

12/14 02:01, 429^F

→

12/14 02:02, 2月前 , 430^F

12/14 02:02, 430^F

→

12/14 02:02, 2月前 , 431^F

12/14 02:02, 431^F

→

12/14 02:03, 2月前 , 432^F

12/14 02:03, 432^F

→

JKjohnwick

12/14 13:43, 2月前 , 433^F

12/14 13:43, 433^F

→

JKjohnwick

12/14 13:44, 2月前 , 434^F

12/14 13:44, 434^F

推

mtm

12/14 14:59, 2月前 , 435^F

12/14 14:59, 435^F

推

mtm

12/14 16:20, 2月前 , 436^F

12/14 16:20, 436^F

推

eknbz

12/15 03:22, 2月前 , 437^F

12/15 03:22, 437^F

推

verydolungbe

12/15 07:23, 2月前 , 438^F

12/15 07:23, 438^F

推

verydolungbe

12/15 07:41, 2月前 , 439^F

12/15 07:41, 439^F

噓

patvessel

12/15 09:09, 2月前 , 440^F

12/15 09:09, 440^F

→

patvessel

12/15 09:09, 2月前 , 441^F

12/15 09:09, 441^F

→

patvessel

12/15 09:09, 2月前 , 442^F

12/15 09:09, 442^F

推

nelso

12/15 14:39, 2月前 , 443^F

12/15 14:39, 443^F

‣ 返回看板[ Stock ] 學術

‣ 更多 minazukimaya 的文章

文章代碼(AID): #1fF6Uc_j (Stock)

討論串 (同標題文章)

完整討論串 (本文為第 10 之 23 篇)：

排序：最新先 | 最舊先 | 留言數

Re: [新聞] 甲骨文股價暴跌超10%！訂單積壓越來越多「燒錢」砸AI已刪文

breathair

2月前, 12/14

waitrop

2月前, 12/14

148

pujos

2月前, 12/14

111

a1e

2月前, 12/14

onekoni

2月前, 12/14

176

drraujn

2月前, 12/14

oopFoo

2月前, 12/14

2月前, 12/14

179

LDPC

2月前, 12/14