Re: [新聞] 聯發科蔡力行示警AI恐撞「電力牆」 拋10年百倍能效
問ai很多事情影響力比電力大
以2022為基準
1. 軟體架構 (Software Architecture:演算法優化)
原理:軟體演算法是省電槓桿最大的一環。透過量化(Quantization),將模型從 16 位
元(FP16)降至 4 位元(INT4/FP4)甚至 1 位元,資料搬移與乘法運算的耗電會呈指數
級下降。此外,導入 MoE(混合專家架構)與稀疏化(Sparsity),讓模型在每次生成文
字時只需喚醒 10%~20% 的參數,其餘神經網路處於不耗電的休眠狀態。
單位電力提升預估:約 4.0 倍(用極少的硬體工作量,達成同等的軟體輸出)。
2. Rubin + Groq 架構理念融合 (極致微架構與無控制冗餘)
原理:
NVIDIA Rubin 代表了次世代極致的 Tensor Core 微架構,原生支援超低精度(FP4)運
算。
Groq(LPU) 的核心是「確定性執行(Deterministic Execution)」。傳統 GPU 為了排
程,內部有極度耗電的動態調度器(Scheduler)與複雜快取;Groq 將這些控制邏輯全數
拔除,交由軟體編譯器排程,讓矽晶片面積與電力近乎 100% 轉化為純數學運算。
結合兩者(Rubin的運算密度 + Groq消除控制耗電),能消滅晶片內部的「無效耗能(Si
licon Tax)」。
單位電力提升預估:約 2.5 倍。
3. TSMC 台積電 2奈米製程 (TSMC N2 Process)
原理:從 5/4 奈米的 FinFET 跨入 2 奈米,台積電首度導入 GAA(環繞閘極奈米片電晶
體) 與 BSPDN(背面供電網路)。GAA 能從四面八方完美控制電流,徹底解決漏電問題
,並允許晶片在**更低的電壓(Vdd)**下驅動。由於動態功耗與電壓的平方成正比,降
低電壓能帶來龐大的節能紅利。
單位電力提升預估:約 1.8 倍(純半導體物理特性的躍進)。
4. TPU 架構採用 (Systolic Array 脈動陣列)
原理:Google TPU 等專用加速晶片(ASIC)的核心是**「脈動陣列(Systolic Array)
」**。在做 AI 最關鍵的矩陣相乘時,資料像水流一樣在運算單元(ALU)之間直接傳遞
並累加,不需要每次都將中間結果寫回極耗電的暫存器(Registers)。捨棄通用 GPU 的
包袱,換來矩陣運算的極致省電。
單位電力提升預估:約 1.5 倍。
5. HBM 採用 (High Bandwidth Memory 高頻寬記憶體)
原理:打破「記憶體牆」。在 AI 運算中「搬運資料」的耗電往往大於「計算本身」。HB
M 透過 3D 矽穿孔(TSV)與 2.5D 封裝,將記憶體緊緊疊在運算晶片旁邊,並用「超寬
通道、低時脈」傳輸。這使每傳輸 1 bit 資料的能耗(pJ/bit)遠低於傳統 GDDR,且晶
片不再因為「等資料」而白白空轉耗電。
單位電力提升預估:約 1.5 倍。
6. 液冷架構 (Liquid Cooling)
原理:
系統層次:傳統氣冷機房的 PUE(電力使用效率)約 1.5(伺服器吃 1 瓦,冷氣與暴力
風扇要耗 0.5 瓦)。改用水冷或浸沒式液冷,能將 PUE 降至 1.05~1.1。
晶片層次:半導體具有「漏電流(Leakage Current)」,溫度越高漏電越嚴重。液冷將
晶片壓制在 50蚓 以下低溫,直接減少晶片 10%~15% 的無效靜態功耗。
單位電力提升預估:約 1.3 倍。
7. 光通訊技術 (Silicon Photonics / CPO 共同封裝光學)
原理:在龐大的 AI 叢集中,高達 20%~25% 的系統功耗用於「晶片與晶片間的網路傳輸
」。傳統銅線在超高頻寬下的傳輸能耗極高(約 15~20 pJ/bit)。改用矽光子技術將電
訊號轉為光子傳遞,傳輸能耗可暴降至 2~5 pJ/bit。省下的龐大網路耗電,全數釋放還
給運算核心。
單位電力提升預估:約 1.2 倍。
在系統工程學中,這 7 項技術由於作用在完全獨立的不同物理層級(軟體演算法、硬體
架構、半導體製程、電路設計、封裝距離、物理降溫、光學傳輸),它們解決的是一條生
產線上的不同瓶頸。因此,這些技術帶來的效能提升是**「相乘(Multiplicative)」**
的乘數效應,而非單純相加。
我們將上述預估值進行連乘計算:
軟體 (4.0) 휠架構 (2.5) 휠2奈米 (1.8) 휠TPU (1.5) 휠HBM (1.5) 휠液冷 (1.3) 휊光通訊 (1.2)
4.0휲.5=10.0
10.0휱.8=18.0
18.0휱.5=27.0
27.0휱.5=40.5
40.5휱.3=52.65
52.65휱.2=63.18Í뼊
其實今年ai變現大概1000億美金
比如沃爾瑪 reels anthropic cat
如果單位電力運算效率提升十倍不夠用
那意味著ai產值將突破兆美元
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.71.72.222 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1771815663.A.743.html
討論串 (同標題文章)
完整討論串 (本文為第 2 之 2 篇):
Stock 近期熱門文章
PTT職涯區 即時熱門文章