討論串[心得] 馮·諾伊曼架構的物理牆
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓1(1推 0噓 2→)留言3則,0人參與, 1小時前最新作者x000032001 (某數)時間2小時前 (2026/06/16 16:29), 編輯資訊
0
0
6
內容預覽:
branchless加速技巧其實本身場景有點受限,因為現代CPU分支預測器太強了. perf event有抓出bad speculation再加比較有價值. 資料結構要重新思考一次。像Tree or Linked List是特定場景加上大N才有改善。. 資料量太小是純純拿大砲打小鳥。可以考慮換成簡單
(還有962個字)

推噓8(8推 0噓 16→)留言24則,0人參與, 1天前最新作者erspicu (.)時間1周前 (2026/06/06 15:52), 編輯資訊
0
0
5
內容預覽:
續之前side project學到. i-cache的優化策略和bitwise.swar(SIMD Within A Register).. 還有branchless各種加速技巧後 (這些都比較偏向Cpu ALU效率問題). 現在的side project撞到另外一個牆 是馮諾伊曼架構 天花板之一.
(還有997個字)
首頁
上一頁
1
下一頁
尾頁