看板
[ Soft_Job ]
討論串[心得] 馮·諾伊曼架構的物理牆
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁
內容預覽:
branchless加速技巧其實本身場景有點受限,因為現代CPU分支預測器太強了. perf event有抓出bad speculation再加比較有價值. 資料結構要重新思考一次。像Tree or Linked List是特定場景加上大N才有改善。. 資料量太小是純純拿大砲打小鳥。可以考慮換成簡單
(還有962個字)
內容預覽:
續之前side project學到. i-cache的優化策略和bitwise.swar(SIMD Within A Register).. 還有branchless各種加速技巧後 (這些都比較偏向Cpu ALU效率問題). 現在的side project撞到另外一個牆 是馮諾伊曼架構 天花板之一.
(還有997個字)
首頁
上一頁
1
下一頁
尾頁