看板
[ Stock ]
討論串[請益] 魔改舊顯卡
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁
內容預覽:
個人是不太了解, 因為也不是AI專家. 現在看到中國在魔改二手顯卡跑一些千億級參數大模型推理和優化. 他們拿這些二手顯卡跑 運行DeepSeek-Vision R1 72B、Llama 3.2 Vision 90B、Qwen2.5 72B和Qwen1.5 130B. 就問了chatgpt這些大模型,
(還有518個字)
內容預覽:
在以前模型聰不聰明是用有多少超參數決定的. 因為他是從0,慢慢學習變化到100. 所以腦容量不夠大,就不夠聰明。. 從1~100的過程,除了初期資本開支,server ,溫控,顯卡晶片,電力,人力,資料. 完完全全的資本密集。. DS 知識蒸餾,跟其他的優化,基本上就是一種錢跟時間用在刀口上. 開源
(還有1013個字)
首頁
上一頁
1
下一頁
尾頁