[新聞] 低成本高效能AI模型或再度引發美股慘烈震盪
新聞標題: 低成本高效能AI模型或再度引發美股慘烈震盪
鉅亨網編譯 莊閔棻 2025-04-28 15:10
中國人工智慧(AI)公司 DeepSeek 似乎即將再度在市場上投下震撼彈。隨著 DeepSeek
即將發布的 R2 AI 模型細節再度流出,市場對該模型的關注再次掀起波瀾,並可能又對
美國股市,尤其是科技股,造成衝擊。
據報導,雖然目前 DeepSeek 尚未正式公布 R2 的具體規格,但中國媒體引述消息指出,
R2 將採用升級版的專家混合(Hybrid MoE)架構,並可能結合先進的(gating mechanis
ms)與 Dense 層(dense layers)設計,專為優化高負載運算。新模型的參數量預計將
達到驚人的 1.2 兆,是 R1 的兩倍。
根據爆料,DeepSeek R2 在每個字元(token)的單位成本上,比 GPT-4 暴降了 97.4%,
輸入(input)每百萬個字元只要 0.07 美元,輸出(output)每百萬個字元則只要 0.27
美元。與 OpenAI 目前的收費標準相比,R2 將成為企業市場上極具吸引力的高效能、低
成本選擇。
這樣的成本優勢,無疑將對美國 AI 公司造成嚴重衝擊。市場分析指出,若 DeepSeek R2
真如預期般強勢推出,將使 OpenAI 等企業面臨前所未有的競爭壓力,進而影響美股科
技類股的表現。
值得一提的是,DeepSeek R2 不僅在參數規模和成本上實現突破,還在硬體層面實現了自
家技術的深度整合。DeepSeek 選擇全程依賴華為 Ascend 910B 晶片群進行訓練,把華為
Ascend 910B 晶片群利用率推到了 82%,FP16 精度算力實測達到 512PetaFLOPS,接近
同規模輝達 A100 群 91% 的性能。
資料還顯示,DeepSeek R2 的訓練資料量高達 5.2PB,並在多項測試中表現出色。特別是
在 C-Eval2.0 中文語言測試中,R2 達到了 89.7% 的優異成績;在 COCO 資料集上,R2
的電腦視覺能力也達到了 92.4%,顯示其不僅在語言處理方面有顯著突破,也在視覺識別
領域有了長足進展。
除了在參數規模和成本上取得突破,DeepSeek R2 還在模型部署方面創新。報導稱,R2
可在 8bit 量化壓縮模式下將模型體積縮小至 83%,同時精度損失控制在 2% 以內,大大
提升 AI 模型在終端設備上的部署可能性,為未來的 AI 應用開啟了新的大門。
DeepSeek R2 的發布或將成為科技股的重大挑戰。DeepSeek R1 曾經讓美國股市遭遇慘痛
損失,尤其是對輝達等 AI 晶片製造商造成巨大打擊,市值一度蒸發 6000 億美元。隨著
R2 的消息逐步流出,美股投資者開始擔心中國 AI 企業再次在市場上掀起新的風暴。
新聞來源: https://reurl.cc/LaaRNa
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.243.82 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1745832389.A.8DB.html
→
04/28 18:02,
6小時前
, 1F
04/28 18:02, 1F
→
04/28 18:10,
6小時前
, 2F
04/28 18:10, 2F
推
04/28 18:46,
5小時前
, 3F
04/28 18:46, 3F
推
04/28 19:22,
4小時前
, 4F
04/28 19:22, 4F
推
04/28 20:18,
4小時前
, 5F
04/28 20:18, 5F
→
04/28 20:18,
4小時前
, 6F
04/28 20:18, 6F
推
04/28 21:55,
2小時前
, 7F
04/28 21:55, 7F
→
04/28 21:57,
2小時前
, 8F
04/28 21:57, 8F
推
04/28 23:11,
1小時前
, 9F
04/28 23:11, 9F
Tech_Job 近期熱門文章
16
39
PTT職涯區 即時熱門文章