[新聞] 低成本高效能AI模型或再度引發美股慘烈震盪

看板Tech_Job (科技人)作者qazxc1156892 (QQ)時間6小時前 (2025/04/28 17:26)推噓5(5推 0噓 4→)

留言9則, 8人參與討論串1/1

新聞標題：低成本高效能AI模型或再度引發美股慘烈震盪鉅亨網編譯莊閔棻 2025-04-28 15:10 中國人工智慧（AI）公司 DeepSeek 似乎即將再度在市場上投下震撼彈。隨著 DeepSeek 即將發布的 R2 AI 模型細節再度流出，市場對該模型的關注再次掀起波瀾，並可能又對美國股市，尤其是科技股，造成衝擊。據報導，雖然目前 DeepSeek 尚未正式公布 R2 的具體規格，但中國媒體引述消息指出， R2 將採用升級版的專家混合（Hybrid MoE）架構，並可能結合先進的（gating mechanis ms）與 Dense 層（dense layers）設計，專為優化高負載運算。新模型的參數量預計將達到驚人的 1.2 兆，是 R1 的兩倍。根據爆料，DeepSeek R2 在每個字元（token）的單位成本上，比 GPT-4 暴降了 97.4%，輸入（input）每百萬個字元只要 0.07 美元，輸出（output）每百萬個字元則只要 0.27 美元。與 OpenAI 目前的收費標準相比，R2 將成為企業市場上極具吸引力的高效能、低成本選擇。這樣的成本優勢，無疑將對美國 AI 公司造成嚴重衝擊。市場分析指出，若 DeepSeek R2 真如預期般強勢推出，將使 OpenAI 等企業面臨前所未有的競爭壓力，進而影響美股科技類股的表現。值得一提的是，DeepSeek R2 不僅在參數規模和成本上實現突破，還在硬體層面實現了自家技術的深度整合。DeepSeek 選擇全程依賴華為 Ascend 910B 晶片群進行訓練，把華為 Ascend 910B 晶片群利用率推到了 82%，FP16 精度算力實測達到 512PetaFLOPS，接近同規模輝達 A100 群 91% 的性能。資料還顯示，DeepSeek R2 的訓練資料量高達 5.2PB，並在多項測試中表現出色。特別是在 C-Eval2.0 中文語言測試中，R2 達到了 89.7% 的優異成績；在 COCO 資料集上，R2 的電腦視覺能力也達到了 92.4%，顯示其不僅在語言處理方面有顯著突破，也在視覺識別領域有了長足進展。除了在參數規模和成本上取得突破，DeepSeek R2 還在模型部署方面創新。報導稱，R2 可在 8bit 量化壓縮模式下將模型體積縮小至 83%，同時精度損失控制在 2% 以內，大大提升 AI 模型在終端設備上的部署可能性，為未來的 AI 應用開啟了新的大門。 DeepSeek R2 的發布或將成為科技股的重大挑戰。DeepSeek R1 曾經讓美國股市遭遇慘痛損失，尤其是對輝達等 AI 晶片製造商造成巨大打擊，市值一度蒸發 6000 億美元。隨著 R2 的消息逐步流出，美股投資者開始擔心中國 AI 企業再次在市場上掀起新的風暴。新聞來源： https://reurl.cc/LaaRNa -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.243.82 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1745832389.A.8DB.html