[新聞] 中國 AI 公司 DeepSeek 令矽谷震驚

看板Tech_Job (科技人)作者 (乙醯胺酚)時間1天前 (2025/01/25 19:55), 編輯推噓23(29658)
留言93則, 46人參與, 5小時前最新討論串1/1
OpenAI 強大新勁敵,中國 AI 公司 DeepSeek 令矽谷震驚 https://bit.ly/4hxOiYJ 中國幻方成立的 AI 研究公司 DeepSeek 公布最新研究成果,震驚了全世界,無視美國阻止 中國發展尖端科技的野心。 幻方的創始團隊在 2015 年組成,其中代表人物為梁文鋒,團隊從零開始探索全自動化交易 ;到了 2015 年創立幻方量化,依靠數學與 AI 進行量化投資。來到 2023 年 4 月,幻方 宣布成立一家研究公司 DeepSeek 以探索 AGI(Artificial General Intelligence,通用 人工智慧),本週 20 日釋出的 DeepSeek-R1 模型正式版,在 AI 業界掀起熱烈討論。 「今日發表 DeepSeek-R1,同步開源模型權重。DeepSeek-R1 遵循 MIT 授權條款,允許研 究人員以蒸餾技術用 DeepSeek-R1 訓練其他模型」,DeepSeek 表示,而 DeepSeek-R1 基 準測試結果可說是追平 OpenAI o1。 同樣在 20 日,中國國務院總理李強主持由專家、企業家及各領域代表參與的座談會,聽取 政府工作報告並提出建議,梁文鋒正是其中一員,以自身經驗對 AI 發展提出建言。 來自美國的 OpenAI 和 Google DeepMind 率先開發推理模型,這是一種相對新穎的 AI 研 究領域,試圖使模型接近人類認知能力。其中,OpenAI 先後發表 o1、o3,Google 則有 Ge mini 2.0 Flash Thinking Experimental,雙方對研究方法保密到家。 DeepSeek-R1 釋出在矽谷引發激烈爭論,重點在於資源相對充足的美國 AI 公司,是否能夠 持續捍衛自身技術優勢。 華盛頓當局禁止 NVIDIA 向中國供應最先進的晶片,無法建構充足算力下,中國當地 AI 公 司被迫找出創新方法,盡可能提高既有晶片的算力,而梁文鋒的團隊知道如何解決這樣的問 題。 DeepSeek 宣稱,使用供應中國市場的 2,048 個 NVIDIA H800 和不到 600 萬美元訓練一款 擁有 6,710 億參數的模型,所需費用遠遠不及 OpenAI 和 Google 訓練同等規模的模型。 不只如此,DeepSeeK 願意開源分享研究成果,而不是為了商業利益而保護它。DeepSeek 未 從外部資源籌措資金,是靠母公司在對沖基金交易的收益支撐,也沒有採取重大措施將模型 商業化。 加州大學柏克萊分校的 AI 政策研究員 Ritwik Gupta 表示,DeepSeek 近來推出模型表明 「AI 能力沒有護城河」,認為第一個訓練模型的人必須耗費大量資源才能達成目標,但後 進者能以更便宜、更快速的方法辦到。他補充說,中國比起美國擁有更龐大的人才庫,他們 了解如何充分利用運算資源,以更便宜的方法訓練、運行模型。 業界人士則表示,儘管 DeepSeek 以有限資源取得受人矚目的成績,但隨 AI 產業發展,能 否繼續保有競爭力仍是一個大問題。DeepSeek 面對的美國競爭對手並沒有坐以待斃,他們 利用 NVIDIA 下一代 Blackwell 架構晶片建構運算叢集,強大算力有助於拉開競爭差距。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.232.174.138 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1737806116.A.0EE.html

01/25 20:28, 1天前 , 1F
老黃老早就說過了
01/25 20:28, 1F

01/25 20:31, 1天前 , 2F
先進晶片裡跑一堆垃圾雜訊
01/25 20:31, 2F

01/25 20:36, 1天前 , 3F
如果成真,那幫美股大科技們哭哭,
01/25 20:36, 3F

01/25 20:36, 1天前 , 4F
幾千億美元的資本支出白花了,但可
01/25 20:36, 4F

01/25 20:36, 1天前 , 5F
能嗎?
01/25 20:36, 5F

01/25 20:53, 1天前 , 6F
要deepseek 自介,結果自稱chat gp
01/25 20:53, 6F

01/25 20:53, 1天前 , 7F
t 4這就是中國研發
01/25 20:53, 7F

01/25 21:10, 1天前 , 8F
內建習近平思想的AI 就問你怕了沒
01/25 21:10, 8F

01/25 21:21, 1天前 , 9F
中國又在徵文比賽了喔之前的電動車
01/25 21:21, 9F

01/25 21:21, 1天前 , 10F
呢?
01/25 21:21, 10F

01/25 21:31, 1天前 , 11F
看過一個比喻很傳神:從頭到尾. 從
01/25 21:31, 11F

01/25 21:31, 1天前 , 12F
採買到煮菜完成一到料理-》 美國A
01/25 21:31, 12F

01/25 21:31, 1天前 , 13F
I巨頭。買半成品再研究怎麼煮的快
01/25 21:31, 13F

01/25 21:31, 1天前 , 14F
又好-〉 deepseek
01/25 21:31, 14F

01/25 22:40, 1天前 , 15F
上車的是
01/25 22:40, 15F

01/25 23:04, 1天前 , 16F
中國的DeepSeek比美國還自由開放
01/25 23:04, 16F

01/25 23:18, 1天前 , 17F
ok 調高AI關稅200%
01/25 23:18, 17F

01/25 23:29, 1天前 , 18F
繼續吹,看吹多久能成功..
01/25 23:29, 18F

01/25 23:36, 1天前 , 19F
純噓16 F
01/25 23:36, 19F

01/25 23:52, 1天前 , 20F
本來以為科技版會就事論事素質比八
01/25 23:52, 20F

01/25 23:52, 1天前 , 21F
卦版好一點結果素質比八卦版更糟XD
01/25 23:52, 21F

01/26 00:12, 1天前 , 22F
恐內建豆包人工智障
01/26 00:12, 22F

01/26 00:48, 1天前 , 23F
科技版炫耀薪資下限用的,一堆打工
01/26 00:48, 23F

01/26 00:48, 1天前 , 24F
01/26 00:48, 24F

01/26 01:08, 1天前 , 25F
如果成本優勢極大,那美國AI相關公
01/26 01:08, 25F

01/26 01:08, 1天前 , 26F
司的股價應該就崩盤了
01/26 01:08, 26F

01/26 01:26, 1天前 , 27F
又遙遙領先
01/26 01:26, 27F

01/26 02:04, 1天前 , 28F
純噓6樓,你真的有去問他自介嗎
01/26 02:04, 28F

01/26 02:54, 1天前 , 29F
這邊大概一堆人搞不清楚open sourc
01/26 02:54, 29F

01/26 02:54, 1天前 , 30F
e的意義吧
01/26 02:54, 30F

01/26 05:53, 23小時前 , 31F

01/26 06:33, 22小時前 , 32F
文組ID只 只剩下「吹」這等級的用
01/26 06:33, 32F

01/26 06:33, 22小時前 , 33F
詞,畢竟根本AI 哈哈
01/26 06:33, 33F

01/26 06:34, 22小時前 , 34F
這要討論起來,文組青鳥大概,什麼
01/26 06:34, 34F

01/26 06:34, 22小時前 , 35F
都插不上話,只能靠逢中必反的政治
01/26 06:34, 35F

01/26 06:34, 22小時前 , 36F
立場來模糊焦點,大家繼續觀察就知
01/26 06:34, 36F

01/26 06:34, 22小時前 , 37F
道那幾個特定人士在洗了XDD
01/26 06:34, 37F

01/26 06:34, 22小時前 , 38F
*畢竟根本不懂AI
01/26 06:34, 38F

01/26 07:54, 21小時前 , 39F
一堆政黑柵欄關不住,跑來丟人現眼
01/26 07:54, 39F

01/26 08:01, 21小時前 , 40F
我看又是the 抄
01/26 08:01, 40F

01/26 08:17, 21小時前 , 41F
中國人才內捲是可以搞出一些東西,
01/26 08:17, 41F

01/26 08:17, 21小時前 , 42F
只是台灣不屬於中國,宅男發財還是
01/26 08:17, 42F

01/26 08:17, 21小時前 , 43F
01/26 08:17, 43F

01/26 08:18, 20小時前 , 44F
這推文是科技版?根本是奴隸版
01/26 08:18, 44F

01/26 08:32, 20小時前 , 45F
Scale.AI CEO: “My understanding
01/26 08:32, 45F

01/26 08:32, 20小時前 , 46F
is that DeepSeek has about 50,000
01/26 08:32, 46F

01/26 08:32, 20小時前 , 47F
H100s—which they can’t talk ab
01/26 08:32, 47F

01/26 08:32, 20小時前 , 48F
out, obviously, because it is aga
01/26 08:32, 48F

01/26 08:32, 20小時前 , 49F
inst the export controls that the
01/26 08:32, 49F

01/26 08:32, 20小時前 , 50F
United States has put in place.
01/26 08:32, 50F

01/26 08:32, 20小時前 , 51F
01/26 08:32, 51F

01/26 08:56, 20小時前 , 52F
這裡的老人有幾個看得懂AI的都難說
01/26 08:56, 52F

01/26 09:04, 20小時前 , 53F
怎麼這麼多,丟人現眼的...
01/26 09:04, 53F

01/26 09:47, 19小時前 , 54F
只能證明對中國的晶片禁令還不夠嚴
01/26 09:47, 54F

01/26 09:47, 19小時前 , 55F
格,應該是新加坡偷賣太多了
01/26 09:47, 55F

01/26 10:04, 19小時前 , 56F
Reddit 有人做實驗,跑deepseek r1
01/26 10:04, 56F

01/26 10:04, 19小時前 , 57F
需要大約 150k USD 的設備
01/26 10:04, 57F

01/26 10:04, 19小時前 , 58F
其實沒到真的很多很貴吧
01/26 10:04, 58F

01/26 11:49, 17小時前 , 59F
…世界上便宜又好用會造成市場失衡
01/26 11:49, 59F

01/26 11:49, 17小時前 , 60F
,你要先看中國ai有讓美國害怕的實
01/26 11:49, 60F

01/26 11:49, 17小時前 , 61F
力?有的話,明天七大巨頭科技AI就
01/26 11:49, 61F

01/26 11:49, 17小時前 , 62F
應該要跌50趴
01/26 11:49, 62F

01/26 12:21, 16小時前 , 63F
ai重點是有大數據得天下 中國不缺
01/26 12:21, 63F

01/26 12:21, 16小時前 , 64F
數據
01/26 12:21, 64F

01/26 12:21, 16小時前 , 65F
只是與西方數據base有差
01/26 12:21, 65F

01/26 12:32, 16小時前 , 66F
捲積網路還真適合內捲的國家開發呢
01/26 12:32, 66F

01/26 12:38, 16小時前 , 67F
又遙遙領先
01/26 12:38, 67F

01/26 12:48, 16小時前 , 68F
樓上,現在已經沒有人在用卷積了吧
01/26 12:48, 68F

01/26 12:48, 16小時前 , 69F
,現在不都內積?
01/26 12:48, 69F

01/26 13:16, 16小時前 , 70F
現在台灣政府的方向就是跟世界脫軌
01/26 13:16, 70F

01/26 13:16, 16小時前 , 71F
你看那數位幣就明白了,從世界先進
01/26 13:16, 71F

01/26 13:16, 16小時前 , 72F
變成對岸差不多的法規了…
01/26 13:16, 72F

01/26 13:46, 15小時前 , 73F
跑 R1 是訓練還是做 inference?
01/26 13:46, 73F

01/26 14:13, 15小時前 , 74F
用ChatGPT來訓練較小的模型。不需要
01/26 14:13, 74F

01/26 14:13, 15小時前 , 75F
大量的人工建構的資料,訓練成本當
01/26 14:13, 75F

01/26 14:13, 15小時前 , 76F
然比較低。模型參數少了,當然運行
01/26 14:13, 76F

01/26 14:13, 15小時前 , 77F
成本降低。open ai也有自己的蒸餾模
01/26 14:13, 77F

01/26 14:13, 15小時前 , 78F
型。跟著做的本來就比較容易
01/26 14:13, 78F

01/26 15:29, 13小時前 , 79F
為什麼這麼多明明不懂硬要裝懂的人
01/26 15:29, 79F

01/26 15:29, 13小時前 , 80F
01/26 15:29, 80F

01/26 16:05, 13小時前 , 81F
這我信,強調cp值的國家
01/26 16:05, 81F

01/26 18:08, 11小時前 , 82F
剛剛試用了一下,以免費仔的立場來
01/26 18:08, 82F

01/26 18:08, 11小時前 , 83F
說還真的蠻好用的
01/26 18:08, 83F

01/26 19:28, 9小時前 , 84F
中研院又能用中國模型了
01/26 19:28, 84F

01/26 19:36, 9小時前 , 85F
合作才能更強 現在要這樣搞 就是看
01/26 19:36, 85F

01/26 19:36, 9小時前 , 86F
哪一邊技勝ㄧ籌
01/26 19:36, 86F

01/26 20:19, 8小時前 , 87F
人家都開源了 數發部還在點麵線
01/26 20:19, 87F

01/26 20:47, 8小時前 , 88F
同84樓ww
01/26 20:47, 88F

01/26 20:47, 8小時前 , 89F

01/26 21:06, 8小時前 , 90F
共產黨的AI
01/26 21:06, 90F

01/26 22:04, 7小時前 , 91F
看到一堆講到中國就高潮的ID就知道
01/26 22:04, 91F

01/26 22:04, 7小時前 , 92F
台灣真的沒救了
01/26 22:04, 92F

01/26 23:39, 5小時前 , 93F
祖國已成最大贏家,厲害了,我的國
01/26 23:39, 93F
文章代碼(AID): #1dbD4a3k (Tech_Job)
文章代碼(AID): #1dbD4a3k (Tech_Job)