Re: [新聞] 敏感詞達35萬 DeepSeek使用率從50%跌至3%

看板Tech_Job (科技人)作者 (hi)時間5小時前 (2025/07/15 03:57), 編輯推噓3(300)
留言3則, 3人參與, 57分鐘前最新討論串3/3 (看更多)
※ 引述《sxy67230 (charlesgg)》之銘言: : ※ 引述 《sunbysea》 之銘言: : : 敏感詞達35萬 DeepSeek使用率從50%跌至3% : : https://i.ntdtv.com/assets/uploads/2025/07/id104002656-GettyImages-2200111369- : : 868x488.jpg : : 2025年2月21日,上海人工智慧產業協會在上海舉辦的全球開發者大會上展示了Deepseek : : 的標誌。(Photo by Hector RETAMAL / AFP) : 其實用戶下降要從好幾個層面來看啦! : 以To C來說,想衝高流量其實DeepSeek大可以分成海內版跟海外版,海外版不設置使用限制 : ,海內版設置敏感詞做Guardrails。 : 當前很多Agentic的方法是確實有辦法依據各國法律來制定服務政策的,不過我想關鍵原因 : 可能還是DeepSeek手上握有的卡效能跟算力都存在瓶頸,尤其是美國從年初對高階顯卡的管 : 制是真的有掐住大部分中國AI公司短期的痛點。DeepSeek當前的內部研究可能是急缺顯卡的 : 狀態的,這種狀態要在提供To C用戶其實負荷是蠻高的。 : 我看媒體上說是缺乏數據我反而感覺是有點問題的,主因就是如果真的缺乏數據那V3、R1的 : 更新理論上也會有問題才是,但是開源版R1、V3確是有更新而且performance 是可以直追Op : enAI o3系列的,我自己體感拿一些新的benchmark測試也是跟o3不分上下,有些題目表現反 : 而反超o3。 : 我自己感覺R2沒有發佈除了研究本來就不是線性發展外,更大可能是算力缺乏。以過往 : 梁文峰的一些採訪片段,如果只是單純的數據或是模型大小提升可能不是他要的,R2感覺更 : 多會是架構或是訓練範式的改進,但純無模型的RL訓練其實是不太好做的而且算力需求可能 : 會不小,我更傾向讓子彈飛一會。 : 我感覺很多媒體把很多研究型公司強硬要對標服務型公司其實是不太好的,研究型公司其實 : 產品週期會比很多人想像的長投入更高,服務型公司就是單純建構在既有技術上為用戶服務 : 迭代的。關鍵還是DeepSeek對自己公司的定位,反而需要去關注創始人的看法跟營運目標了 : 。 算力缺乏是有可能的! 不過另外一個更有可能角度就是,DeepSeek 其實根本不在意toC的用戶 DS跟一般AI公司不同,他背後的資金來源是HighFlyer Quant,專做高頻交易的,錢賺得太無聊了弄個AI實驗室玩玩~ DS自己又非常省錢,訓練的價格很便宜 別的AI公司是到處求爺爺告奶奶找人借錢,DS是阿里,國家基金想入股都被經營團隊拒絕了 DS 本身幾乎都只有研發團隊,連運營團隊都沒聽過,更不用說行銷團隊了 梁文鋒至今你看過他上過幾次媒體新聞? 但是 altman,天天在上節目,拜訪投資人,拼命宣揚chatGPT 所以別間AI公司念茲在茲的使用人數,DS很可能根本連監看都懶了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 83.87.43.148 (荷蘭) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1752523041.A.AE8.html

07/15 08:04, 1小時前 , 1F
DS只要把黨服務好就好,的確
07/15 08:04, 1F

07/15 08:13, 1小時前 , 2F
爬梯翻牆遙遙領先
07/15 08:13, 2F

07/15 08:26, 57分鐘前 , 3F
生一個模型可以空個幾天就賺飽了
07/15 08:26, 3F
文章代碼(AID): #1eTM4Xhe (Tech_Job)
文章代碼(AID): #1eTM4Xhe (Tech_Job)