看板 [ Stock ]
討論串[新聞] OpenAI:已掌握DeepSeek盜用模型證據
共 12 篇文章

推噓0(3推 3噓 13→)留言19則,0人參與, 1天前最新作者dreambreaken (小滅滅)時間1天前 (2025/01/30 01:49), 1天前編輯資訊
0
1
4
內容預覽:
我先講我非AI專業. 但這件事情基本就是鬼扯. 甚麼叫做利用O1蒸餾出R1. 你要用API抓多少資訊量跟TOKEN才做得出來. 然後這件事情OPENAI還會不知道?. 這是GPT回我的. 透過 API 硬訓練一個能夠與 GPT-4 相媲美的模型,基本上是不可能的,原因如下:. 1. 訓練大規模語言模
(還有2232個字)

推噓32(33推 1噓 44→)留言78則,0人參與, 22小時前最新作者iecju520 (台中李鐘碩)時間1天前 (2025/01/30 02:44), 1天前編輯資訊
0
1
0
內容預覽:
各位是不是忘了 中國人文化. 先說ㄛ 我沒深究 但我六年前影像的 我猜原理應該還是差不多. AI 發展幾十年 論文裡從沒看過 模型能只接把算力幹掉90%的. 偏偏中國人就可以,雖說中國人也發表過幾篇幾十萬引用的優秀模型. 但經典開源模型裡 通常會給出. pre-trained weights, ra
(還有439個字)

推噓117(127推 10噓 173→)留言310則,0人參與, 10小時前最新作者zzahoward (Cheshire Cat)時間1天前 (2025/01/30 07:26), 23小時前編輯資訊
1
2
6
內容預覽:
以下部分資訊來自於Reddit anitakirkovska文章的翻譯. LDPC哥哥講到一個重點. Reinforcement Learning =/= Reinforcement Learning from Human Feedback. 這也是R1為什麼爆紅的原因. https://imgur
(還有1818個字)

推噓1(1推 0噓 1→)留言2則,0人參與, 1天前最新作者deweyj (累)時間1天前 (2025/01/30 08:24), 編輯資訊
0
0
0
內容預覽:
前文恕刪. 網紅要的是流量 台灣媒體要的是點擊率和收視率. 大家現在拿chatGPT來幹嘛 不就用同樣的方法檢視deepseek?. 要求在媒體 或者社群媒體上看到討論技術性的文章只能說...... 個人從沒這種奢望拉. 八卦版 不就政治意識形態 股版是要標的賺錢啊. 或許技術開發者會感到某種興奮?
(還有160個字)

推噓50(50推 0噓 75→)留言125則,0人參與, 8小時前最新作者Lushen (pttlushen)時間1天前 (2025/01/30 08:59), 1天前編輯資訊
1
9
1
內容預覽:
OpenAPI 的 Chief Research Officer (首席研究員). Mark Chen 2025/01/29 凌晨發了一波推文評價 Deepseek R1 的論文. https://i.imgur.com/A73X07x.png. https://i.imgur.com/rjDczV
(還有3758個字)