討論串[討論] Claude Mythos SWE bench verify 93.9%
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者jamo時間3小時前 (2026/04/10 03:31), 3小時前編輯資訊
0
0
1
內容預覽:
AI 從最一開始根本沒人看好. 到 alphaGO石破天驚打敗李世石,終結了AI永遠下不好圍棋的神話. 到突破圖靈測試----這個幾乎是有史以來,人類認為的AI難以突破的天塹. 結果現在沒有人再提圖靈測試了. 我昨天教我一個高中沒畢業的股東,安裝 cursor 後點幾下寫出一個貪食蛇. 現在他玩嗨了
(還有358個字)

推噓8(8推 0噓 14→)留言22則,0人參與, 4小時前最新作者yamakazi (大安吳彥祖)時間1天前 (2026/04/08 21:30), 編輯資訊
0
0
1
內容預覽:
4/7 Anthropic發布地表最強模型. Claude Mythos. 直接把opus 4.6按在地上磨擦. https://eu.36kr.com/zh/p/3757764949213698. 五項SWE bench都超越原本的opus 4.6 10~20%. 但Anthropic不打算發布此
(還有326個字)
首頁
上一頁
1
下一頁
尾頁