[討論] OpenAI GPT o1模型

看板Tech_Job (科技人)作者 (拉卡)時間2天前 (2024/09/17 10:14), 1天前編輯推噓38(38033)
留言71則, 36人參與, 54分鐘前最新討論串1/5 (看更多)
https://openai.com/index/learning-to-reason-with-llms/ 上禮拜OpenAI發布經過強化學習訓練的新型語言模型o1 宣稱模型有更強大的思考能力 o1在回答之前會深入思考產生內部的推理練 結果就是o1模型在各個人類頂尖領域獲得相當好的成績 o1數學方便相當於美國奧林匹克AIME前500名的選手 程式方面位居Codeforce前11% 上禮拜的Leetcode雙週比賽 https://leetcode.com/contest/biweekly-contest-139/ranki ng/ 以12分鐘通關 在物理生物化學領域(GPQA)已經超過人類博士的程度 對科技業比較相關的是 看來以後線上面試考白板題 可能都還要關注面試者眼神有沒有亂飄以防用GPT作弊 但如果是OA好像就無法可防了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.250.51.3 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1726539293.A.A27.html

09/17 10:22, 2天前 , 1F
太興奮了看成OL模型
09/17 10:22, 1F

09/17 10:29, 2天前 , 2F
現在可以解3.11vs3.9哪個大了嗎?
09/17 10:29, 2F

09/17 10:42, 2天前 , 3F
但是沒辦法貼圖片或者附檔比較麻煩
09/17 10:42, 3F

09/17 11:23, 2天前 , 4F
搭配cursor使用 ng立刻變senior level
09/17 11:23, 4F

09/17 11:29, 1天前 , 5F
不用防吧 以後就不用考白板題啦
09/17 11:29, 5F

09/17 11:29, 1天前 , 6F
Gpt 已經比99%的面試者強了
09/17 11:29, 6F

09/17 11:29, 1天前 , 7F
以後只剩know how比較重要了
09/17 11:29, 7F
這樣看來白板題八股文是不是要走入歷史了 以後也不用刷題了 只是是說這些know how未來也會被GPT取代吧 現在都已經能達到這個程度了 SWE以後可能就是負責下指令然後幫gpt review吧 ※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 11:35:00

09/17 11:45, 1天前 , 8F
軟工刷題仔逝去
09/17 11:45, 8F

09/17 11:46, 1天前 , 9F
還好台灣大部分是不用刷題的硬體工作
09/17 11:46, 9F

09/17 11:46, 1天前 , 10F
leetcode這種陋習早該下去了
09/17 11:46, 10F

09/17 11:51, 1天前 , 11F
gpt的知識量真的屌虐,自己研究個東西可能要兩三小
09/17 11:51, 11F

09/17 11:51, 1天前 , 12F
問一下答案直接套用,雖然不能每次都work也夠了
09/17 11:51, 12F

09/17 11:52, 1天前 , 13F
軟工的知識在網路上太多了 很容易訓練
09/17 11:52, 13F
※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 11:58:58

09/17 12:04, 1天前 , 14F
看什麼時候能讓我當甲方直接開需求就把軟體含UI都
09/17 12:04, 14F

09/17 12:04, 1天前 , 15F
寫好
09/17 12:04, 15F
※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 12:08:38

09/17 12:41, 1天前 , 16F
好像網頁製作可以正確產生 bilibili有人測試
09/17 12:41, 16F

09/17 12:41, 1天前 , 17F
直接提需求 code直接寫完 成品網頁直接產生
09/17 12:41, 17F

09/17 12:42, 1天前 , 18F
但我走FW的 看不懂他們在幹嘛 感覺有點厲害就是了
09/17 12:42, 18F

09/17 12:43, 1天前 , 19F
先拿台灣學測的數學戳戳看
09/17 12:43, 19F

09/17 12:45, 1天前 , 20F
刷題其實不算陋習
09/17 12:45, 20F

09/17 12:49, 1天前 , 21F
台廠聊天面試比較像陋習
09/17 12:49, 21F

09/17 13:03, 1天前 , 22F
以前就說了,現場考實作題比較有鑑別度。考那個leet
09/17 13:03, 22F

09/17 13:03, 1天前 , 23F
code 還不如直接挑本科系人選就好。
09/17 13:03, 23F

09/17 13:05, 1天前 , 24F
考實作題本科系還不一定答的出來。
09/17 13:05, 24F

09/17 13:07, 1天前 , 25F
還好啦,面試還會考系統設計 那才是定級的關鍵
09/17 13:07, 25F

09/17 13:42, 1天前 , 26F
是說還真的把整份需求丟上去過,寫是寫的出來但是畫
09/17 13:42, 26F

09/17 13:42, 1天前 , 27F
面醜爆,有資安檢測也不可能過的那種,頂多就是單一
09/17 13:42, 27F

09/17 13:42, 1天前 , 28F
功能能跑能動,可是串不起來整個流程這樣
09/17 13:42, 28F

09/17 13:43, 1天前 , 29F
系統設計大部分人也都是唸書本上的再想辦法兜啊 只
09/17 13:43, 29F

09/17 13:43, 1天前 , 30F
要是套現成系統性的知識99%的人都贏不了gpt 的 只
09/17 13:43, 30F

09/17 13:43, 1天前 , 31F
剩最後1%真的能做開創性東西的人才還有一席之地
09/17 13:43, 31F

09/17 13:50, 1天前 , 32F
https://reurl.cc/OrRqaX 新智元這篇報導說o1 門薩
09/17 13:50, 32F

09/17 13:50, 1天前 , 33F
測驗IQ超過120
09/17 13:50, 33F

09/17 13:53, 1天前 , 34F
刷題慢慢式微也不錯,本來太偏重刷題也不太正確
09/17 13:53, 34F

09/17 13:55, 1天前 , 35F
沒差吧他們應該會調整難度
09/17 13:55, 35F

09/17 13:57, 1天前 , 36F
畢竟真的問題他解不了
09/17 13:57, 36F

09/17 14:06, 1天前 , 37F
上次有個門薩的說pchome會倒閉後來也沒有
09/17 14:06, 37F

09/17 15:57, 1天前 , 38F
其實這些工具出來,即使取代了一些功能,總有別的方
09/17 15:57, 38F

09/17 15:57, 1天前 , 39F
面可以去努力吧
09/17 15:57, 39F

09/17 16:42, 1天前 , 40F
還考啥?連職缺都可以關一關了喇
09/17 16:42, 40F

09/17 17:04, 1天前 , 41F
不能驗證自己說出口的話 就依舊只是高級 google搜尋
09/17 17:04, 41F

09/17 17:54, 1天前 , 42F
好猛喔拉卡
09/17 17:54, 42F

09/17 18:41, 1天前 , 43F
也進步太快了…
09/17 18:41, 43F

09/17 19:41, 1天前 , 44F
雙週賽Q4解法醜到爆,這絕對過不了面試的放心
09/17 19:41, 44F

09/17 20:10, 1天前 , 45F
我分享一下我寫1000多題的心得啦,講好聽是單純講
09/17 20:10, 45F

09/17 20:10, 1天前 , 46F
難聽是死板,幫你複習大學學過的資結演算法而已,去
09/17 20:10, 46F

09/17 20:10, 1天前 , 47F
想我們用的工具哪個不是以資結與演算法為基本的?
09/17 20:10, 47F

09/17 20:10, 1天前 , 48F
不知所以然的人還是很多啦,不要說刷題面試是陋習,
09/17 20:10, 48F

09/17 20:10, 1天前 , 49F
題刷不好才有問題
09/17 20:10, 49F

09/17 20:13, 1天前 , 50F
但是週賽是competitive programming,題目本質跟面
09/17 20:13, 50F

09/17 20:13, 1天前 , 51F
試有差
09/17 20:13, 51F

09/17 20:32, 1天前 , 52F
真要防只能回歸疫情前 onsite都進公司考白板題了吧
09/17 20:32, 52F

09/17 21:47, 1天前 , 53F
應該會回歸真的on site 然後很多場擠在同一天這樣
09/17 21:47, 53F

09/17 22:01, 1天前 , 54F
以後應該會優先考system design了
09/17 22:01, 54F

09/17 22:10, 1天前 , 55F
是說copilot最近變好笨,有甚麼方法可以重製嗎
09/17 22:10, 55F

09/17 22:10, 1天前 , 56F
他會auto complete一些別的repo的structure...蝦寫
09/17 22:10, 56F

09/17 22:10, 1天前 , 57F
一波
09/17 22:10, 57F

09/17 22:22, 1天前 , 58F
以後測驗大概會變成看你是否能理解除錯AI生成的答案
09/17 22:22, 58F

09/17 22:23, 1天前 , 59F
以及如何用最佳的prompt來快速建構出程式碼
09/17 22:23, 59F

09/17 22:53, 1天前 , 60F
說真的,AI寫題這麼強的情況下,以後考算法絕對不是現
09/17 22:53, 60F

09/17 22:53, 1天前 , 61F
在這樣
09/17 22:53, 61F

09/17 22:54, 1天前 , 62F
甚至 system design prompt 下對的情況,也能在很短
09/17 22:54, 62F

09/17 22:54, 1天前 , 63F
時間內透過互動得到一個還行的架構
09/17 22:54, 63F

09/17 23:57, 1天前 , 64F
HTML 碰到特殊字元還是不行
09/17 23:57, 64F

09/18 07:40, 1天前 , 65F
聽休學後待業超過10年的人談論努力,真是醍醐灌頂,
09/18 07:40, 65F

09/18 07:40, 1天前 , 66F
謝謝開示
09/18 07:40, 66F

09/18 09:09, 1天前 , 67F
ai 會解決一切問題
09/18 09:09, 67F

09/18 15:54, 19小時前 , 68F
所以現在會寫verilog 了嗎
09/18 15:54, 68F

09/18 18:39, 16小時前 , 69F
Nvda內部就有verilog生成器了好嗎
09/18 18:39, 69F

09/19 09:55, 1小時前 , 70F
4o 9.11>9.9 o1 9.9>9.11 但明顯算比較久
09/19 09:55, 70F

09/19 10:31, 54分鐘前 , 71F
你先提示他9.11跟9.9是純數字,就不會算錯了啦
09/19 10:31, 71F
文章代碼(AID): #1cwEOTed (Tech_Job)
文章代碼(AID): #1cwEOTed (Tech_Job)