[心得] 純粹聊聊AI使用

看板Soft_Job (軟體人)作者 (北歐組一生推)時間1月前 (2026/02/04 02:00), 1月前編輯推噓29(29053)
留言82則, 29人參與, 3周前最新討論串1/1
也不知道哪根筋不對半夜睡不著來這個基本沒在看的版發文 先上個人權 https://imgur.com/I7XPLK8
這篇文沒有打算細談任何AI實際應該怎麼使用的內容 一方面懶得說二方面我覺得這很因情況而異三方面我也不知道 純粹想到什麼打什麼打到我睡著為止 開頭放個Andrej Karpathy這篇推特 https://x.com/karpathy/status/2015883857489522876?s=46 我覺得這是最近我看到最符合個人使用經驗的文章 網路上充斥許多只有AI很強跟AI沒用論點的文章 真正中肯做出分析的反而很難看到 (當然也可能是推薦算法使然 喔對了小小自介一下 我最近的工作比較大的milestone是release了一個叫做nijiv7的動漫風格文生圖模型 https://x.com/nijijourney/status/2009714744597643503?s=20 更之前的話則是參與midjourney video 1的開發 我的工作內容基本包涵 - 上千張顯卡的模型訓練 - 以億為等級的圖片影片數據處理 - 圖片影像生成模型的各種調整跟feature development 比較忙的時候可能一天同時會碰到資料處理 訓練 跟模型推理的代碼 實際工作更雜像我最近就開副本在做別的事情 但上面可以當作是工作的主幹 而個人在ai coding這一方面覺得算是經歷了三個大的變革 1. chatgpt 出來後複製貼上問答 2. cursor 類型的 ide 直接導入 3. claude code等的自主 ai 代理人 3這一塊我們團隊也是到最近才開始比較積極探索 主要是opus 4.5, codex等模型讓agent能力大幅提升 也讓3使用起來帶來的效益更大 (個人覺得從hype到實際落地能用通常都需要一段緩衝期 而且比起1 2 要運用好3的learning curve更陡 我最近都開玩笑說vibe coding比coding難 寫skill比寫code難 現在使用算是2 3混合只有在非常偶爾的情況會把獨立的問題用1拿去問不同llm吧 至於模型嗎 我們都是用最好的甚至claude code直接開api usage (比 team plan速度快 一個月一個人燒個幾百幾千美元都有 (還沒算cursor跟其他雜七雜八的 ai agent這東西感覺是 用起來其實沒這麼容易 也沒有像網路上大部分講的這麼萬能 現在最大的問題基本是context management跟spec 畢竟目前ai還不會讀心 他不知道你想做什麼 而且就算spec寫好了實際跑起來還是會發現常常有遺漏 所以的確是一行code都不用寫 其實我去年用cursor就幾乎一行code都沒寫了 但會發現到頭來最大的bottleneck還是人類自己 因為人類要負責提出requirement (spec)跟做evaluation 這兩件事情並沒有這麼簡單 嘛所以像是brainstorm這種讓agent釐清requirement的就很好用 至於evaluation 作為有程式背景的做code review還是最直接的方式 (上面Andrej Karpathy的文也有提到 實際上ai寫的code有時候就算是對的 但就是看他的code style或是一些冗餘的內容很不爽 至於那些純vibe完全不看code的人 大概需要不同的evaluation方式吧 但考慮到ml這種超大規模數據處理跟模型訓練 坦白講你不看code你安心嗎 你除了看code有什麼方式保證他在所有情況的behavior都是對的 我還真不知道 所以說 這東西真的很看情況 網路上kol說了ai多好用 但他們也不會知道怎麼把它用在千卡的集群上對吧 我有朋友在銀行 或者在quant工作 那邊又是完全不同的情況跟問題 每個人都有自己的工作流程目標跟限制 只能在這個為基礎來嘗試把ai容納到工作流裡面去 是說既然為什麼這麼麻煩為什麼還要用ai agent呢 因為人就是懶 而agent雖然不是萬能 但如果用得好 對於偷懶 不對 對於提升工作效率 還是有很大幫助的 大概這樣 一時沒想到啥要寫了 睡覺去起來繼續當agent manager -- https://i.imgur.com/LKAEPG4.png
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 160.237.80.233 (日本) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1770141650.A.FD4.html

02/04 02:07, 1月前 , 1F
推分享
02/04 02:07, 1F
※ 編輯: cybermeow (160.237.80.233 日本), 02/04/2026 02:08:37

02/04 02:15, 1月前 , 2F
推 那些有用無用一刀切的幻想文根本是廢文
02/04 02:15, 2F

02/04 02:15, 1月前 , 3F
強者 推
02/04 02:15, 3F

02/04 04:04, 1月前 , 4F
有份量的人權宣言 ^_^
02/04 04:04, 4F

02/04 07:42, 1月前 , 5F
如何解決contex window size limit?
02/04 07:42, 5F
無解 所以說現階段context management 是最重要的 但可能過幾個月又是不同的光景 Claude 5, ChatGPT 5.3 似乎都快出了

02/04 08:23, 1月前 , 6F
02/04 08:23, 6F

02/04 09:17, 1月前 , 7F
一定還是會看過一遍啊
02/04 09:17, 7F

02/04 09:43, 1月前 , 8F
真的很多人覺得ai是廢文製造機
02/04 09:43, 8F

02/04 10:21, 1月前 , 9F
目前用下來context還是很大的問題 有時候還是要使用1
02/04 10:21, 9F

02/04 10:25, 1月前 , 10F
樓上 完全不用1 要把任務拆成小張票 每個票大概幾次對話
02/04 10:25, 10F

02/04 10:25, 1月前 , 11F
就可以完成 然後就叫ai commit寫message
02/04 10:25, 11F

02/04 10:25, 1月前 , 12F
不知道怎麼拆叫ai幫你拆
02/04 10:25, 12F

02/04 11:14, 1月前 , 13F
不是你說的問題
02/04 11:14, 13F

02/04 11:14, 1月前 , 14F
在大型專案中 這種agent一定是用rag的形式做 少數狀況
02/04 11:14, 14F

02/04 11:14, 1月前 , 15F
下才會讀全文
02/04 11:14, 15F

02/04 11:15, 1月前 , 16F
這種context不全很容易出問題
02/04 11:15, 16F

02/04 11:34, 1月前 , 17F
我用Claude Code VS Code Plugin 餵給它我要改的檔案 跟它
02/04 11:34, 17F

02/04 11:34, 1月前 , 18F
說我想幹嘛 它就左翻右翻 看完開始改 改完跑測試 好了
02/04 11:34, 18F
這基本是我cursor的使用範圍 局部修改 提供足夠好的context通常都能解決

02/04 11:35, 1月前 , 19F
但還是會在很難預料到的地方出差錯 或者鬼打牆
02/04 11:35, 19F

02/04 11:35, 1月前 , 20F
我只能說 divide and conquer
02/04 11:35, 20F

02/04 11:37, 1月前 , 21F
長期下來我認為程式碼跟文件整理這種硬功夫 即便到了AI時代
02/04 11:37, 21F

02/04 11:37, 1月前 , 22F
還是十分重要 即便你可能文件不是寫給人看的(Skill之類)
02/04 11:37, 22F
倒不如說現在寫docs變得更重要了wwww

02/04 11:50, 1月前 , 23F
我用ai寫自製小工具,有bug,殺進去看,解掉不用5分鐘,文
02/04 11:50, 23F

02/04 11:50, 1月前 , 24F
件就算了,寫文件是想放輕鬆吃工作時數的吧,寫文件還用z
02/04 11:50, 24F

02/04 11:50, 1月前 , 25F
ip檔版控
02/04 11:50, 25F

02/04 11:53, 1月前 , 26F
用ai寫code 也不存在coding stlye問題,那是人類手工才
02/04 11:53, 26F

02/04 11:53, 1月前 , 27F
需要規範,說實在話現在ai還比人工穩,至少不會搞詐欺摸
02/04 11:53, 27F

02/04 11:53, 1月前 , 28F
工時拖延症跟埋雷
02/04 11:53, 28F
Coding style的部分有兩種 一種是我單純看不爽 另一種是依個人經驗來說這樣寫長遠來講比較好 不過這很大一部分也是看用途而定就是了 如果你的用途是完全不用做code review就能保證正確性的那你自然也可以完全不用管它寫 什麼 另外就是這一部分也可以盡量在Claude.md agents.md 規範雖然它不一定會聽 ※ 編輯: cybermeow (160.237.80.233 日本), 02/04/2026 12:01:40

02/04 12:12, 1月前 , 29F
Coding style沒差啦,用clang formatt 自動化style就好
02/04 12:12, 29F

02/04 12:12, 1月前 , 30F
。早就沒人在手打調整style了
02/04 12:12, 30F

02/04 12:19, 1月前 , 31F
我釐清一下 我這裡coding style包含用什麼library 或
02/04 12:19, 31F

02/04 12:19, 1月前 , 32F
者一些更接近architecture design的問題 哪些函數在哪
02/04 12:19, 32F

02/04 12:19, 1月前 , 33F
裡 做什麼等等
02/04 12:19, 33F

02/04 12:39, 1月前 , 34F
推推
02/04 12:39, 34F

02/04 12:51, 1月前 , 35F
推推
02/04 12:51, 35F

02/04 13:47, 1月前 , 36F
網紅永遠只跟你介紹實現todo app的效果 真正有價值的內
02/04 13:47, 36F

02/04 13:47, 1月前 , 37F
容 沒有人會分享出來 都要自己試過才知道有哪些坑
02/04 13:47, 37F

02/04 13:48, 1月前 , 38F
一堆范式隨著model越來越強 很多都可以丟了
02/04 13:48, 38F

02/04 13:59, 1月前 , 39F
謝分享!
02/04 13:59, 39F

02/04 15:44, 1月前 , 40F
感謝分享
02/04 15:44, 40F

02/04 23:31, 1月前 , 41F
感謝大大分享,使用歷程一模一樣,導致最近在找工作的時
02/04 23:31, 41F

02/04 23:31, 1月前 , 42F
候變成額外會思考工作目前導入哪種AI coding tool,很好
02/04 23:31, 42F

02/04 23:31, 1月前 , 43F
奇大大有這方面的經驗嗎(從Team Lead/ Manager/ 企業方
02/04 23:31, 43F

02/04 23:31, 1月前 , 44F
視角出發)?現在玩過Claude Code和Cursor之後,這兩年
02/04 23:31, 44F

02/04 23:31, 1月前 , 45F
來AI幫我寫的code比例越來越高,但面試時聽到有些企業好
02/04 23:31, 45F

02/04 23:31, 1月前 , 46F
像沒有買這些工具,或是用自架的Qwen等模型,但使用體感
02/04 23:31, 46F

02/04 23:31, 1月前 , 47F
跟商用模型還是差很多… 像是大大文章中提及的其他領域
02/04 23:31, 47F

02/04 23:31, 1月前 , 48F
也很好奇他們業內的情況XD (剛好昨天看到Anthropic又讓
02/04 23:31, 48F

02/04 23:31, 1月前 , 49F
美股軟體股集體跳水…)
02/04 23:31, 49F

02/05 03:35, 1月前 , 50F
我朋友大公司都有買AI服務,你面試的公司不夠大間吧,哈
02/05 03:35, 50F

02/05 03:36, 1月前 , 51F
我個人是寫提示詞寫小工具,一行CODE都不用手key
02/05 03:36, 51F

02/05 09:08, 1月前 , 52F
好奇你們怎麼把agent用在ML上的 我只用來做些小修補 像是
02/05 09:08, 52F

02/05 09:08, 1月前 , 53F
實作GRPO變種 寫log與monitor邏輯等我懶得寫的部分 或讓a
02/05 09:08, 53F

02/05 09:08, 1月前 , 54F
gents reproduce某個GitHub的實驗成果 不得不說他們省下
02/05 09:08, 54F

02/05 09:08, 1月前 , 55F
大量我自己寫的時間 但真的要上prod我還是沒那個膽子XD
02/05 09:08, 55F

02/05 09:27, 1月前 , 56F
context window可以用multi agent緩解 譬如讓一個agent d
02/05 09:27, 56F

02/05 09:27, 1月前 , 57F
elegate tasks到多個sub agnets等與把那些tasks的context
02/05 09:27, 57F

02/05 09:27, 1月前 , 58F
從主線任務切出去 當然主線任務太長還是沒救
02/05 09:27, 58F

02/05 10:39, 1月前 , 59F
所以最終還是回歸 邏輯清楚 定義明確才是效率能否提高
02/05 10:39, 59F

02/05 10:39, 1月前 , 60F
的關鍵,原本工作就不明不白的人用AI就是災難
02/05 10:39, 60F

02/05 18:48, 4周前 , 61F
觀念還沒轉變而已,未來沒在看code了,就是產出大量
02/05 18:48, 61F

02/05 18:48, 4周前 , 62F
測試碼各種行為與邊界測試。時代在轉變,人類介入就
02/05 18:48, 62F

02/05 18:48, 4周前 , 63F
是低效而已。人類越少介入越好,未來連決策次數都還
02/05 18:48, 63F

02/05 18:48, 4周前 , 64F
要再降低,當速度越快,成品完成丟棄的成本越低,直
02/05 18:48, 64F

02/05 18:48, 4周前 , 65F
接做完你看行不行這樣是未來的方式。
02/05 18:48, 65F

02/05 20:54, 4周前 , 66F
人類介入的點不會再是敲鍵盤產code 而是指揮管理大量agent
02/05 20:54, 66F

02/05 21:15, 4周前 , 67F
有style很爛,像是std::chrono duration一直用count
02/05 21:15, 67F

02/05 22:14, 4周前 , 68F
推,實際用起來,rule skill,還要管理context 更新讓後
02/05 22:14, 68F

02/05 22:14, 4周前 , 69F
續接手agent 能銜接,要搞大系統不容易
02/05 22:14, 69F

02/06 05:19, 4周前 , 70F
雀有
02/06 05:19, 70F

02/09 16:28, 3周前 , 71F
那要轉回AI板嗎XDD
02/09 16:28, 71F

02/09 22:11, 3周前 , 72F
好奇大家有實際算過或是大概估算過純人工或原 PO 1
02/09 22:11, 72F

02/09 22:11, 3周前 , 73F
方法跟 2, 3 之間的產出效率提升多少嗎
02/09 22:11, 73F

02/12 10:14, 3周前 , 74F
用Ai配合完成工作 工時要放夠大 取代位置就要夠深 所以未
02/12 10:14, 74F

02/12 10:14, 3周前 , 75F
來程式碼就直接像機碼一樣沒什麼人會去看 會看的是更上層
02/12 10:14, 75F

02/12 10:14, 3周前 , 76F
的設計工作流程 這個也是只能工程師做 因為需要將ai遇到不
02/12 10:14, 76F

02/12 10:14, 3周前 , 77F
明或是困難時導回或提取代方案(甚至是實際設計邏輯) ==
02/12 10:14, 77F

02/12 10:14, 3周前 , 78F
只能說寫程式層級架的越高 產生的工作量能越大 但難度也是
02/12 10:14, 78F

02/12 10:15, 3周前 , 79F
一直疊上去(越來越多黑盒子 失去對應工具想直接從最根層
02/12 10:15, 79F

02/12 10:15, 3周前 , 80F
找問題更難)這種情況下幾乎沒辦法擺個菜的..更別說連訓練
02/12 10:15, 80F

02/12 10:15, 3周前 , 81F
都沒有的 至少現在是這樣
02/12 10:15, 81F

02/12 16:38, 3周前 , 82F
推樓上
02/12 16:38, 82F
文章代碼(AID): #1fWZVI_K (Soft_Job)
文章代碼(AID): #1fWZVI_K (Soft_Job)