Re: [討論] Claude開始水token

看板Tech_Job (科技人)作者 (Channel Coding)時間3周前 (2026/04/21 04:53), 3周前編輯推噓32(320118)
留言150則, 28人參與, 2周前最新討論串2/3 (看更多)
應該會吃緊啊 現在矽谷一堆PR都用claude審 搭配人類 我們算過 一個複雜點PR claude大概花費5~20美金 然後品質比較跟人類比 只要正確搭配人類 可以省下30min ~1hr 我們這邊工時一個人都是100美金/hr起跳 現在都是用時間和token費用和品質在換算 結論就是token狂燒 幹死對家 比誰的錢多和迭代速度快 然後我們PM也捲起來 跳下來開始幹實作 和對接crossfun team 在模型設計上codex使用體感還是比claude 好 這真是出乎意料(參照下方) 有傳言codex是MoE設計 claude是dense transformer 理論上後者的邏輯順序會比較好 但缺點就是計算量和速度偏慢 前者是一定會快的 https://reurl.cc/R2LaWD 但很吃Harness上下文管理設計不然邏輯順序會亂掉 現在進行式就是 token費用 vs 人類價值 vs 速度產出 vs 系統品質搭建 看到上一篇說LLM/Agent只就只是個語言系統....嗯嗯恩 QQ 我好羨慕那個世界線 現在Agent就幹這幾件事 拆解問題 選擇工具 組合工具解問題 工具結果驗證 已經不在是個當純語言模型的問題了 這也是為啥Harness設計最近很夯 尤其最近一篇ICLR paper已經驗證 SFT去訓練模型會打輸模型加個好的Context設計 原因就是SFT會造成information collapse和失去reasoning ability -- 人類跟猴子差別就是 會用工具 好的Agent就是會用工具 模型設計現在為啥RL會夯 就是因為RL在訓練模型要跟現實工具環境做交互影響來解決問題 已經不在是"語言"模型 比方說claude前幾代 當模型快用完context資源 會開始把答案縮短 來增加回合 逼得人類學在context上在系統架構 不斷要code來選曲 重新釋放 但現在最新模型 已經會自己去管context長度控制了 所以現在模型owner大概就是走向RL+ Context設計 SFT除了在少數落地場景需要速度 使用範圍性越來越下降 至於上篇說 沒有新血補入 實際上是有 只是會走向像是精英運動系統一樣 大學生被挑選上實習這些人 通常可以畢業正職加入 但這些名額是限量的 ※ 引述《yamakazi (大安吳彥祖)》之銘言: : 包含4.6 4.7 : https://youtu.be/J-fgEGfskaI?si=OXtbInZEST1ODp4_
: 跟影片前半段一樣 : 我要放棄claude轉gemini : 跟這個影片一樣 : 我今天幫一個同事安裝公司內部的wiki mcp : 我自己也裝過,很簡單一次提示詞就好 : 但幫我同事裝的時候 : 居然先問一堆問題,又寫了一個md : 然後開始寫python還一直寫錯 : 他媽的裝mcp為何要寫md和python : 有夠坑錢 : ----- : Sent from JPTT on my iPhone -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 98.37.67.135 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1776718380.A.23A.html ※ 編輯: LDPC (98.37.67.135 美國), 04/21/2026 05:29:23 ※ 編輯: LDPC (98.37.67.135 美國), 04/21/2026 05:54:17

04/21 06:28, 3周前 , 1F
LPDC大 前面那篇自刪很可惜 其實這系列討
04/21 06:28, 1F

04/21 06:28, 3周前 , 2F
論串蠻有意義的 不知為何要自刪呢 畢竟回
04/21 06:28, 2F

04/21 06:28, 3周前 , 3F
文章也是要花時間的
04/21 06:28, 3F

04/21 08:37, 3周前 , 4F
推推
04/21 08:37, 4F

04/21 09:47, 3周前 , 5F
現在還是有90%以上的人覺得AI很笨
04/21 09:47, 5F

04/21 09:47, 3周前 , 6F
真的是不同世界.....
04/21 09:47, 6F

04/21 10:02, 3周前 , 7F
你當然要羨慕了。你們堅信這能取代新人
04/21 10:02, 7F

04/21 10:02, 3周前 , 8F
堅信這等同於真正的智慧,然後配合AI
04/21 10:02, 8F

04/21 10:03, 3周前 , 9F
廠商的模型及其開發的輔助工具上面
04/21 10:03, 9F

04/21 10:04, 3周前 , 10F
搞各種嘗試,結果最後連自己的文章也
04/21 10:04, 10F

04/21 10:04, 3周前 , 11F
不敢把「只要正確搭配人類」前提拿掉?
04/21 10:04, 11F

04/21 10:04, 3周前 , 12F
你本質上還是在一個滿不穩定的基礎上
04/21 10:04, 12F

04/21 10:06, 3周前 , 13F
跟模型難預測的行為對賭。你有可能賭贏
04/21 10:06, 13F

04/21 10:06, 3周前 , 14F
但也有可能賭輸,只要賭輸時有風度一點
04/21 10:06, 14F

04/21 10:06, 3周前 , 15F
不用顧著講別人不同時間線或落伍即可。
04/21 10:06, 15F

04/21 10:08, 3周前 , 16F
這也就是為什麼會說可能驚訝發現提升的
04/21 10:08, 16F

04/21 10:08, 3周前 , 17F
效率雖不能說沒有,但不如預期高。
04/21 10:08, 17F

04/21 10:10, 3周前 , 18F
賭贏的時候爽歪歪,賭輸的時候額外奉還
04/21 10:10, 18F

04/21 10:12, 3周前 , 19F
最後,這裡的成本是總持有成本嗎?
04/21 10:12, 19F

04/21 10:12, 3周前 , 20F
若不是的話,記得把試探各種工具組合
04/21 10:12, 20F

04/21 10:13, 3周前 , 21F
以及設計各種測試情境及評估指標的時間
04/21 10:13, 21F

04/21 10:13, 3周前 , 22F
算進去。總持有成本算出來才能看綜效。
04/21 10:13, 22F

04/21 10:19, 3周前 , 23F
有綜效才能客觀評估是否真有省到人力
04/21 10:19, 23F

04/21 11:02, 3周前 , 24F
推樓上 會用AI不是什麼稀有技能
04/21 11:02, 24F

04/21 11:02, 3周前 , 25F
AI超神or撞牆大家都遇過 AI整體增
04/21 11:02, 25F

04/21 11:02, 3周前 , 26F
加生產力大家都同意 但計算成本的時
04/21 11:02, 26F

04/21 11:02, 3周前 , 27F
候永遠只算省下多少時間 卻不算為了
04/21 11:02, 27F

04/21 11:02, 3周前 , 28F
用這套系統額外付出了什麼成本
04/21 11:02, 28F

04/21 11:29, 3周前 , 29F
覺得ai很笨的人大概率自己用不好ai 大
04/21 11:29, 29F

04/21 11:29, 3周前 , 30F
部分人當成進階的搜索引擎包括我 但可
04/21 11:29, 30F

04/21 11:29, 3周前 , 31F
想見會用的會把效率上到什麼程度 矽谷本
04/21 11:29, 31F

04/21 11:29, 3周前 , 32F
來就是一神帶數坑的競爭環境 看過thinki
04/21 11:29, 32F

04/21 11:29, 3周前 , 33F
ng game體會就很深 個人認為可以不用
04/21 11:29, 33F

04/21 11:29, 3周前 , 34F
很會用ai 但資產一定要有ai 部位來hedg
04/21 11:29, 34F

04/21 11:29, 3周前 , 35F
e ai impact
04/21 11:29, 35F

04/21 12:51, 3周前 , 36F
坦白說 AI有幫助沒人不承認 但現在的幫助都
04/21 12:51, 36F

04/21 12:51, 3周前 , 37F
是只更快的開發代碼 但很多人都忘了 對一間
04/21 12:51, 37F

04/21 12:51, 3周前 , 38F
軟體公司而言 每一行代碼都是負債 不過他們
04/21 12:51, 38F

04/21 12:51, 3周前 , 39F
也不在意 現在的風氣都是趕快做趕快上 有問
04/21 12:51, 39F
還有 73 則推文
04/21 21:48, 3周前 , 113F
垃圾 也是一種難以理解的思維 除非你
04/21 21:48, 113F

04/21 21:49, 3周前 , 114F
認為他有一天終會停滯或是不會再進步
04/21 21:49, 114F

04/21 22:40, 3周前 , 115F
VC的錢燒完AI provider要盈利的時候,一個t
04/21 22:40, 115F

04/21 22:40, 3周前 , 116F
oken如實反映data center的價格才會是泡沫
04/21 22:40, 116F

04/21 22:40, 3周前 , 117F
的第一個真正的引爆點
04/21 22:40, 117F

04/21 22:40, 3周前 , 118F
一直看不懂這麼貴的東西拿來聊天,自動完成
04/21 22:40, 118F

04/21 22:40, 3周前 , 119F
或者做PR審核這種工作有什麼可持續性
04/21 22:40, 119F

04/21 23:28, 3周前 , 120F
token的成本會降啊
04/21 23:28, 120F

04/21 23:55, 3周前 , 121F
用真空管的當然無法理解電晶體的坪效 XD
04/21 23:55, 121F

04/22 02:17, 3周前 , 122F
然而token的價格只能替代超高薪的時間 對
04/22 02:17, 122F

04/22 02:17, 3周前 , 123F
手是工人智慧
04/22 02:17, 123F

04/22 02:50, 3周前 , 124F
化療來自不小心的毒氣外洩發現細胞殺法
04/22 02:50, 124F

04/22 02:51, 3周前 , 125F
最近流行的瘦瘦針也是治療糖尿病的意外發現
04/22 02:51, 125F

04/22 02:53, 3周前 , 126F
現代AI自己都是GPU不務正業的意外想法
04/22 02:53, 126F

04/22 09:44, 3周前 , 127F
(偷偷說-網路上找得到前面自刪的文)
04/22 09:44, 127F

04/22 12:00, 3周前 , 128F
04/22 12:00, 128F

04/22 13:07, 3周前 , 129F
這麼卷那你們有賺爛嗎
04/22 13:07, 129F

04/22 13:09, 3周前 , 130F
最近Copilot, Anthropic 開始調高模型入
04/22 13:09, 130F

04/22 13:09, 3周前 , 131F
門門檻了,錢還是有一天會燒完,再捲捲不
04/22 13:09, 131F

04/22 13:09, 3周前 , 132F
出新的商業模式,只能跟中國一樣無限內卷
04/22 13:09, 132F

04/22 13:09, 3周前 , 133F
卷走人力成本
04/22 13:09, 133F
現在AI落地2026很明顯就是toB 這塊就是垂直領域AI 我股版已經說過了 以法律為例 代表公司Harvey 今年ARR已經飆到200Million(年度經常性收入) 從去年低於100 Million 今年營收為指數成長 它所造成的影響 就是初階律師失業率提高 開缺數量下降 其他各自垂直領域龍頭 其他還有IT 會計 財務 廣告 金融 都開始在影響就業 https://money.udn.com/money/story/5599/9426489 這也是為何Andrej Karpathy 職位評分工具 有計算過哪些職缺會被影響到 現在紅衫資本top30公司 全部都是SAAS相關 所有的營收都在瘋狂成長 PM職缺現在都可以被otter AI給影響到 更別說有的是電影產業 我在股板也講過 (阿凡達 火與燼) 音樂部分有spotfiy AI創作音樂 如果這些認知跟你不一樣 你只是還沒看到 中國已經在用skills 練化人類技能 這也是為何所有公司都開始走coding agent 因為他是垂直AI產業線最重要 因此xAI重組 合作cursor 而google創辦人成立了一個突擊隊在改善coding agent 而openAI 放棄sora 而著重在 codex 原因就是2026 2月 所有的風向都指向 toB的營收是最好賺的 麥當勞客服引入cladue, Walmart販賣服務也引入openAI 繳稅軟體傳統SAAS 現在都馬上去跟openAI合作 垂直AI -> coding agent -> 傳統SAAS市場被分割 ->辦公室產業縮減 這也是為何上文提到Harness很重要 他就是垂直AI工作重要的一環 基於此 所有一線公司都開始coding tool agent大競賽 至於速度跟品質 現在大家都用新的思維去看 打個比方 在c語言出來前 你會去看組語 但c語言後 你根本不會去管組語 你注重的是c語言架構的維護性 同樣的 現在的coding agent 就是"自然語言"編成 換言之 你寫程式 已經邁向更高階的語言 ->人類語言 而且 這溝通是雙向的 不是像以前人類寫c單方向 比方說 你在清掃屎山 你第一步會叫ai把系統state machine先畫出來 這光是針對傳統人類去讀屎山 就加速對系統的理解程度 接者拆解系統去設計 你系統設計就變得很重要 而你跟AI協作 就是一種雙向的用人類語言 寫程式 你過去的手寫code 就類似於手寫組語一樣 你會在效率上大幅改善 你會去用更大的思維去看這系統去設計 包含測試邊界 corner case 反過來說 如果矽谷這邊都如同你們說 就是砸錢拼速度 不顧品質 那為何在2026 token數量 燒的程度已經指數上漲程度(詳情看股版) 以及為何原本持懷疑態度的果家 都開始送人 去AI coding訓練營 直接拿claude code強迫員工用AI寫程式? 甚至矽谷有許多公司在印度開始裁員 嘗試用AI更多自動化 這意味者 隨者token 費用越低 人類效能低成本國家 和自動化系統的競賽也會開始 有一件很殘酷事情是 這兩年是窗口期 它允許所有不是從事AI的人轉進這領域 允許你使用AI tool 狂燒token 用AI tool視角去搭建系統 打磨產品 因為這市場才開始 畢竟沒有這樣的人才 所有的環境都是給第一代人 去嘗試打磨系統 兩年後 等到市場有足夠的經驗人士 token花費就不會讓你邊試錯邊去學習怎樣用ai外掛 而是會傾向雇用有用AI設計產品經驗的人 因此大家都知道 瘋狂的在累積經驗 打磨產品 直到大門關上那日 這類型工作就叫做GenAI Engieer 任務包含如何用產品思維對接 橫向整合 現在面試風格已經轉成 給你個產品系統 大概會是你平常手寫需要兩到三天才能完成任務 這產品就是有一半的code 你在一個小時就是拿AI tool 去先拆解架構 叫AI把系統畫圖給你 跟AI協作 然後從這裡去完成剩下任務 包含怎樣寫test 以及以後如何擴展系統 當你在懷疑這件事情時候 你就在變相的在這陣痛期轉換選擇不進入這扇門 僅此罷了

04/22 14:32, 3周前 , 134F
推推
04/22 14:32, 134F
※ 編輯: LDPC (67.194.225.207 美國), 04/22/2026 14:54:19 ※ 編輯: LDPC (67.194.225.207 美國), 04/22/2026 14:56:39

04/22 15:04, 3周前 , 135F
感謝分享,我很認同coding Agent已經確實
04/22 15:04, 135F

04/22 15:04, 3周前 , 136F
改變整個生態,不管是不是軟體相關的,也
04/22 15:04, 136F

04/22 15:04, 3周前 , 137F
不可能回到以前手打程式的時代。只是很好
04/22 15:04, 137F

04/22 15:04, 3周前 , 138F
奇像你們走在前緣是否真的有賺,還是大家
04/22 15:04, 138F

04/22 15:04, 3周前 , 139F
只是狂推生產力、狂堆算力,把可以自動化
04/22 15:04, 139F

04/22 15:04, 3周前 , 140F
的自動化然後就沒然後了
04/22 15:04, 140F

04/22 15:06, 3周前 , 141F
認同Andrej Karpathy 說的embrace expone
04/22 15:06, 141F

04/22 15:06, 3周前 , 142F
ntials
04/22 15:06, 142F

04/22 20:28, 3周前 , 143F
LDAI大救我 我快失業了QQ
04/22 20:28, 143F

04/22 20:41, 3周前 , 144F
軟工變要走PLTR模式 直接對接系統問題
04/22 20:41, 144F

04/23 09:04, 3周前 , 145F
AI正在以非常快的速度取代低階重複性
04/23 09:04, 145F

04/23 09:04, 3周前 , 146F
數位工作,矽谷環境很樂意擁抱並測試
04/23 09:04, 146F

04/23 09:04, 3周前 , 147F
新生產工具,這五年的變化非常劇烈
04/23 09:04, 147F

04/23 17:39, 3周前 , 148F
測試也是ai在寫在弄啊
04/23 17:39, 148F

04/25 14:36, 2周前 , 149F
04/25 14:36, 149F

04/27 17:19, 2周前 , 150F
謝謝大大無私分享,我感覺錢途茫茫QQ
04/27 17:19, 150F
文章代碼(AID): #1fvf8i8w (Tech_Job)
文章代碼(AID): #1fvf8i8w (Tech_Job)