[新聞] GPT-5.5 API 價格翻倍 強調成本效益更高

看板Stock (股票)作者 (dark hatter)時間1小時前 (2026/04/24 09:02), 編輯推噓17(18119)
留言38則, 29人參與, 17分鐘前最新討論串1/1
GPT-5.5 API 價格翻倍 強調成本效益更高 連結:https://reurl.cc/3kMegV 時間:2026年4月24日週五 上午6:14 記者署名:Doris 原文內容:OpenAI 正式發佈了 GPT-5.5 代理式模型,聲稱其達到了「用於實際工作和驅動代理程式 的新一代智能」。這款模型旨在自主執行複雜任務,能夠跨多種工具獨立完成工作,並檢 查其自身的輸出。儘管其 API 價格比上一代模型翻倍,但 OpenAI 強調 GPT-5.5 在效率 上有所提升。目前,GPT-5.5 已向付費的 ChatGPT 及 Codex 用戶開放。 提升代理式工作流程與長上下文處理能力 OpenAI 表示,GPT-5.5 在程式碼編寫與除錯、網路研究、數據分析、文件與試算表創建 ,以及軟體操作方面表現突出。該模型能夠獨立地在不同工具之間切換,直至任務完成。 OpenAI 指出,GPT-5.5 的主要提升集中在代理式程式設計、電腦使用、知識工作和早期 科學研究等四個領域,這些都需要跨情境推理和長時間執行動作的能力。在針對代理式工 作流程的 Terminal-Bench 2.0 編碼基準測試中,GPT-5.5 取得 82.7% 的分數,超越前 身 GPT-5.4 的 75.1%,同時在困難數學問題上的優勢更為明顯。此外,GPT-5.5 的長上 下文處理能力也大幅改善,在 MRCR v2 基準測試中,其在 512K 至 1M Token 的上下文 長度下,準確率從 GPT-5.4 的 36.6% 躍升至 74.0%。 優勢並非全面性 然而,GPT-5.5 的優勢並非全面性。在測試實際 GitHub 問題解決能力的 SWE-Bench Pro 基準測試中,Anthropic 的 Claude Opus 4.7 以 64.3% 的分數超越 GPT-5.5 的 58.6%。在由 Scale AI 執行的工具使用基準測試 MCP Atlas 中,GPT-5.5 獲得 75.3%, 仍落後於 Claude Opus 4.7 (79.1%) 和 Gemini 3.1 Pro (78.2%)。同時發佈的 GPT-5.5 Pro 型號,旨在作為更強大的「研究夥伴」,特別適合處理大量上下文的複雜工 作負載。在網絡安全能力方面,OpenAI 將 GPT-5.5 歸類為「高」,並表示其在 CyberGym 基準測試中相較 GPT-5.4 有所改善,達到 81.8%。 心得/評論: 剛剛測試了一下,推理能力真的有上來,之前被酸openai要下去了,這個版本要重返榮耀 了嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.91.32.112 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1776992566.A.AD2.html

04/24 09:06, 1小時前 , 1F
屌打隔壁4.7
04/24 09:06, 1F

04/24 09:06, 1小時前 , 2F
價格翻倍是要重返榮耀啥
04/24 09:06, 2F

04/24 09:06, 1小時前 , 3F
我用Codex-5.4寫程式 覺得它很會飄 常常產生code
04/24 09:06, 3F

04/24 09:06, 1小時前 , 4F
偏離主題 即使用AGENT.md 規範它也一樣
04/24 09:06, 4F

04/24 09:08, 1小時前 , 5F
但是好處就基本上不限流 沒事就用還行
04/24 09:08, 5F

04/24 09:09, 1小時前 , 6F
Chatgpt 早就不用了 爛到有剩
04/24 09:09, 6F

04/24 09:10, 1小時前 , 7F
蠻多人跳到gemini跟clude
04/24 09:10, 7F

04/24 09:14, 1小時前 , 8F
不上不下還這麼貴 我看難喔
04/24 09:14, 8F

04/24 09:15, 1小時前 , 9F
看脆上蠻獲好評的
04/24 09:15, 9F

04/24 09:15, 1小時前 , 10F
Claude 太貴了 Pro方案問兩個問題就要等5個小時
04/24 09:15, 10F

04/24 09:16, 1小時前 , 11F
gpt感覺不出有什麼大幅進步了
04/24 09:16, 11F

04/24 09:17, 1小時前 , 12F
隔壁4.7跑分完就變智障了根本沒屁用
04/24 09:17, 12F

04/24 09:19, 1小時前 , 13F
屌打gemini
04/24 09:19, 13F

04/24 09:19, 1小時前 , 14F
二樓是不知道Claude本來比OpenAI貴多少嗎 嘻嘻
04/24 09:19, 14F

04/24 09:21, 1小時前 , 15F
沒有cowork的功能 沒用
04/24 09:21, 15F

04/24 09:24, 1小時前 , 16F
5.5升級有感,對長任務的效率更高了
04/24 09:24, 16F

04/24 09:24, 1小時前 , 17F
Codex好用 目前已從claude轉向用這個
04/24 09:24, 17F

04/24 09:27, 59分鐘前 , 18F
有競爭是好事 不過claude我大哥
04/24 09:27, 18F

04/24 09:30, 56分鐘前 , 19F
Claude現在是垃圾 貴又降智嚴重
04/24 09:30, 19F

04/24 09:32, 54分鐘前 , 20F
早就沒用了 太貴了
04/24 09:32, 20F

04/24 09:37, 49分鐘前 , 21F
井蛙整天臭codex 井到笑死 claude現在更臭
04/24 09:37, 21F

04/24 09:37, 49分鐘前 , 22F
現在還有人要吹gemini也是笑死
04/24 09:37, 22F

04/24 09:41, 45分鐘前 , 23F
欸欸欸 我前幾天才跳到Claude誒
04/24 09:41, 23F

04/24 09:45, 41分鐘前 , 24F
現在換gemini有點智障
04/24 09:45, 24F

04/24 09:45, 41分鐘前 , 25F
有競爭是好事+1
04/24 09:45, 25F

04/24 09:46, 40分鐘前 , 26F
拿他分析數值沒強調要多方查證會給你完全不一樣的
04/24 09:46, 26F

04/24 09:46, 40分鐘前 , 27F
結果
04/24 09:46, 27F

04/24 09:46, 40分鐘前 , 28F
價格翻倍也能吹喔XD
04/24 09:46, 28F

04/24 09:50, 36分鐘前 , 29F
沒在接觸使用AI才會臭codex
04/24 09:50, 29F

04/24 09:56, 30分鐘前 , 30F
哈哈哈,繼續當免費仔,他的翻譯還不錯
04/24 09:56, 30F

04/24 09:57, 29分鐘前 , 31F
Gemini最近一直亂給答案
04/24 09:57, 31F

04/24 10:00, 26分鐘前 , 32F
AI用久了答案都會亂飄很正常
04/24 10:00, 32F

04/24 10:01, 25分鐘前 , 33F
貴代表他專注在獲利 只想認真服務高階用戶
04/24 10:01, 33F

04/24 10:02, 24分鐘前 , 34F
那些整天問些智障問題的免費用戶不是他們想要的
04/24 10:02, 34F

04/24 10:04, 22分鐘前 , 35F
所以月訂閱就好,不要一直訂一年的,過陣子龍頭又
04/24 10:04, 35F

04/24 10:04, 22分鐘前 , 36F
換人
04/24 10:04, 36F

04/24 10:05, 21分鐘前 , 37F
notebooklm屌打
04/24 10:05, 37F

04/24 10:09, 17分鐘前 , 38F
notebooklm免費又比你強,真的笑死
04/24 10:09, 38F
文章代碼(AID): #1fwi4shI (Stock)
文章代碼(AID): #1fwi4shI (Stock)