[新聞] GPT-5.5 API 價格翻倍 強調成本效益更高
GPT-5.5 API 價格翻倍 強調成本效益更高
連結:https://reurl.cc/3kMegV
時間:2026年4月24日週五 上午6:14
記者署名:Doris
原文內容:OpenAI 正式發佈了 GPT-5.5 代理式模型,聲稱其達到了「用於實際工作和驅動代理程式
的新一代智能」。這款模型旨在自主執行複雜任務,能夠跨多種工具獨立完成工作,並檢
查其自身的輸出。儘管其 API 價格比上一代模型翻倍,但 OpenAI 強調 GPT-5.5 在效率
上有所提升。目前,GPT-5.5 已向付費的 ChatGPT 及 Codex 用戶開放。
提升代理式工作流程與長上下文處理能力
OpenAI 表示,GPT-5.5 在程式碼編寫與除錯、網路研究、數據分析、文件與試算表創建
,以及軟體操作方面表現突出。該模型能夠獨立地在不同工具之間切換,直至任務完成。
OpenAI 指出,GPT-5.5 的主要提升集中在代理式程式設計、電腦使用、知識工作和早期
科學研究等四個領域,這些都需要跨情境推理和長時間執行動作的能力。在針對代理式工
作流程的 Terminal-Bench 2.0 編碼基準測試中,GPT-5.5 取得 82.7% 的分數,超越前
身 GPT-5.4 的 75.1%,同時在困難數學問題上的優勢更為明顯。此外,GPT-5.5 的長上
下文處理能力也大幅改善,在 MRCR v2 基準測試中,其在 512K 至 1M Token 的上下文
長度下,準確率從 GPT-5.4 的 36.6% 躍升至 74.0%。
優勢並非全面性
然而,GPT-5.5 的優勢並非全面性。在測試實際 GitHub 問題解決能力的 SWE-Bench
Pro 基準測試中,Anthropic 的 Claude Opus 4.7 以 64.3% 的分數超越 GPT-5.5 的
58.6%。在由 Scale AI 執行的工具使用基準測試 MCP Atlas 中,GPT-5.5 獲得 75.3%,
仍落後於 Claude Opus 4.7 (79.1%) 和 Gemini 3.1 Pro (78.2%)。同時發佈的
GPT-5.5 Pro 型號,旨在作為更強大的「研究夥伴」,特別適合處理大量上下文的複雜工
作負載。在網絡安全能力方面,OpenAI 將 GPT-5.5 歸類為「高」,並表示其在
CyberGym 基準測試中相較 GPT-5.4 有所改善,達到 81.8%。
心得/評論:
剛剛測試了一下,推理能力真的有上來,之前被酸openai要下去了,這個版本要重返榮耀
了嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.91.32.112 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1776992566.A.AD2.html
推
04/24 09:06,
1小時前
, 1F
04/24 09:06, 1F
推
04/24 09:06,
1小時前
, 2F
04/24 09:06, 2F
推
04/24 09:06,
1小時前
, 3F
04/24 09:06, 3F
→
04/24 09:06,
1小時前
, 4F
04/24 09:06, 4F
→
04/24 09:08,
1小時前
, 5F
04/24 09:08, 5F
推
04/24 09:09,
1小時前
, 6F
04/24 09:09, 6F
→
04/24 09:10,
1小時前
, 7F
04/24 09:10, 7F
推
04/24 09:14,
1小時前
, 8F
04/24 09:14, 8F
推
04/24 09:15,
1小時前
, 9F
04/24 09:15, 9F
推
04/24 09:15,
1小時前
, 10F
04/24 09:15, 10F
推
04/24 09:16,
1小時前
, 11F
04/24 09:16, 11F
推
04/24 09:17,
1小時前
, 12F
04/24 09:17, 12F
推
04/24 09:19,
1小時前
, 13F
04/24 09:19, 13F
→
04/24 09:19,
1小時前
, 14F
04/24 09:19, 14F
→
04/24 09:21,
1小時前
, 15F
04/24 09:21, 15F
→
04/24 09:24,
1小時前
, 16F
04/24 09:24, 16F
推
04/24 09:24,
1小時前
, 17F
04/24 09:24, 17F
→
04/24 09:27,
59分鐘前
, 18F
04/24 09:27, 18F
→
04/24 09:30,
56分鐘前
, 19F
04/24 09:30, 19F
推
04/24 09:32,
54分鐘前
, 20F
04/24 09:32, 20F
→
04/24 09:37,
49分鐘前
, 21F
04/24 09:37, 21F
→
04/24 09:37,
49分鐘前
, 22F
04/24 09:37, 22F
推
04/24 09:41,
45分鐘前
, 23F
04/24 09:41, 23F
→
04/24 09:45,
41分鐘前
, 24F
04/24 09:45, 24F
→
04/24 09:45,
41分鐘前
, 25F
04/24 09:45, 25F
→
04/24 09:46,
40分鐘前
, 26F
04/24 09:46, 26F
→
04/24 09:46,
40分鐘前
, 27F
04/24 09:46, 27F
推
04/24 09:46,
40分鐘前
, 28F
04/24 09:46, 28F
推
04/24 09:50,
36分鐘前
, 29F
04/24 09:50, 29F
→
04/24 09:56,
30分鐘前
, 30F
04/24 09:56, 30F
推
04/24 09:57,
29分鐘前
, 31F
04/24 09:57, 31F
→
04/24 10:00,
26分鐘前
, 32F
04/24 10:00, 32F
→
04/24 10:01,
25分鐘前
, 33F
04/24 10:01, 33F
→
04/24 10:02,
24分鐘前
, 34F
04/24 10:02, 34F
推
04/24 10:04,
22分鐘前
, 35F
04/24 10:04, 35F
→
04/24 10:04,
22分鐘前
, 36F
04/24 10:04, 36F
噓
04/24 10:05,
21分鐘前
, 37F
04/24 10:05, 37F
推
04/24 10:09,
17分鐘前
, 38F
04/24 10:09, 38F
Stock 近期熱門文章
857
1490
26
50
PTT職涯區 即時熱門文章
13
73