[新聞] 告別GPU OpenAI推出極速晶圓引擎模型

看板Stock (股票)作者 (單推人) 每日換婆 (1/1)時間2天前 (2026/02/13 11:13), 編輯推噓98(103569)
留言177則, 102人參與, 1天前最新討論串1/2 (看更多)
原文標題: Introducing OpenAI GPT-5.3-Codex-Spark Powered by Cerebras 原文連結: https://www.cerebras.ai/blog/openai-codexspark 發布時間: 2026-02-12 記者署名: James Wang 原文內容: Today, we’re announcing that OpenAI’s new GPT-5.3-Codex-Spark model, powered b y Cerebras, is available in research preview. This marks the first release in ou r collaboration between Cerebras and OpenAI. Codex-Spark is designed for real-ti me software development where responsiveness matters as much as intelligence. Po wered by the Cerebras Wafer-Scale Engine, it runs at over 1,000 tokens/s, enabli ng near-instant feedback in live coding environments. 今日,我們正式發布由 Cerebras 技術驅動的 OpenAI 全新模型 GPT-5.3-Codex-Spark,並 開放研究預覽。這是 OpenAI 與 Cerebras 合作的首個里程碑。Codex-Spark 專為對響應速 度要求極高的即時軟體開發而設計。憑藉 Cerebras 晶圓級引擎(Wafer-Scale Engine)的 強大效能,其執行速度突破每秒 1,000 個標記(tokens/s),為即時程式開發環境提供近 乎瞬時的回饋。 Agentic coding has fundamentally changed software development. For the first tim e, machines can autonomously work for hours or days without human supervision. B ut this mode of interaction can also leave developers feeling out of the loop wi th long wait times and less opportunity to direct the work. As software developm ent is iterative, developers need to inject taste, direction, and sensibility al ong the way. Codex-Spark is designed for this kind of real-time, iterative work. It is fast, responsive, and steerable, putting the developer back in the driver ’s seat. Codex-Spark is a smaller version of Codex optimized for fast inference. On agent ic software engineering benchmarks such as SWE-Bench Pro and Terminal-Bench 2.0, it produces more capable responses than GPT-5.1-Codex-mini while completing tas ks in a fraction of the time. Codex-Spark excels at making precise edits, revising plans, and answering contex tual questions about your codebase. It’s a fast way to visualize new layouts, r efine styling, and test new interface changes. 「代理型編碼」(Agentic coding)已從根本上改變了軟體開發,使機器能獨立運作數小時 甚至數日。然而,這種模式也可能讓開發者因漫長的等待而產生疏離感,減少了引導工作的 機會。由於軟體開發本質上是反覆迭代的過程,開發者需要隨時注入審美、方向感與判斷力 。Codex-Spark 正是為此類即時、互動式工作而生;它反應迅速且易於引導,讓開發者重新 掌握主導權。 Codex-Spark 是針對快速推論(Inference)優化的 Codex 精簡版本。在 SWE-Bench Pro 與 Terminal-Bench 2.0 等代理型軟體工程基準測試中,它的表現優於 GPT-5.1-Codex-min i,且完成任務的時間僅需後者的一小部分。 Codex-Spark 擅長進行精確編輯、修訂計畫,以及回答關於程式碼庫的脈絡問題。對於視覺 化新佈局、精煉樣式及測試介面更動,它提供了一種極速的實現方式。 "Cerebras has been a great engineering partner, and we’re excited about adding fast inference as a new platform capability. Bringing wafer-scale compute into p roduction gives us a new way to keep Codex responsive for latency-sensitive work , and we’re excited to learn from developer feedback on how to compose our comp ute capabilities into one smooth workflow," said Sachin Katti, Head of Industria l Compute at OpenAI. OpenAI 工業運算負責人 Sachin Katti 表示:「Cerebras 是傑出的工程合作夥伴,我們很 高興將『快速推論』納入平台能力。將晶圓級運算導入生產環境,為維持 Codex 在延遲敏 感型任務中的響應速度提供了全新途徑。我們期待透過開發者的回饋,學習如何將這些運算 能力整合進流暢的工作流中。」 Codex-Spark is just a taste of what’s possible on Cerebras hardware. Our broade r goal is to accelerate a wide spectrum of AI workloads across both real-time an d asynchronous use cases. Our purpose-built Wafer-Scale Engine features the larg est on-chip memory of any AI processor, enabling high-speed inference at thousan ds of tokens per second per user. The architecture scales out to thousands of sy stems, extending fast memory capacity into the multi-terabyte domain to support trillion-parameter models for both training and inference. We expect to bring th is ultra-fast inference capability to the largest frontier models in 2026. Codex-Spark is rolling out as a research preview for ChatGPT Pro users across th e Codex app, CLI, and VS Code extension, with API access rolling out to select d esign partners. Try Codex-Spark rolling out today. Codex-Spark 僅是 Cerebras 硬體潛力的初步展現。我們的長遠目標是加速涵蓋即時與異步 (Asynchronous)情境的全方位 AI 工作負載。我們專為 AI 打造的晶圓級引擎擁有業界最 大的片上記憶體(On-chip memory),可支援每位使用者每秒數千個標記的極速推論。該架 構可擴展至數千台系統,將高速記憶體容量提升至多 TB 等級,足以支援兆級參數模型的訓 練與推論。我們預計在 2026 年將此極速推論能力導入最強大的前沿模型中。 Codex-Spark 研究預覽版即日起向 ChatGPT Pro 用戶推送,支援 Codex App、CLI 及 VS C ode 擴充功能;API 存取權限則將逐步開放給特定設計合作夥伴。歡迎今日立即體驗 Codex -Spark。 心得/評論: 上個月我有發了兩家合作的消息, 今天正式推出第一個合作產品,推理速度破千的GPT-5! 給大家一個比例尺:平常用的GPT-5速度不到一百。 Cerebras的台積電5奈米晶圓引擎WSE-3是世界唯一的晶圓運算, 由於能直接載入整個AI模型到運算單元上, 速度是GPU的數十倍, 這是Cerebras成立以來第一個企業級應用, 或將衝擊整個GPU市場。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.79.16.163 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1770952439.A.F56.html

02/13 11:16, 2天前 , 1F
台積電噴
02/13 11:16, 1F

02/13 11:16, 2天前 , 2F
都不用gpu NV要涼了
02/13 11:16, 2F

02/13 11:17, 2天前 , 3F
還是要台積電...
02/13 11:17, 3F

02/13 11:18, 2天前 , 4F
會不會有人不玩了?….
02/13 11:18, 4F

02/13 11:18, 2天前 , 5F
關鍵字 台積電
02/13 11:18, 5F

02/13 11:19, 2天前 , 6F
這超大威化餅真的能吃啊...?太厲害了
02/13 11:19, 6F

02/13 11:19, 2天前 , 7F
又是台積電
02/13 11:19, 7F

02/13 11:20, 2天前 , 8F
GG噴 NV哭
02/13 11:20, 8F

02/13 11:20, 2天前 , 9F
沒人在乎
02/13 11:20, 9F

02/13 11:20, 2天前 , 10F
GPU需求下修? GPU市場要被衝擊了?
02/13 11:20, 10F

02/13 11:21, 2天前 , 11F
黃爸直接砸錢買下來掐死你
02/13 11:21, 11F

02/13 11:22, 2天前 , 12F
NV 88
02/13 11:22, 12F

02/13 11:23, 2天前 , 13F
能訓練再來說取代gpu 都幾年了還在亂下標 不專業
02/13 11:23, 13F

02/13 11:24, 2天前 , 14F
還是要台積 結案
02/13 11:24, 14F

02/13 11:24, 2天前 , 15F
推論跟訓練本來尋求就不一樣
02/13 11:24, 15F

02/13 11:24, 2天前 , 16F
老黃:我不投資你就扯我後腿?
02/13 11:24, 16F

02/13 11:24, 2天前 , 17F
跟去年說Deepseek 會終結運算需求一樣的知識水準
02/13 11:24, 17F

02/13 11:28, 2天前 , 18F
台積電
02/13 11:28, 18F

02/13 11:28, 2天前 , 19F
xddd 啥都要扯到台積電 2330真的無腦多
02/13 11:28, 19F

02/13 11:28, 2天前 , 20F
GPU is over!
02/13 11:28, 20F

02/13 11:28, 2天前 , 21F
沒人在乎
02/13 11:28, 21F

02/13 11:29, 2天前 , 22F
又又又又又要被取代了
02/13 11:29, 22F

02/13 11:29, 2天前 , 23F
看成曲速引擎 想說有曲速AI引擎都出來了還不飛天
02/13 11:29, 23F

02/13 11:30, 2天前 , 24F
誰代工?
02/13 11:30, 24F

02/13 11:31, 2天前 , 25F
誰用鏟子 鏟子是什麼形狀 不重要
02/13 11:31, 25F

02/13 11:33, 2天前 , 26F
黃老爺要哭了
02/13 11:33, 26F

02/13 11:33, 2天前 , 27F
台積電又噴
02/13 11:33, 27F

02/13 11:33, 2天前 , 28F
滿庫存的GPU沒電力用?投放廣告?
02/13 11:33, 28F

02/13 11:35, 2天前 , 29F
亂下標才有高能兒看啊 嘻嘻
02/13 11:35, 29F

02/13 11:36, 2天前 , 30F
管你多快,沒電都算庫存
02/13 11:36, 30F

02/13 11:36, 2天前 , 31F
cpu藥丸惹 gpu藥丸惹 tpu藥丸惹
02/13 11:36, 31F

02/13 11:36, 2天前 , 32F
超巨大那個嗎? 成本很高的說
02/13 11:36, 32F

02/13 11:38, 2天前 , 33F
算這麼快 CPO該噴了吧
02/13 11:38, 33F

02/13 11:40, 2天前 , 34F
蛋雕
02/13 11:40, 34F

02/13 11:41, 2天前 , 35F
難怪老黃說1000億投資沒有確定 果然被骨仔
02/13 11:41, 35F

02/13 11:41, 2天前 , 36F
OAI還有錢喔 嘻嘻
02/13 11:41, 36F

02/13 11:41, 2天前 , 37F
台雞雞受惠 ? 封裝測試也會受惠 ?
02/13 11:41, 37F

02/13 11:42, 2天前 , 38F
又是台積電代工,賣鏟子怎麼輸阿
02/13 11:42, 38F

02/13 11:42, 2天前 , 39F
NV掰
02/13 11:42, 39F
還有 98 則推文
02/13 13:03, 2天前 , 138F
好險還有台積,但我的alphabet是不是下去了
02/13 13:03, 138F

02/13 13:07, 2天前 , 139F
孫正義那300億看來撐不到2027了
02/13 13:07, 139F

02/13 13:08, 2天前 , 140F
硬體回答說只有GG 三星 INTEL有能力。但只有GG有跟
02/13 13:08, 140F

02/13 13:08, 2天前 , 141F
它們完成前面兩代的經驗。所以還是GG的天下
02/13 13:08, 141F

02/13 13:15, 2天前 , 142F
看產量吧,量少只能當專武用
02/13 13:15, 142F

02/13 13:16, 2天前 , 143F
甲骨文:幹 要呷骨了
02/13 13:16, 143F

02/13 13:19, 2天前 , 144F
從燒錢跑道換到另一個燒錢跑道
02/13 13:19, 144F

02/13 13:21, 2天前 , 145F
老黃6090賣五萬我就原諒你
02/13 13:21, 145F

02/13 13:23, 2天前 , 146F
取代不了 因為這個超級貴
02/13 13:23, 146F

02/13 13:23, 2天前 , 147F
太太太 咦 五奈米
02/13 13:23, 147F

02/13 13:26, 2天前 , 148F
反正繼續噴
02/13 13:26, 148F

02/13 13:29, 2天前 , 149F
openai就是不長進,gemini 聰明又博學
02/13 13:29, 149F

02/13 13:30, 2天前 , 150F
2330:你們打完叫我
02/13 13:30, 150F

02/13 13:31, 2天前 , 151F
問啥大家不看好這架構 不是很符合AI發展的需求嗎
02/13 13:31, 151F

02/13 13:31, 2天前 , 152F
良率問題可能也被GG解決了
02/13 13:31, 152F

02/13 13:35, 2天前 , 153F
因為很貴
02/13 13:35, 153F

02/13 13:38, 2天前 , 154F
整天叫,去空nv阿
02/13 13:38, 154F

02/13 13:41, 2天前 , 155F
先搶的到產能再說
02/13 13:41, 155F

02/13 13:55, 2天前 , 156F
2奈米輝達不用亞麻要搶喔 你敢退單嗎
02/13 13:55, 156F

02/13 13:56, 2天前 , 157F
想太多 現在2奈米廠商排隊搶 輝達寧可捏著也不願意
02/13 13:56, 157F

02/13 13:56, 2天前 , 158F
退單
02/13 13:56, 158F

02/13 13:57, 2天前 , 159F
亞麻T4晶片現在擠不進去單 你敢退亞麻直接塞進來
02/13 13:57, 159F

02/13 14:02, 2天前 , 160F
先不論成品,這個問題是本來整片晶圓就算良率低還是
02/13 14:02, 160F

02/13 14:02, 2天前 , 161F
可以做,那這個一整片的,良率需要多少?
02/13 14:02, 161F

02/13 14:06, 2天前 , 162F
藥丸
02/13 14:06, 162F

02/13 14:24, 2天前 , 163F
電力is over
02/13 14:24, 163F

02/13 15:07, 2天前 , 164F
看來今天晚上又要七崩賢
02/13 15:07, 164F

02/13 15:30, 2天前 , 165F
好好用的模型,可惜還不能識別圖片
02/13 15:30, 165F

02/13 15:50, 2天前 , 166F
這篇文章是要炒TSMC的股票嗎?本文根本沒提到TSMC
02/13 15:50, 166F

02/13 15:51, 2天前 , 167F
Cerebras的WSE-3提到TSMC的新聞都去年的事了
02/13 15:51, 167F

02/13 15:52, 2天前 , 168F
除非看到WSE-3因為市場需求需要增加晶圓訂貨量
02/13 15:52, 168F

02/13 15:53, 2天前 , 169F
不然這新聞跟TSMC根本沒啥關聯...
02/13 15:53, 169F

02/13 16:05, 2天前 , 170F
老黃上次來台灣提前暗示了?
02/13 16:05, 170F

02/13 16:15, 2天前 , 171F
你們要怎麼用鏟子我不管
02/13 16:15, 171F

02/13 17:16, 2天前 , 172F
台積電又贏
02/13 17:16, 172F

02/13 18:19, 2天前 , 173F
繼續吹牛,看何時被看破手腳
02/13 18:19, 173F

02/13 19:19, 2天前 , 174F
顯卡可以降價了嗎
02/13 19:19, 174F

02/13 23:57, 2天前 , 175F
訓練需要GPU 推理TPU的效率比較好…GG 贏
02/13 23:57, 175F

02/14 08:12, 1天前 , 176F
這很難啦,封裝、冷卻系統怎麼接?
02/14 08:12, 176F

02/14 13:38, 1天前 , 177F
所以成本更高?
02/14 13:38, 177F
文章代碼(AID): #1fZfRtzM (Stock)
文章代碼(AID): #1fZfRtzM (Stock)