[新聞] 字節跳動「豆包 2.0」上線!性能對標GPT-5.2、Gemini 3 Pro 但成本更低

看板Stock (股票)作者 (I Need Some Sleep)時間13小時前 (2026/02/15 23:50), 編輯推噓66(748116)
留言198則, 94人參與, 2小時前最新討論串1/1
原文標題:字節跳動「豆包 2.0」上線!性能對標GPT-5.2、Gemini 3 Pro 但成本更低 原文連結:https://m.cnyes.com/news/id/6345148 發布時間:2026-02-15 19:00 記者署名:鉅亨網新聞中心 原文內容: 在全球生成式人工智慧(AI)競爭加速之際,字節跳動正式宣布旗下「豆包」大模型邁 入 2.0 階段,推出面向代理時代的系統性升級版本。 官方強調,新版本在整體性能上可對標 GPT-5.2 與 Gemini 3 Pro,同時將推理成本降低 約一個數量級,為大規模生產環境下的複雜任務執行提供更具競爭力的解決方案。 字節跳動於周六(14 日)公布,豆包 2.0 系列涵蓋 Pro、Lite、Mini 三款通用代理模 型,以及專門面向程式開發場景的 Code 模型。 其中,旗艦版本豆包 2.0 Pro 全面對標 GPT-5.2 與 Gemini 3 Pro,在多數視覺理解基 準測試中達到業界最高水準,並在國際數學奧林匹克、中國數學奧林匹克與 國際大學生 程式設計競賽中取得金牌。 目前,豆包 2.0 Pro 已全面上線,並接入豆包 App、電腦端與網頁版的「專家」模式; Code 版本則整合至 AI 程式設計產品 TRAE。同時,火山引擎也已同步推出面向企業與開 發者的 API 服務。 業界分析指出,在真實世界的複雜任務中,大規模推理與長鏈路生成往往消耗大量 token ,若能在維持高效能的同時顯著降低成本,將成為模型商業化落地的關鍵。 多模態能力躍升至頂尖水準 豆包 2.0 在多模態能力上進行大幅強化,無論是影像理解、感知判斷、空間推演,或長 文本脈絡掌握,都展現明顯進步,整體表現躍升至業界前段班水準。 在動態情境辨識方面,該模型於 TVBench 等重要評測中名列前茅,並在 EgoTempo 測試 中取得超越人類平均成績的表現,顯示其在解析畫面變化、人物動作與節奏轉換時,具備 更高穩定度與準確度。 面對長時間影片內容,豆包 2.0 同樣展現強勁實力,在多項測試中領先其他主流模型, 尤其在串流式即時問答相關基準評比中表現突出。 憑藉上述能力,豆包 2.0 得以升級為更具主動性的 AI 助理,不僅能即時分析影像內容 、辨識環境變化,還能在互動過程中進行主動提醒與修正,甚至提供陪伴式回饋,讓使用 情境從單純回應問題,進化為主動引導與建議,適用於健身指導、穿搭建議等日常陪伴場 景。 推理實力對標國際強者 成本優勢成關鍵 在推理能力方面,豆包 2.0 Pro 透過強化長尾領域知識,在 SuperGPQA 測試中分數超 越 GPT-5.2,並於 HealthBench 奪得第一名。在科學領域整體表現上,則與 Gemini 3 Pro 及 GPT-5.2 相當。 於代理能力與高難度推理評測中,該模型在國際數學奧林匹克、中國數學奧林匹克與國際 大學生程式設計競賽中取得金牌成績,並在 Putnam Bench 上超越 Gemini 3 Pro 表現。 在人類的最後考試(Humanity’s Last Exam)測試中,豆包 2.0 Pro 則取得最高棻 54.2 分,於工具調用與指令遵循能力測試中亦表現優異。 更受市場關注的是,字節跳動表示,在維持與頂尖大模型相當效果的同時,豆包 2.0 的 token 定價降低約一個數量級,預計將在大規模推理與長鏈路生成場景中,大幅提升企業 導入意願與商業化可行性。 與此同時,基於 OpenClaw 框架與豆包 2.0 Pro,字節跳動已在企業協作平台飛書上打造 智慧客服代理。 該代理能透過調用不同技能完成客戶對話,遇到複雜問題時主動邀請真人同事加入群組協 作,協助預約上門維修,並於事後主動回訪與推薦產品。 Code 模型助攻開發效率 針對程式開發需求,豆包 2.0 Code 建構於 2.0 基礎模型之上,並針對程式設計場景進 行專項優化,強化對大型程式碼庫的解析能力與應用生成效率,同時提升模型在代理工作 流程中的自我修正與除錯表現。 目前該模型已作為內建核心模型,上線至 TRAE 中國版,並支援圖像理解與推理功能。 在實際案例中,開發者透過 TRAE 搭配豆包 2.0 Code,只需一次提示詞輸入,便能快速 搭建「TRAE 春節小鎮 · 馬年廟會」互動專案的基本架構與場景設計;經過約五輪提示 後,更是可完成整體專案開發。 該專案包括了 11 位由大型語言模型驅動的 NPC,能依據角色設定自然對話、主動招呼顧 客並進行現場議價;AI 遊客也會自行決定造訪攤位、選購商品與互動內容,呈現高度擬 真的虛擬市集體驗。相關提示詞與素材已於 GitHub 開源,供開發者測試與延伸應用。 目前,豆包 2.0 Pro 已於豆包 App、電腦端與網頁版推出「專家」模式,開放一般用戶 使用;面向企業與開發者,火山引擎亦同步提供豆包 2.0 系列模型的 API 服務。 字節跳動表示,未來將持續以真實應用場景為核心,推動模型能力更新升級,進一步拓展 智慧應用的邊界。 心得/評論: 字節跳動實際上是中國第一的AI廠商 在B端 C端市佔第一 先前SEEDANCE 2.0發布後引發熱烈討論 現在又發佈了豆包2.0 號稱性能對標GPT,GEMINI 3 PRO 但成本只要1/10 -- 如何嘴砲 反駁對方的重點──◢◣確實指出人家論點的錯誤性 ψQSWEET> ◎ 駁斥────── 用引言指出對方錯誤或矛盾的地方( 優質論文) 在嘴砲王 相反的觀點──◢████◣列出相反的論點並以事實當證據( 辯論社) 應該出現矛盾────◢██████◣列出相反的論點但不加以證實( 論壇) 的元素 攻擊態度◢████████◣質疑對方的態度和口氣 ( 匿名版) 人身攻擊偏見▄▄▄▄▄▄▄▄▄▄▄攻擊身份和能耐幹你娘(小朋友) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.195.224.26 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1771170617.A.EE8.html

02/15 23:54, 13小時前 , 1F
不錯,可以聽得懂閩南語,還能用閩南語當輸入法
02/15 23:54, 1F

02/15 23:57, 13小時前 , 2F
問問看敏感關鍵字會不會被拒絕訪問再說
02/15 23:57, 2F

02/15 23:58, 13小時前 , 3F
我是GPT
02/15 23:58, 3F

02/15 23:59, 13小時前 , 4F
用審查過的資料生成ai根本沒威脅
02/15 23:59, 4F

02/15 23:59, 13小時前 , 5F
seedance還有點威脅
02/15 23:59, 5F

02/16 00:12, 13小時前 , 6F
又是蒸餾?
02/16 00:12, 6F

02/16 00:13, 13小時前 , 7F
小紅I
02/16 00:13, 7F

02/16 00:14, 13小時前 , 8F
不管政治審查之後好不好用 都可以給G家O家壓力 好事
02/16 00:14, 8F

02/16 00:15, 13小時前 , 9F
知道8*8=?
02/16 00:15, 9F

02/16 00:15, 13小時前 , 10F
豆包真的超猛,直接開鏡頭跟他聊天 各種互動 幫你看
02/16 00:15, 10F

02/16 00:16, 13小時前 , 11F
各種物品即時辨別、計算
02/16 00:16, 11F

02/16 00:22, 13小時前 , 12F
樓上那些CHATGPT早就會了
02/16 00:22, 12F

02/16 00:24, 13小時前 , 13F
各國都在搞AI,我們正在搞什麼
02/16 00:24, 13F

02/16 00:25, 13小時前 , 14F
我們在專心做該做的事
02/16 00:25, 14F

02/16 00:25, 13小時前 , 15F
中又贏!!!!
02/16 00:25, 15F

02/16 00:31, 13小時前 , 16F
便宜治百病
02/16 00:31, 16F

02/16 00:32, 13小時前 , 17F
我現在只需要色色的
02/16 00:32, 17F

02/16 00:35, 12小時前 , 18F
十樓帳號被買走了嗎 變成大外宣了
02/16 00:35, 18F

02/16 00:35, 12小時前 , 19F
台灣有點麵線
02/16 00:35, 19F

02/16 00:45, 12小時前 , 20F
AV可以訓練啊
02/16 00:45, 20F

02/16 00:46, 12小時前 , 21F
我們專心做鏟子 礦商們去廝殺
02/16 00:46, 21F

02/16 00:50, 12小時前 , 22F
全世界目前也就兩個國家有能力搞AI
02/16 00:50, 22F

02/16 00:52, 12小時前 , 23F
能色色嗎?不能我可是不要的喔
02/16 00:52, 23F

02/16 00:54, 12小時前 , 24F
能色色嗎?
02/16 00:54, 24F

02/16 01:05, 12小時前 , 25F
能查8964嗎?
02/16 01:05, 25F

02/16 01:11, 12小時前 , 26F
台灣在AI產業角色超重要吧怎麼有人問我們在幹什麼
02/16 01:11, 26F

02/16 01:15, 12小時前 , 27F
拿鏟子就自滿嗎 新加坡都知道要和qwen合作做ai 有
02/16 01:15, 27F

02/16 01:15, 12小時前 , 28F
做出自己的模型
02/16 01:15, 28F

02/16 01:16, 12小時前 , 29F
雖然新加坡政府投資背後技術還是阿里就是
02/16 01:16, 29F

02/16 01:31, 12小時前 , 30F
不知道台灣搞什麼gdp8.6,我覺得還是不要搞清楚,搞
02/16 01:31, 30F

02/16 01:31, 12小時前 , 31F
清楚反而降低
02/16 01:31, 31F

02/16 01:33, 11小時前 , 32F
怎麼前幾篇講ai泡沫,然後你這篇說台灣不能只做鏟子
02/16 01:33, 32F

02/16 01:34, 11小時前 , 33F
字節資金不輸七巨頭,就是買不到晶片
02/16 01:34, 33F

02/16 01:34, 11小時前 , 34F
Ai 真的雙方有來有往
02/16 01:34, 34F

02/16 01:37, 11小時前 , 35F
搗灰
02/16 01:37, 35F

02/16 01:37, 11小時前 , 36F
台灣沒data搞三小AI 乖乖賣鏟子就好
02/16 01:37, 36F

02/16 01:43, 11小時前 , 37F
越多家搞越好,消費者越吃香
02/16 01:43, 37F

02/16 02:08, 11小時前 , 38F
什麼都要做到最好,那你怎麼不負責把台灣AI搞起來
02/16 02:08, 38F

02/16 02:17, 11小時前 , 39F
02/16 02:17, 39F
還有 119 則推文
02/16 09:24, 4小時前 , 159F
AI的發展效率完全不覺得GPT和Gemini這時間辦不到
02/16 09:24, 159F

02/16 09:24, 4小時前 , 160F
當好萊塢要提告時,代表seedance真的搶了他們的飯碗
02/16 09:24, 160F

02/16 09:24, 4小時前 , 161F
當初sora可以生一堆日本動漫 就被日商聯合警告了
02/16 09:24, 161F

02/16 09:24, 4小時前 , 162F
但中國產品確實有優勢 在他們的法院 勝負難料
02/16 09:24, 162F

02/16 09:25, 4小時前 , 163F
又不是做不到 笑死 人家做正經生意的只能縮了
02/16 09:25, 163F

02/16 09:25, 4小時前 , 164F
即使GPT跟Google辦得到,也不可能提供字節跳動的低
02/16 09:25, 164F

02/16 09:25, 4小時前 , 165F
廉價格
02/16 09:25, 165F

02/16 09:25, 4小時前 , 166F
中國廠商版權和資安意識跟沒有一樣 誰要做你生意
02/16 09:25, 166F

02/16 09:25, 4小時前 , 167F
推文有人超激動 而且大概準備進桶XD
02/16 09:25, 167F

02/16 09:26, 4小時前 , 168F
AI發展大家看兩三年了 大家差距大多在三個月內而已
02/16 09:26, 168F

02/16 09:26, 4小時前 , 169F
其實SORA所有版本跟SD所有版本我都摸過 SD強很多
02/16 09:26, 169F

02/16 09:27, 4小時前 , 170F
但我也相對期待SORA能端出更厲害的東西 有競爭才好
02/16 09:27, 170F

02/16 09:27, 4小時前 , 171F
這白菜價格足以讓
02/16 09:27, 171F

02/16 09:27, 4小時前 , 172F
美國瘋狂
02/16 09:27, 172F

02/16 09:28, 4小時前 , 173F
中國AI廠商對中國以外的消費者來說就是避風歐美的
02/16 09:28, 173F

02/16 09:28, 4小時前 , 174F
AI過度漲價的產品
02/16 09:28, 174F

02/16 09:28, 4小時前 , 175F
各家都有可能藏招啦 不敢放太快,要不然手上都沒
02/16 09:28, 175F

02/16 09:28, 4小時前 , 176F
牌可以打了,當初Deepseek 就是這樣加速各家發布時
02/16 09:28, 176F

02/16 09:28, 4小時前 , 177F
02/16 09:28, 177F

02/16 09:30, 4小時前 , 178F

02/16 09:30, 4小時前 , 179F
中國AI成本低到令人髮指
02/16 09:30, 179F

02/16 09:35, 3小時前 , 180F
很多人不常摸過 TOKEN便宜真的非常重要
02/16 09:35, 180F

02/16 09:38, 3小時前 , 181F
美國繼續燒錢投入AI無底洞吧嘻嘻
02/16 09:38, 181F

02/16 09:42, 3小時前 , 182F
seedance2.0好玩
02/16 09:42, 182F

02/16 09:46, 3小時前 , 183F
笑死,總有人拿8964出來說嘴,你中華民國怎不搞一
02/16 09:46, 183F

02/16 09:46, 3小時前 , 184F
個出來,然後問尹清楓案
02/16 09:46, 184F

02/16 09:46, 3小時前 , 185F
一堆人活在過去,跟每年拿228出來鞭的一樣,可悲小
02/16 09:46, 185F

02/16 09:46, 3小時前 , 186F
02/16 09:46, 186F

02/16 09:56, 3小時前 , 187F
這就是不用管版權的好處 直接偷降低成本
02/16 09:56, 187F

02/16 09:59, 3小時前 , 188F
8964 8964 8964
02/16 09:59, 188F

02/16 10:05, 3小時前 , 189F
確實 看openrouter 就知道成本很重要
02/16 10:05, 189F

02/16 10:12, 3小時前 , 190F
Claude:怎麼沒對手啊
02/16 10:12, 190F

02/16 10:18, 3小時前 , 191F
台灣資源也有限,不用每個領域都想贏 在那反觀的很
02/16 10:18, 191F

02/16 10:18, 3小時前 , 192F
搞笑
02/16 10:18, 192F

02/16 10:25, 3小時前 , 193F
問AI的資料都會被偷走
02/16 10:25, 193F

02/16 10:28, 3小時前 , 194F
什麼都沒有的台灣,就繼續嘲笑中國
02/16 10:28, 194F

02/16 10:30, 3小時前 , 195F
便宜治百病,真的發展到AI普及成熟的階段,一般消
02/16 10:30, 195F

02/16 10:30, 3小時前 , 196F
費者也用不到多尖端的功能
02/16 10:30, 196F

02/16 10:36, 2小時前 , 197F
跟在別人後面抄答案的,是能抄到第一嗎?
02/16 10:36, 197F

02/16 10:37, 2小時前 , 198F
這輸出很多影片
02/16 10:37, 198F
文章代碼(AID): #1faUivxe (Stock)
文章代碼(AID): #1faUivxe (Stock)