[新聞] Google正式發表Gemini 3.1 Pro 全面強化複雜任務處理能力

看板Stock (股票)作者 (為何世界會那麼不單純)時間2天前 (2026/02/20 18:37), 2天前編輯推噓45(53840)
留言101則, 68人參與, 1天前最新討論串1/2 (看更多)
-------------------------------發文提醒---------------------------------- 1.發文前請先詳閱[新聞]分類發文規範,未依規範發文將受處分。 2.發文請依照格式文章標明段落,不符合格式者依 1-2-1 處分。 3.連結過長請善用縮網址服務,連結不能點擊者板規 1-2-2 處分。 4.心得/評論請盡量充實,心得過短或濫竽充數將以板規 1-2-3 處分。 ------------------------ 按ctrl+y 可刪除以上內容。 ---------------------- 原文標題: Google正式發表Gemini 3.1 Pro 全面強化複雜任務處理能力 原文連結: https://news.cnyes.com/news/id/6347511 發布時間: 2026-02-20 16:20 記者署名: 原文內容: Google(GOOGL-US) 周四 (19 日) 透過官方部落格,突然宣布推出其最新的人工智慧核心 模型 Gemini 3.1 Pro。這款模型被定位為處理最複雜任務的「智慧升級版」,象徵著 Google 在 AI 核心推理能力上取得了重大突破。 隨著 Gemini 3.1 Pro 的發布,Google 旨在將更強大的智慧應用於日常開發與消費級產 品中,幫助使用者解決那些「簡單回答已不足夠」的艱難挑戰。 核心推理能力的飛躍:基準測試表現驚人 Gemini 3.1 Pro 最受矚目的改進在於其邏輯推理能力的提升。根據 Google 發布的數據 ,該模型在評估邏輯模式解決能力的關鍵基準測試 ARC-AGI-2 中,獲得了 77.1% 的驗證 分數。與前代 Gemini 3 Pro 的 31.1% 相比,其推理性能提升超過兩倍,也遠高於 Gemini 3 Deep Think 的 45.1%。 https://cimg.cnyes.cool/prod/news/6347511/l/ec6f683db3c26648a93e93380118728e.jpg
https://reurl.cc/KONy0q (來源: Google blog) 在與競爭對手的橫向對比中,Gemini 3.1 Pro 在多項指標上領先於 Anthropic 的 Claude Opus 4.6 以及 OpenAI 的 GPT-5.2。例如: ‧ Humanity"s Last Exam(人類最後的考驗):Gemini 3.1 Pro 分數為 44.4%,優於 Claude Opus 4.6 的 40.0% 與 GPT-5.2 的 34.5%。 ‧ MMLU(大規模多任務語言理解):達到 92.6%,領先競爭對手。 ‧ GPQA Diamond:得分 94.3%,展現出極高水平的專業知識理解。 儘管如此,報導也指出在特定領域中,競爭對手仍保有優勢。例如,Claude Opus 4.6 在 部分 SWE-Bench 驗證中仍位居榜首,而 OpenAI 的 GPT-5.3-Codex 則在特定的編程測試 中表現較佳。 多樣化的實務應用 Google 強調,Gemini 3.1 Pro 不僅是數據上的進步,更在於能將高級推理轉化為實用的 功能。 1. 純程式碼動畫生成:該模型能直接根據文字指令生成網頁適用的 SVG 動畫。由於這些 動畫是基於純程式碼而非像素構建,因此在任何比例下都能保持清晰,且檔案體積遠小於 傳統影片。 2. 複雜系統整合:Gemini 3.1 Pro 展現了連接複雜 API 與使用者介面的能力。在官方 展示中,它成功構建了一個即時航太儀表板,利用公開遙測數據視覺化國際太空站 (ISS) 的軌道運行。 3. 沉浸式互動設計:該模型能編寫複雜的 3D 動態視覺效果 (如鳥群飛翔模擬),並結合 手部追蹤功能,讓使用者能操控視覺效果,甚至產生隨動作變化的生成式配樂。 4. 創意編碼與文學轉化:Gemini 3.1 Pro 展現了理解文學主題並將其轉化為功能性程式 碼的能力。例如,它能根據艾蜜莉 · 勃朗特的經典小說《咆哮山莊》的大氣色調,設計 出富有現代感的個人作品集網站,而非僅僅是摘要文字。 全方位布局:如何體驗 Gemini 3.1 Pro Google 目前已在多個平台上陸續推送 Gemini 3.1 Pro,涵蓋開發者、企業及一般消費者 : ‧ 一般消費者:可透過 Gemini App 使用。訂閱 Google AI Pro 與 Ultra 方案的用戶 將享有更高的使用限制。此外,NotebookLM 也已開放 Pro 與 Ultra 用戶專屬體驗。 ‧ 開發者與企業:可透過 Gemini API (Google AI Studio)、Vertex AI、Gemini Enterprise 以及 Google 的代理式開發平台 Antigravity 進行訪問。 ‧ 開發工具整合:該模型也將整合進 Gemini CLI、Android Studio,甚至延伸至微軟的 服務,如 GitHub Copilot 和 Visual Studio Code。 AI 賽賽升溫:Google 的市場防禦與進攻 這次發布正值 AI 市場競爭最激烈的時刻。市場分析指出,Gemini 3 Pro 在去年 11 月 發布後曾引發 OpenAI 的「紅色警報 (code red)」,並導致部分用戶從 ChatGPT 流向 Gemini。Google 執行長 Sundar Pichai 在最近的財報中提到,Gemini App 的月活躍用 戶已超過 7.5 億,且其模型透過 API 每分鐘處理超過 100 億個 token。 Gemini 3.1 Pro 的推出被視為 Google 快速迭代策略的一部分。Google 表示,目前發布 的是預覽版,目的是為了在正式全面開放 (GA) 之前,驗證更新並進一步推進代理式工作 流 (agentic workflows) 等雄心勃勃的研發領域。 Karpathy:應用商店模式正在過時 Gemini 3.1 Pro 發布之際,OpenAI 共同創辦人 Andrej Karpathy 提出「應用商店模式 正在過時」的觀點,他指出,隨著如 Gemini 3.1 Pro 等具備強大推理能力的模型出現, 模型已能從單純回答問題延伸到完成一整套專業工作流。 Karpathy 預見一個由「AI 原生傳感器」和「執行器」構成的時代,屆時將由 LLM 負責 編排、即興生成高度定制的應用。這種「即時生成、用完即棄」或「個人專屬」的軟體邏 輯,將從根本上取代傳統應用商店的發布與下載機制。 總結來說,Karpathy 認為,AI 讓軟體開發的門檻與成本降到極低,未來的趨勢是 AI 根 據用戶需求直接生成解決方案,而非用戶去適配應用商店中既有的 App。 心得/評論: 現在出的AI強到一句話就能輸出 完美的程式和動畫, 離AGI真的不遠 感覺人類似乎快無用了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.193.229.55 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1771583831.A.A42.html ※ 編輯: tanted (123.193.229.55 臺灣), 02/20/2026 18:39:19

02/20 18:37, 2天前 , 1F
噴噴噴噴噴噴噴
02/20 18:37, 1F

02/20 18:38, 2天前 , 2F
無感
02/20 18:38, 2F

02/20 18:40, 2天前 , 3F
早上就注意到了,盤前噴噴,聽說Coding 超越Claude
02/20 18:40, 3F

02/20 18:40, 2天前 , 4F
02/20 18:40, 4F

02/20 18:40, 2天前 , 5F
樓下點名台股估狗概念股週一市價買
02/20 18:40, 5F

02/20 18:41, 2天前 , 6F
救救狗家救救我!
02/20 18:41, 6F

02/20 18:42, 2天前 , 7F
歐噴醬的靈壓…
02/20 18:42, 7F

02/20 18:42, 2天前 , 8F
狗狗還有救嗎
02/20 18:42, 8F

02/20 18:42, 2天前 , 9F
坐等測評 前一版寫扣跟垃圾一樣
02/20 18:42, 9F

02/20 18:43, 2天前 , 10F
寫扣跟垃圾一樣=賺不到錢
02/20 18:43, 10F

02/20 18:43, 2天前 , 11F
300撿好多了
02/20 18:43, 11F

02/20 18:50, 2天前 , 12F
99估狗
02/20 18:50, 12F

02/20 18:51, 2天前 , 13F
claude我大哥
02/20 18:51, 13F

02/20 18:54, 2天前 , 14F
我用了之後覺得還是GPT翻譯比較好
02/20 18:54, 14F

02/20 19:04, 2天前 , 15F
軟工要死光了吧
02/20 19:04, 15F

02/20 19:06, 2天前 , 16F
希望真的有贏過Claude4.6
02/20 19:06, 16F

02/20 19:08, 2天前 , 17F
才剛把狗賣了改搭美光戰艦
02/20 19:08, 17F

02/20 19:14, 2天前 , 18F
從垃圾變成贏過claude 彎道超車?
02/20 19:14, 18F

02/20 19:18, 2天前 , 19F
發哥開噴
02/20 19:18, 19F

02/20 19:21, 2天前 , 20F
沒用了 下山已久
02/20 19:21, 20F

02/20 19:24, 2天前 , 21F
再下去就要比人類聰明了
02/20 19:24, 21F

02/20 19:25, 2天前 , 22F
可以生成澀澀嗎
02/20 19:25, 22F

02/20 19:27, 2天前 , 23F
現在估狗沒人要了,前進老黃。
02/20 19:27, 23F

02/20 19:34, 2天前 , 24F
真假啦 coding真超越claude我就要訂閱了
02/20 19:34, 24F

02/20 19:37, 2天前 , 25F
支持模型三家努力捲,得利的都是消費者。
02/20 19:37, 25F

02/20 19:42, 2天前 , 26F
歐印
02/20 19:42, 26F

02/20 19:44, 2天前 , 27F
人類完了
02/20 19:44, 27F

02/20 19:49, 2天前 , 28F
claude其實本就還好。。。cursor也是
02/20 19:49, 28F

02/20 19:50, 2天前 , 29F
支持卷爛,看哪家方案更便宜
02/20 19:50, 29F

02/20 19:52, 2天前 , 30F
狗狗+u
02/20 19:52, 30F

02/20 19:52, 2天前 , 31F
Coding有沒有比Cluade強見仁見智,但各方面都是
02/20 19:52, 31F

02/20 19:53, 2天前 , 32F
比較便宜或給的用量比較多
02/20 19:53, 32F

02/20 19:53, 2天前 , 33F
然後多語言能力其實沒特別進步 多模態能力還退步
02/20 19:53, 33F

02/20 19:53, 2天前 , 34F
但不重要,推理變強就好了
02/20 19:53, 34F

02/20 19:53, 2天前 , 35F
車太快
02/20 19:53, 35F

02/20 19:54, 2天前 , 36F
現在應用範圍太廣了,抓好什麼任務給哪個模型比較
02/20 19:54, 36F

02/20 19:54, 2天前 , 37F
需要下點功夫
02/20 19:54, 37F

02/20 19:55, 2天前 , 38F
google真能一統天下 要考慮加碼
02/20 19:55, 38F

02/20 19:56, 2天前 , 39F
因為就算你技術不輸google 它也能用服務全家桶商法
02/20 19:56, 39F
還有 22 則推文
02/20 21:10, 2天前 , 62F
估狗跟垃圾一樣
02/20 21:10, 62F

02/20 21:17, 2天前 , 63F
200再說
02/20 21:17, 63F

02/20 21:17, 2天前 , 64F
彈回320,接著烙賽回225
02/20 21:17, 64F

02/20 21:33, 2天前 , 65F
谷歌不是漲完了 沒跟到別接了
02/20 21:33, 65F

02/20 21:44, 2天前 , 66F
特別喜歡看Claude模型執行任務時的chain of thought
02/20 21:44, 66F

02/20 21:45, 2天前 , 67F
感覺它比其他家的大語言模型還活XD
02/20 21:45, 67F

02/20 21:50, 2天前 , 68F
超越claude? 不太可能呢
02/20 21:50, 68F

02/20 21:53, 2天前 , 69F
4.6貴是真的有料阿 我是覺得還沒超越啦
02/20 21:53, 69F

02/20 21:58, 2天前 , 70F
越來越猛
02/20 21:58, 70F

02/20 22:26, 2天前 , 71F
進步速度越來越快了 AI不用睡覺 接下來會越來越快
02/20 22:26, 71F

02/20 22:28, 2天前 , 72F
強不強跟能不能變現是兩回事
02/20 22:28, 72F

02/20 22:34, 2天前 , 73F
厲害
02/20 22:34, 73F

02/20 22:36, 2天前 , 74F
非常実用!很強大!
02/20 22:36, 74F

02/20 22:36, 2天前 , 75F
在推論方面,表現得不錯
02/20 22:36, 75F

02/20 22:45, 2天前 , 76F
一個月後不降智再說
02/20 22:45, 76F

02/20 23:08, 2天前 , 77F
問問題成天突然幫我畫畫要解決了?
02/20 23:08, 77F

02/20 23:17, 2天前 , 78F
用了兩個多小時 慘輸5.3-codex和opus4.6
02/20 23:17, 78F

02/20 23:17, 2天前 , 79F
然後opus 4.6不如4.5 幻覺率有變高的感覺
02/20 23:17, 79F

02/20 23:18, 2天前 , 80F
越來越容易亂寫一通 4.5還比較聽話
02/20 23:18, 80F

02/20 23:18, 2天前 , 81F
5.3 codex還是屌打全部 尤其困難需求xhigh一發解
02/20 23:18, 81F

02/20 23:19, 2天前 , 82F
三個交叉用下來就是這樣 Gemini還是只能拿來產視覺
02/20 23:19, 82F

02/20 23:19, 2天前 , 83F
其它一無是處
02/20 23:19, 83F

02/20 23:24, 2天前 , 84F
寫寫歌編曲,真有趣!
02/20 23:24, 84F

02/21 00:09, 2天前 , 85F
文組gpt理組Gemini
02/21 00:09, 85F

02/21 00:35, 2天前 , 86F
所有模型好壞取決於你要做的領域是什麼
02/21 00:35, 86F

02/21 00:36, 2天前 , 87F
大致上都不會太差 你問冷門的或是比較沒辦法收入到
02/21 00:36, 87F

02/21 00:36, 2天前 , 88F
訓練集都是用掰的
02/21 00:36, 88F

02/21 00:48, 2天前 , 89F
看看就好 上次也是吹很大 但coding實際用起來根本
02/21 00:48, 89F

02/21 00:48, 2天前 , 90F
沒比其他家強
02/21 00:48, 90F

02/21 01:09, 2天前 , 91F
Codex屌打claude
02/21 01:09, 91F

02/21 01:28, 2天前 , 92F
算了吧 google bug會刪對話 一堆紀錄都沒了
02/21 01:28, 92F

02/21 01:32, 2天前 , 93F
擠牙膏大賽開始
02/21 01:32, 93F

02/21 02:08, 2天前 , 94F
三家都很爛 連寫個簡單腳本都會報錯 還改不好
02/21 02:08, 94F

02/21 07:19, 1天前 , 95F
谷歌不再擠牙膏了
02/21 07:19, 95F

02/21 09:19, 1天前 , 96F
越跑越慢
02/21 09:19, 96F

02/21 10:51, 1天前 , 97F
股溝資本支出超標 當然漲不動 現在你不擴充軍武
02/21 10:51, 97F

02/21 10:52, 1天前 , 98F
就是被淘汰 擴充就是跌股價 畢竟沒有100%成功投資
02/21 10:52, 98F

02/21 12:43, 1天前 , 99F
沒感覺
02/21 12:43, 99F

02/21 15:18, 1天前 , 100F
Antigravity昨天claude的配額用完試著用gem3.1pro
02/21 15:18, 100F

02/21 15:18, 1天前 , 101F
來修code 個人覺得還是claude比較強
02/21 15:18, 101F
文章代碼(AID): #1fc3bNf2 (Stock)
文章代碼(AID): #1fc3bNf2 (Stock)