Re: [新聞] 谷歌Gemini 2.5升級「全能王」推理、程式皆拿榜首!輾壓o3與Claude 4

看板Stock (股票)作者 (Channel Coding)時間17小時前 (2025/06/07 02:07), 7小時前編輯推噓98(1002364)
留言466則, 54人參與, 3小時前最新討論串2/2 (看更多)
這幾天比較有趣的消息是 Mary Meeker的新報告 她在29年前開始寫了一份 internet trends report 成功預測 網路用戶成長 廣告 行動網路等因為internet互聯網路 (The Internet Report” (1995) ) (1995年她在Morgan Stanley寫的報告 預測多媒體電腦等 https://ibb.co/6RshM1Bp ) 細節可以看這 https://www.bondcap.com/report/it95/ 最近她寫了一份Trends – Artificial Intelligence 340頁報告 https://tenten.co/learning/mary-meeker/ 有趣的地方在於訓練成本跟推理成本這邊 訓練成本在急遽上升 但推理成本也在顯著下降 這意味者 在應用端成本不在是門檻 這也意味者 誰先推出一桶漿糊大模型 提高使用用戶黏性 誰就會贏得市場 而訓練成本就是那個護城河 就像台G那個高昂成本 為了複製先進晶片 就是護城河 另外一個有趣點 在大網路時代 Google花了11年才得到八億用戶黏性(使用產品) Chatgpt只用17個月就辦到了 另外AI的成本接觸也在大幅下降 逐漸變成公共設施那種概念 報告也註明其他領域顯著受到AI領域影響 顯著的大幅進展 回到股點 現在在打大模型使用用戶黏度戰 就是狗家跟openai和claude 這之前幾篇也提到過了 狗家現在就是用一千個廖化調參數下游任務打一個呂布科學家 臉家跟亞麻(shopping experience) 屬於第二梯次 然後軟家無法評價@@ 這場大模型戰役少說得在打個一兩年 下好離手@@b 然後老黃繼續受益 摘錄其他跟股點有關的 開發者生態的繁榮: 以 NVIDIA 生態系統為例 其開發者數量在七年內增長了 6 倍 達到 600 萬 同樣 谷歌的 Gemini 生態系統也報告了同比 5 倍的開發者增長 達到 700萬 這龐大的開發者群體是 AI 應用和創新的基石。 專利申請的激增 美國與計算相關的專利授權量經歷了兩次顯著的爆發式增長 第一次是在網景公司 (Netscape) 1995 年上市之後, 第二次則是在 ChatGPT 2022 年發布之後,且後者的增長勢頭更為迅猛。 ChatGPT的桌面用戶留存率在 27 個月內從約 50% 攀升至 80% 遠高於同期谷歌搜索的留存率 這充分證明了 AI 工具的用戶粘性和不可替代性 移動端應用參與度的飆升- 美國活躍用戶在 ChatGPT 移動應用程序上花費的每日時長 在短短 21 個月內增長了驚人的 202%. 與此同時 用戶的會話時長和每用戶每日會話次數也呈現出顯著的增長趨勢。 AI 助力工作效率提升- 超過 72% 使用 AI 聊天機器人的美國受僱成年人表示, 這些工具顯著幫助他們更快、更好地完成工作任務。 **老黃股點 https://ibb.co/fsZKnh7 (參照https://www.pttweb.cc/bbs/Stock/M.1747509845.A.030 ) 老黃的開發社群還在指數成長 這也是一種護城河@@b -- 中文 https://reurl.cc/OYK5Yr https://reurl.cc/NYKbYx 你也可以下載完後丟給gpt 去問股點@@b https://www.bondcap.com/report/pdf/Trends_Artificial_Intelligence.pdf ※ 引述《buffon (簡 單)》之銘言: : 原文標題: : 谷歌Gemini 2.5升級「全能王」推理、程式皆拿榜首!輾壓o3與Claude 4 : 原文連結: : https://news.cnyes.com/news/id/6009666 : 發布時間: : 2025-06-06 15:10 : 記者署名: : 鉅亨網新聞中心 : 原文內容: : 谷歌 (GOOGL-US) 深夜攜全新 Gemini 2.5 Pro 強勢歸來,僅用一個月碾壓舊版 Gemini : 2.5。數學、程式設計、推理全面封神,穩坐所有榜單第一名,全面領先競爭對手如 o3、 : Claude 4 和 DeepSeek-R1 。 : 這次升級的 Gemini 2.5 Pro 在效能上展現出驚人的提升。其在整體 Elo 分數上提升了 : 24 分 ,尤其是在 Web Arena 上的 Elo 分數更是大幅躍升 35 分,達到 1443 分 。 : 在 LMArena 排行榜上,其 Elo 分數躍升 24 分,達到 1470 分,穩居榜首,並在所有領 : 域都排名第一,這充分證明了其在處理複雜任務方面的強大能力 。Google 官博介紹稱, : 這次發布的是 Gemini 2.5 Pro 的升級預覽版,被譽為 Google 迄今為止最聰明的模型 : 。 : 此外,Gemini 2.5 Pro 無論是數學、程式設計還是推理能力,都刷新了業界的「最先進 : 水準」(SOTA),穩居所有榜單之首,徹底碾壓了包括 o3、Claude 4 和 DeepSeek-R1 : 在內的所有競爭對手,為人工智慧的發展樹立了新的里程碑。 : token 價格不變 性價比極高 : 更令人振奮的是,儘管性能實現了質的飛躍,新版本 Gemini 2.5 Pro 的 token 價格卻 : 保持不變,這使得其具備極高的性價比。與市場上的競爭對手相比,Gemini 2.5 Pro 的 : 輸出價格僅為 o3 的四分之一,與 Claude 4 相比更是顯著經濟。 : 這對廣大開發者和企業而言,無疑是一大利好消息,意味著他們能夠以更低的成本獲得頂 : 級的 AI 能力,加速創新應用開發和部署。 : 新版 Gemini 2.5 Pro (06-05) 還引入了多項創新功能,進一步提升了模型的可用性和開 : 發效率。其中最引人注目的便是高達 32k 的「思考預算」(Thinking Budget)功能,以 : 及改進的函數呼叫能力。 : 「思考預算」功能導入 提升開發靈活性 : 這些新特性賦予了開發者更大的靈活性和精確度,使其能夠更有效地控制模型運行的成本 : 和延遲,實現更為複雜和客製化的 AI 解決方案。根據 Google 官方部落格的介紹,此次 : 發布的 Gemini 2.5 Pro 是一個升級預覽版,是 Google 迄今為止最聰明的模型,預計在 : 幾週後將成為普遍可用的穩定版本,非常適合企業級應用,滿足各行各業對高效能 AI 的 : 需求。 : 在程式設計領域,Gemini 2.5 Pro 的表現同樣令人印象深刻。它在 Aider Polyglot 等 : 高難度程式設計基準測試中名列前茅,展現了卓越的程式碼生成、理解和除錯能力。 : 同時,在 GPQA 和被譽為「人類最後考試」(HLE)等極具挑戰性的基準測試中,Gemini : 2.5 Pro 也展現了頂尖性能。這些測試全面評估了模型的數學、科學、知識和推理能力, : 其優異的表現再次證明了 Gemini 2.5 Pro 的綜合實力。 : 此外,Google 也針對先前 2.5 Pro 版本的用戶回饋進行了改進,顯著提升了其風格和結 : 構,現在它能提供更有創意、格式更優的回答,使其在內容生成和交流互動方面更加自然 : 流暢。 : 目前,開發者已可透過 Google AI Studio 和 Vertex AI 中的 Gemini API 開始使用更 : 新的 2.5 Pro 進行開發。其便捷的存取方式和強大的功能,將極大地促進 AI 技術的應 : 用創新。同時,Gemini 2.5 Pro 也已在 Gemini App 中正式上線,讓廣大普通用戶也能 : 體驗到其尖端 AI 能力所帶來的便利與智慧。 : 網友實測 驗證強大實力 : 為了驗證 Gemini 2.5 Pro 在真實任務中的表現,眾多網友紛紛進行了實測,結果令人驚 : 嘆。一張「劈柴圖」的廣泛流傳,暗示著業界普遍認為 Gemini 已是「獸中之王」。 : 在編碼能力方面,其對 o3 和 Claude 4 的碾壓已不再是空談——新版 Gemini 2.5 Pro : 成功通過了六邊形物理模擬測試,證明了其在複雜物理環境建模和模擬方面的卓越能力。 : 更令人驚豔的是,它還能透過 Three.js 創造出逼真的 3D DNA 模型,展現出強大的圖形 : 處理和視覺化能力。 : 資料科學家 Diego 進行了一項引人注目的測試:他讓 Gemini 2.5 Pro 06-05 編寫一段 : Python 程式碼,用於視覺化單行道中交通燈的工作原理,並要求車輛以隨機速率進入。 : 程式碼運行後的效果顯示,動畫整體精美,運行流暢,沒有明顯問題。 : 作為對比,GPT 4.5 生成的程式碼效果則顯得畫面粗糙,車輛也不符合物理規律,這凸顯 : 了 Gemini 2.5 Pro 在程式設計和模擬精確度方面的顯著優勢。Diego 先前也測試了 : Claude Sonnet 3.7 和 Grok 3,這些對比進一步鞏固了 Gemini 2.5 Pro 在 AI 領域的 : 領先地位。 : Google Gemini 2.5 Pro (06-05) 的發布,標誌著 Google 在人工智慧領域又邁出了堅實 : 的一步。其卓越的性能、高效的成本效益以及不斷創新的功能,無疑將加速 AI 技術的普 : 及和應用。隨著「李在明時代」的開啟,我們預期 Google 將繼續引領 AI 技術的發展, : 為全球用戶帶來更多創新與便利。 : 心得/評論: : google 的 chrome 面臨被法院強制出售的威脅 : 不過 Gemini 2.5 Pro 則是帶來了好消息 : Web Arena 上的 Elo 達到 1443 分 : LMArena 排行榜上,Elo 達到 1470 分,穩居榜首 : 內文還提到 "高達 32k 的「思考預算」(Thinking Budget) 功能" : 不過我看不懂這是啥 XD : 另外 : 最後一段提到 "李在明時代"也很莫名 : 不知道想表達什麼 : 總之, 這最新推出的 Gemini 2.5 Pro 照內文所說 : 目前是輾壓一切的存在 : 分享給各位股東參考 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 76.21.72.78 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1749233267.A.BCC.html

06/07 02:16, 17小時前 , 1F
謝謝,好險有看到
06/07 02:16, 1F

06/07 02:17, 17小時前 , 2F
99漫威99tsla
06/07 02:17, 2F

06/07 02:20, 17小時前 , 3F
股點就是nv和googl,那落地端呢?
06/07 02:20, 3F

06/07 02:21, 16小時前 , 4F
落地端,看起來googl一定可以分到一杯羹
06/07 02:21, 4F

06/07 02:22, 16小時前 , 5F
重點看AI的滲透率,不只生成式AI還有其他AI新應用
06/07 02:22, 5F

06/07 02:22, 16小時前 , 6F
不要一桶漿糊啦,各擁山頭比較好
06/07 02:22, 6F

06/07 02:33, 16小時前 , 7F
揪救窩 qq
06/07 02:33, 7F

06/07 02:36, 16小時前 , 8F
我還是無腦買S&P500好了0.0
06/07 02:36, 8F

06/07 02:38, 16小時前 , 9F
0.0
06/07 02:38, 9F

06/07 02:40, 16小時前 , 10F
不要一桶江湖,我想看到的是天網對決Matrix
06/07 02:40, 10F
※ 編輯: LDPC (76.21.72.78 美國), 06/07/2025 02:49:25

06/07 02:54, 16小時前 , 11F
能夠統整摘要的AI真是閱讀神器
06/07 02:54, 11F

06/07 02:55, 16小時前 , 12F
NV的優勢可確定幾年內堅若磐石
06/07 02:55, 12F
※ 編輯: LDPC (76.21.72.78 美國), 06/07/2025 03:05:31

06/07 03:07, 16小時前 , 13F
06/07 03:07, 13F

06/07 03:08, 16小時前 , 14F
打扁搜尋引擎 沒什麼問題 它們本身都是差不多的邏
06/07 03:08, 14F

06/07 03:08, 16小時前 , 15F
輯 至於AGI就不太可能 然後要比google 跟ChatGPT
06/07 03:08, 15F

06/07 03:08, 16小時前 , 16F
成長速度根本沒什麼意義 時代差太多 光基礎建設 各
06/07 03:08, 16F
還是有意義啊 成長速度和人口數量(對比全人口)意味者 新科技滲透率到普羅大眾速度 大internet時代 產業變遷 落地場景大概是個10~15年週期 每個階段硬體基建 軟體滲透 外面使用者adopt 都可以解讀為科技滲透對比人口使用數 現在最好參考點就是internet 他是至少完整走過如讓一個新科技滲透至整體人口 科技滲透對比人口大多是參考這個 https://en.wikipedia.org/wiki/Early_adopter 現在主要是要透過對比資料 來反推接下來可能性 比方七巨頭都是目標兩年內 消滅20~50%碼農用ai生產工具輔助寫程式 但是外面一般民眾需要多少時間去adopt這新科技? 有多少人還是認為ai是泡沫? 一般來說early adopter佔總人口13.5% early majority佔34% 轉折點會是late majority(34%) 那意味者70~80%總人口 這時候AI落地場景會大量出現 一般聽到現在大模型初戰 10億使用戶會是一個基本門票 用的就是搶early adopter 簡言之 用戶成長速度和數量 黏著性 就是科技滲透率和市場佔有率 最簡當評定方法 https://reurl.cc/2KR6AE 這也可以成為投資股票方向的一個引則 目前來說現在還是AI大基建時代 而現一班用戶還大多為early adopter 等到20億人口 使用時 差不多就要進入earl/late majority時代 改買應用公司諸如databrick 因此作為配股現在理應就是半導體(/NVDA/AVGO/MU/TSM) 預計兩年後可以轉往其他應用層 那時候外面民眾大多是成為可習慣AI 以iphone出現時代2007 等到智慧手機有early majority大約是2010~2012 用戶使用量和總人口比數 以及黏著性 會指出 這玩意到底是不是泡沫 以及是不是準備好到下個時代 以元宇宙為例 他從來沒有突破過 early adopter人口數量 說到底 人口使用成長速度 就是最暴力簡單解讀新科技散透速度

06/07 03:08, 16小時前 , 17F
國經濟就不一樣 外行人講講就好 放內容裡只是被當
06/07 03:08, 17F

06/07 03:08, 16小時前 , 18F
成無料小丑 NV能爽多久難說 我聽一些消息 黃是想獨
06/07 03:08, 18F

06/07 03:08, 16小時前 , 19F
佔整個市場 連湯都不給喝的 短時間可能真得會因為
06/07 03:08, 19F

06/07 03:08, 16小時前 , 20F
CUDA架構 繞不過去 長時間 除非chat開源 或什麼AI
06/07 03:08, 20F

06/07 03:08, 16小時前 , 21F
龍頭開源 生態大到像windows 無法離開才有機會
06/07 03:08, 21F

06/07 03:36, 15小時前 , 22F
推樓上 比不同時代的用戶成長速度沒意義
06/07 03:36, 22F

06/07 03:52, 15小時前 , 23F
ai模型在一兩年就會走到盡頭了 目前看起來是openai
06/07 03:52, 23F

06/07 03:52, 15小時前 , 24F
跟google互打 其他人喝湯
06/07 03:52, 24F

06/07 04:35, 14小時前 , 25F
推 LD!
06/07 04:35, 25F

06/07 04:58, 14小時前 , 26F
06/07 04:58, 26F

06/07 05:07, 14小時前 , 27F
我要看天網
06/07 05:07, 27F

06/07 05:37, 13小時前 , 28F
越來越
06/07 05:37, 28F

06/07 05:37, 13小時前 , 29F
老實說AGI在這幾年算力大躍進後也不是不可能
06/07 05:37, 29F

06/07 05:38, 13小時前 , 30F
這兩年AI的進展太快了 覺得到頂時就會出現新東西
06/07 05:38, 30F

06/07 05:49, 13小時前 , 31F
個人看好Google可以統一AI新世界,最多算力最多資
06/07 05:49, 31F

06/07 05:49, 13小時前 , 32F
料,原本落後現在也追上了,怎麼輸?
06/07 05:49, 32F

06/07 06:04, 13小時前 , 33F
Meeker不是網路時代的Cathie Wood嗎?
06/07 06:04, 33F
※ 編輯: LDPC (76.21.72.78 美國), 06/07/2025 06:16:48

06/07 06:29, 12小時前 , 34F
不可能股版都說AI泡沫化 難道說AI泡沫的都是小丑嗎c
06/07 06:29, 34F

06/07 06:29, 12小時前 , 35F
c
06/07 06:29, 35F
還有 391 則推文
還有 2 段內文
06/07 14:55, 4小時前 , 427F
沒事給一個人一個月三萬有算什麼嗎 人家一個月賺三
06/07 14:55, 427F

06/07 14:55, 4小時前 , 428F
百三千億就當養巃物乖乖不要做亂就好 底層只活在金
06/07 14:55, 428F

06/07 14:55, 4小時前 , 429F
錢受限的世界
06/07 14:55, 429F

06/07 14:55, 4小時前 , 430F
對啦你的世界就是 有實力有能力的人 辛苦幫無能的人
06/07 14:55, 430F

06/07 14:55, 4小時前 , 431F
工作生產製造給他們享樂
06/07 14:55, 431F

06/07 14:56, 4小時前 , 432F
不過未來人也是會更少就是了 不需要那麼多人
06/07 14:56, 432F

06/07 14:56, 4小時前 , 433F
你的世界的人真是偉大無私
06/07 14:56, 433F

06/07 14:57, 4小時前 , 434F
所以你養寵物很辛苦? 這麽說人為什麼要花錢養寵物?
06/07 14:57, 434F

06/07 14:57, 4小時前 , 435F
誰邏輯正常還不清楚嗎?
06/07 14:57, 435F

06/07 14:57, 4小時前 , 436F
這跟偉大有什麼關係
06/07 14:57, 436F

06/07 14:59, 4小時前 , 437F
你像是沒有出過社會磨練過一樣 人就不是如此 但我確
06/07 14:59, 437F

06/07 14:59, 4小時前 , 438F
實希望人能這樣
06/07 14:59, 438F

06/07 15:00, 4小時前 , 439F
所以我才用偉大兩個字
06/07 15:00, 439F

06/07 15:00, 4小時前 , 440F
對啊 世界首富 AI巨頭CEO 諾貝爾獎得主 都太天真惹
06/07 15:00, 440F

06/07 15:00, 4小時前 , 441F
就你最實際 最懂 好喔
06/07 15:00, 441F

06/07 15:01, 4小時前 , 442F
以上那幾個 一定是在炒股才在那邊吹牛 對吧
06/07 15:01, 442F

06/07 15:02, 4小時前 , 443F
就你最有鍛練 最有社會經歷 以上那幾個都不食人間
06/07 15:02, 443F

06/07 15:02, 4小時前 , 444F
煙火 對啊
06/07 15:02, 444F

06/07 15:02, 4小時前 , 445F
所以我才說你心中的ai通向的是奴役之路
06/07 15:02, 445F

06/07 15:05, 4小時前 , 446F
其實全民爽過真的沒那麼難懂耶 目前現實世界就已經
06/07 15:05, 446F

06/07 15:05, 4小時前 , 447F
有案例了 那叫卡達 只是這個國家人民爽過 奴役的是
06/07 15:05, 447F

06/07 15:05, 4小時前 , 448F
外國人 現在就把被奴役的外國人 改成AI機器人 不就
06/07 15:05, 448F

06/07 15:05, 4小時前 , 449F
好了?以前還需要請外國苦力做低階工作 現在AI機器
06/07 15:05, 449F

06/07 15:05, 4小時前 , 450F
人效率跟成本遠剩那些外國苦力 那何必要奴役別人?
06/07 15:05, 450F

06/07 15:05, 4小時前 , 451F
如果ai通向的是奴役之路 那確實你本身就是他們的奴
06/07 15:05, 451F

06/07 15:06, 4小時前 , 452F
隸 拱你吃喝也是理所當然
06/07 15:06, 452F

06/07 15:06, 4小時前 , 453F
那這一套只要有一個地方成功 就可以複製到其他地方
06/07 15:06, 453F

06/07 15:06, 4小時前 , 454F
跟你講不通 人類生產力提升 尤其是AI革命之後 基本
06/07 15:06, 454F

06/07 15:06, 4小時前 , 455F
衣食住行不是什麼問題 還在講一般人沒那麼偉大 那
06/07 15:06, 455F

06/07 15:06, 4小時前 , 456F
慈善機構都假的 你就不是以世界 政府 大企業的眼光
06/07 15:06, 456F

06/07 15:06, 4小時前 , 457F
看事
06/07 15:06, 457F

06/07 15:06, 4小時前 , 458F
奴役你人類幹嘛?你人類什麼都做不贏AI呀?
06/07 15:06, 458F

06/07 15:07, 4小時前 , 459F
供你人類吃喝拉撒住 然後你想幹什麼就去幹什麼啊
06/07 15:07, 459F

06/07 15:07, 4小時前 , 460F
這麼簡單的事情怎麼想不透
06/07 15:07, 460F

06/07 15:09, 4小時前 , 461F
當然這都是以AI機器人已經成熟發展的前提啦 還早
06/07 15:09, 461F

06/07 15:09, 4小時前 , 462F
10年看有沒有機會 或20年 但其實這樣算一算進展也
06/07 15:09, 462F

06/07 15:09, 4小時前 , 463F
很快啦 你我真的能活著看到這件事情發生
06/07 15:09, 463F

06/07 15:23, 3小時前 , 464F
AI的確是通向被奴役之路沒錯 因為你更沒力量更沒選
06/07 15:23, 464F

06/07 15:23, 3小時前 , 465F
擇了 權力更集中在少數控制AI的人手上 被豢養不是
06/07 15:23, 465F

06/07 15:23, 3小時前 , 466F
好事
06/07 15:23, 466F
文章代碼(AID): #1eGovplC (Stock)
文章代碼(AID): #1eGovplC (Stock)