[討論] Cloudflare 網絡大爆炸事故報告

看板MIS (IT資訊人員)作者 (Dont QQ)時間4天前 (2025/11/19 23:27), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
Cloudflare 網絡大爆炸事故報告 故障歷時 6 小時 初期誤判被 DDoS 攻撃 【網絡大爆炸 ... 】Cloudflare 18 日香港時間晚上 7 時 20 分起突然出現網絡服務嚴 重故障,導致全球大量網站及網絡服務完全停擺,使用 Cloudflare 的網站出現「Intern al Server Error」,並顯示為 Cloudflare 服務出錯。官方今日公布事故報告,指出初 期誤判為遭受 DDoS 攻擊,其後才發現是人為的「低級錯誤」,卻引發連鎖性的全球網站 大崩潰。 資料顯示,Cloudflare 的網絡在 2025 年 11 月 18 日晚上 7 時 20 分開始出現嚴重故 障,就連 Downdetector 網站也 Down 了。初時,Cloudflare 觀察到的症狀似乎由大規 模 DDoS 攻擊引起,花了不少時間排查後才發現方向完全錯誤,問題並非由任何形式的網 絡攻擊或惡意活動所致。 再深入調查後發現,Cloudflare 網絡故障原因是內部人員失誤,導致「資料庫系統權限 變更」被誤設,觸發資料庫向 Cloudflare 機器人管理系統使用的「特徵檔案」輸出大量 條目,令「特徵檔案」異常龐大。這些異常的特徵檔案被傳播到 Cloudflare 網絡中的所 有機器人,從而引發重大災難。 這個「特徵檔案」是 Cloudflare 防禦網絡攻擊的重要文件,讓 Cloudflare 機器人管理 系統能夠及時更新,以應對不斷變化的網絡威脅。然而該系統對「特徵檔案」大小設有容 量上限,結果整個 Cloudflare 網絡服務因「特徵檔案」異常龐大而導致系統失效。 找到問題根源後,Cloudflare 阻止了異常龐大檔案的傳播,並將其替換為較早版本。到 2025 年 11 月 18 日晚上 10 時 20 分,核心流量基本恢復正常;但在流量突然恢復而 負載增加的情況下,部分網站和網絡服務仍一度無法運作。直至 19 日凌晨 1 時 06 分 才宣告所有系統已恢復正常運作,整個故障歷時 5 小時 45 分鐘。 這次故障是 Cloudflare 自 2019 年以來最嚴重的網絡事故。Cloudflare 表示已汲取教 訓,並著手建立更新、更具容錯能力的系統,確保此類故障不再發生。 https://blog.cloudflare.com/18-november-2025-outage/ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.15.0.152 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/MIS/M.1763566068.A.A0A.html
文章代碼(AID): #1f7U7qeA (MIS)
文章代碼(AID): #1f7U7qeA (MIS)