专栏名称: 老冯云数
云计算泥石流,数据库老司机。
目录
相关文章推荐
安徽省应急管理厅  ·  安全生产月丨关键时刻能救命的2个小东西,快看 ... ·  昨天  
地球资源与地质活动  ·  中国科学院:王春琴-中国空间站舱外辐射剂量实测结果 ·  昨天  
地球资源与地质活动  ·  中国科学院:王春琴-中国空间站舱外辐射剂量实测结果 ·  昨天  
大众新闻-大众日报  ·  SU7刹车盘生锈?小米紧急回应 ·  2 天前  
大众新闻-大众日报  ·  SU7刹车盘生锈?小米紧急回应 ·  2 天前  
51好读  ›  专栏  ›  老冯云数

带瘫全球互联网,Google云/Cloudflare全球故障

老冯云数  · 公众号  · 互联网安全  · 2025-06-13 08:08

主要观点总结

本文主要描述了近期发生的一场涉及多个互联网服务供应商的大故障事件,事件涉及Google云平台GCP和Cloudflare等多个知名云服务商,影响范围广泛。文章详细分析了故障的原因和影响,包括Google云的身份和访问管理(IAM)服务的问题以及可能的触发因素等。

关键观点总结

关键观点1: 主要事件概述

一场全局性的大故障与错误影响到了几乎你能想到的主要互联网服务供应商,疑因Google云平台GCP的身份和访问管理服务出现问题。

关键观点2: 具体细节分析

故障起源于Google云的IAM服务的问题,进而影响了Cloudflare的关键服务并导致其故障,波及了承载全球互联网20%流量的云平台,包括诸多知名应用与服务如Cursor,Claude,Spotify等。

关键观点3: 故障原因推测

根据现有信息推断,故障可能源于配置或软件更新错误。考虑到此次事故发生在太平洋时间上午,可能恰逢某个全球发布窗口或变更操作。一种合理推测是Google对IAM/策略服务进行了某项更新,导致服务崩溃或拒绝请求。

关键观点4: 历史类似事件与教训

历史上Google也发生过类似情况,如内部身份认证系统因存储配额配置变更触发bug导致的身份服务瘫痪。此次事故的症状与之相似,表明可能存在人为操作失误。

关键观点5: 事件启示与反思

此次故障揭示了大型公有云平台的脆弱性,警示整个科技行业:大型公有云厂商已成为互联网世界的“单点”,需要依赖自有服务器而非专有云环境的公司更容易遭受此类故障风险。


正文

请到「今天看啥」查看全文


这场故障揭示出大型公有云平台的脆弱性: Google这次的控制服务故障,其影响都超出了单个公司的范畴,成为全网用户共同承受的“多米诺骨牌”式中断。这警示着整个科技行业:大型公有云厂商已经成为互联网世界的 “单点”,而这可并不是互联网发明的初衷。

许多仅依赖自有服务器的独立网站都在此次事故中完好无损 —— 大多数公司最好投资一些 IT人员,而不是将系统全部交给某个专有且极其复杂的云环境。否则,你会越来越依赖于你不认识、无法控制、也无法直接沟通的人与服务。

References

[1] : https://cloud.google.com/service-infrastructure/docs/service-management/reference/rpc/google.api#control
[2] : https://status.cloud.google.com/
[3] : https://www.cloudflarestatus.com/incidents/25r9t0vz99rp

云计算泥石流专栏


大故障:阿里云核心域名被拖走了

阿里云:从上到下烂到根了【去除原文版】

硬编码密码泄漏,阿里云的软件工程也太差了

Azure和OpenAI来查水表了

深度分析:迪奥数据泄露事件,云配置失当的锅?

10万用户的软件,因腾讯云欠费2元灰飞烟灭?

AWS 东京可用区故障:影响13项服务

云计算不能做成云算计之一:云行贿必须清理 马工

CVE惨遭断奶,美帝自毁安全长城

Shopify:愚人节真的翻车了

DHH下云:S3晚搬一天,就多花四万

Oracle云大翻车:6百万用户认证数据泄漏

今日大瓜:赛博佛祖与赛博菩萨大打出手

花钱买罪受的大冤种:逃离云计算妙瓦底

OpenAI全球宕机复盘:K8S循环依赖

支付宝崩了?双十一整活王又来了

草台回旋镖:Apple Music证书过期服务中断







请到「今天看啥」查看全文