GCP 2025年6月12日事故分析报告

2025年6月12日 GCP 服务中断事件

一次由核心身份认证服务(IAM)故障引发的全球性连锁事件，深刻揭示了现代云生态系统的脆弱性与相互依赖性。

🔑

身份与访问管理 (IAM) 系统配置错误

⏱️

约 2-3 小时 (部分服务残留影响更久)

🌍

全球多个区域，影响GCP、Workspace及大量第三方服务

本节通过可交互的时间轴，详细梳理了从故障初现到逐步恢复的关键节点。将鼠标悬停在不同事件上可以突出显示该节点，帮助您清晰地了解整个事件的演变过程。

本节通过交互式图表直观展示了单一IAM故障如何像多米诺骨牌一样，迅速波及谷歌内外部的众多服务。点击图表的不同部分，可以筛选查看受影响的具体服务列表，从而更清晰地理解本次事件的连锁效应和广泛影响范围。

本节深入剖析了导致此次大规模中断的技术根源，并概述了谷歌为应对危机所采取的关键步骤。左侧的流程图清晰地揭示了故障的传导路径，右侧则总结了谷歌的应急响应措施。

对 IAM 系统进行配置变更

IAM 核心服务出现故障

服务间的 API 调用无法通过身份验证

大量依赖服务全球性中断

此次事件不仅是一次技术故障，更是对整个行业的警示。本节从行业、客户和谷歌自身三个维度，提炼了核心教训与未来建议，旨在共同构建一个更具韧性的云未来。