您现在的位置是:物联网 >>正文
Cloudflare API 服务中断事件分析:React useEffect 漏洞引发级联故障
物联网268人已围观
简介Cloudflare 近日发布详细事故报告,披露2025年9月12日导致其控制面板和API服务中断超过一小时的重大故障。经调查,此次事件源于控制面板软件漏洞与服务更新的叠加效应,最终引发关键内部系统的 ...
Cloudflare 近日发布详细事故报告 ,服发级披露2025年9月12日导致其控制面板和API服务中断超过一小时的断事洞引重大故障。经调查,漏联故此次事件源于控制面板软件漏洞与服务更新的服发级叠加效应 ,最终引发关键内部系统的断事洞引级联故障 。

事件始于Cloudflare控制面板新版本的模板下载漏联故发布。公司报告显示,服发级该更新中的断事洞引React代码存在缺陷 ,导致对内部租户服务API(Tenant Service API)发起重复且过度的漏联故调用。该服务是服发级处理API请求授权的云计算核心组件。
具体而言,断事洞引漏洞存在于useEffect钩子中——错误配置使其在每次状态变更时都会触发API调用 ,漏联故导致单次面板渲染期间形成请求循环。服发级恰逢此时租户服务API自身也正在进行更新部署。断事洞引
存在缺陷的漏联故控制面板产生"惊群效应"(thundering herd) ,使新部署的建站模板服务不堪重负 ,最终引发异常故障与恢复失败 。由于租户服务承担API请求授权职能 ,其瘫痪导致UTC时间17:57起Cloudflare控制面板及大量API服务大面积中断。
应急处置过程Cloudflare工程团队首先监测到租户服务负载激增,随即采取减压扩容措施:
实施临时全局速率限制规则增加Kubernetes pods资源以提升吞吐量这些措施虽部分恢复了API可用性 ,但控制面板仍处于宕机状态 。UTC时间18:58尝试修补服务错误代码路径的免费模板操作适得其反 ,导致API可用性二次短暂受影响。该变更被迅速回滚 ,最终于19:12全面恢复服务。
值得注意的是 ,此次中断仅限于处理配置管理的源码库控制平面(control plane) 。得益于严格隔离机制,处理客户流量的数据平面(data plane)未受影响,终端用户服务始终保持在线。
后续改进措施Cloudflare已制定多项防范措施:
优先将租户服务迁移至Argo Rollouts部署工具,该工具可自动检测错误并回滚版本在控制面板API重试逻辑中引入随机延迟机制,缓解"惊群效应"大幅增加租户服务资源配置改进容量监控系统,服务器租用实现主动预警功能Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“信息技术视野”。http://www.bziz.cn/news/344c399652.html
相关文章
黑客入侵 Tile 内部工具,数百万用户数据或被泄露
物联网在最近的一次数据泄露事件中,领先的蓝牙定位跟踪设备供应商之一 Tile 的数百万用户的个人信息可能被暴露,并引发了赎金要求。据 404 Media 报道,黑客利用窃取的一名前 Tile 公司员工的凭证 ...
【物联网】
阅读更多小米4i与米4在硬件上有哪些区别?
物联网关于近日小米在印度发布的新机小米4i,国内的相关消息却是寥寥,但这仍然挡不住国内的用户们对这部手机的好奇,如果你所知道的只是印度发布的小米4i颇具性价比的话,那么这篇小文将让你详细了解小米4i的细致信 ...
【物联网】
阅读更多华为P8熄屏快呼怎么使用
物联网华为P8熄屏快呼使用方法。熄屏快呼就是在黑屏状态下按住音量下键,喊一个你联系人里有的名字就直接把电话打出去,很多小伙伴还不知道有这个功能,现在就跟小编一起学学华为P8熄屏快呼使用方法吧! ...
【物联网】
阅读更多