您现在的位置是:系统运维 >>正文
因拼写错误,17个数据库被删除,微软 Azure DevOps 罢工十小时
系统运维9人已围观
简介The register 网站披露,巴西南部地区部署的 Microsoft Azure DevOps 服务”罢工“了约十个小时。随后,微软首席软件工程经理 Eric Mattingly 为本次中断事件 ...
The 因拼register 网站披露 ,巴西南部地区部署的写错 Microsoft Azure DevOps 服务”罢工“了约十个小时。随后,误个微软微软首席软件工程经理 Eric Mattingly 为本次中断事件公开道歉 ,数据删除并透露中断原因是库被一个简单拼写错误致使 17 个生产数据库被删除 。
Mattingly 表示 Azure DevOps 工程师会定期对生产数据库进行快照(Snapshot)处理 ,因拼以便及时调查报告上来的写错问题或测试性能是否改进,这些举动都依赖一个每天运行的误个微软后台系统,该系统会在特定时间删除旧的数据删除快照 。
在 Azure DevOps 工程师近期进行的亿华云库被一次代码升级中,用支持的因拼 Azure.ResourceManager.*NuGet 包取代了弃用的 Microsoft.Azure.Management.*包 ,此举引起一个大型的写错拉取请求,其中更换了旧包和新包中的误个微软 API 调用 。
然而拉取请求中却出现了拼写错误,数据删除误将删除快照数据库的库被调用改成了删除托管数据库的 Azure SQL Server 的调用,导致后台快照删除作业删除了整个服务器。

Mattingly 指出 Azure DevOps 有专门的建站模板测试来捕捉此类问题,但是错误的代码只在某些特定条件下才得以运行 ,因此在现有的测试中没有很好的覆盖到。(据推测 ,这些条件需要存在于一个足够“老”的数据库快照 ,以便被删除脚本所捕获。)
Mattingly 进一步指出由于没有任何快照数据库,Sprint 222 的内部部署(第0环)没有发生任何意外 ,几天后,高防服务器软件变更被部署到客户环境(第1环)被用于南巴西规模单位(一个特定角色的服务器集群)。该环境中有一个快照数据库,其年龄“老”到足以触发该错误,最终导致后台工作删除了该规模单位的“整个 Azure SQL 服务器和所有 17 个生产数据库” 。
经过十多个小时的努力 ,微软方面已经全部恢复了数据库,为防止此类问题再次发生 ,微软已经采取各种修复和重新配置措施。花费如此长时间的原因如下:
第一:由于客户自己无法恢复 Azure SQL Server, 必须由 Azure 工程师来处理这一问题,这一过程大约需要一个小时:第二:数据库具有不同的免费模板备份配置 ,一些数据库被配置为区域冗余备份 ,另一些数据库被设置为最近的地理区域冗余备份 ,协调这种不匹配的冗余备份,需要花费几个小时;最后一个原因 :在数据库开始恢复在线后 ,由于自身网络服务器存在一系列复杂问题 ,使用这些数据库的客户也无法立刻访问整个规模单元 。据悉,这些问题由服务器预热任务引起,该任务通过测试调用在可用数据库列表中反复进行 ,恢复过程中的数据库出现了一个错误,服务器租用就会触发预热测试 执行指数回退重试,导致预热平均需要 90 分钟,在正常情况下此操作只需要几秒钟。
更为复杂的是 ,整个恢复过程交错进行 ,一旦有一两台服务器开始接受客户流量,就会出现过载现象,然后停机 。因此 ,恢复服务需要阻断所有到巴西南部规模单位的流量 ,直到一切都充分准备好后,才重新加入负载平衡器并处理流量 。香港云服务器
文章来源 :https://www.theregister.com/2023/06/03/microsoft_azure_outage_brazil/
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“信息技术视野”。http://www.bziz.cn/news/06c799986.html
相关文章
警惕!黑客正在从分类信息网站上窃取信用卡
系统运维Bleeping Computer 网站披露,新加坡正在发生一场新的信用卡窃取活动,攻击者通过精心设计的网络钓鱼伎俩,“抢夺”分类网站上卖家的付款信息。更糟糕的是,攻击者还试图利用银行平台上的一次性有 ...
【系统运维】
阅读更多Cool1跑分高低与性能表现详解(一起了解Cool1的跑分成绩以及其背后的性能实力)
系统运维Cool1是由酷派和乐视合作推出的一款智能手机,它以出色的性能和高效的处理能力在市场上备受瞩目。本文将深入探讨Cool1的跑分情况,了解其在性能方面的实际表现。1.Cool1的整体性能水平介绍Cool ...
【系统运维】
阅读更多安卓手机怎么打印照片?
系统运维1、准备工作:确保电脑中的QQ在线,和电脑连接的彩色打印机开机。好了,我们可以开始了。打开手机QQ,用和电脑QQ相同号码登录。 2、在打开的;手机QQ”的界面上,出现很多功能选项,如图所 ...
【系统运维】
阅读更多
热门文章
最新文章
友情链接
- Realtek 蓝牙安全连接配对漏洞可导致攻击者发起拒绝服务攻击
- 身份安全成焦点:Palo Alto Networks拟以250亿美元收购CyberArk
- W7手动还原系统教程(一步步教您如何使用W7手动还原系统,保护和修复您的计算机)
- 0day 漏洞量产?AI Agent “生产线”曝光
- DellInspiron5548(一款超值的笔记本电脑选择)
- 戴尔易安信加固过的机箱,保证在远程和恶劣环境下工作的可靠性,满足边缘工作负载不断增长的需求
- 备份系统也能成为“核心设施”?瑞数信息给出了一套“有韧性”解题思路!
- 戴尔PowerEdge以高性能计算 为奥运健儿保驾护航
- 运维工程师来活了,Linux 又报了两个超级漏洞(附解决方案)
- 苹果6s升级iOS11的体验(以苹果6s为例,探索iOS11的新特性和性能提升) 香港物理机云服务器企业服务器源码库亿华云网站建设b2b信息平台