2024年7月19日,全球各地网友突然发现他们的 Windows 电脑开始频繁出现蓝屏(BSOD)故障。当他们在社交媒体上吐槽时,更严重的危机也蔓延到了关键领域,包括但不限于零售、航空、金融、医疗等。比如,美国多家主要航空公司取消航班,银行和交易所停止服务。然而这次蓝屏故障对国内却没什么影响,国内虽然也有 Windows 电脑出现蓝屏宕机,但主要是外企的设备,国内大部分公司和个人电脑未受影响。
随着网友、各个机构以及微软的介入,这场全球 Windows 系统宕机故障的原因逐渐清晰——宕机设备都安装了 CrowdStrike 公司的安全软件。CrowdStrike的产品主要用于帮助企业防范勒索软件等黑客威胁,近年来业务扩展迅速,成为该领域的主要供应商。与传统防病毒软件相比,其产品属于「端点检测和响应」类软件,可以不断扫描设备上的可疑活动并自动做出响应。为了实现这种级别的防护,其组件需要作为驱动程序运行在内核级别,从而带来了造成操作系统故障的潜在风险。
根据目前的最新情况来看,CrowdStrike在安全配置文件上缺乏完善地测试,没有严格进行环境测试和代码审查,导致存在Bug的更新包未经过充分测试就被直接部署到生产环境,CrowdStrike也缺乏应急回滚机制,在出现了蓝屏问题以后不能及时撤销新推送的安全配置文件,最后不少领域的机构用户没有冗余备份,单一节点故障就导致业务停摆。
|