CrowdStrike 更新错误如何导致全球计算机崩溃
世界各地的航空公司、银行、医院和其他规避风险的组织选择网络安全公司 CrowdStrike 来保护他们的计算机系统免受黑客和数据泄露的侵害。但周五,CrowdStrike 软件的一次错误更新就引发了全球混乱,导致航班停飞、银行和媒体机构下线,医院、零售商和其他服务也陷入混乱。
康奈尔大学工程学助理教授 Gregory Falco 表示:“这是因为我们所有 IT 基础设施的主干都采用了同质化技术。造成这种混乱的真正原因是,我们只依赖少数几家公司,而每个人都聘用同样的人,因此所有人都会同时陷入困境。”
CrowdStrike 表示,其发布的更新问题以及影响运行微软 Windows 操作系统的计算机的问题并不是黑客事件或网络攻击,该公司已道歉并表示正在修复问题。
但这不是一个简单的解决办法。Gartner 分析师 Eric Grenier 表示,这需要“实地行动”来补救。
“修复工作正在奏效,但这只是个非常手动的过程,并没有万能钥匙可以解锁,”格雷尼尔说。“我认为这可能就是公司目前面临的最大问题。”
虽然并不是每个人都是 CrowdStrike 及其平台 Falcon 的客户,但它是领先的网络安全提供商之一,尤其是在交通运输、医疗保健、银行和其他对保持其计算机系统正常运转至关重要的行业。
“他们通常是厌恶风险的组织,不想要疯狂创新的东西,但这些东西既能发挥作用,又能在出现问题时为他们提供保障。这就是 CrowdStrike,”Falco 说。“他们环顾其他行业的同事,说:‘哦,你知道,这家公司也在使用这个,所以我也需要他们。’”
2024 年 7 月 19 日星期五,纽约拉瓜迪亚机场的屏幕上显示延误的航班时刻表,此前 CrowdStrike 更新出现故障,导致运行 Microsoft Windows 的计算机出现大规模互联网中断。图片来源:美联社/Yuki Iwamura
担心全球互联技术生态系统的脆弱性并不是什么新鲜事。上世纪 90 年代,人们曾担心技术故障会在千禧之际引发混乱。
澳大利亚网络安全顾问特洛伊·亨特 (Troy Hunt) 在社交平台 X 上写道:“这基本上就是我们对千年虫问题所担心的问题,只不过这次真的发生了。”
周五,全球各地受影响的计算机均出现“蓝屏死机”现象,这表明微软的 Windows 操作系统出现了问题。
但现在的不同之处在于“这些公司的地位更加稳固,”法尔科说。“我们认为我们有很多可用的参与者。但最终,最大的公司使用的东西都是一样的。”
CrowdStrike 成立于 2011 年,自 2019 年起上市,该公司在提交给金融监管机构的年度报告中称,该公司“为云时代重塑了网络安全,并改变了网络安全的交付方式和客户体验方式”。该公司强调,它使用人工智能来帮助自己跟上对手的步伐。该公司报告称,今年年初,其订阅客户数量已达 29,000 人。
这家总部位于德克萨斯州奥斯汀的公司是全球知名度较高的网络安全公司之一,在营销方面投入巨资,包括超级碗广告。在网络安全会议上,该公司以大型展台而闻名,这些展台展示了代表不同国家支持的黑客团体的大型人偶雕像,CrowdStrike 技术承诺抵御这些黑客团体。
CrowdStrike 首席执行官乔治·库尔茨 (George Kurtz) 是全球薪酬最高的人之一,过去三年的总薪酬超过 2.3 亿美元。库尔茨还是 CrowdStrike 赞助的赛车队的车手。
库尔茨最初就这一问题发表的声明因缺乏悔意而受到批评后,他于周五在社交媒体上以及在美国全国广播公司 (NBC) 的“今日秀”节目中道歉。
2024 年 7 月 19 日星期五,在 CrowdStrike 更新出现故障影响运行 Microsoft Windows 的计算机并导致互联网严重中断后,Porter 乘客在多伦多皮尔逊机场等候。图片来源:Chris Young/美联社
他在 X 上表示:“我们了解情况的严重性,并对由此带来的不便和干扰深表歉意。”
网络安全行业分析师理查德·斯蒂农 (Richard Stiennon) 表示,这是 CrowdStrike 的一个历史性失误。
追踪网络安全行业 24 年的斯蒂恩农表示:“这无疑是任何安全软件提供商有史以来最严重的失误、技术失误或故障。”
他说,虽然这个问题很容易通过技术手段解决,但对一些组织来说,它的影响可能会持续很长时间,因为修复每台受影响的计算机都需要动手。“修复数百万台机器真的非常非常困难。而且现在大家都在度假,所以你知道,首席执行官几周后就要从巴哈马回来了,他不能使用他的电脑。”
斯蒂农表示,他不认为这次中断事件暴露了网络安全行业或 CrowdStrike 公司存在的更大问题。
他说:“市场会原谅他们,客户也会原谅他们,这件事情都会过去的。”
Forrester 分析师 Allie Mellen 称赞 CrowdStrike 明确告知客户解决问题需要做什么。但她表示,要恢复信任,需要更深入地了解发生了什么,以及可以做出哪些改变来防止再次发生。
“这很大程度上可能归咎于测试和软件开发过程,以及他们在部署之前为测试此类更新所做的工作,”梅伦说。“但直到我们看到完整的回顾,我们才会知道故障到底是什么。”
页:
[1]