Josiah02 发表于 2024-8-27 19:40:24

使用“混沌工程”使云计算不易受到网络攻击

云计算已成为当今技术的关键要素,是全球连接的支柱。它使企业、政府和个人能够使用和构建基于云的服务,并构成我们每天使用的大量系统的基础,包括电信、交通、医疗保健、银行甚至流媒体服务。
此类系统与任何硬件或软件一样,容易发生故障和遭受不可预测的网络攻击。网络犯罪分子变得更加坚定,他们的攻击也越来越复杂和频繁。这些团体经常使用的策略之一是分布式拒绝服务 (DDoS)攻击,这种攻击会向公司系统发送超出其 IT 系统处理能力的大量请求和流量。
这会将合法用户拒之门外,给公司带来严重问题,包括收入损失和客户忠诚度下降。这一问题可能会给谷歌和亚马逊等提供云计算服务来托管消费者数据、系统和服务的公司带来重大困难。
在我们的最新研究中,我们采用了几种策略来展示云计算系统如何通过压力得到加强。我们采用了一种称为混沌工程和自适应策略的技术,它们可以帮助系统从故障和网络攻击中学习。
云计算安全公司 Cloudflare 在最近的网络安全威胁季度分析中报告称,2023 年第三季度的 DDoS 攻击次数与上一季度相比增加了 65%。根据 Cloudflare 的2024 年第二季度报告,DDoS 攻击次数达 400 万次。
除了 DDoS 和其他蓄意攻击外,使用基于云的软件的公司还容易受到各种问题(从连接问题到物理服务器故障)导致的中断的影响,其中一些问题也可能由网络攻击造成。有时,即使是打字错误等小问题也可能导致基于云的网站瘫痪。
7月19日,CrowdStrike 的 Falcon 传感器发生故障,导致连接到 Microsoft Azure 云计算系统的 Windows 主机崩溃,从而引发全球范围的 IT 中断。
Falcon 传感器旨在防止网络相关攻击,并未受到网络攻击的影响。此次中断是由更新的技术问题引起的。7 月 31 日,微软 DDoS 防御系统出现错误,导致Azure中断 8 小时。
消除脆弱性
由于云的复杂性及其对其他系统(包括网络安全)的诸多依赖,解决此类重大中断带来了巨大挑战。实施可靠的修复可能需要数小时到数天的时间,在某些情况下,例如 CrowdStrike 的情况,甚至需要更长时间。
此类事件表明我们的技术基础设施总体上非常脆弱,尤其是基于云的系统。目前的解决方案侧重于管理这些事件的影响,而不是通过创建更可靠、更具弹性的云系统来解决根本问题。为了防止故障,一个关键步骤是集成标准的高级软件测试,以评估其在压力下的弹性和可靠性。
在我们的研究中,我们通过这样做来帮助云消费者抵御这些威胁,使云计算能够更好地抵御大规模攻击和中断并保持正常运行。那些运营云系统的人也需要适应并从以前的事件中吸取教训,使它们更强大。
我们一直在使用一种称为混沌工程的技术——故意攻击和试验这些基于云的软件应用程序——来观察系统如何应对此类攻击。
我们最近的一篇论文发现,我们可以利用这种技术更准确地预测系统对攻击的反应。混沌工程涉及故意将故障引入系统,然后测量结果。这种技术有助于识别和解决系统设计、架构和操作实践中的潜在漏洞和弱点。
方法可以包括关闭服务、注入延迟(系统响应命令的方式的时间滞后)和错误、模拟网络攻击、终止进程或任务,或模拟系统工作环境和配置方式的变化。
在最近的实验中,我们将故障引入实时云系统,以了解它们在攻击或故障等压力情况下的表现。通过逐渐增加这些“故障注入”的强度,我们确定了系统的最大压力点。
我们的调查显示,性能和服务可用性因此下降。因此,这些混沌工程实验发现了传统性能测量无法检测到的问题。
从混乱中学习
混沌工程是增强软件系统性能的绝佳工具。然而,为了实现我们所说的“反脆弱性”——系统在压力和混乱下会变得更强而不是更弱——我们需要将混沌测试与其他工具结合起来,使系统在受到攻击时变得更强。
在我们的最新作品中,我们提出了一个自适应框架来实现这一点。这个框架被称为“Unfragile”,它采用混沌工程逐步引入故障并评估系统在这些压力下的响应。
然后,我们引入新的自适应策略来消除通过混沌工程发现的漏洞。这可以包括修改软件本身的源代码以提高其性能。通过引入实时系统性能指标,系统可以变得具有自适应性,因为潜在的问题可以尽早发现并解决。
通过将混沌工程与这些自适应策略相结合,实时向操作员发出漏洞警报,以便修复漏洞,我们可以教会云系统不仅能承受压力,还能变得更强大。
这将确保我们的关键数字基础设施更加强大、可靠,并能够从混乱中学习,以更好地应对未来的挑战。

页: [1]
查看完整版本: 使用“混沌工程”使云计算不易受到网络攻击