Josiah02 发表于 2024-11-2 00:03:18

揭示复杂系统中的因果关系:新算法揭示隐藏的影响

了解因果关系的核心是理解我们周围世界的关键。导致一个变量(无论是生物物种、投票地区、公司股票还是当地气候)从一种状态转变为另一种状态的原因可以告诉我们未来如何塑造该变量。
但在现实世界的系统中,追踪结果到其根本原因很快就会变得难以解决,因为许多变量可能会汇聚、混淆并掩盖任何因果关系。
现在,麻省理工学院的一个工程师团队希望在因果关系的探索中提供一些清晰的线索。他们开发了一种可以应用于各种情况的方法,用于识别复杂系统中可能影响其他变量的变量。
该方法采用算法的形式,收集随时间推移而收集的数据,例如海洋环境中不同物种种群的变化。根据这些数据,该方法测量系统中每个变量之间的相互作用,并估计一个变量的变化(例如,某个地区沙丁鱼的数量随时间的变化)可以预测另一个变量的状态(例如同一地区的凤尾鱼种群)的程度。
然后,工程师们生成一个“因果关系图”,将可能存在某种因果关系的变量联系起来。
该算法确定该关系的具体性质,例如两个变量是否具有协同作用(即一个变量只有与第二个变量配对时才会影响另一个变量)或冗余作用,即一个变量的变化可以具有与另一个变量完全相同的效果,因此是冗余的。
新算法还可以对“因果泄漏”进行估计,即系统行为无法通过现有变量解释的程度;一定有一些未知的影响在起作用,因此必须考虑更多的变量。
麻省理工学院航空航天系(AeroAstro)研究生阿尔瓦罗·马丁内斯·桑切斯 (Álvaro Martínez-Sánchez) 表示:“我们的方法的意义在于它跨学科的多功能性。”
“它可以用于更好地了解生态系统中物种的进化、大脑中神经元的交流以及不同地区气候变量的相互作用,仅举几例。”
工程师们计划使用该算法来帮助解决航空航天领域的问题,例如识别飞机设计中可以降低飞机燃料消耗的特点。
“我们希望通过将因果关系嵌入模型,帮助我们更好地理解飞机设计变量之间的关系以及它与效率的关系,”AeroAstro 副教授 Adrián Lozano-Durán 说。
该工程师与麻省理工学院博士后 Gonzalo Arranz 在《自然通讯》上发表了他们的研究成果。
看到联系
近年来,人们开发了许多计算方法来获取有关复杂系统的数据,并基于应该代表因果关系的某些数学描述来识别系统中变量之间的因果关系。
“不同的方法使用不同的数学定义来确定因果关系,”洛扎诺-杜兰指出。“有很多可能的定义听起来都不错,但在某些情况下可能会失败。”
他特别指出,现有方法并非旨在区分某些类型的因果关系。也就是说,它们无法区分“独特”因果关系(即一个变量对另一个变量产生的独特影响,与其他所有变量无关)与“协同”或“冗余”联系。
协同因果关系的一个例子是,如果一个变量(比如,药物 A 的作用)对另一个变量(一个人的血压)没有影响,除非第一个变量与第二个变量(药物 B)配对。
冗余因果关系的一个例子是,如果一个变量(学生的工作习惯)影响另一个变量(他们获得好成绩的机会),但该影响与另一个变量(学生的睡眠时间)具有相同的影响。
“其他方法依靠变量的强度来衡量因果关系,”Arranz 补充道。“因此,它们可能会错过那些强度不强但很重要的变量之间的联系。”
短信费率
在他们的新方法中,工程师们借鉴了信息理论——信息理论是一门关于信息如何通过网络传递的科学,它基于已故麻省理工学院名誉教授克劳德·香农提出的理论。该团队开发了一种算法,用于评估任何复杂的变量系统作为信息网络。
“我们将系统视为一个网络,变量之间以可测量的方式传递信息,”洛扎诺-杜兰解释道。“如果一个变量向另一个变量发送信息,则意味着它一定有影响。这就是使用信息传播来衡量因果关系的想法。”
新算法同时评估多个变量,而不是像其他方法那样一次只考虑一对变量。该算法将信息定义为一个变量的变化会导致另一个变量发生变化的可能性。
随着算法随着时间的推移评估系统的更多数据,这种可能性(以及变量之间交换的信息)可能会变得更强或更弱。
最后,该方法会生成因果关系图,显示网络中哪些变量之间存在紧密联系。根据这些联系的速率和模式,研究人员可以区分哪些变量之间存在独特、协同或冗余关系。
通过同样的方法,该算法还可以估计系统中的“因果关系泄漏”的数量,即无法根据现有信息预测系统行为的程度。
“我们的方法的一部分是检测是否有东西缺失,”洛扎诺-杜兰说。“我们不知道缺失了什么,但我们知道我们需要纳入更多变量来解释正在发生的事情。”
研究团队将该算法应用于一系列通常用于测试因果推理的基准案例。这些案例包括对捕食者与猎物之间随时间变化的观察、对不同地理区域的气温和气压的测量,以及海洋环境中多个物种的共同进化。
与大多数只能处理某些情况的方法相比,该算法成功地识别了每种情况下的因果关系。
该团队发明的 SURD(因果关系的协同唯一冗余分解)方法可以在线获取,其他人可以在自己的系统上进行测试。
马丁内斯-桑切斯表示:“SURD 有潜力推动多个科学和工程领域的进步,例如气候研究、神经科学、经济学、流行病学、社会科学、流体动力学等领域。”

页: [1]
查看完整版本: 揭示复杂系统中的因果关系:新算法揭示隐藏的影响