研究人员向人工智能传授蛋白质折叠中的挫折感
科学家们找到了一种预测蛋白质在发挥作用时如何改变形状的新方法,这对于了解它们在生物系统中的工作方式非常重要。虽然最近的人工智能 (AI) 技术已经可以预测蛋白质在静息状态下的样子,但弄清楚它们如何运动仍然具有挑战性,因为没有足够的蛋白质运动实验直接数据来训练神经网络。在《美国国家科学院院刊》上发表的一项新研究中,莱斯大学的 Peter Wolynes 和他的中国同事将有关蛋白质能量景观的信息与深度学习技术相结合来预测这些运动。
他们的方法改进了 AlphaFold2 (AF2),这是一种预测静态蛋白质结构的工具,通过教导它关注“能量挫折”。蛋白质已经进化到可以最大限度地减少其各部分之间的能量冲突,因此它们可以集中到其静态结构上。冲突持续存在的地方,就被称为挫折。
“从预测的静态基态结构开始,新方法首先找到并逐步增强编码蛋白质进化发展的输入多序列比对序列中的能量挫折特征,从而为蛋白质运动生成替代结构和途径,”DR Bullard-Welch 基金会科学教授兼研究合著者 Wolynes 说。
研究人员在蛋白质腺苷酸激酶上测试了他们的方法,发现其预测的运动与实验数据相符。他们还成功预测了其他形状发生显著变化的蛋白质的功能性运动。
“预测蛋白质的三维结构和运动对于理解其功能和设计新药至关重要,”沃林斯说。
该研究还探讨了 AF2 的工作原理,表明将能量景观的物理知识与人工智能相结合,不仅有助于预测蛋白质的运动方式,而且还解释了为什么人工智能会高估结构完整性,从而只产生最稳定的结构。
沃林斯和他的同事几十年来一直致力于研究的能量景观理论是该方法的关键部分,但最近的人工智能代码被训练成只预测最稳定的蛋白质结构,而忽略了蛋白质在发挥作用时可能呈现的不同形状。
能量景观理论表明,虽然进化塑造了蛋白质的能量景观,使它们能够折叠成最佳结构,但偏离原本可以引导折叠的完美漏斗景观(称为局部挫折)对于蛋白质的功能运动至关重要。
通过精确定位这些受阻区域,研究人员教会人工智能在指导其预测时忽略这些区域,从而使代码能够准确预测替代蛋白质结构和功能运动。
研究人员利用在能量景观框架内开发的挫折分析工具,确定了蛋白质中受挫且因此具有灵活性的区域。
然后,通过操纵 AlphaFold 使用的对齐蛋白质家族序列中的进化信息并根据挫折分数,研究人员教会人工智能识别这些受挫区域,从而能够准确预测它们之间的替代结构和途径,Wolynes 说。
页:
[1]