找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

只需一步,快速开始

查看: 36|回复: 0

诺贝尔化学奖授予三位利用人工智能设计蛋白质和生命构造块的科学家

[复制链接]

2733

主题

0

回帖

5466

积分

管理员

积分
5466
发表于 2024-10-10 16:26:53 | 显示全部楼层 |阅读模式 IP归属地:亚太地区
三位科学家因发现了预测甚至设计新型蛋白质(生命的基本成分)的强大技术而于周三荣获诺贝尔化学奖。他们的研究成果采用了人工智能等先进技术,有望改变新药的生产方式。
该奖项授予了西雅图华盛顿大学的生物化学家戴维·贝克(David Baker)以及位于伦敦的英美人工智能研究实验室谷歌 DeepMind 的计算机科学家德米斯·哈萨比斯(Demis Hassabis)和约翰·江珀(John Jumper)。
诺贝尔化学奖委员会主席海纳·林克表示,该奖项旨在表彰数十年来解决化学,特别是生物化学领域重大挑战的研究。
他说:“今天获奖的正是这一突破。”
2024 年诺贝尔化学奖颁给什么人?
蛋白质是一种复杂的分子,由数千个原子组成,这些原子以无数种形状扭曲、旋转、成环和螺旋,这些形状决定了它们的生物功能。几十年来,科学家一直梦想着能够高效地设计和制造新的蛋白质。
62 岁的贝克的研究自 1990 年代以来一直获得美国国立卫生研究院的资助,他创建了一个名为 Rosetta 的计算机程序,帮助分析综合数据库中现有蛋白质的信息,以构建自然界中不存在的新蛋白质。
诺贝尔委员会的约翰·奥奎斯特 (Johan Åqvist) 表示:“现在看来,利用这项技术几乎可以构建任何类型的蛋白质。”
该委员会补充说,48 岁的哈萨比斯和 39 岁的江珀创建了一个人工智能模型,可以预测研究人员已发现的几乎所有 2 亿种蛋白质的结构。
林克说,两人“成功破解了密码。通过熟练使用人工智能,他们能够预测自然界中任何已知蛋白质的复杂结构”。
这项工作为何重要?
定制设计新蛋白质以及更好地理解现有蛋白质的能力可以帮助研究人员开发新型药物和疫苗。它还可以帮助科学家设计新的酶来分解塑料或其他废料,并设计用于检测危险材料的精细传感器。
贝克对美联社说:“我认为研制更好的药物有着美好的前景,这些药物更智能,只在身体的正确时间和地点发挥作用。”
他说,一个例子是一种潜在的鼻腔喷雾剂,它可以减缓或阻止特定病毒(如 COVID-19)的快速传播。另一种是用于破坏被称为细胞因子风暴的连锁症状的药物。
“这一直是我们的追求。如果你能弄清楚蛋白质序列如何折叠成特定的结构,那么就有可能设计出以前从未见过的蛋白质序列,这可能对我们有用,”美国国立卫生研究院院长乔恩·洛尔施 (Jon Lorsch) 说。
获奖者的反应
贝克告诉美联社,他是在凌晨时分与妻子一起得知自己获得诺贝尔奖的消息的,妻子立刻尖叫起来。
“所以声音也有点震耳欲聋,”他说。
哈萨比斯在一次在线新闻发布会上表示,获得诺贝尔奖是“一生中难以置信的荣誉”。
2023 年 11 月 2 日星期四,DeepMind Technologies 首席执行官兼 AlphaGO 开发者 Demis Hassabis 出席在英国布莱切利布莱切利园举行的英国人工智能 (AI) 安全峰会。图片来源:Toby Melville/Pool Photo via AP,文件
他是英国科技界的领军人物之一,2010 年与他人共同创立了人工智能研究实验室 DeepMind,该实验室于 2014 年被谷歌收购。DeepMind 过去的突破包括开发出一种人工智能系统,该系统掌握了中国围棋游戏,并击败了人类世界冠军。
哈萨比斯说,当他最终接到电话时,他正在家里度过一个“普通的早晨”。诺贝尔委员会最初没有他的电话号码,他们先是设法联系了他的妻子,但她多次挂断了电话。
“这太不可思议了。这一刻简直太不真实了,”谷歌 DeepMind 研究员兼主管 Jumper 说道。“这真是太棒了。”
人工智能的作用是什么?
过去研究人员花费数月甚至数年的时间来破译单个复杂蛋白质的结构。
但哈萨比斯在接受美联社采访时表示,DeepMind 研究人员创建的人工智能模型 AlphaFold“可以在几秒钟或几分钟内相当准确地确定蛋白质的结构”,并补充说,这为研究人员节省了“数年可能艰苦的实验工作”。
两个研究小组互相学习对方的工作。
贝克表示,哈萨比斯和江珀的人工智能工作给他的团队带来了巨大的推动。
贝克说:“戴米斯和约翰在蛋白质结构预测方面取得的突破确实向我们展示了人工智能的威力。这促使我们将这些人工智能方法应用于蛋白质设计。”
科学研究已经加速,Jumper 说道。“这是人工智能将加快科学研究速度的关键证明”
这是今年第二位授予与谷歌人工智能研究有关联的人的诺贝尔奖。
昨日的诺贝尔物理学奖获得者杰弗里·辛顿(Geoffrey Hinton)经常被称为“人工智能教父”,他之前也曾在这家科技公司工作,但后来辞职,以便能够更公开地谈论人工智能的潜在弊端。
“我希望人工智能能带来巨大的好处,”欣顿在周二的一次网络新闻发布会上说道。“我相信人工智能将在医疗保健领域带来巨大的好处。”
“我担心这也可能导致一些不好的事情。尤其是,当我们拥有比我们更聪明的东西时,没有人真正知道我们是否能够控制它们。”
有关诺贝尔奖的更多信息
贝克获得 1100 万瑞典克朗(100 万美元)奖金的一半,哈萨比斯和江珀分享另一半。
诺贝尔奖颁奖典礼于周一拉开帷幕,为期六天,美国人维克多·安布罗斯和加里·鲁夫昆荣获医学奖。机器学习的两位创始人——辛顿和约翰·霍普菲尔德——荣获物理学奖。
诺贝尔奖颁奖典礼继续进行,文学奖将于周四公布。诺贝尔和平奖将于周五公布,经济学奖将于 10 月 14 日公布。
奖金来自该奖项创始人、瑞典发明家阿尔弗雷德·诺贝尔的遗赠。获奖者将受邀于 12 月 10 日(诺贝尔逝世周年纪念日)参加颁奖典礼。
诺贝尔委员会公告:
瑞典皇家科学院决定颁发 2024 年诺贝尔化学奖
其中一半
戴维·贝克 (David Baker),华盛顿大学,美国华盛顿州西雅图
“用于计算蛋白质设计”
另一半则共同
Demis Hassabis,谷歌 DeepMind,英国伦敦
John M. Jumper,谷歌 DeepMind,英国伦敦
“用于蛋白质结构预测”
他们破解了蛋白质惊人结构的密码
2024 年诺贝尔化学奖将颁发给蛋白质,即生命中精妙的化学工具。大卫·贝克成功完成了几乎不可能完成的壮举,制造出全新种类的蛋白质。德米斯·哈萨比斯和约翰·江珀开发了一种人工智能模型来解决一个 50 年前的问题:预测蛋白质的复杂结构。这些发现具有巨大的潜力。
生命的多样性证明了蛋白质作为化学工具的惊人能力。它们控制和驱动所有化学反应,这些化学反应共同构成了生命的基础。蛋白质还充当激素、信号物质、抗体和不同组织的组成部分。
诺贝尔化学奖委员会主席海纳·林克 (Heiner Linke) 表示:“今年获得认可的发现之一与神奇蛋白质的构造有关。另一项发现则实现了一个 50 年来的梦想:根据氨基酸序列预测蛋白质结构。这两项发现都开辟了广阔的可能性。”
蛋白质通常由 20 种不同的氨基酸组成,可以说是生命的基石。2003 年,大卫·贝克成功利用这些基石设计出一种与其他蛋白质不同的新蛋白质。此后,他的研究小组不断创造出一个又一个富有想象力的蛋白质,包括可用作药物、疫苗、纳米材料和微型传感器的蛋白质。
第二个发现涉及蛋白质结构的预测。在蛋白质中,氨基酸以长链连接在一起,折叠起来形成三维结构,这对蛋白质的功能至关重要。自 20 世纪 70 年代以来,研究人员一直试图根据氨基酸序列预测蛋白质结构,但这是非常困难的。然而,四年前,出现了一个惊人的突破。
2020 年,Demis Hassabis 和 John Jumper 提出了一个名为 AlphaFold2 的 AI 模型。借助该模型,他们能够预测研究人员发现的几乎所有 2 亿种蛋白质的结构。自他们取得突破以来,来自 190 个国家的 200 多万人使用了 AlphaFold2。在众多科学应用中,研究人员现在可以更好地了解抗生素耐药性并创建可分解塑料的酶的图像。
没有蛋白质,生命就无法存在。我们现在可以预测蛋白质结构并设计自己的蛋白质,这给人类带来了最大的利益。
2024 年诺贝尔化学奖
化学家们一直梦想着完全理解和掌握生命的化学工具——蛋白质。现在这个梦想已经触手可及。Demis Hassabis 和 John M. Jumper 已经成功利用人工智能预测了几乎所有已知蛋白质的结构。David Baker 已经学会了如何掌握生命的组成部分并创造全新的蛋白质。他们的发现潜力巨大。
他们通过计算和人工智能揭示了蛋白质的秘密
生命如此丰富的化学反应是如何产生的?答案是蛋白质的存在,蛋白质可以说是一种出色的化学工具。它们通常由 20 种氨基酸组成,可以以无数种方式组合。利用 DNA 中存储的信息作为蓝图,氨基酸在我们的细胞中连接在一起形成长链。
然后,蛋白质的神奇之处就出现了:氨基酸链扭曲并折叠成独特的(有时是独一无二的)三维结构。正是这种结构赋予蛋白质功能。一些蛋白质成为可以制造肌肉、角或羽毛的化学构件,而另一些则可能成为激素或抗体。它们中的许多形成酶,以惊人的精度驱动生命的化学反应。位于细胞表面的蛋白质也很重要,它们充当细胞与周围环境之间的通讯渠道。
生命化学构件这 20 种氨基酸所蕴含的潜力无论怎样强调都不为过。2024 年诺贝尔化学奖旨在表彰对氨基酸的全新理解和掌握。奖金的一半授予 Demis Hassabis 和 John Jumper,他们利用人工智能成功解决了化学家们 50 多年来一直困扰他们的一个问题:根据氨基酸序列预测蛋白质的三维结构。这让他们能够预测几乎所有 2 亿种已知蛋白质的结构。奖金的另一半授予 David Baker。他开发了计算机化方法来实现许多人认为不可能实现的事情:创造以前不存在的蛋白质,而且在许多情况下,这些蛋白质具有全新的功能。
2024 年诺贝尔化学奖表彰了两项不同的发现,但正如你所看到的,它们紧密相连。要了解今年的获奖者克服了哪些挑战,我们必须回顾现代生物化学的起源。
第一张蛋白质颗粒状照片
自 19 世纪以来,化学家们就知道蛋白质对生命过程至关重要,但直到 20 世纪 50 年代,化学工具才足够精确,研究人员才开始更详细地探索蛋白质。剑桥研究人员约翰·肯德鲁和马克斯·佩鲁茨在 20 世纪 50 年代末取得了一项突破性的发现,他们成功地使用一种名为 X 射线晶体学的方法呈现了蛋白质的第一个三维模型。为了表彰这一发现,他们于 1962 年获得了诺贝尔化学奖。
随后,研究人员主要利用X射线晶体学,往往花费大量精力,成功生成了约20万种不同蛋白质的图像,为2024年诺贝尔化学奖奠定了基础。
一个谜语:蛋白质如何找到自己独特的结构?
美国科学家克里斯蒂安·安芬森 (Christian Anfinsen) 也做出了另一项早期发现。他利用各种化学技巧,成功使现有蛋白质展开,然后再次折叠起来。有趣的是,蛋白质每次都呈现出完全相同的形状。1961 年,他得出结论,蛋白质的三维结构完全由蛋白质中的氨基酸序列决定。这让他于 1972 年获得诺贝尔化学奖。
然而,安芬森的逻辑中却存在一个悖论,另一个美国人赛勒斯·列文塔尔在 1969 年就指出了这一点。他计算出,即使一种蛋白质只由 100 种氨基酸组成,理论上该蛋白质至少可以呈现 10 47种不同的三维结构。如果氨基酸链随机折叠,那么找到正确的蛋白质结构所需的时间将比宇宙的年龄还要长。在细胞中,这只需要几毫秒。那么氨基酸链究竟是如何折叠的呢?
安芬森的发现和列文塔尔悖论暗示折叠是一个预先确定的过程。而且——重要的是——有关蛋白质如何折叠的所有信息都必须存在于氨基酸序列中。
迎接生物化学的巨大挑战
上述见解带来了另一个决定性的认识——如果化学家知道蛋白质的氨基酸序列,他们就应该能够预测蛋白质的三维结构。这是一个令人兴奋的想法。如果他们成功了,他们将不再需要使用繁琐的 X 射线晶体学,并且可以节省大量时间。他们还能够为所有不适用 X 射线晶体学的蛋白质生成结构。
这些合乎逻辑的结论向生物化学领域的巨大挑战——预测问题——发起了挑战。为了促进该领域的更快发展,研究人员于 1994 年启动了一项名为“蛋白质结构预测关键评估”(CASP)的项目,该项目发展成为一场比赛。每隔一年,来自世界各地的研究人员就会获得刚刚确定结构的蛋白质氨基酸序列。然而,这些结构对参与者是保密的。挑战是根据已知的氨基酸序列预测蛋白质结构。
CASP 吸引了众多研究人员,但解决预测问题却异常困难。研究人员在竞赛中输入的预测与实际结构之间的对应关系几乎没有任何改善。直到 2018 年,一位国际象棋大师、神经科学专家和人工智能先驱进入该领域,才取得了突破。
棋盘游戏大师参加蛋白质奥运会
让我们简单了解一下 Demis Hassabis 的背景:他从四岁开始下国际象棋,13 岁时就达到了大师级水平。十几岁时,他开始了程序员和成功的游戏开发者的职业生涯。他开始探索人工智能,并涉足神经科学,在那里他取得了几项革命性的发现。他利用自己对大脑的了解为人工智能开发了更好的神经网络。2010 年,他与他人共同创立了 DeepMind,这家公司为流行的棋盘游戏开发了精湛的人工智能模型。该公司于 2014 年被出售给谷歌,两年后,DeepMind 引起了全球关注,当时该公司实现了许多人认为是人工智能的圣杯:击败了世界上最古老的棋盘游戏之一围棋的冠军选手。
然而,对于哈萨比斯来说,围棋并不是目标,而是开发更好的人工智能模型的手段。在这次胜利之后,他的团队准备解决对人类更重要的问题,因此在 2018 年他报名参加了第十三届 CASP 比赛。
Demis Hassabis 的 AI 模型意外获胜
前些年,研究人员为 CASP 预测的蛋白质结构最多只能达到 40% 的准确率。而哈萨比斯团队的 AI 模型 AlphaFold 则将准确率提升到了近 60%。他们最终获胜,而优异的结果也让很多人感到意外——这是意料之外的进展,但解决方案还不够好。要想获得成功,预测结果与目标结构的准确率必须达到 90%。
哈萨比斯和他的团队继续开发 AlphaFold——但无论他们多么努力,算法都未能完全实现。残酷的事实是,他们已经走进了死胡同。团队已经筋疲力尽,但有一位相对较新的员工对如何改进人工智能模型有着决定性的想法:约翰·江珀 (John Jumper)。
约翰·江珀 (John Jumper) 接受生物化学的巨大挑战
约翰·江珀对宇宙的迷恋使他开始学习物理和数学。然而,2008 年,当他开始在一家使用超级计算机模拟蛋白质及其动力学的公司工作时,他意识到物理知识可以帮助解决医学问题。
2011 年,Jumper 开始攻读理论物理学博士学位,当时他对蛋白质产生了浓厚的兴趣。为了节省计算机容量(当时大学里计算机容量非常紧缺),他开始开发更简单、更巧妙的方法来模拟蛋白质动力学。很快,他也接受了生物化学的巨大挑战。2017 年,他刚刚完成博士学位,就听到有传言称,谷歌 DeepMind 已经开始秘密预测蛋白质结构。他向他们发送了一份工作申请。他在蛋白质模拟方面的经验使他对如何改进 AlphaFold 有了创造性的想法,因此,在团队开始停滞不前后,他得到了晋升。Jumper 和 Hassabis 共同领导了从根本上改革人工智能模型的工作。
改革后的人工智能模型取得了惊人的成果
新版本 AlphaFold2 的出现得益于 Jumper 对蛋白质的了解。该团队还开始使用人工智能领域最近取得巨大突破背后的创新:称为 transformers 的神经网络。这些神经网络可以以比以前更灵活的方式在大量数据中寻找模式,并有效地确定应该关注什么才能实现特定目标。
该团队利用数据库中所有已知蛋白质结构和氨基酸序列的海量信息对 AlphaFold2 进行了训练,新的 AI 架构在第十四届 CASP 竞赛开始取得良好的成绩。
2020 年,当 CASP 的组织者评估结果时,他们意识到生物化学 50 年的挑战已经结束。在大多数情况下,AlphaFold2 的表现几乎与 X 射线晶体学一样好,这令人震惊。当 CASP 的创始人之一约翰·莫尔特 (John Moult) 于 2020 年 12 月 4 日结束比赛时,他问道——现在怎么办?
我们稍后会回到这个问题上。现在,我们将回到过去,介绍 CASP 的另一位参与者。让我们介绍 2024 年诺贝尔化学奖的另一半,该奖项涉及从零开始创造新蛋白质的艺术。
一本关于细胞的教科书让大卫·贝克改变了方向
大卫·贝克开始在哈佛大学学习时,选择了哲学和社会科学。然而,在学习进化生物学课程时,他偶然发现了如今已成为经典教科书的《细胞分子生物学》的初版。这让他改变了人生方向。他开始探索细胞生物学,并最终对蛋白质结构产生了浓厚的兴趣。1993 年,他开始担任西雅图华盛顿大学的课题组组长,并接受了生物化学的巨大挑战。他利用巧妙的实验,开始探索蛋白质的折叠方式。这为他提供了深刻的见解,让他在 20 世纪 90 年代末开始开发可以预测蛋白质结构的计算机软件:Rosetta。
1998 年,贝克首次使用 Rosetta 参加 CASP 竞赛,与其他参赛者相比,它的表现非常出色。这次成功带来了一个新想法——大卫·贝克的团队可以反向使用该软件。他们不必在 Rosetta 中输入氨基酸序列并得到蛋白质结构,而是可以输入所需的蛋白质结构并获得其氨基酸序列的建议,这将使他们能够创建全新的蛋白质。
贝克成为蛋白质建造者
蛋白质设计领域(研究人员设计具有新功能的定制蛋白质)在 20 世纪 90 年代末开始兴起。在许多情况下,研究人员对现有蛋白质进行调整,以便它们能够分解危险物质或作为化学制造业的工具。
然而,天然蛋白质的范围是有限的。为了增加获得具有全新功能的蛋白质的可能性,贝克的研究小组希望从头开始创造它们。正如贝克所说:“如果你想制造一架飞机,你不会从改造一只鸟开始;相反,你要了解空气动力学的基本原理,并根据这些原理制造飞行器。”
一种独特的蛋白质问世
构建全新蛋白质的领域称为从头设计。研究小组绘制了一种具有全新结构的蛋白质,然后让 Rosetta 计算哪种氨基酸序列可以产生所需的蛋白质。为此,Rosetta 搜索了所有已知蛋白质结构的数据库,并寻找与所需结构相似的蛋白质短片段。然后,Rosetta 利用蛋白质能量图的基本知识优化了这些片段并提出了一个氨基酸序列。
为了研究该软件的成功程度,贝克的研究小组将拟议氨基酸序列的基因引入到产生所需蛋白质的细菌中。然后他们使用 X 射线晶体学确定了蛋白质结构。
事实证明,Rosetta 确实可以构建蛋白质。研究人员开发的蛋白质 Top7 几乎与他们设计的结构完全一致。
贝克实验室的惊人创造
Top7 的诞生对从事蛋白质设计的研究人员来说是一个意外的惊喜。之前设计从头蛋白质的人只能模仿现有的结构。Top7 的独特结构在自然界中并不存在。此外,该蛋白质含有 93 种氨基酸,比之前使用从头设计生产的任何蛋白质都要大。
贝克于 2003 年发表了他的发现。这是一项只能被描述为非凡发展的第一步。他还发布了 Rosetta 的代码,因此全球研究界继续开发该软件,寻找新的应用领域。
现在是时候解决 2024 年诺贝尔化学奖的悬而未决的问题了。现在怎么办?
以前需要几年时间才能完成的工作现在只需几分钟
当 Demis Hassabis 和 John Jumper 确认 AlphaFold2 确实有效后,他们计算了所有人类蛋白质的结构。然后他们预测了研究人员在绘制地球生物图谱时迄今发现的几乎所有 2 亿种蛋白质的结构。
谷歌 DeepMind 还将 AlphaFold2 的代码公开,任何人都可以访问。这个人工智能模型已经成为研究人员的金矿。到 2024 年 10 月,来自 190 个国家的 200 多万人使用了 AlphaFold2。以前,获得蛋白质结构通常需要数年时间,现在只需几分钟即可完成。这个人工智能模型并不完美,但它可以估计它所生成的结构的正确性,因此研究人员知道预测的可靠性。
2020 年 CASP 竞赛结束后,David Baker 意识到了基于 Transformer 的 AI 模型的潜力,于是在 Rosetta 中加入了该模型,这也促进了蛋白质的从头设计。近年来,Baker 的实验室中出现了一个又一个令人难以置信的蛋白质创造。
令人眼花缭乱的发展造福人类
蛋白质作为化学工具的惊人多功能性反映在生命的多样性中。我们现在可以如此轻松地看到这些小分子机器的结构,这令人难以置信;它让我们更好地了解生命的运作方式,包括某些疾病为何发展、抗生素耐药性如何产生或某些微生物为何能够分解塑料。
创造具有新功能的蛋白质的能力同样令人惊叹。这可以带来新的纳米材料、靶向药物、更快的疫苗开发、最小的传感器和更绿色的化学工业——这些只是为人类带来最大利益的几个应用。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|NewCET |网站地图

GMT+8, 2024-11-16 22:40 , Processed in 0.027214 second(s), 21 queries .

Powered by NewCET 1.0

Copyright © 2012-2024, NewCET.

快速回复 返回顶部 返回列表