DeepMind突破!AlphaFold一年预测2亿蛋白质: 近日,Google DeepMind 创始人、诺奖得主Demis Hassabis在接受《60 Minutes》的采访时提到,DeepMind 的蛋白质预构成式 Al……
哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“DeepMind突破!AlphaFold一年预测2亿蛋白质”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。
DeepMind突破!AlphaFold一年预测2亿蛋白质:
近日,Google DeepMind 创始人、诺奖得主Demis Hassabis在接受《60 Minutes》的采访时提到,DeepMind 的蛋白质预构成式 AlphaFold 仅一年时间就能绘制超过2亿个结构图。
这是一个十分惊人具象的进展!因为在没有 AI 加持的年代,人类绘制每一个结构图都需要数年的时间。
这意味着,药物的设计周期将从几年缩短到几个月甚至几周!
蛋白质是所有生物体的基础,由长链氨基酸组成,每个氨基酸都具有独特而复杂的三维结构。这些结构源于物理化学原理和最低自由水平的多肽序列折叠,所以,解析蛋白质折叠是结构生物学中最重要的目标之一。
20 世纪 60 年代初,剑桥大学的两位生物学家 Max Perutz 和 John Kendrew 将蛋白质培育成晶体,用X射线晶体学的技术确定了血红蛋白和肌红蛋白的三维结构。这项实验耗时二十多年,为两人赢得了诺贝尔奖。
溶液状态下的蛋白质结构也可以通过核磁共振解析,溶液比起晶体结构能够描述生物大分子在细胞内真实结构。但是,有时候也会因为蛋白质在溶液中结构不稳定能难得获取稳定的信号,因此,往往借助计算机建模或者其他方法完善结构解析流程。通过核磁共振解析的生物大分子结构,只占到蛋白质数据库(PDB)的10%。
这些技术复杂、耗时、昂贵,仅仅解析其中一个结构就可能需要耗费掉大量的时间和金钱,而且解析出的结构通常不是其天然形式。
在这些限制因素的影响下,与已知的大量蛋白质序列相比,已解析三级结构的蛋白质数量很少,PDB 条目数仅为 200,988 个,科学家需要开发更多新的蛋白质结构预测方法。
自20世纪90年代以来,一些结构生物学家一直尝试将神经科学网络运用到蛋白质科学中,但浅层网络和稀疏数据的局限性让他们止步不前。随着计算机的发展,科学家们学会了如何更好地构建神经网络,以便对更多层神经元进行稳定的训练,这给蛋白质结构预测带来了更大的机会。
2018,DeepMind 推出 AlphaFold 的首个版本,利用深度学习预测蛋白质结构,证明了仅通过训练一个蛋白质序列的神经网络,即可学习特定蛋白质的潜力。它包含了一个卷积神经网络,该神经网络通过 PDB 结构进行训练,根据目标蛋白质的氨基酸序列,从而预测蛋白质结构本身。
2020年,AlphaFold 2 的发布取得了蛋白质结构预测方面的突破,归功于两个神经网络模块——evoformer 和结构模块。evoformer 从MSA和模板中提取信息,在整个网络中来回交换信息,进而修改模板假设的蛋白质结构,使 MSA 和模板处于正确的“嵌入空间”。
AlphaFold 2 结合基于蛋白质结构进化、物理和几何约束的新型神经网络架构和训练程序,能够在几分钟内预测蛋白质结构,且准确度惊人。据统计,AlphaFold 2 已经预测了2亿个蛋白质结构,几乎涵盖所有已知蛋白质序列的数据库。
前酶工程创新中心的主任John McGeehan表示,“我们花了数月甚至数年才完成的工作,AlphaFold 只用了一个周末就完成了。”
去年5月,AlphaFold 3 发布。同年10月,瑞典皇家科学院宣布将2024年诺贝尔化学奖授予Demis Hassabis,表彰他的团队解决了一个50年历史的难题:预测蛋白质的复杂结构。
在 AlphaFold 2 的基础上,AlphaFold 3 拥有新一代架构和训练方法,涵盖了所有生命分子。它不仅可以预测蛋白质的结构,还可以预测几乎所有生命分子的结构,包括蛋白质、DNA、RNA、配体等对于蛋白质与其他分子类型的相互作用。与PoseBusters 基准上的最佳传统方法相比,AlphaFold 3 的准确度提高了50%。
AlphaFold 3 的核心是DeepMind Evoformer 模块的改进版本。处理输入后,AlphaFold 3 使用类似于 AI 图像生成器中的扩散网络来整合预测结果。扩散过程从原子云开始,经过多个步骤最终收敛到其最精确的分子结构。
通过这个架构,AlphaFold 3 得以破解细胞中最大结构之一——核孔复合体的精细结构。作为细胞核的”守门人”,这个复合体掌控着遗传物质DNA的进出,与癌症、衰老及神经退行性疾病密切相关。如今,人类首次看清了它原子层面的真容。
AlphaFold 3 可以通过预测药物中常用的分子(如配体和抗体)拥有药物设计能力,可以结合分子与蛋白质以改变它们在人类疾病中的相互作用方式。通过将AlphaFold与基于物理原理的软件相结合,医药研究人员已能精确模拟这些相互作用。这项技术有望帮助科学家以前所未有的精准度设计靶向受体的分子。
Google DeepMind 还推出了 AlphaFold Server,一个预测蛋白质在细胞内如何与其他分子相互作用的工具。它是一个免费平台,只需点击几下,生物学家就能利用 AlphaFold 3 的强大功能,对由蛋白质、DNA、RNA 以及一系列配体、离子和化学修饰组成的结构进行建模。
牛津大学肿瘤学博士 Samuel Hume 表示,AlphaFold Server 可以帮助他在五分钟内制作出一个蛋白质结构,完成他整个博士期间的工作。
但是,据《自然》杂志称,AlphaFold 目前也面临数据短缺的难题。公开可用的蛋白质数据库,例如 PDB,主要是与ATP等生物分子相互作用的数据,而不是与药物相互作用。缺乏的药物数据限制了 AlphaFold 有效模拟药物-蛋白质相互作用的能力。
为了应对这一限制,一些制药公司宣布将基于AlphaFold 3 创造自己的AI模型版本。包括强生、AbbVie打算使用自己内部的专有数据,这些数据集包含了与各种药物结合的蛋白质结构。这些数据不会与外部共享,制药公司打造的模型也有访问权限。
Google旗下的药物研发公司 Isomorphic Labs 将 AlphaFold 3 与一套互补的内部 AI 模型相结合,致力于为内部项目以及制药合作伙伴进行药物设计。Isomorphic Labs 正在利用 AlphaFold 3 加速并提高药物设计的成功率——理解如何接近新的疾病靶点,并开发新的方法来探索此前无法触及的现有靶点。
尽管这些私人数据可能带来潜在的改进,但能否提升 AlphaFold 3 的性能仍是个未知数。尽管如此,AlphaFold 3 还是将生物世界带入了高清时代,使科学家能够洞察细胞系统的全部复杂性,包括结构、相互作用和修饰。Demis Hassabis称,DeepMind将持续推动人工智能为药物研发提供解决方案,缩短药物研发的时间周期和成本。
嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“DeepMind突破!AlphaFold一年预测2亿蛋白质”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!
还没有评论呢,快来抢沙发~