一年前,人工智能(AI)公司DeepMind等依靠其推出的AI系统AlphaFold预测并公布了约35万种蛋白质的结构。这让许多科学家大吃一惊,该进展入选《科学》2021年度十大科学突破。
一年后,AlphaFold完成又一次飞跃。据《科学》报道,7月28日,DeepMind公布了从细菌到人类的几乎所有已知(2亿多个)蛋白质的可能结构,并将其纳入相关数据库,研究人员可免费搜索蛋白质结构。
这是人工智能领域的一个惊人成就,也是药物开发和迭代研究的潜在宝库。
“我们发布了整个蛋白质宇宙的结构。”DeepMind联合创始人、首席执行官Demis Hassabis在新闻发布会上说。
AlphaFold功能强大,它解决了从蛋白质氨基酸序列中准确推导蛋白质三维结构的长期挑战——蛋白质折叠问题。大多数药物都是利用蛋白质结构信息设计的,准确描绘结构图谱往往是发现蛋白质如何工作的第一步。
通过与欧洲生物信息学研究所(EMBL-EBI)合作,AlphaFold数据库也于一年前启动,其中纳入的35万个蛋白质预测结构涵盖了人类、小鼠和其他19种被广泛研究的生物体产生的几乎每种蛋白质。
AlphaFold新预测的蛋白质结构也已发布到现有数据库中。Hassabis说,该数据库“为结构生物学家提供了强大的新工具,在这里,可以像在谷歌通过关键词搜索信息一样轻松地查找蛋白质三维结构”。
据EMBL-EBI估计,在现有的超2.14亿个预测的蛋白质结构中,大约35%是高度准确的,这意味着它们与实验确定的结构质量一样高;有45%的结构足以在许多应用程序中使用。
DeepMind表示,自去年发布部分蛋白质结构以来,已有超过50万名研究人员使用了该数据库。
Hassabis预见了一个“数字生物学新时代”,在这个时代里,药物开发人员可以从利用AI预测医学上很重要的蛋白质结构,转向使用AI设计影响这些蛋白质的小分子,从而治疗疾病。
其他人正在通过结构预测开发候选疫苗,探索如核孔复合体如何把分子送入细胞核或者生命最初进化时蛋白质如何进化等基本生物学问题。
在Hassabis看来,公布蛋白质结构只是一个起点,还有许多生物学和化学方面的工作有待探索。