互联网爱好者创业的站长之家 – 南方站长网
您的位置:首页 >运营 >

六个月找出新药分子,AI比人强在哪里?

时间:2021-12-31 16:46:55 | 来源:雷锋网

原标题:六个月找出新药分子,AI比人强在哪里?

近日,由雷峰网& 医健AI掘金志主办的GAIR「医疗科技高峰论坛」在深圳正式召开。

这一次,医健AI掘金志以「医疗AI的破局与新生 」为主题,将话筒传递给四院院士、5位IEEE Fellow、19位行业领袖,由他们以分别从历尽铅华的医学影像AI、和风劲正浓的AI制药两大赛道出发,为行业的发展提出自己的判断。

论坛之上,英矽智能首席科学官任峰博士,发表了题目为《人工智能加速纤维化药物研发》的演讲。

会议召开的十天之前,英矽智能的全新靶点和新分子结构的候选药物,成为有史以来,首个进入临床试验阶段的AI辅助研发创新药。

演讲中,任峰博士详细介绍了IPF项目的研发细节,以及英矽智能自有的人工智能药物研发平台Pharma.AI中PandaOmics和Chemistry 42的实际作用。

任峰表示:目前市场上只有两款药治疗肺纤维化,分别是:吡非尼酮和尼达尼布。这两款药在2019年总销售额是30亿美金左右,这是一个庞大的市场。但是吡非尼酮和尼达尼布有共同的问题,就是安全窗口非常小。

这导致10-40%的病人由于无法耐受这两款药的毒副作用,无法继续用药,也没有其他药物可以治疗。英矽智能希望通过在连接生成生物学和生成化学的人工智能药物研发平台的辅助下找到全新的靶点和全新的化合物,治疗尚未被满足的临床需求。

在靶点发现方面,我们通过自研的人工智能平台PandaOmics对比患者和健康人转录组学的数据,找到其中的差异,通过分析其中信号通路的变化,找到新的靶点。

我们通过这种方式找到了20多个全新的靶点,又通过自己的过滤条件(比如靶点蛋白有无晶体结构、或者这个蛋白有无动物数据证明其安全性等)最终选定了一个靶点。目前全球没有任何一款针对这个靶点的纤维化药物进入临床试验阶段,临床前的研究也非常少。

此外,AI在新药研发上可以做很多事情,例如擅长找到蛋白靶点,或者针对已知药物进行老药新用,甚至是用在很多‘快跟’项目上。大家对于AI新药研发的想法应该更加深远,今天想到的新药分子、新的靶点都还只是一小步,接下来还需要向端到端发展。

以下是演讲的全部内容,雷峰网(公众号:雷峰网)做了不改变愿意的整理和编辑:

英矽智能是一家研究如何用人工智能做新药研发的公司。新药研发是风险很高的行业,众所周知,它有“一高一低一长”的特点:研发费用高、研发成功率低、研发周期长。

平均每款新药的研发需要10年以上时间,需要花费20亿美金以上的研发投入。另外,其成功率非常低。临床1、2、3期总成功率只有大概10%,所以从靶点的发现到药物获批的成功率只有3-5%左右。

小分子新药研发分为三个主要过程:

第一,跟生物学相关,主要是靶点发现和验证。

第二,和化学相关,主要是针对已知的靶点找到合适的小分子化合物进入临床。

第三,临床试验。

针对这三个(小分子)新药研发的主要过程,英矽智能发明了三款人工智能的软件,辅助这三个新药研发里主要的环节。第一环节,我们通过组学数据帮助靶点发现,找到新靶点后,在第二环节通过生成化学的人工智能平台,主要是生成对抗神经网络为主的30多个模型帮助设计和发现新的小分子化合物,第三环节是帮助预测临床试验的结果。

接下来,我想用个例子跟大家介绍英矽智能如何利用人工智能平台赋能新药研发。

这是我们特发性肺纤维化的项目。今年我们提名了这个项目的PCC(临床前候选化合物)并推进这个候选药物进入人体试验的阶段。

特发性肺纤维化是罕见病,但也在全球影响了70多万病人,在亚洲就有30多万。这个病的致死性很强,诊断后如果没有得到合适的治疗,患者平均寿命周期只有4年。特发性肺纤维化患者的一个典型特征是用力肺活量每年以7%左右的速度丧失,病程非常痛苦。

目前市场上只有两款药治疗肺纤维化,分别是:吡非尼酮和尼达尼布。这两款药在2019年总销售额是30亿美金左右,这是一个庞大的市场。但是吡非尼酮和尼达尼布有共同的问题,就是安全窗口非常小。这导致10-40%的病人由于无法耐受这两款药的毒副作用,无法继续用药,也没有其他药物可以治疗。

英矽智能希望通过在连接生成生物学和生成化学的人工智能药物研发平台的辅助下找到全新的靶点和全新的化合物,治疗尚未被满足的临床需求。

在靶点发现方面,我们通过自研的人工智能平台PandaOmics对比患者和健康人转录组学的数据,找到其中的差异,通过分析其中信号通路的变化,找到新的靶点。

我们通过这种方式找到了20多个全新的靶点,又通过自己的过滤条件(比如靶点蛋白有无晶体结构、或者这个蛋白有无动物数据证明其安全性等)最终选定了一个靶点。目前全球没有任何一款针对这个靶点的纤维化药物进入临床试验阶段,临床前的研究也非常少。

也就意味着没有合适的化学起点,于是我们利用人工智能小分子生成平台Chemistry 42,针对这个靶点生成小分子化合物,在相当短的时间内,我们设计并合成了78个化合物,这些化合物有良好的活性。

055是我们合成并测试的第55个化合物,这个化合物有良好的活性和成药性,值得往下一步推进。在博来霉素诱导的小鼠特发性肺纤维化测试中,可以看到化合物055在尼达尼布十分之一的剂量下,在肺功能改善上可以起到与尼达尼布非常类似的效果。

虽然有小鼠模型证明化合物055的活性非常好,但我们认为还需要细胞层面的实验,进一步增加证据。于是我们使用特发性肺纤维化患者的细胞开展了两种体外实验:

一是用患者的纤维化细胞的转化,可以看到化合物055与尼达尼布相比,活性高了5倍。二是用患者的上皮细胞的转化,可以看到化合物055比尼达尼布的活性高了16倍。再次证明在体外实验上,化合物055比尼达尼布有更好的活性。

得到临床前的数据对有效性的支持后,我们下一步进行了一些安全性的评价,包括做了小鼠14天的DRF实验,以及体内外、药效、药代动力学(DMPK)等实验,从各个方面来支持化合物055进一步推进,这里是罗列了主要的实验及其结果。

化合物055今年11月份正式进入临床,现在已经完成了微剂量临床实验。从早期的靶点发现到提名临床前候选化合物,大概用了18个月时间,研发经费260万美金左右。跟传统研发新药研发相比,一个新的靶点平均需要10年半的时间,需要花费几千万美金的研发费用。通过人工智能的赋能,在这个项目上确实大大加速了研发进程,同时大大降低了研发费用。

同时,这个全新的靶点不仅是对特发性肺纤维化有效,在临床前实验上我们已证明它对皮肤纤维化、肾纤维化、肝纤维化进程等都有效果。

比如对于肾纤维化,我们找到了另一个化合物073,对它做了大量临床前实验,证明化合物073可以停止或者逆转纤维化的过程。

今年以来,我们不仅实现了特发性肺纤维化和肾纤维化的两个临床侯选化合物的确定;同时,完成了C轮融资,由华平投资领投,融资额达2.55亿美金;并且,我们在上海建立了比较强大的新药研发团队,快速推进了26个以上的自研项目。

英矽智能从2014年建立后,立足于打造端到端人工智能促进新药研发的生态体系。我们的研发项目是由人工智能和新药研发团队共同立项产生,我们在上海有强大的CRO管理团队,可以通过CRO帮助做湿实验验证,同时通过把验证数据反馈给人工智能和新药研发团队,进一步提高人工智能的效率和新药研发团队设计化合物的效率,从而形成了一个干湿实验的一个闭环。

下面我想介绍我们这三款人工智能的平台:

第一个平台是以生物学为主的靶点发现平台PandaOmics。

第二个平台是Chemistry 42,以生成化学为基础的小分子化合物生成平台。

第三个平台是InClinco,是一个优化和预测临床实验方案的平台。

对于PandaOmics靶点发现平台,我们后台有大量的数据,这里展示了我们后台在这个平台后面的数据量。我们有1000万个组学的数据,4000万个文献专利数据,还有130万个化合物、抗体数据、大分子数据,以及300万个科研经费支持的研发项目数据和34.2万个临床实验数据。

这就是我们PandaOmics做靶点发现研究的界面,以克罗恩病为例,这是我们对克罗恩病找到的靶点,左边是一些靶点的信息,中间是以组学数据、文献专利为基础的评分,右边是针对这个靶点的信息,包括有没有小分子化合物,有没有大分子药物,及其安全性如何、吸引性如何,有没有晶体结构,目前有没有在临床试验阶段的药物,它属于哪个靶点。

还是以克罗恩病为例,点进去后会展示跟疾病相关的信息,这里展示跟克罗恩病有关的组学数据,选一组进行靶点发现。然后用健康的人作为对比,系统运行后会呈现火山图,对比克罗恩病患者和健康人组学间的差异。同时可以看基因所影响的所有信号通路,比如这里有1800多条信号通路被这些基因所影响,可以对信号通路进行排序,同时可以看到每一个信号通路的一些基本信息。

如果对一个特定的新药通路感兴趣,比如CDC 6,可以看到其上下游之间的关系,同时在下方找到跟新药通路相关的文献专利。把要做的组选完后,PandaOmics会帮你找新的靶点,这就会出现刚才跟大家介绍的界面。

我们最后找了一些结果,有组学数据、11个组学评分,同时我们有以文献专利为基础的评分,可以看到对每一个组学的评分都会有一定的介绍。这里找到的靶点的吸引力都不高,因为在设置时没有让它找新的靶点,想找新的靶点需要重新设置,把文献专利数据去掉,重新进行靶点搜寻工作。这样就可以找到全新的或者相对有吸引力的靶点。这就是PandaOmics帮助做靶点发现的过程。

除了PandaOmics外,我们另一款AI平台是Chemistry 42,是一个小分子化合物生成平台。它最大的优势是在中间有一个生成对抗模型,包括30多个生成算法。同时在生成之前,可以做很多设置,比如成药性、结构吸引性或者合成的可及性。设置好后,电脑会自动生成针对这些靶点的小分子化合物。当小分子化合物生成后,可以用传统CADD的方式进行排序,成功选择一些小分子化合物进行合成和测试。

下面我想用另一个小视频来介绍Chemistry 42是如何生成小分子化合物的。我想用一个靶点,这个靶点比较热门,它跟AMG510有共同结构,对我们来讲更容易比较生成的化合物和AMG510的区别。

这是我们的界面,首先设置文件名,同时把数据上传,选好后会出现共晶结构,如果把蛋白结构去掉就是AMG510的小分子结构。可以点药效团自动识别,这里识别了5个药效团。下一步可以做一些设置,因为这个物质需要共价结合的头端,可以选上共价结合的头端,这样得到的化合物都是有共价结合的药效团,从而可以设置分子量等参数。

这是我们的30多个生成模型,一般运行72个小时,可以产生出比较优质的小分子化合物。点进去每个小分子化合物,可以看到它的结构,可以跟AMG 510进行对比,可以看出它占据的空间是比较相像的,同时跟AMG 510化合物本身区别还是非常大的。Chemistry 42人工智能平台能帮助你产生真正全新的小分子化合物。在这里有很多排序,可以找到跟蛋白的结合口袋最匹配的一个小分子,可以看到跟AMG 510占据的口袋比较相像,整体三维结构是比较相似的。在此,由于时间关系,我不把化合物一一跟大家介绍。

英矽智能的商业模式有两种:一是用AI作为工具,我们有软件外授权使用,也可以跟公司进行合作。另一个是我们利用人工智能的平台做一些内部管线,这些管线到一定阶段会转让和授权出去。目前我们利用强大的人工智能平台,包括生成生物学和生成化学,我们跟很多制药公司,包括国内外大药企进行全方位的合作,包括靶点的发现合作和化合物生成合作以及软件授权业务。

总的来说,我们AI平台可以做很多事情,比如用PandaOmics,它擅长的事情是找到细胞靶点,或者针对已知的靶点进行老药新用;用Chemistry 42可以做“快跟”项目,主要解决选择性和耐药性问题,以及针对一些全新的靶点可以产生全新的先导化合物,我们现在也试图把Chemistry 42用到蛋白降解疗法上。

最后再介绍一个例子,是我们做“快跟”的一个项目是DDR1靶点,这是与药明康德合作的药物发现挑战,看最快多长时间找到合适的小分子化合物。接到这个任务后我们花7天时间生成数据,12天生成模型,生成了3万个化合物,通过一些过滤方式,过滤到40个化合物。药明康德从中选择6个化合物进行合成测试,最后2个化合物的活性在10nM以上。整个过程只花了46天时间,这是创记录的高效过程,该结果发表在2019年的Naturebiotechnology上。

在英矽智能,我们不光有AI算法,还有非常强大的生物医药研发团队,希望把AI和DD结合起来,就是我们所说的AIDD。这是我今天想跟大家分享的所有内容,谢谢大家!

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。