作者:赵国屏、刘陈立
合成生物学从学术界“出圈”
9月底,北京香山,召开了以“定量合成生物学”为主题的学术讨论会(香山科学会议第S64次学术讨论会)。40余位在“系统生物学”、“合成生物学”、“定量生物学”等领域卓有建树的学者围绕合成生物学的基础理论研究、技术创新和工程应用以及我国在合成生物学领域的发展战略,针对“合成生物学使能技术”、“‘黑箱’理论与人工智能”、“多尺度‘白箱’定量理论”和“合成生物学的医学与工程应用”4个议题展开深入而具有建设性的研讨。
如果说这还只是合成生物学发展脚步渐疾的“常规学术动静”,那么下面发生的事情,就一定不是偶然了。
据不完全统计,目前已有广东、湖北、云南、甘肃、北京、上海、山西、江苏、天津、浙江、海南、内蒙古、宁夏、黑龙江、河北等15个省(区市)发布了科技创新“十四五”规划。我们研读发现,其中有10个省(区市)科技创新“十四五”规划均明确提到有关合成生物学的规划和意见;虽然侧重点各有不同,但强调合成生物学技术创新,并以其引导产业提升甚至产业革命的核心理念基本是一致的。
比如,在《广东省科技创新“十四五”规划》中,提出将合成生物学领域作为“前沿技术和颠覆性技术研究”实施研发专项。广东省还在行动计划中明确,要“提升合成生物系统的定量可预测设计能力”“推动合成生物技术在工业生物智造、疾病诊疗、环境安全、能源安全与国家安全等领域的颠覆性前沿技术创新与工程化应用”。
显然,“政”“学”呼应之下,合成生物学即将呈现出的“研”“产”“用”并举的发展格局。另一方面,如果从这一发展格局视角出发,总结合成生物学发展过程中积累的经验教训,也不难“倒逼”出合成生物学发展的科技战略布局,特别是真正认识到其核心理论与技术工程平台的突破,将在我国科学进步与经济发展进程中承载重要使命。
破解合成生物学瓶颈问题
合成生物学理念有两个缘起,一是从合成化学开始,经基因重组技术带来的“人工合成生命”愿景到本世纪初全人工合成基因组支原体Synthia的诞生所形成的以合成人造生命为目标的理念。另一方面,则是基于本世纪初采用生物元件-底盘构建逻辑线路成功的突破,将工程科学的“设计-合成-测试-学习”理念引入生命科学,形成了以采用工程科学策略改造或创造人工生命系统的学科,也被称为工程生物学。经过过去20年的实践,这两个理念不断融合,可以把“合成生物学”综合为以工程科学理念研究生命,实现生命过程工程化和工程化合成人造生命体系这样一个高度交叉融合的前沿学科。合成生物学的任务是用知识达到构建事物的目的,以增进人们对工程生命体与自然生命体的基础认识。
合成生物学通过从头设计复杂生命体,为认识和改造生物提供“自下而上”的理论指导(即“造物致知”),进而为相关重要科学问题的解决带来新机遇,因此成为当前生命科学发展的前沿热点之一。然而,合成生物学也面临着重大挑战,即缺乏可预测性设计(或称“理性设计”)的指导,这也是制约合成构建更复杂、更可控的生物系统的关键瓶颈。
众所周知,无论是构建具有新功能的生物系统,还是重构、改造现有生物系统,都需要具备“基于理解生命系统规律的理性设计能力”。迄今人们对于生命系统规律的理解,采用的是系统生物学的方法,即采用分析(还原论)与综合(系统论)的手段,直接探究生命系统形成发展运动的规律。由于生命是一个超级复杂的系统,其运行的规律基本是非线性的,因而对于其规律的工程化抽象,不仅困难,甚至是“难以企及”的。因此,在上世纪80年代,一批学科交叉的学者们用一种全新的,统一的视角来认识复杂系统,大量运用隐喻和类比的方法,寻找不同系统之间的共性,提出了“涌现”的概念,就是指系统中的个体遵循简单的规则,通过局部的相互作用构成一个整体的时候,一些新的属性或者规律就会突然在系统的层面诞生。我们认为对生命功能涌现性的理解将使得合成生命体系的理性设计真正置于工程科学理论之上。而这种超越现象描述、寻找生命体系在各个层次过渡态上发生“涌现”的定量规律,正是合成生物学构建其自身理论架构,从描述科学与实验科学转变为理论科学的核心。
所谓理性设计,就是“可预测性”设计;而要可预测,就必须将规律定量化。建立定量关系、发展定量理论,目前有两种解决思路:一是传统的“定量生物学”的方法,即通过定量表征和数理建模的研究方法,构建知识驱动的“白箱模型”;二是结合自动化产生大数据与机器学习等“人工智能”方法,构建数据驱动的“黑箱模型”。二者都指向同一目标,即用数理逻辑与定量关系研究自然现象。两者综合,定量生物学是应用数理思维,研究生物系统基本原理,旨在用简单定量关系描述复杂生物过程,进而帮助人们可预测地设计合成生命体;反过来,运用合成生物学自下而上的工程化平台技术,系统产生大量生物学数据,不仅支撑了“黑箱模型”的机器学习,而且可以通过构建合成生物系统,验证定量生物学的“白箱模型”。当然,如果可以解读人工智能学习得到的理论规律,就能让“黑箱模型白箱化”,还可通过构建合成生物系统,验证定量生物学对生命现象的定量预测,真正解析“涌现”的理论规律。
可见,定量生物学和合成生物学的交叉互补,是在当前发展阶段上,从根本上促进合成生物学学科以及相关工程应用发展的关键核心与历史机遇。当然,迎接这一机遇,也面临着巨大的挑战。为此,我们在这次香山会议上提出“定量合成生物学”的研究方向,希望能集各领域专家学者的智慧,抓住机遇,实现合成生物学的又一次跃迁。
建设整体化定量合成生物学体系
在生物研究中,基于理性设计原理和合成构建技术的“设计—合成—测试—学习”研究循环,往往速度慢、效率低,且高度依赖于昂贵的人力成本。所以,自动化、高通量的设备平台和标准化的实验方法、算法和流程,将是未来的合成生物学不可或缺的一部分。比如,2020年发表在《自然》杂志的“人工智能机器人化学家”就属于此类技术进化的应用典范。
基于此,我们提出,要建设理论(理性设计)、技术(合成能力)、工程(自动化平台)三者相辅相成的合成生物学体系,进而以此推动合成生物学研究由定性、描述性、局部性的研究,向定量、理论化和整体化的变革。
具体而言,首先,要在分子到亚细胞(细胞器)再到细胞的“涌现”层次上发展定量合成生物学,包括定量描述和预测基因回路与细胞行为,发展生命体系定量理解与理性设计的基础理论框架,建立复杂生物系统的设计理论、从头设计原则和数学模型,探索生命体维系运转的基本规律。
其次,要大力发展使能技术,进而提升大片段DNA合成、基因组组装、生物原件功能设计与定向进化、基因回路设计、自动化建模及仿真测试能力。
其三,要建设自动化、高通量的构建平台,发展高通量、数字化、标准化的设计、合成、测试技术体系。
第四,要发展相应的机器学习能力,包括硬件和软件能力,特别要做好数据标准化以及整合交互使用与知识图谱构建的基础性工作。
推动我国合成生物学高质量发展的五条建议
我国在合成生物学领域虽然起步比国际上晚了十多年,但经过近十年来不同学科与领域的专家合作攻关以及国际合作,已奠定了相当好的研究基础。在定量合成生物学香山会议上,20余家单位的40余位专家学者深入探讨合成生物学的科学问题和主要瓶颈并达成多方共识。为推动我国合成生物学高质量发展,强化合成生物技术战略科技力量,进一步构建合成生物学战略布局,我们提出了如下建议:
一是必须充分认识合成生物学对于当今世界国际竞争、国家安全与国内民生的重大战略意义,建议国家对合成生物学增强基础研究投入,并组织多学科交叉合作团队,进行系统的基础理论和核心技术研究攻关。
其中,发展定量合成生物学将转变研究范式,涉及多个学科领域以及先进生物技术、数据科学与工程技术的结合,属于国际科学研究的前沿,需要更广泛、深入的学科交叉与合作。因此要吸引多学科人才,加快推动国家级科研载体平台及产业创新中心建立。发展定量合成生物学是我国占据科技前沿制高点的一次重要机遇,要认识到这对于推进我国合成生物学基础理论研究和技术创新领先国际水平的重大战略价值。
二是在合成生物使能技术方面,建议聚焦于发展更高效、更精准、更智能的基因改造技术和基因组的精准合成与重排技术,开发对亚细胞结构进行理性设计、构建与拓展的手段,探索无细胞体系与人造膜系统的生物功能设计与构建技术以及先进合成生物学分析技术,例如多组学技术、单细胞技术、单分子技术等。这些前沿技术是合成生物学发展的工具与基础,我国目前已取得了良好的成绩,应当持续发力,占领前沿技术研究制高点。
三是建议大力发展前沿数据科学与人工智能相结合的、面向合成生物学的黑箱理论与方法。
人工智能辅助生物计算是国际上最重要的前沿方向之一。建议聚焦于发展面向合成生物学的人工智能技术平台,实现数据标准化,解决数据偏向性问题,并建设开放共享有效的数据库和计算平台。建议发展结合物理模型与机器学习的可解释黑箱模型,发展兼顾速度与精度的生物计算方法以及利用人工智能对生物元件高精度预测、辅助生物元件理性设计的方法。
四是建议加强发展合成生物学领域的多尺度白箱定量理论,利用合成生物学的手段推动理论研究,将定量理论作为指导合成生物学理性设计的基础。
此方面的前沿科学问题包括:发展适用于复杂生物系统的设计原理,实现范式转化;研究合成基因回路在资源竞争条件下的协调策略;探索具有抗噪和鲁棒性功能的系统设计;探索进化论的定量理论等。
构建白箱模型,需要获取标准化、定量化实验数据,可以通过建立唯象模型来掌握系统的运行规律,并进一步归纳、提炼出具有普适性的理论框架,最终利用理论达到生物系统的理性设计与精准合成这一工程目标。这方面的研究国际上尚未建立体系,有巨大的发展空间,也是未来的发展方向,需要得到各级政府重视。
五是建议加强重视合成生物学的医学与工程应用,充分发挥合成生物学在民生、医疗、经济、能源、环境和安全等方面的发展前景与战略意义。
为了推动合成生物学的应用研究,应加强学科交叉与产业配套。合成生物学技术的应用,需要合成生物技术与工程技术的有机结合,其复杂性和难度表现为较大跨度的多学科交叉,涉及到医学、材料学、生物物理学、生物化学、纳米技术、电子工程等,需要加强学科交流与国内国际合作。同时,应当提升科技支撑,加强产业配套,在解决好底层基础理论构建以及技术概念验证之后,加快产业化进程,在市场与资本的双重推动下,加速我国技术壁垒的形成,实现我国合成生物技术与产品的产业化应用。
总结来说,我们期待基础生命科学研究与合成生物学研究两者的螺旋上升,这将真正开启生命科学研究革命之门,同时针对工业、农业、健康、能源、环境、材料、信息、工程等国民经济领域重大需求,不断引领新一代生物技术和工程生物学发展。
赵国屏:中国科学院院士、中科院上海营养与健康研究所生物医学大数据中心首席科学家、中科院分子植物科学卓越创新中心合成生物学重点实验室专家委员会主任
刘陈立:中科院深圳先进院合成生物学研究所所长、中国科学院定量工程生物学重点实验室主任、深圳合成生物学创新研究院院长、合成生物研究重大科技基础设施首席科学家