来源:科普中央厨房
今年诺贝尔物理学奖授予复杂系统的研究。复杂系统是什么?地震癌症股市为什么都和它有关?听欧阳颀院士解析“复杂”与“简单”。
北京时间10月5日17点45分许,瑞典皇家科学院宣布将2021年诺贝尔物理学奖授予真锅淑郎(Syukuro Manabe)、克劳斯·哈塞尔曼(Klaus Hasselmann)和乔治·帕里西(Giorgio Parisi),表彰他们“对我们理解复杂物理系统的开创性贡献”。
三位获奖者分享了今年的诺贝尔物理学奖,因为他们对混乱和明显随机现象的研究。Syukuro Manabe和Klaus Hasselmann为我们了解地球气候以及人类如何影响地球气候奠定了基础。Giorgio Parisi因对无序材料和随机过程理论的革命性贡献而得到奖励。
复杂的系统具有随机性和紊乱的特点,难以理解。今年的奖项表彰了描述他们和预测他们长期行为的新方法。
对人类至关重要的一个复杂系统是地球的气候。你是否感觉天气预报总不准,从古人就开始研究的事我们今天依然不能完全搞清楚?气象学家用超级计算机模拟气候变化,但现实环境太复杂,没有任何一套模型能真正代表真实的大气演变,正所谓“天有不测风云”。还有地震预测、癌症治疗等等与我们息息相关的难题,科学家也经常“束手无策”。为啥在科学如此发达的今天,科学还不能解决这些难题。
在2018年4月1日的首都科学讲堂《复杂性科学浅谈》主题讲座上,中国科学院院士、北京大学定量生物学中心副主任欧阳颀告诉我们,其背后都是因为复杂性科学“惹的祸”。
整理/刘辛味 图文编辑/陈永杰
[演讲嘉宾]
欧阳颀中国科学院院士、 北京大学定量生物学中心副主任
以下是欧阳颀院士讲座实录:
物理学还未走到尽头,复杂系统刚起步
我们先了解一下物理学的前沿介绍。物理学主要是研究时空和物质,分为宇观和微观两方面。宇观上时间尺度已到150亿年,空间尺度是150光年,包含宇宙诞生到现在我们所知道的全部的内容,利用宇宙大爆炸模型中可追溯到宇宙最初诞生时候,经历暴涨,星系分布,星系演化等。当然这里还有两朵“乌云”:暗物质和暗能量,这两者占了我们观测到宇宙的95%,而我们了解的物质仅占宇宙的5%。在21世纪的今天,我们有各种模型来描述,但还不知道它们具体是什么,需要继续的研究。
暗物质和暗能量,这两者占了我们观测到宇宙的95%,而我们了解的物质仅占宇宙的5%(图片来自网络)微观尺度上,时间尺度到10-17秒,飞秒量级,如此短的时间内发生的过程我们已经有所了解。空间尺度到10-34厘米,这尺度下的物质运动能通过量子力学描述。在这一尺度下发展出了强激光物理、基本粒子物理等。虽然在某些方面还有问题,但物质在时空尺度上的研究我们已经做的非常成功了,而且对技术的指导是决定性的。假如没有量子力学,今天能使用手机根本无从谈起。
物理学走到头了吗?实际上还远没有,我们还有第三级——复杂系统。实际上复杂系统我们刚研究了三、四十年,现在的复杂系统包括什么呢?最开始是非线性科学,由于外界的一些条件物质集合在一起产生的现象,比如湍流。大飞机起飞,火箭上天等,空气形成湍流,湍流会造成几乎90%的阻力,如何了解它让飞行器更快,是我们还未解决的问题。
非线性科学中还有混沌,斑图自组织,复杂网络等。生命系统就是一个复杂网络,如何定量的预测的一些事件,我们刚开始这些研究。生物物理实际上是用系统的角度研究生物,希望得到一些普适性、定量的理论,可以做出定量的预测,这是我现在主要的研究方向。
我工作所在北京大学凝聚态研究所,凝聚态实际上是物质紧密的关联在一起的状态,由此发展出了新型半导体物理,高温超导,强关联系统和玻璃态等。它们呈现了一些新的规律,不是单一理论可以描述的。
我们还把复杂系统向其他领域扩展,比如社会科学。大家知道社会是复杂的,用定量的手段来使社会稳定。合作机制,社会控制都用到复杂系统。尤其在今天大数据支持下,我们可以做到在某些情况下做到定量预测,实际上是需要复杂性科学作为理论基础。在经济方面,财富分配,股票市场动力学,博弈论等都属于复杂科学研究范畴。
什么是复杂性科学
今天我们讲复杂性科学,首先要定义什么是复杂性,什么是复杂系统。复杂性实际上是一个框,以我的定义:复杂系统是我们还没有有效方法做出可靠预测的系统,就是以我们现在数学和物理手段对世界的理解,还没发展到能对这个系统做出定量的预测。
实际上,在科学发展过程中,有很多系统原来认为是复杂系统,由于有了科学手段,它变成了简单系统。比如天体行星的运行轨道,如果没有牛顿力学它是复杂系统,现在我们能做到非常精准的预测。所以,复杂系统的定义是动态的,有些东西我们了解了它的规律,就从复杂系统变成了简单系统。我们不知道它的规律,所以打一个包叫它复杂系统。
由于有牛顿力学,我们能对天体行星的运行轨道做出非常精准的预测。天体运动从复杂系统变成了简单系统。图为太阳系行星运动轨迹(图片来自网络)复杂系统的特征,一是非线性系统。非线性系统会出现产生相变,意思是从一种状态突然转变到另一种状态。随着非线性科学的发展,我们已经能够做出一定预测。对于突然转变的现象,我们叫它涌现,就像1+1≠2,并不是给它多少力就会产生多少行为的正比关系。如果画出一条线,横轴是扰动,纵轴是行为结果,如果画出直线说明是线性系统,而非线性不是直线,而且可能会出现很奇怪的曲线。
复杂系统第二个特征是属于强关联系统。我们在做物理研究时通常会做一些局域化和近似处理,否则我们得不到一个很好描述系统的方程。没有数学方程的话,无法做定量预测。有些系统因为关联强度很大,无法做有效的近似处理。这是凝聚态物理中的核心问题,为什么高温超导实验上已经发现30余年,却还没有一个理论去解释这个现象,就因为无法做近似处理。
复杂系统第三个特征是平均场理论失败。假如我们要描述一瓶水中的水分子运动,我们不必知道每个水分子的运动情况,而用所有水分子的平均值来代表所有的水分子的运动情况,这就是物理中的平均场理论,是一种非常有效的方法。但在生物学处理上,有些系统的平均值不能代表系统的全部行为,误差极大,导致平均场理论失败。
复杂系统第四个特征是属于主动性系统,属博弈论范畴。研究的对象会根据不同环境有不同的行为,存在一个主动思维过程使自身利益最大化。在金融系统中较多体现,构成了复杂系统。
最后一个特征是受历史影响,比如生物进化,受历史影响一步步进化,每次进化都有分叉行为,如何去追溯它,我们还没有很好的办法。复杂系统之所以复杂,是这些问题没有得以解决。如果解决,它可能就变成了简单系统。
非线性系统中的灾变
我们接着讲讲非线性系统。已经过数十年的努力,我们已经了解了一些非线性系统的规律,但还不能很好的预测一些东西,所以依然属于复杂系统。
非线性系统最典型的特点是存在多稳,它可以有多个稳定的状态,所以在某些因素的影响下它可以从一个状态变为另一个状态,也就是物理中的相变。比如下图,从不同角度看,可能有人认为它是鸭子,也有人认为它是兔子。这时我们在大脑中形成了两个概念,但不可能同时两者都看到。这表明大脑的复杂性,存在多稳态。
Destalt转换:你可以自图画中看到一只兔子或一只鸭子,但你不能同时两个都看到。图中的立方体也可以被看成两个不同的面朝前。(来源:报告PPT)我们如何用定量的方法描述这个现象呢?实际上大脑接受了一定的刺激后,进入了一个稳定态。但一个系统接受了一个刺激后,可能有多种稳定态,这就是复杂性的来源之一。从一个稳定态到另一个稳定态存在一个势垒,跨越障碍才能到另一个稳定态。比如虫子的群体生长模型,它自身繁殖随时间会越来越多,但是会受到天敌的影响,使虫群处于一个动态的稳定状态,会存在多个稳定态。
若在一个系统中处于在单稳态区域,其行为可以近似为线性行为,外界变化引起的系统变化成正比关系,这就是渐变。如果虫群因为基因突变等因素,生长率发生了很小的变化,但最后群落的大小会有很大的变化,这是一种典型的非线性效应,所谓”灾变”。非线性效应引起的灾变可好可坏。
环境科学中生态改变和地球科学中的气候变化都是典型的非线性科学。非线性科学还体现在经济学和社会科学中,一些很小的变化会引突然地剧烈变化,如经济增长和衰退,或者社会改良或革命,都是非线性科学中的灾变的体现。当然,目前我们已经找了一些规律,知道灾变为什么会发生。我们需要研究灾变什么时候发生,作出预测。
非线性系统的另一大特点是涌现,最典型的例子是图灵斑图。动物身上的花纹是怎么来的,能不能用简单,定量的预测出花纹什么样。这背后的原因我们已经有了猜想和证实:动物的斑图形成机制是由于体内的生物化学反应与生物分子的随机扩散耦合,在特定情况下导致均匀定态失稳而产生的。
原来均匀分布的情况失去了稳定性,而漂亮的斑图成为了新的稳定态。将其翻译成数学语言就可以进行了一些定量的预测。我在25年前做出的实验,在化学系统中存在图灵斑图机制。目前在生物学领域,老鼠的毛囊出现的位置和老鼠爪子的发育证明了图灵斑图的预测。
由于动植物体内稳态失衡,导致了斑图的形成。(来源:报告PPT)气候变暖最后会进入冰期
灾变现象非常可怕。因为发生灾变后,系统变成了另一种稳定态,想变回原来的状态很难实现。目前地球变暖讨论的最核心问题就是,我们距离相变点还有多远。如果距离很远,我们对二氧化碳的排放要求就不会那么高。如果距离相变点很近,排放二氧化碳引起了灾变,那时减少排放已经来不及了。
目前大部分科学家认为我们已经接近了相变点,再肆意排放二氧化碳,地球可能会发生大的灾变。也有一部分科学家认为距离灾变点很远,因为通过计算发现,人类行为造成的二氧化碳排放增加只占自然系统排放的千分之一。如果用线性系统思考这些小量,问题不大。但目前各种迹象表明我们在相变的边缘,这些小量会引起灾变。
电影《后天》显示地球因全球变暖进入了冰河时期 (图片来自网络)全球变暖最终的结果,不是变暖,而是更冷!电影《后天》所展现的就是地球变暖背后相变的规律。地球出现各种超强风暴,极端气候越来越多,最终形成冰期。
调控地球的冷暖主要依靠海洋的洋流,洋流就存在双稳态。洋流把赤道附近的热量带到北极,使赤道与两极的温差并不是很大,目前还趋于一种较为温和的情况。在全球变暖的模型中,由于气候变暖,北极冰山融化,海水盐度减少,导致太平洋洋流不能抵达北极,进而导致赤道与两极温差过大,这就会造成更多的极端天气的出现,如超级气旋等等。科学家怀疑往年的一些极端气候就是由于地球变暖造成的,目前发现冰岛附近海水的盐度急剧减少,洋流循环在减弱。减弱到一定程度,就会成造成灾变。
所以不要理解气候变暖就是气温上升,从长时间尺度看,气候变暖最终的结果是冰期,历史上称为雪球(Snowball Earth)。如果想回到现在的状态,只能依靠火山爆发,引起二氧化碳积累,这些在地球历史上发生过。
癌症是灾变现象
我们知道癌症是世界性疾病,每年都有上千万新增病例。在四十年前,美国总统尼克松提出向癌症宣战,拨款大量资金研究癌症。四十年过去了,科研资金增长了无数倍,但结果只能说我们跟癌症打了平手。
全球癌症发病分布,颜色越深代表发病率越高。(来源:报告PPT)胰腺癌五年死亡率增加0.6%,发病率几乎持平。而肝癌发病率逐年上升,五年的死亡率增加了2.2%。血癌是最好的情况,5年死亡率下降1.3%。
我们战平的原因就在于对于癌症的机理还不了解。人体是一个复杂系统,癌细胞的行为也是复杂系统。癌细胞特征是持续增长,规避细胞凋亡控制,诱导正常细胞为其提供营养,而且还有细胞迁移,也就是癌细胞转移。癌细胞本身是正常细胞改变的,所以其它的大部分行为是正常行为,能够规避免疫系统。正常细胞只是改变的一点变成了癌细胞,就像灾变,但我们从分子水平上很难检测出改变的具体是什么。
科学界和医学界进行了四十年的努力,得到了一个好消息,现在关于癌细胞最为广泛接受的理论是基因突变。在绝大多数癌症中,我们都发现了细胞中的碱基发生了变化。大部分癌症的基因突变的位点我们已经找到。
那么是否我们进行基因修复就可以了吗?不可以,因为科学家还知道了一个坏消息。对于一些癌症,它的突变谱非常宽。意思是说,同样一种癌症,病人的反应相似,但是发现两者癌细胞的突变位置完全不同,所以无从设计一种药物或治疗手段来治疗。
非线性科学如何介入癌症研究呢?十年前的一篇论文提供了思路,作者测试了24例胰腺癌病人,每人的突变位点都不同。但从功能上看,所有可能的致癌基因突变位点都处于13条信号转到通路上。这里就与非线性科学中的相变联系起来。
由于细胞突变的存在,让体内细胞发生了微小的改变,这个微小的改变引起了巨变,这就是非线性理论中的灾变现象。所以癌症是一个非线性的在灾变现象。我们可以用非线性动力学的视角来理解癌症,把生物术语翻译成数学和物理的术语,把基因序列变成系统参数,边界小件,初始条件动。到细胞水平上用复杂系统的非线性动力学行为描述,再到功能水平上,用系统的稳定性和相变来描述。当然,这些还是目前的研究设想。
科学研究最重要的是证伪,如果论断和假设经过严密的逻辑推导,但与实验结论不符,那么我们就要放弃这个理论。对于癌症来讲,我们的基本假设是由于基因突变引起参数小变化,引起了功能上的灾变。然后对于这一假说进行证明或证伪。如果模型中的参数真正对应于癌症的突变位点,那么我们的理论就是正确的。
P53细胞突变是目前对癌症发病机制为数不多的了解之一。(来源:报告PPT)我们发现在90%的癌细胞中都有P53细胞突变,这是一种在细胞受损后决定细胞生死的细胞,是停止细胞增殖进行DNA修复,还是使其调往由它来控制。癌细胞的存在必然要规避它所带来的控制通路。虽然P53核心机制的控制网络比较简单,但要翻译成定量科学中的数学语言非常复杂,它的方程超过30个,参数有82个。
当然我们并非要把所有的变量进行分析,我们只抓住假设中存在灾变点,找到其所有的灾变点,就能描述它的行为。目前我们已经得到了一些结论,细胞突变代表了系统参数的变化,导致了相变点的变化,最后导致功能的变化。如果你身体内的基因突变在灾变点附近,那就有可能成为癌细胞。
由于进化,生物系统的网络趋于稳定,不依赖于系统参数的变化,80%的系统参数对于系统行为没有影响,也就是说大部分细胞突变都不会影响系统正常运行,不会变成癌细胞。但有一些系统参数非常敏感,它们一定对应于癌细胞的基因突变位点。
虽然我们已经有了一些基础性的研究,做出一些预测,但距离战胜癌症还很远。
不能预测的地震与股市
除了相变和涌现,非线性科学中还有自组织临界系统。它是一类具有多组分的复杂系统,这些系统有自发演化到临界态的趋势。在临界态上,对系统的一个小的扰动可能引发不同规模的“雪崩”式反应。这些雪崩式反应大部分都是非渐变(非线性)的灾变形式。这些雪崩式反应大部分都是非渐变(非线性)的灾变形式。
地震预测是典型的自组织临界系统,地壳板块总是自发的向临界态运动,最终造成地震。统计地震次数与强度发现它们成幂律分布,在对数坐标下呈直线,说明地震发生在临界态上。平均值在这种分布关系就没有意义,没有办法预测发生地震的时间和强度,这也是地震预测的困难之处。地震预报不轻易发出,因为错误率太高。
另一个典型的例子是股票市场,股价的涨落服从幂律分布,存在平均值但误差无界,导致计算平均值没有意义,无法预测股票市场。目前经济学中有些数学模型非常成功,它的前提是平均值有意义。经济学家无法预测金融上大的灾变。还有很多例子,比如社会发展中城市出现,语言学中用词分布,都是向临界态发展。
那么它背后的机制是什么呢?科学家提出了“沙堆”模型,当我们堆出一个小沙丘后,再放一粒沙子,可能就会引起塌方。很小几率是大的塌方,很大几率是的小塌方,这在数学上可以用幂律分布表示,和上述例子相同。那么如何对此类系统做出精准预测和有效干越?目前我们还没有普适性的方法来进行模拟和预测。
科学家用“沙堆”模型来解释自组织临界现象(来源:报告PPT)所以,我们科学还不是所有事情都能解释,这里套用一句台词,“科学不是万能的,没有科学是万万不能的”。
(本文整理自2018年4月1日首都科学讲堂534期《复杂性科学浅谈》,文字已经欧阳颀院士审核并授权,部分内容来自中国物理学会期刊网)