原标题:科技工作者日:谁来关心他们的“计算焦虑”?
5月30日是第5个“全国科技工作者日”。在这个向科学家致敬的日子,钱学森、邓稼先、吴文俊、袁隆平、黄旭华等许多老一辈科学家在这天成为人们“追星”的对象。
人们总是要问:在那个一穷二白的年代,他们是怎样做到的?
尤其是,那个没有电子计算机的年代,他们是怎么运算、模拟、设计的?用算盘吗?
还真是。
一. 从算盘到超算
这张图是“中国核潜艇之父”黄旭华院士至今仍珍藏着的一把“前进”牌算盘。许多人可能想象不到,中国的第一代核潜艇,是用算盘和计算尺一点点算出来的。
中国核潜艇的另外一位“拓荒牛”、近日被授“时代楷模”称号的彭士禄院士,也曾回忆说:“那时没有电脑,仅有一台手摇计算机,大家就拉计算尺、打算盘,那么多的数据都是靠这些工具没日没夜地算出来的。”
那时的中国,一穷二白。尽管如此,仅靠算盘、计算尺,加上一台手摇计算机,彭士禄、黄旭华和科研人员计算了十余万组数据,成功确定了100多个参数。
有时为了保证数据准确,常常是算盘、计算尺两组一起算,直到结果一致。最终,他们完成了潜艇核动力装置的基本设计方案。
图上这把算盘,曾陪伴黄旭华度过无数个日日夜夜。
一代艇如此,“两弹一星”研制早期也如此。下面这张图,就是为两弹一星研制做出过卓越贡献的“飞鱼牌”手摇计算机。
据说,当年苏联专家撤离时,给我国科学家们留下了一个原子弹研发的关键数据,但这个数据却与我国科学家计算的结果不一致。“两弹一星”元勋邓稼先和同事们就靠着这一台台手摇计算机,花了一年多的时间算出了正确的数据,最终成功研发出我国第一颗原子弹。
说起计算机,我国著名流体力学家、中科院院士童秉纲曾有一段难忘的回忆。
他记得,1972年他被派去沈阳一个航空工厂的设计科,从事空气动力学方面的研究。当时,沈阳工厂引进了一台计算机,但这台计算机运行非常不稳定,经常一不小心几个小时的运算数据就全毁了。
童秉纲只能安排在后半夜上机,出于对运算的担心,他常常后半夜不能睡觉。长期超负荷工作损耗着他的身体,以至于新陈代谢失调,“走起路来头重脚轻”。
后来,随着我国计算机事业的起步、发展和腾飞,科技工作者逐步用上了国产的计算机和超级计算机。从“功勋机”109丙机到100系列,从银河-I巨型机到“曙光一号”,再从“曙光1000”到“神威·太湖之光”,我国逐渐治好了“计算机焦虑症”。
二. 僧多粥少的计算焦虑
但科技工作者们的“计算焦虑”还没有治好。
很多人没有接触过超算,误以为使用超算和个人电脑一样,这显然不对。
以最常见的材料计算为例,研究人员为了获得某特性的合金材料(比如要满足某航空器要求),首先需要对材料建模,然后将模型(比如使用Fortran和vasp)写成代码、程序发给超算。得到计算结果后,如果材料特性不合格,就要调整模型、改代码重新计算,如此往复,直至得到满足要求的材料模型。整个过程难免需要多次计算,而拿到成功模型却在试制样品时得不到合格材料也是常有的事儿,这样一来,还要再去重复上述步骤。
虽然过程曲折艰辛,但如果没有超算直接制样试验,找到合格配方的合金材料没个几十年是难以成功的——超算模拟计算已极大加速了这一过程。
材料计算还只是应用超算的一种,汽车工业、高端制造、生物信息、药物研发、气候模拟、海洋环境、能源勘探、航空航天……这些领域向前进的每一步,都离不开超算。
再加上近几年大数据分析等人工智能应用逐渐成为超级计算机的主要负载,坊间数据“全球的算力需求每三个半月翻一倍”虽稍显夸张,但也反映了问题。
需要科学计算的人数也在不断增加。2019年7月,国家统计局发布的《新中国成立70周年经济社会发展成就报告》显示,2018年,我国按折合全时工作量计算的全国研发人员总量为419万人年,是1991年的6.2倍。
在计算机仿真和大数据计算越来越取代实验成为主流科学研究范式的今天,“僧多粥少”的超算必须以更高效的方式传递到用超算的人手中。
自建中小型超算用起来既方便也不方便:方便在没人争抢资源,不方便在凡事都要亲力亲为——从超算的开关机及日常维护这些繁琐事项,到计算底层开发和优化这些需要高度专业的技术活儿,科学家们独力难支。
超算云时代的到来,顺理成章。
三. 超算云服务时代
“超算云”与“云计算”概念略有不同,它是超算拥有者或第三方组织者将超算资源以云服务的形式提供给用户,解决的是用户“无超算可用”“无好超算用”“因缺乏技术支持而超算难用”等问题。
“并行科技”是国内最早开展超算云服务的机构之一,近10年的行业服务积累已助其成长为中国超算云服务的领导者。
并行科技基于国家网格与云计算技术,结合自身多年高性能计算研发经验,推出“并行超算云”一站式超算服务平台,迄今已综合300+HPC集群向20多个行业的5万多用户(多数为各行各业的科学家)提供超算云服务。
这背后,超60万CPU核、超30万台软件装机量的海量资源,已占了通用计算的半壁江山。
自然资源部第一海洋研究所某研究员告诉笔者,他自2013年开始接触高性能计算起,先后经历了尝试自建高性能服务器、2016年后开始采购并行超算云服务的过程,两阶段两相对比,孰优孰劣,一目了然。
“我们课题组的海洋天气预报、厄尔尼诺现象预测等业务需求以及无固定周期的科研型任务,均通过并行超算云服务得到很好的满足。”该研究员说,使用并行超算云服务,大大降低了一次性资本开支,还解决了招标采购、运维管理、系统维护等痛点。
研究方向为“激光约束核聚变”的上海某所某研究员说,激光实验中一些计算任务,无法通过所内自建服务器来满足,比如大规模模拟仿真,他就选择并行超算云。
“用超算云做一个初步的模拟仅需几万元,相比每次几十上百万的激光实验,节约了很多经费。”这位研究员说。
企业研发也看到了超算云服务的优势。
国内风电龙头金风科技在2017年成为并行科技的用户。在金风科技看来,相比自建超算,并行超算云意味着“多快好省”:资源充足且稳定,有充分的研发支持和及时高效的客户服务,在保证业务持续性的同时,具有较高性价比,可大大降低公司资本开支。
笔者观察到,以超算云服务提供计算资源的形式正在国内流行起来。
一方面,国家超算广州中心、中科院超算中心、国家超算长沙中心、国家超算无锡中心、北京超级云计算中心等众多大型超算中心构成的海量资源池的超算“电力网”,正通过超算云将这个算力网接入千万科研工作者的电脑。
另外,阿里云、浪潮云、腾讯云等也逐步开始推广超算云的服务形态。
研究方向为“激光约束核聚变”的上海某所某研究员说,激光实验中一些计算任务,无法通过所内自建服务器来满足,比如大规模模拟仿真,他就选择并行超算云。
“用超算云做一个初步的模拟仅需几万元,相比每次几十上百万的激光实验,节约了很多经费。”这位研究员说。
企业研发也看到了超算云服务的优势。
国内风电龙头金风科技在2017年成为并行科技的用户。在金风科技看来,相比自建超算,并行超算云意味着“多快好省”:资源充足且稳定,有充分的研发支持和及时高效的客户服务,在保证业务持续性的同时,具有较高性价比,可大大降低公司资本开支。
笔者观察到,以超算云服务提供计算资源的形式正在国内流行起来。
一方面,国家超算广州中心、中科院超算中心、国家超算长沙中心、国家超算无锡中心、北京超级云计算中心等众多大型超算中心构成的海量资源池的超算“电力网”,正通过超算云将这个算力网接入千万科研工作者的电脑。
另外,阿里云、浪潮云、腾讯云等也逐步开始推广超算云的服务形态。
四. 与科学家一路并行,“C位”永远留给“C”
笔者观察并行科技多年。并行科技作为一家名气并不太出圈的企业,能够在国内引领起超算云服务之风,一方面得益于背后专业的超算应用支持团队(由一批专业计算开发人员和并行应用专业人才组成),另一方面则是他们始终把服务科学家(及其他用户)用好超算作为最重要的事来做的企业文化。
用好超算是有门槛的,并行科技推广超算云服务的过程,贡献了很多主动付出。换言之,并行不仅关注用户眼前的急难愁盼,还会主动解决共性难题。
例如,针对合肥某院黄老师团队PyCDT软件的安装难题,技术服务团队不仅第一时间沟通处理、给出解决方案,为了避免类似状况的发生,他们又把PyCDT软件部署到超算公共环境,并为后续用户预置的软件作了进一步完善。
再如,在战“疫”行动中,并行科技也一直与开展各类疫用研发的科学家们一路并行。基于北京超级云计算中心的通用计算资源,并行科技不但第一时间为南科大、中科院长春应化所、晶泰科技等需要超算的团队提供超算云服务支持,还为这些抗疫勇士们提供专属“云队列”功能,帮助他们实现任务云调度,解决任务“排队”问题。
这样的例子还有很多。用并行科技的话来说,他们心目中“C位”永远留给“C”(Customer):“这不是某一天要做的事情,而是每一天都要做的事情。”
在第5个全国科技工作者日到来之际,并行科技推出第二届“530并行日”,拿出计算资源免费给科技工作者试用,让他们体验省心的科学计算服务。
连续两年,并行计算已经拿出价值500万元的核时数助力这一行动,向科学家致敬。
并行科技还着眼于未来的超算应用保障。比如,并行科技持续加大“并行基金”的投入,连续9年举办“全国并行应用挑战赛”(PAC),发掘和定向培养高性能计算机人才,通过扩大人才培养助推中国科研数字化发展,缓解科学家们的计算焦虑。
“科技无止境,对科技的臂助同样如此。”并行科技写下的这句话,在“全国科技工作者日”这天显得更加意义非凡。科学计算“底座”引擎作用正愈发凸显,与科技工作者们一路并行的“并行科技们”,也将走得更快更远。
“美好的生活是因为有科学家在奋斗”。向所有的科技工作者致意!