原标题:更智能、更节能:联想集团升级顶级高性能计算机SuperMUC-NG
日前,认证运算性能排名全球第17的高性能计算机SuperMUC-NG宣布,即将开始下一轮升级,以更好的结合AI人工智能的力量来运行越来越普遍的高级模拟、建模、机器学和数据分析工作的。作为SuperMUC-NG的建造方,中国公司联想集团也将继续参与这个集群的升级。
2018年建造完成的SuperMUC-NG高性能计算机位于德国巴伐利亚科学与人文学院的莱布尼茨高性能计算机中心(LRZ),投入了6500个联想ThinkSystem SD650计算节点,具有305856个计算核心,使用了水冷技术,2021年6月TOP500的认证算力高达1.9亿亿次每秒,是联想集团在全球建造的最强大的高性能计算集群。
联想集团表示,本次升级工程不仅将延续SuperMUC-NG的高效,建造一个更强大的高性能计算系统来处理这些先进的工作负载,而且还有助于加速推动传统HPC领域之外的用户更容易将人工智能引入。传统上,在高性能计算机上运行的负载主要是计算和内存密集型任务,比如行星观测中的自动图像和模式识别、处理气候数据,以及数据人口统计学等等。在升级之后,SuperMUC-NG将投入和延续三种主要的新技术:GPU图形计算单元加速,这将大幅加强集群运行人工智能算法的能力;联想分布式异步对象存储(DAOS)系统,这种比传统机械硬盘快得多的存储系统是处理超大型数据集的关键;联想海神温水水冷方案,这是实现高性能计算集群碳中和的关键技术。
联想集团副总裁兼HPC和AI总经理Scott Tease表示,人工智能在HPC计算中越来越流行,研究人员利用人工智能进行更深入的数据分析,比如在生物信息学科、气候学科等超大型的数据集中发现异常或变化等。一个新的时代正在到来,将有更多的人可以利用大型高性能计算机的计算能力,算力本身可能不再是创新和研究的瓶颈因素。
与此同时,高性能计算行业也在进入一个更“绿色”的时代,可持续、碳中和都将成为新的追求目标。联想集团将在SuperMUC-NG的升级继续引入标志性的“海神”直接式温水水冷方案,将热量从CPU、GPU、存储等和核心发热部件直接排出系统,不仅比传统的空气散热更高效,而且更便宜。联想温水水冷技术是一种高效的液体冷却技术,无需专门的制冷设备,被计算核心加热的水可以重新用于建筑供热,也可以使用吸收式冷却器重新利用热能。使用联想温水水冷技术,高性能计算的废热从废品变成了有价值的商品,与此同时因为水的散热性能更好,集群就可以部署更高性能的CPU和GPU,进一步提高计算效率。
最关键的是,在SuperMUC-NG这样的全球顶尖高性能计算集群使用温水水冷技术具有相当强的标杆意义,对于在全球范围内推广,促进HPC和数据中心行业向碳中和转型意义重大。
按照规划,升级的第二阶段计算节点的每瓦特的性能将是第一阶段的四倍,整体项目奖在2022年完成。
除了SuperMUC-NG这样的顶尖集群,联想集团在HPC领域在全球范围内都具有优势。2021年6月29日,TOP500发布了最新的全球高性能计算TOP500榜单,联想集团再次蝉联榜单制造商份额第一,全球性能最强的500台高性能计算集群中,联想集团交付了184台,独占TOP500中36.8%的份额。
作为全球第一的算力厂商,联想集团在刚刚过去的2020/21财年中,以全面覆盖个人计算、云计算、软件与服务的全面业务,取得了靓丽的业绩:全年整体营业额在一年内飙升近700亿人民币,同比增长19.8%,达到4116亿人民币的新里程碑;税前利润120亿人民币,净利润近80亿人民币,年同比增长均超过70%。包含高性能计算业务的DCG数据中心业务在新财年全面整合升级成为了ISG基础设施方案业务集团,在上财年也取得了增长高于大市的业绩:全面营业额达到429亿人民币,同比增长15%;中国业务营业额实现同比增长12%。
从数字化向智能化的升级中,核心的人工智能、数据中心等应用均建筑在数据、算力和算法这三大要素的基础之上。数据中心作为算力的载体,散热方面的优化必然会成为需要重点突破的技术瓶颈之一。面对我国提出的“碳中和”、“碳达峰”目标,社会经济的全面绿色发展重大转型势在必行。数据中心作为数字经济的核心承载基础,联想集团掌握建设绿色节能算力基础设施的瓶颈技术、关键技术。联想集团的新一代绿色智能算力基础设施,在满足国家‘碳中和’战略的同时,亦能够用强大高效的算力,赋能各行业客户的高质量发展。