21世纪经济报道记者白杨 北京报道
在数字经济时代,数据成为了比肩土地、劳动力、资本、技术的“第五要素”,与此同时,算力也成为不可回避的一个话题。
作为数字经济的重要基础设施,算力将决定数据应用能力的上限,而今天,社会对于大算力的需求,正变得比以往任何一天都迫切。
近日,阿里云智能全球销售总裁蔡英华分享了两个行业趋势:一是当下在中国,已有58%的企业在使用人工智能,而全球的平均水平是35%;二是数字化转型浪潮正带来大量的数据,预计到2025年,中国的数据量将达到48.6ZB。
在蔡英华看来,数据的智能应用将加速数据量的增加,这也要求人工智能训练模型要不停地变大。有数据显示,过去六年,人工智能的算力增长达到30万倍,这意味着每3.5个月就要翻一番,其速度已远超摩尔定律。
数据的暴增也在刺激和驱动着我国算力基础设施进行升级。在这过程中,蔡英华发现,算力结构其实也在发生变化,“十三五期间,我国算力总规模增长近5倍,其中,通用算力增长近3倍左右,而智能算力的增长是近百倍的。目前,智能算力在整个融合算力中的占比已达到40%,未来可能会更多”。
因此,面对爆发式增长的算力需求,简单用硬件去堆砌算力的路子已经行不通,未来的算力,更强调效率,也更强调绿色,是一种更智慧的算力。
全球最大智算中心
8月30日,阿里云宣布正式启动张北超级智算中心。按照规划,这个智算中心总建设规模为12 EFLOPS(每秒1200亿亿次浮点运算)AI算力,将超过谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成为全球最大的智算中心。
同时,阿里云还将同步启动另一座位于乌兰察布的智算中心,建设规模为3 EFLOPS(每秒300亿亿次浮点运算)AI算力。
据蔡英华介绍,未来,张北智算中心将主要服务AI大规模训练模型、数字人、电商等场景,而乌兰察布智算中心主要服务自动驾驶、生物制药、科学探索、元宇宙等。
据了解,智能计算不同于通用型计算,需要海量数据对AI模型进行训练,算力也会被损耗在数据迁移、同步等环节。所以,传统智算中心达到一定规模之后,增加算力资源反而会降低算力输出的能力,如千卡以上规模的算力输出最低往往仅有40%左右。
这导致智能算力的成本十分高昂。而阿里云通过体系化的技术创新,改变了智能计算的损耗难题,将千卡并行计算效率提升至90%以上。
而实现这一效率提升背后,依托的则是阿里云的“飞天智算平台”。据了解,该平台可以运行在X86、GPU、ARM等多种芯片类型的服务器上,并可将算力资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。
比如在通信技术方面,飞天智算平台可实现端对端最低2微秒延迟,配合阿里云自研的无阻塞通信技术,可让计算过程中的数据交换速度提升5倍以上。
让智算走入更多行业
在启动两座超大规模智算中心的同时,阿里云也宣布将“飞天智算平台”对外开放,并将以公共云和专有云两种模式,为各类科研、公共服务和企业机构提供智能计算服务。
基于飞天智算平台,开发人员可以进行数据存储、数据治理、数据分析、模型开发、模型训练与推理的工作。同时,平台提供了预训练模型,以及语音,图像、自然语言处理、决策等领域的模型能力,以方便开发者更好的加速AI应用的开发。
在此之前,飞天智算平台除了在阿里内部得到广泛应用外,还已经服务了小鹏汽车、深势科技、上汽集团、中国气象局、南方电网等机构和企业。
不久前,小鹏汽车基于飞天智算平台在乌兰察布建设了智算中心——“扶摇”,算力规模达600PFLOPS,可将自动驾驶模型训练提速近170倍,是国内最大的自动驾驶智算中心。
而生命科学领域,深势科技在采用飞天智算平台后,将集群性能优化提升超过100%,并让分子动力学仿真模拟训练效率提升了5倍。
在工业领域,智己汽车运用高性能计算将工业仿真的效率提升了25%,智能驾驶训练效率提升了70%,加速了新车型的研发上市。而山东德州电力通过AI进行复核预测,准确率达到了98%,耗时从1小时缩短至几分钟。
事实上,无论是工业能源领域,还是与数字孪生相关的空间治理,亦或是科学研究,对于智算服务都有着巨大的需求。未来,智能计算将加速数据的智能化应用,从而推动各行各业快速迈入智能时代。
(作者:白杨 编辑:张伟贤)