原标题:高性能计算与人工智能何处去?英特尔剑指XPU
内置高带宽内存(HBM)的Sapphire Rapids至强可扩展处理器进一步打造性能标杆;英特尔GPU、网络和存储能力丰富高性能计算产品组合
新闻要点
最新的第三代英特尔®至强®可扩展处理器将驱动下一代超级计算机和高性能计算系统。
下一代英特尔至强可扩展处理器(代号“Sapphire Rapids”)将集成高带宽内存(HBM)。
基于英特尔 Xe架构的HPC GPU (Ponte Vecchio)已成功启动,正在进行系统验证,包括OAM规格的产品及其子系统。
英特尔宣布推出基于以太网的高性能网络(HPN),此举将使英特尔以太网扩展到高性能计算应用。
英特尔宣布引入对 DAOS(分布式异步对象存储)的商业支持。
加州圣克拉拉,2021年6月28日——在2021年国际超算大会(ISC)上,英特尔通过一系列技术披露、重点合作与客户成功案例,全面展现了其在高性能计算领域日益强化的领导地位。目前,英特尔处理器是全球超级计算机中部署最广泛的计算架构,持续助力全球医学探索和科学突破。英特尔还宣布了用于高性能计算与人工智能领域的至强处理器的重大发展,以及用于一系列高性能计算用例的内存、软件、E级存储和网络技术方面的创新。
英特尔副总裁兼高性能计算部总经理Trish Damkroger表示:“为了最大限度地提高高性能计算性能,我们必须尽可能地利用所有计算机资源与技术进步。英特尔是整个行业迈向E级计算的重要推动力,而我们在 CPU、XPUs、oneAPI工具包、E级DAOS存储和高速网络方面的突出优势正在逐步将这一目标变为现实。”
扩大高性能计算的性能领先优势
今年早些时候,英特尔凭借最新推出的第三代英特尔至强可扩展处理器进一步扩大了其在高性能计算的领先地位。相较于前代产品,它能够为广泛的高性能计算工作负载提供高达53%的性能提升,其中包括生命科学、金融服务和制造等领域。
对比最接近的x86竞品,第三代英特尔至强可扩展处理器能够为一系列主流高性能计算工作负载提供更强大的性能。例如,在英特尔®至强®可扩展8358处理器和AMD EPYC 7543处理器的对比中,至强可扩展处理器的NAMD性能表现胜出62%,LAMMPS性能表现胜出57%,RELION性能表现胜出68%,二项式选项性能表现胜出37%。此外,蒙特卡罗(Monte Carlo)模拟在全新的英特尔®至强®可扩展处理器上的运行速度比在AMD霄龙处理器上快两倍,这将使金融类公司仅通过一半时间就能实现定价结果。英特尔®至强®可扩展8380处理器在关键AI工作负载上的性能也优于AMD EPYC 7763处理器,在20个常见基准测试中都能提供高达50%的性能提升。全球诸多高性能计算实验室、超算中心、大学及原始设备制造商正在利用英特尔最新的计算平台开发高性能计算解决方案,其中包括戴尔科技集团、HPE、韩国气象局、联想、马克斯·普朗克计算和数据机构(MPCDF)、甲骨文、大阪大学和东京大学。
在下一代英特尔至强可扩展处理器内集成高带宽内存(HBM)
如今,建模和模拟(例如计算流体动力学、气象和天气预报、量子色动力学)、分析(例如大数据分析)、内存数据库、存储等广泛的工作负载正在显著推动人类的科学突破。下一代英特尔至强可扩展处理器(代号“Sapphire Rapids”)将集成高带宽内存(HBM),可显著提高处理器的可用内存带宽。通过在处理器内封装高带宽内存,运行高性能计算与人工智能应用等内存带宽密集型工作负载的处理器性能将获得大幅提升。集成高带宽内存的Sapphire Rapids处理器可在仅使用高带宽内存或结合 DDR5 的情况下处理工作负载。
集成高带宽内存的 Sapphire Rapids 处理器深受客户青睐,目前成功部署在美国能源部在阿贡国家实验室的Aurora超级计算机、以及洛斯阿拉莫斯国家实验室的Crossroads 超级计算机上。
阿贡国家实验室的计算、环境与生命科学实验室副主任Rick Stevens表示:“实现E级计算需要快速访问和处理海量数据。在英特尔至强可扩展处理器中集成高带宽内存将大幅提升Aurora超级计算机的内存带宽,并让我们利用人工智能和数据分析来进行高级模拟和3D建模。”
洛斯阿拉莫斯国家实验室的物理学实验室副主任Charlie Nakhleh表示:“洛斯阿拉莫斯国家实验室的Crossroads超级计算机旨在推动用于科学和国家安全的复杂物理系统的研究工作。下一代英特尔至强处理器Sapphire Rapids结合高带宽内存(HBM),将在我们的Crossroads系统中大幅提升内存密集型工作负载的性能。[Sapphire Rapids-HBM]产品能够加速目前最大型的复杂物理学和工程运算,让我们能够进行全球安全、能源技术和经济竞争力领域的大型研发项目。”
基于Sapphire Rapids的平台将提供独特的功能,为高性能计算提供加速,包括搭配PCI express 5.0的更高的I/O带宽(与PCI express 4.0相比),以及对Compute Express Link (CXL) 1.1的支持,从而在跨计算、网络和存储的情况下支持先进用例。
除了内存和 I/O 方面的提升外,Sapphire Rapids还借助全新内置人工智能加速引擎——英特尔® 高级矩阵扩展 (AMX) ,针对高性能计算和人工智能工作负载进行了优化英特尔 AMX,旨在显着提升深度学推理和训练的性能。目前,已经决定采用了Sapphire Rapids的客户包括CINECA、莱布尼茨超级计算中心(LRZ)和阿贡国家实验室,以及洛斯阿拉莫斯国家实验室和桑迪亚国家实验室的Crossroads系统团队。
基于英特尔Xe架构的HPC GPU(Ponte Vecchio)已成功启动
今年早些时候,英特尔基于Xe架构的HPCGPU(代号“Ponte Vecchio”)已成功启动,目前正处于系统验证阶段。Ponte Vecchio是一个基于Xe 架构的GPU产品,为高性能计算和人工智能工作负载进行了优化。Ponte Vecchio将利用英特尔的Foveros 3D封装技术,对多个IP进行封装,其中包括HBM内存和其它IP。这款GPU的架构包含计算、内存和Fabric,以满足像Aurora这样的全球最先进的超级计算机不断演进的算力需求。
Ponte Vecchio将会支持OCP加速器模块(OAM)规格及子系统,提供高性能计算应用所需的横向与纵向扩展功能。
将英特尔以太网能力注入高性能计算
在2021年国际超算大会(ISC)上,英特尔还宣布了其全新的以太网高性能网络 (HPN) 解决方案,该解决方案通过使用标准的英特尔以太网 800 系列网络适配器和控制器、基于英特尔® Tofino™ P4 可编程以太网交换机 ASIC 和英特尔® 以太网结构套件软件的交换机,为 HPC 领域的小型集群扩展以太网技术功能,HPN能够对以太网提供的易用性进行充分利用,以更低的成本实现与InfiniBand相当的应用程序性能。
对DAOS进行商业化支持
英特尔正在引入对 DAOS(分布式异步对象存储)的商业支持。DAOS是一种开源软件定义对象存储,旨在优化跨英特尔高性能计算架构的数据交换。DAOS同时是阿贡国家实验室此前宣布的英特尔®E级存储堆栈的基础,被英特尔的LRZ和JINR(联合核研究所)等客户广泛采用。
DAOS 支持现已作为 L3 的支持产品对英特尔合作伙伴开放,这使广泛的合作伙伴能够将完整的交钥匙存储解决方案与服务相结合,持续赋能产业下游。除了英特尔自身的数据中心构建模块,这一新商业支持计划的早期合作伙伴还包括慧与、联想、美超微、Brightskies、Croit、Nettrix、广达和RSC集团。