来源:机器之心
编辑:维度、魔王
AMD 全新发布 Epyc(霄龙)7003 系列处理器,代号「米兰」。该处理器基于 Zen 3 内核和 AMD Infinity 架构打造,每核心最多可达 32 MB 的 L3 缓存,相比二代处理器「罗马」,实现了 19% 的 IPC 提升。
当地时间周一,AMD 发布了全新的 Epyc(霄龙)7003 系列处理器,代号「米兰」(Milan),搭载了去年 10 月发布的全新 Zen 3 架构。Epyc「米兰」服务器芯片的规格与 Ryzen 5000 系列 CPU 大致相同:多核心、高加速时钟频率、19% 的单核性能提升,以及相较竞争对手英特尔表现出的巨大优势。
据 AMD 官网数据显示,EPYC 7003 系列处理器基于 Zen 3 内核和 AMD Infinity 架构打造,具有整套功能和特性:先进的 I/O、7nm x86 CPU 工艺技术以及片上集成安全处理器。
EPYC 7003 处理器具有每核心最多可达 32 MB 的 L3 缓存,支持 4-6-8 内存通道交织从而让多 DIMM 配置具有更好的性价比,并且其互联电路和内存之间时钟同步,所有这些特性都将促进更好、更快地得到结果。
AMDEpyc 处理器。
据悉,AMD 发布「米兰」服务器芯片,旨在从竞争对手英特尔手中抢占更多的市场份额。与消费级 PC 和工作站相比,AMD 与英特尔在服务器芯片领域的竞争更为明显。即使在 AMD 开始主导多线程性能之后,英特尔依然在单线程方面占据领先地位。这一领先地位在 2020 年趋于消失,但英特尔依然可以拿出与 AMD 几乎相同的单线程性能,尽管在全线程性能方面遭到了碾压。
据悉,AMD 已经完成该芯片的设计,并委托台积电采用 7nm 芯片制程工艺来实现量产。
全方位领先 Intel 至强可扩展处理器
与 2019 年自家发布的第二代 7nm 制程 Epyc 罗马(Rome)处理器相比,AMD Epyc「米兰」完成了从 Zen 2 架构到 Zen 3 架构的过渡,并且与桌面端 Ryzen 5000 系列 CPU 相比相差不大。
但与英特尔 Xeon 处理器相比,Epyc「米兰」的速度更快,且能够使用更少的物理空间和功率完成更多的工作。下图展示了 AMD Epyc 处理器与英特尔 Xeon 处理器不同的发展曲线,其中 Epyc 处理器在 2017 年实现了突飞猛进,超越了英特尔 Xeon,并在之后几年继续遥遥领先:
此外我们可以看到,2017 年和 2018 年,AMD Epyc 和英特尔 Xeon Scalable 之间并没有拉开太大差距,但是 AMD 在 2019 年推出了 Zen 2 架构,实现了真正的巨大飞跃。
以具体数据说话,AMD Epyc 7763 系统上运行的 VDI 桌面会话数量是英特尔 Xeon Platinum 8280 系统上的 2.12 倍:
AMD首席执行官苏姿丰在发布会上。
在高性能计算(HPC)和云计算工作负载方面,第三代 Zen 架构的 AMD Epyc 处理器较竞争对手英特尔双双提升了 106%:
在企业工作负载方面,AMD Epyc 处理器提升了 117%。此外,即使从 64 核心的 Eypc 7763 降至 32 核心的 75F3,其性能依然较英特尔最佳性能提升了 70%。
从罗马到米兰,Epyc处理器有哪些架构变化
「米兰」实现了 19% 的 IPC 提升,而这主要由于其采用了全新 Zen 3 架构,该架构改进了分支预测、执行 pipeline 更宽,每时钟周期加载 / 存储操作有所增加。
Zen 3 架构还提供了比 Zen 2 更统一的 L3 缓存设计。Zen 2 / Rome 为每个四核组提供 16MiB L3 缓存,而 Zen 3 / Milan 为每个八核组提供 32MiB 的 L3 缓存。虽然每核的 L3 缓存还是 4MiB,但对于多核共享数据的工作负载而言,Zen 3 这种更统一的设计可以更好地节省缓存空间。
如果八核的 L3 缓存数据为 3MiB,则二代罗马处理器需要 6MiB,在每个四核组中它需要进行一次复制。而三代「米兰」处理器可以节省 3MiB 缓存,只用 3MiB 就可以服务八核,这也意味着单核可以处理更多 L3 缓存。其结果就是针对大型工作负载实现更快的内核与缓存通信,同时有效存储延迟也出现对应的降低。
安全性改进
AMD Epyc 处理器在安全性方面的声誉要好于英特尔至强处理器。从 Epyc 罗马开始,Spectre 和 Spectre V4 攻击可以通过硬件和操作系统 / 虚拟机监视器(Hypervisor)得到缓解。而这次新发布的「米兰」处理器支持安全嵌套分页(Secure Nested Paging),即为受信任的虚拟机提供保护,使其免于不受信任的虚拟机监视器,并且米兰还提供了一个新特性——CET Shadow Stack。
该特性能够提供返回地址的镜像,从而免受面向返回编程(ROP)的攻击。这使得系统能够检测和缓解攻击,即使成功实现了某个堆栈溢出攻击,但它无法攻击影子堆栈。该特性要求操作系统 / 虚拟机监视器进行软件更新。
Epyc 「米兰」CPU 型号
Epyc 「米兰」处理器共有 19 种型号,包括 15 款双路型和 4 款单路型,核心数从 8 核到 64 核不等(每路 16 线程到 128 线程不等),下至 8 核 72F3(3.70-4.10GHz,180W TDP),上达 64 核 7763(2.45-3.50GHz,280W TDP)。
图源:https://www.amd.com/zh-hans/processors/epyc-7003-series所有的「米兰」型号均提供同时多线程(单核双线程)、8 通道 DDR4-3200 RAM、128 lane PCIe4、安全内存加密、安全加密虚拟化等。
其 SKU 被分为三个类别:
最高单核性能,这类 SKU 名称中的第三位为字母「F」,从 8 核 180W 72F3 到 32 核 280W 75F3;
针对每个 socket 的最高核 / 线程数量进行优化,名称中带有「76」或「77」,从 48C/225W 7643 到 64C/280W 7763。
其他 SKU 名称以 73、74、75 开头,旨在「平衡」,可以优化性能和 TCO。
此外,如果 SKU 名称中有「P」,则表示这是一个单 socket 模型。
AMD 与英特尔之争
AMD 表示,「米兰」数据中心处理器比英特尔目前最好的数据中心芯片还要快。据了解,这款芯片由 AMD 设计,并委托台积电使用其 7 纳米芯片制程进行生产。
与之相反,英特尔的一贯做法是「芯片设计与制造一体化」。但近年来英特尔的芯片制程技术略显落后。AMD「米兰」芯片及二代「罗马」芯片都超过了英特尔芯片,这帮助 AMD 抢占市场份额,比如谷歌弃用英特尔芯片,转用 AMD 数据中心处理器。
AMD 高级副总裁兼服务器业务部总经理 Dan McNamara 表示,他相信只要 AMD 继续将客户反馈集成到每一代芯片中,AMD 将保持领先地位。
「我们已经生产出了第三代处理器,我们认为这是针对数据中心的顶尖 CPU。如果我们继续这一步调,我们将保持高竞争力。」Dan 表示。
参考链接:
https://arstechnica.com/gadgets/2021/03/amds-zen3-comes-to-the-server-room-with-epyc-milan/
https://www.reuters.com/article/us-amd-intel/amd-launches-milan-chip-for-data-centers-as-battle-with-intel-intensifies-idUSKBN2B71VY
https://www.amd.com/zh-hans/processors/epyc-7003-series
上手实操:出海企业如何快速构建AI应用
3月17日,亚马逊云科技机器学习产品经理李媛和亚马逊云科技机器学习产品技术专家王世帅将带来线上分享。本次分享将介绍如何借助Amazon Rekognition实现用户身份识别、图片视频内容审核与借助Amazon Personalize为用户提供个性化推荐。