热点:

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图

      [  中关村在线 原创  ]   作者:徐鹏   |  责编:徐鹏

          从那不勒斯到罗马,AMD凭借在工艺制程、架构设计上的独特性和创新性在数据中心市场“乘风破浪”。如今,随着代号“米兰”的第三代EPYC到来,7纳米工艺的第三代AMD EPYC(霄龙)处理器(7003系列)在性能、TCO、功能性和应用生态上有了更广阔的发展前景。就像AMD高级副总裁兼服务器业务总经理Dan McNamara所说的,第三代霄龙产品是AMD面向高性能市场迈进转型的重要一步,同时也会进一步扩大其在数据中心领域的领先地位。

          的确,在过去的很长一段时间内,客户们不仅看到了AMD在产品性能上的快速推进,甚至是在某些方面大幅赶超对手,其所在的生态圈也在逐步壮大,市场上涌现出越来越多搭载最新一代EPYC的服务器产品,并且在各行各业的应用场景中加速落地,帮助客户获取更好的业务价值和ROI。据AMD宣布,预计到2021年年底,将有超过400个基于历代EPYC处理器产品的云计算实例、以及超过100个基于第三代EPYC处理器的新服务器平台。

          在第三代EPYC处理器中,除了IPC性能有19%左右的提升、在多项基准测试和工作负责中较上代产品有约两倍的性能提升,在SNP等技术方面也有着跨代的升级,并且加快了交付客户的速度,有效保障了数据中心的高可用性。例如在企业市场,SPECjbb性能基准上的两倍提升更适应高融合基础架构,可以帮助客户高效处理海量数据,并基于这些结构化或非结构化的数据进行快速分析和决策;在云计算市场,性能指标SPEC Int的两倍提升能够大幅加强应用能力,在虚拟密度和速度保持领先的同时,支持每个Socket最高性能,使得TCO价值最大化;而在高性能计算市场,AMD同样刷新了不少基准测试纪录。

          当然,在第三代EPYC大步向前之时,从Zen 2到Zen 3的架构升级可谓居功至伟,比如代际之间19%的IPC性能提升,在架构中的各个环节都进行了优化,包括改善分支预测功能,提高准确性、快速抵达目标,可在系统中发出更快的指令,实现更高指数的吞吐量,增加了更多的流水线,并加强了推理方面的性能。同时,从四核到八核共享同一L3缓存的架构改变也使通信速率得到加快,由于实现了共享内存调用,即使是在线程数较低的系统中也可以降低有效内存访问延迟。

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    Zen 3将IPC性能提升19%

          除此之外,Zen 3在前端把BTB性能提高一倍达到1024,增加了分支预测器带宽,在分支预测中消除了冒泡现象,能够更快速的从误测中恢复和寻址。在处理大型工作负载时,可以在Op cache和Instruction cache之间无缝切换,以及更高颗粒度的流水线切换。在执行部分,针对整数有专用的分支和ST数据拣选器,以及更大的窗口,减少了运行时延,同时在浮点上增加了两个位宽的调度和分发,具有更快的FMAC周期,还有两条INT8的IMAC流水线。此外,Zen 3中还设置了三个运行、三个加载和两个存储操作,对内存依赖性的检测做了优化,完善了操作灵活性,对于随机内存操作提供了6个页表查询器,以实现更好的TLB查询。

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    Zen 3亮点概述

          指令集方面,Zen 3在加速、加密和解密算法上扩展了AVX2指令到256位。在安全性上,对SEV进行改进,限制了中断的注入,以及恶意管理程序注入SEV-ES访客中断/异常类型,将调试寄存器添加到交换状态中。同时,SNP安全嵌套分页能在现有SEV-ES、对虚机内存和虚机寄存器做加密保密的基础上,增加系统完整性保护,防止恶意管理程序通过重放、损坏、重新映射进行攻击。另外像CET Shadow Stack -CET影子栈功能,可以防止ROP编程的攻击,更好的优化系统安全性。

          虽然AMD EPYC处理器在应对“幽灵”、“熔断”等攻击时,有更高的安全性和防御能力,AMD全球院士、Zen核心首席设计师Mike Clark仍然表示:“在第一代EPYC产品投入市场时,正好遇到幽灵攻击,现在回头来看当时我们的应对并不是最优的。但是到了第三代产品的时候,我们应该说从架构方面做好了更强的防御,对性能的折损降到了最低,总结来说,我们能够实现19%的代际之间IPC每核性能的提升,同时大大增强了系统的安全性和稳定性。”

          有了强劲的架构核心,将其整合至SoC才能发挥出最优性能。第三代EPYC处理器除了在性能方面的提升,还实现了每核心32MB缓存,内存交织配置在4和8的基础上增加了6通道模式,经过BIOS设置后可对二代平台兼容,并且完善了安全性和虚拟化性能。在处理器内部,有9个Chiplet设计的模块,采用8个CCD加1个Socket IO整合的多芯片混合设计,每个CCD内的8个核心能够同时共享32MB缓存,支持PCIe Gen 4,具有两个DIMM通道,每插槽支持4TB。

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    第三代AMD EPYC(霄龙)处理器概述

          从Zen 2到Zen 3,AMD对CCD做了8核的整合,使得所有的核心都能直接访问本地32MB的L3缓存,通过这种设计可以降低时延,对于需要用内存子系统较密集的应用来说,可以有效提高性能。这样一来,每颗核心调用缓存的能力都被提升了,在运行一些负载时8颗核心可能只需要共享8MB的三级缓存指令数据,而剩下的24MB三级缓存则可以被8颗核心单独使用或者共享,由此也提升了多核心和多线程应用的性能表现。

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    CCD直接访问L3缓存

          混合的Chiplet架构增强了设计灵活性,为CCD和IO DIE的配置提供了更多可能性,例如8核设计时最大化共享三级缓存,每个CCD上只有一个单独的核心,让每个核心独享32MB的L3缓存,在每CCD的核心数量上做一些变化,实现多种核心数和缓存的组合,而架构中间的IO DIE还能保持平台的兼容性。

          在内存交织上,AMD推荐的通道配置模式可以避免内存通道中出现过热的点,更好的平衡工作负载需求,降低内存成本和所需内存数。相较Zen 2的两通道选择,Zen 3增加了六通道,在四通道和八通道之间给出了一个平衡的选项,让客户在部署时有更多的灵活性,优化了内存成本。

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    内存可靠性和灵活性增强

          安全性方面,Zen 3把处理器安全集成至IO DIE,为密钥的生成、管理提供了加密功能,加入硬件验证启动,在传承上一代产品可靠优势的同时,新增如影子栈技术能增加对控制流攻击的防护,还有SNP能针对访客权限登录的虚机程序防止恶意攻击。

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    新一代EPYC具有更好的安全性

          在硬件验证启动的过程中,安全处理器会加载片上的ROM只读内存,提供硬件信任根,在OS内核执行BIOS代码之前,加载程序会对BIOS进行验证,然后加载程序会执行密钥管理。BIOS通过认证之后,操作系统就会加载OS或虚机管理等程序。期间,密钥管理能对ROM到DIMMs之间往来的数据做端到端加密,为此,AMD也设置了两个模式:在SME安全内存加密模式下,可以对任何系统重置使用单一生成的的随机密钥做加密;在内存加密虚拟化SEV模式下(包括SNP功能),虚机会有一把密钥,同时针对每个访客的登录进程,都会有另外一个单独的密钥,均是通过安全处理器启用。

          AMD院士、SoC架构师Noah Beck表示:“在第一代的系统中,我们提供了SME和SEV,第二代中,我们增加了一个访客加密态的保护,同时可用的密钥数量达到209个。第三代产品在这个基础上增加了SNP,可以增强系统完整性的保护,加强SEV和SEV-ES提供的保密性,防御未验证的虚机管理器对访客登录的虚机系统的保护。”

          可以说,源源不断的工艺和架构创新是推动EPYC服务器在市场中高速发展的关键。在第三代EPYC处理器系列中(见下图),有四款(75F3、74F3、73F3、72F3)针对单核性能做了最大优化,提高了单核频率、可调用缓存、可使用内存、带宽,适用于关系型数据库、技术类运算和商用场景;有五款(7763、7713、7713P、7663、7643)是核心密度高的产品,可以为行业客户提供更高的多线程运算性能和多插槽运算性能,适用于企业市场、高性能计算和云计算;有10款(7543、7543P、7513、7453、7443、7443P、7413、7343、7313、7343)针对性能平衡和优化,以及对整体拥有成本有比较强需求的企业客户。

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    第三代AMD EPYC(霄龙)处理器(7003系列)

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    AMD EPYC处理器家族分布

          高性能计算领域,在SPEC FP基准测试中,第二代EPYC在双插槽服务器中的性能比英特尔至强6258R高出76%,第三代EPYC将这一优势拉大到了106%;云计算领域,在SpecinRate基准测试中,第二代EPYC在双插槽服务器中的性能比英特尔至强6258R快81%,第三代EPYC同样将该数字扩大到106%;企业应用领域,在SPEC JBB基准测试中,第二代EPYC比英特尔至强8280高出79%,而第三代EPYC的领先优势为117%。

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    HPC工作负载对比

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    云计算工作负载对比

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    企业应用工作负载对比

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    性能表现出众

          如果客户需要配置如下图所示规模的系统,以SPECrate为基准性能,若采用搭载英特尔至强6258R的服务器需要63台,若采用AMD EPYC 7763的服务器仅需要32台,在采购和运维成本上均是较大的节约,使用四年的TCO(总体拥有成本)可以实现35%的削减。

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    TCO价值显著

          与此同时,AMD的“朋友圈”也在不断壮大,越来越多的合作伙伴在基于新一代EPYC产品打造类型丰富的解决方案,应用于超融合、关系型数据库、数据分析等场景,快速帮助企业客户实现商业成功。

    “米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图
    AMD EPYC生态伙伴

          “无论是从每个插槽或每个核心来说,第三代AMD EPYC产品都能带来最高性能。”AMD EPYC产品管理全球副总裁Ram Peddibhotla谈到,“同时,我们能够为客户带来最优化的整体拥有成本的价值,并且通过与生态伙伴的合作,能够让客户更有效的部署就绪,让他们能更快的享受到这样的价值。”

    本文属于原创文章,如若转载,请注明来源:“米兰”三代EPYC发布 AMD重塑数据中心市场新格局的关键版图https://server.zol.com.cn/764/7643958.html

    server.zol.com.cn true https://server.zol.com.cn/764/7643958.html report 7668       从那不勒斯到罗马,AMD凭借在工艺制程、架构设计上的独特性和创新性在数据中心市场“乘风破浪”。如今,随着代号“米兰”的第三代EPYC到来,7纳米工艺的第三代AMD EPYC(霄龙)处理器(7003系列)在性能、TCO、功能性和应用生态上有了更广阔的发展...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    0

    下载ZOL APP
    秒看最新热品

    内容纠错