热点:

    英特尔祭出“能效核+性能核”大招 持续赋能数据中心行业

      [  中关村在线 原创  ]   作者:十一

    自2018年,英特尔提出了以制程、架构、存储、互联、安全、软件的六大战略支柱,并明确了计算新时代必要的四大基础计算架构,即标量、矢量、矩阵和空间架构之后,这家半导体领域的巨头就在以XPU战略为基础,不断扩展自身的平台,数据显示,最新的英特尔第三代至强可扩展处理器单在去年12月的出货量便远超AMD全年出货量。但在英特尔公布下一代至强可扩展处理器Sapphire Rapids之后,关于至强未来几代产品的信息一直比较少,不过近期英特尔也是终于回应了大众的期待,对外披露了至强产品的路线图。

    未来可期 英特尔全新能效核处理器后年问世

    01 第三代至强可扩展处理器

    在介绍Sapphire Rapids及之后的至强产品之前,先简单介绍下英特尔目前主要出货的第三代至强可扩展处理器Ice-Lake,它采用原英特尔10nm工艺(现Intel 7)制造,具有多达40个Sunny Cove内核,晶片面积约为660mm2,与第二代至强处理器相比,第三代的性能有了飞跃式的提升。同时得益于FPGA、内存、存储、网络及其独特的加速器持续推动创新和发展,英特尔数据中心在2021年财年达到了20%的收入增长。

    未来可期 英特尔全新能效核处理器后年问世

    第三代至强可扩展处理器的主要技术亮点体现在SGX英特尔软件防护扩展技术和AI加速能力。与常规的隐私保护或者安全技术相比,SGX在安全性、性能和可用性方面都有明显优势。在安全性方面,它是一个硬件级的安全技术,基于对CPU的信任,可以有效避免以往依赖高权限软件而带来的安全隐患;性能方面,在第三代至强可扩展处理器平台上,SGX的计算性能优异,可以有效控制成本;可用性方面,SGX的生态利用LibOS(库操作系统),致力于避免打破现有的应用方式,可以很大程度上降低重新构建一些通信或者是底层架构的代价,从而使数据和模型的加载和保护更加便捷。最大限度上帮助程序开发者把整个数据应用进行无缝迁移,而不像安全多方计算和同态加密或者是差分隐私有一些明显的性能或者是精度上的问题。

    在AI加速方面,以现如今在游戏厂商中广受欢迎的3D人脸建模为例,利用英特尔Ice-Lake上面的VNNI指令集,在int8上实现了从人脸照片到三维模型的图像映射。通过一个FP32向int8的转换,可实现4.23倍的性能提升;在自然语言处理方面,英特尔也通过和阿里云对Transformer的一个模型进行优化,通过VNNI int8实现了3倍的性能提升。

    02 下一代至强可扩展处理器Sapphire Rapids

    英特尔在去年公布了第四代至强可扩展处理器Sapphire Rapids,该产品将使用大于1600 mm2的芯片以打造最高核数的解决方案,其中,Sapphire Rapids的四个单元将通过英特尔嵌入式多芯片互连桥接技术相连。该芯片将拥有8个64位DDR5内存通道,支持与PCIe 5.0及大部分CXL 1.1互连。与此同时,新的矩阵扩展、数据流加速器,以及英特尔Quick Assist技术(英特尔QAT)也将开始发挥作用,所有这些都建立于当前在Alder Lake台式机平台中采用的最新性能核设计之上,并已针对数据中心的使用需求进行了优化,这也意味着该芯片将支持AVX512和更大缓存。与此同时,Sapphire Rapids将搭载HBM内存和全新的Ponte Vecchio高性能计算加速器,并率先应用于阿贡国家实验室的超级计算机Aurora中。目前来看,市场对这款将于2022年问世的Intel 7处理器十分期待。

    未来可期 英特尔全新能效核处理器后年问世

    继Sapphire Rapids之后,与平台兼容且同样基于Intel 7制程工艺的Emerald Rapids将于2023年问世,按照英特尔一贯的命名传统,Emerald Rapids有可能是第五代至强产品。目前看来,Emerald Rapids(EMR)有望从Sapphire Rapids设计以及制造中汲取经验以提高性能。平台兼容意味着不仅有机会看到一个全新加速器,同时Emerald Rapids 还将与前几代相似,在PCIe通道、CPU之间的连接、DRAM、CXL和IO功能方面提供支持。然而,目前这款处理器的庐山真面目仍未揭晓,不过可以预测的是,它极有可能与Sapphire Rapids类似,同时也将是英特尔计划作为下一代产品推出的、拥有全新性能的可扩展处理器。

    据悉,Sapphire Rapids将在2022年第一季度开始出货,并将在3月向第一批客户提供首批产品。

    03 英特尔性能核至强处理器Granite Rapids

    从Granite Rapids(GNR)开始,英特尔将采用Intel 3制程工艺,打造至强性能核处理器,并于2024年推出该款产品。此前的路线图一直显示,Granite Rapids会采用Intel 4制程工艺,但英特尔表示,其技术进步和时间规划将让Granite Rapids得以提前采用Intel 3制程工艺。Intel 3是英特尔在Intel 4之后的第二代EUV工艺节点,可以预测两者的设计规则具有一定的相似性,因此其迭代并不会带来质的变化。

    Granite Rapids将采用单元架构,同时也将在其单元中采用区分策略:区别于Sapphire Rapids的统一设计,Granite Rapids将拥有独立的IO单元和内核单元。英特尔尚未透露它们之间将如何连接,但其理念是IO单元可以包含所有内存通道、PCIe通道和其他功能,而内核单元则完全专注于处理器性能。

    Granite Rapids作为下一代性能核至强处理器,将与英特尔一个全新的产品线共享一个平台——该产品线将推出专为数据中心优化所提供的能效核处理器,并以同样基于Intel 3制程工艺的Sierra Forest(SRF)为起点。能效核多用于当前英特尔Alder Lake消费级处理器产品组合,而Sierra Forest将是基于目前能效核微架构Gracemont的新一代变革,其目的在于让产品更注重内核密度而不是单纯的内核性能。如果内存带宽和互连能够支持,该产品将可以实行低电压运行和并行处理。

    04 英特尔能效核至强处理器Sierra Forest

    Sierra Forest将采用与Granite Rapids相同的IO晶片。由于两者将共享一个平台,可以假定其插槽将互相兼容,因此,两者预计会拥有相同的DDR和PCIe配置。如果英特尔延续现有的命名方式,GNR和SRF将是其第六代至强可扩展处理器。英特尔表示,GNR和SRF将根据客户需求覆盖并扩展目前已有的Ice Lake可扩展处理器产品组合。GNR和SRF预计将于官宣推出之时,在全球范围内上市。

    可以看到,英特尔全新的架构策略(同时拥有基于性能核(P-core)和能效核(E-core)的双轨产品路线图)将两个优化的平台整合为一个通用、定义行业发展的平台。该全新架构策略将更大限度地增强产品的每瓦性能和细分功能,从而全面增强英特尔在业界的整体竞争力。

    英特尔方面表示,现阶段,在数据中心市场英特尔面临严峻挑战。尽管英特尔拥有“性能核”的超高性能内核,能够实现最高的单核或单线程性能。正如在AWS EC2 M6i实例中展示的那样,这些内核包含AVX-512等特性,在加速某些工作负载方面表现出色。但由于性能核必须将整个晶片面积专用于这项功能,也导致许多云工作负载根本无法充分利用这些额外的加速和性能。

    然而对于诸如大型云服务提供商等英特尔客户,则并非如此关心高性能计算加速。相反,他们看重的是ECU/vCPU的整数和浮点运算性能。如果是以牺牲内核密度为代价,可能无法满足他们应用的需求。

    而且,一个能效核目前占用的空间只有性能核的约四分之一,基于此,英特尔Sierra Forest采用能效核,打造专门针对以上工作负载的CPU。这让英特尔能够在相同的封装内放入更多内核。借鉴行业做法,英特尔正以Granite Rapids处理器转向新的芯片设计方案。在分享中,英特尔也提到该处理器正在通过I/O而分解非核心功能

    这种方案意味着英特尔能够在特定芯片所需的计算晶片中使用通用的插槽、固件、平台和开关,这不仅为未来使用异构计算单元铺平了道路,也将对未来的产品设计产生深远影响。这类似于AMD在将于2022末/2023年发布的Genoa和Bergamo中采用的方案。

    然而,这其中也有一个重要的细微差别。由于Ampere Altra和Graviton2等Arm芯片更像是能效核的集合,再加上由制程工艺领先于英特尔的台积电来制造,因此英特尔在PPA方面也受到Arm的冲击。现阶段英特尔处理器的能效可能不如Arm,但当英特尔拥有卓越的制程技术和更高的产量时,Arm就无法与之竞争了。凌动系列拥有能效核的血统,特别是凌动C2000系列中的Avoton和Rangeley有效地把Arm困在低端市场近十年的时间(C3000系列将在稍后推出)。

    一旦英特尔在这些芯片发布时能够追平制造工艺,关于PPA的讨论就会更加多样化。假设Arm的能效比x86高50%,也并不意味着它一定可以多容纳50%的内核。但现阶段许多人做出了错误的假设,需要注意的是,用于缓存、PCIe/CXL I/O、内存接口等的芯片面积也非常大。上图可以查看芯片中内核与其它所有设备所占的比例。

    因此,能效核至强处理器让英特尔真正有机会成为市场上现有Arm解决方案的直接竞争对手,特别是它现在计划采用新的Intel 3制程工艺。

    05 英特尔已为未来做好准备

    关于采用GNR+SRF的统一平台是否意味着此后的至强产品将成为一个英特尔独有的平台,以及英特尔是否会遵循客户喜好同时保留两代产品,英特尔给出的答案是,最好的选择是保持不同代产品之间的平台兼容性,但同时这也取决于时间以及新技术集成。业内估计,除了CPU,PCIe 6.0最早将到2026年才会出现,而DDR6更可能于2029前后问世。所以,除非有更多的内存通道可以添加,否则我们极可能看到英特尔在其第六代或第七代至强产品中实现上述功能。

    除此之外,另一个大众关注的问题是关于混合CPU设计的,既然英特尔目前正推动性能核和能效核产品双线并进,为何不将其整合至一个产品中?对此,英特尔表示,由于每个用户的需求不同,当前市场更倾向于单核设计的产品。比如一个客户希望性能核与能效核的比例是80/20,另一个客户可能更喜欢20/80的比例,然而大量生产各个比例的产品并不具备较高的实现性。与此同时,经部分用户使用发现,他们的软件往往在采用相同内核的处理器上运行效果更好,而非在系统或插槽层面整合两种内核的产品中运行。因此,令人十分高兴的是,我们在短期之内将不会看到混合两种内核的至强可扩展处理器。

    分别为性能核和能效核处理器配备同等数量的内存通道和I/O通道,对于两种场景来说可能都不能达到最佳的效果,英特尔目前也并没有就统一IO晶片做出回答。不过,无论客户使用哪种CPU,采用同一个兼容平台有助于降低部分不可收回的开发成本。而且,我们也可以看到英特尔已为更多适用于至强D的场景,以及为规模较小的部署提供不同的IO配置打开了大门。

    未来可期 英特尔全新能效核处理器后年问世

    关于Granite Rapids和Sierra Forest,英特尔表示正与重点客户展开合作,进行微架构和平台的开发、测试及部署。随着Granite Rapids和Sierra Forest在今明两年发布,更多细节也将会披露。

    本文属于原创文章,如若转载,请注明来源:英特尔祭出“能效核+性能核”大招 持续赋能数据中心行业http://server.zol.com.cn/788/7883934.html

    server.zol.com.cn true http://server.zol.com.cn/788/7883934.html report 8239 自2018年,英特尔提出了以制程、架构、存储、互联、安全、软件的六大战略支柱,并明确了计算新时代必要的四大基础计算架构,即标量、矢量、矩阵和空间架构之后,这家半导体领域的巨头就在以XPU战略为基础,不断扩展自身的平台,数据显示,最新的英特尔第三代至强可扩展处...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    周关注排行榜
    • 产品
    • 品牌
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错