热点:

    蓝色巨人归来 英特尔全新架构推进未来计算创新

      [  中关村在线 原创  ]   作者:十一

           我们熟悉的那个英特尔,似乎真的回来了。

           很长时间里,英特尔都是技术力的代名词,作为半导体领域的巨头,英特尔自成立以来为业界带来了众多黑科技,但自从2017年英特尔确立了“以数据为中心”的转型目标之后,很多不明就里的围观群众都表示不理解。但事实上是,我们所面临的现代社会,正在迎来一场全面的技术进步,无论是计算机视觉的飞速发展,还是虚拟现实概念的深入人心,亦或是人工智能的惠普,都让我们看到了科技的无限可能。

           而作为科技时代最为重要的生产资料,数据的重要性毋庸置疑,成倍增加的数据使得强大的计算能力成为了关键。2018年,英特尔提出了以制程、架构、存储、互联、安全、软件的六大战略支柱,并明确了计算新时代必要的四大基础计算架构,即标量、矢量、矩阵和空间架构,所有的这一切,都是在为应对未来算力提升所做的铺垫。


    四大基础计算架构

           今年8月的架构日活动,谜底揭晓。

           “架构是硬件和软件的‘炼金术’。它融合特定计算引擎所需的先进晶体管,通过领先的封装技术将它们连接,集成高带宽和低功耗缓存,在封装中为混合计算集群配备高容量、高带宽内存和低时延、可扩展互连,并确保所有软件无缝地加速。”英特尔公司高级副总裁兼加速计算系统和图形事业部总经理Raja M. Koduri在架构日活动当天谈到。那英特尔今年的“炼金术”都有什么呢?答案是:两款下一代x86内核微架构、12代酷睿处理器Alder Lake,Xe HPG以及英特尔独立显卡,基础设施处理器IPU和数据中心GPU架构Ponte Vecchio

           正如Raja所说的那样,为了在2025年满足千倍级的处理能力提升需求,要在每个技术领域都实现4倍左右的摩尔定律提升,此次架构日活动公布的创新与突破性技术,正表明英特尔已经做好了未来海量多元化数据时代的准备。

           XPU时代的创新者

           作为数字化时代的基础设施,数据中心的重要性毋庸置疑,但现如今不断演进的数据中心越来越需要一个全新的智能架构。这一架构内,大规模分布式异构计算能够协同工作,无缝连接,形成一个独立的计算平台。这种新架构将有助于解决当今资源搁浅、数据流拥堵和平台安全不兼容的挑战。英特尔的XPU战略,正是对全新智能架构的最好解释,即智能数据中心架构将拥有三类计算单元:用于通用计算的CPU、用于特定应用或特定工作负载加速的XPU以及用于基础设施加速的IPU,它们将通过可编程网络相互连接,从而有效利用数据中心资源

           在这次的架构日活动中,英特尔自然也有针对数据中心市场的一系列技术更新,首先是全新数据中心架构Sapphire Rapids,它基于Intel 7制程工艺技术,采用英特尔性能核与全新加速器引擎,被称作树立了下一代数据中心处理器的标准。Sapphire Rapids的核心是一个分区块、模块化的SoC架构,采用英特尔的嵌入式多芯片互连桥接(EMIB)封装技术,支持加速器接口架构指令集、高级矩阵扩展,以及数据流加速器,能够提供更高的整体工作负载性能,在CPU、内存和缓存以及所有附加的内存、存储和网络设备之间移动数据。当然作为面向数据中心的新一代处理器,Sapphire Rapids通过先进的内存和下一代I/O,包括PCIe5.0、CXL1.1、DDR5和HBM技术,来推动行业技术转型。


    全新数据中心架构Sapphire Rapids

           Sapphire Rapids的黑科技不止于此,我们已经在第三代至强可扩展处理器上看到了其在AI方面的无限潜力,而Sapphire Rapids则更进一步,通过集成英特尔高级矩阵扩展AMX加速IP模块,可以为深度学习算法核心的Tensor处理提供大幅加速。具体来说,Sapphire Rapids可以在每个周期内进行2000次INT 8运算和1000次BFP 16运算,相比AVX-512指令集实现了相当可观的能效比提升,可大幅提升AI工作负载中的训练和推理性能。


    Sapphire Rapids的AI计算性能

           除此之外,Sapphire Rapids也集成了英特尔加速器接口架构指令集AIA和英特尔数据流加速器DSA,前者可以实现对加速器和设备的有效调度、同步和信号传递,而后者可以卸载最常见的数据移动任务,改进对这些开销任务的处理,以提供更高的整体工作负载性能,并可以在CPU、内存和缓存以及所有附加的内存、存储和网络设备之间移动数据。

           可以说,Sapphire Rapids正是这场基础设施建设革命中,提供源源不断算力,实现卓越的性能和利用率,提供从边缘到云的计算能力的重要组成部分。

           今年6月份,英特尔曾在Six Five峰会上介绍了面向基础设施应用的IPU处理器,旨在使云和通信服务提供商减少在CPU方面的开销,并充分释放性能价值。利用IPU,客户能够部署安全稳定且可编程的解决方案,从而更好地利用资源,平衡数据处理与存储的工作负载。

           在今年的架构日活动上,我们也得以一窥针对云和通信市场的两款全新FPGA IPU产品——Oak Springs CanyonArrow Creek,以及基于AISC的IPU产品Mount Evan,其中,Oak Springs Canyon是基于英特尔至强D 处理器和英特尔Agilex FPGA构建;Arrow Creek则是专为搭载至强服务器设计的SmartNIC,而作为英特尔的首款ASIC IPU,Mount Evans是与一家一流云服务提供商共同设计和开发的,它融合了多代FPGA SmartNIC的经验。


    Oak Springs Canyon

           作为可编程的网络设备,基于FPGA的IPU能够快速实施新协议,应对不断变化的要求或新协议;而专用ASIC IPU可以实现性能和效率的最大化,云运营商可以转向完全虚拟化的存储和网络架构,同时保持超高的性能、以及强大的可预测性与可控性。

           在数据中心市场,GPU同样也扮演着重要的角色。去年英特尔曾发布首款基于Xe-LP微架构的独立显卡,专为高密度、低时延的安卓云游戏和流媒体服务而设计,并详细向外界详细介绍了可实现全扩展的另外三个Xe图形架构:包括针对高端游戏和计算市场的Xe-HP、用于高性能计算的Xe-HPC和面向消费端的Xe-HPG

           今年的架构日上,英特尔就为我们带来了面向高性能计算和人工智能工作负载的新款Xe-HPC GPU——Ponte Vecchio。堪称英特尔迄今为止最复杂的SoC,它包含了多达1000亿个晶体管,提供领先的浮点运算和计算密度,以加速AI、HPC和高级分析工作负载。

           英特尔将计算单元、Rambo单元、Xe链路单元以及包含高速HBM内存的基础单元通过高带宽互连进行组装,实现单元之间低功耗高速连接,其IP模块包括每个Xe核的8 个矢量和矩阵引擎(XMX)、切片和堆栈信息,以及包括计算、基础和Xe Link单元的处理节点的单元信息。

           具体来看,Ponte Vecchio的复杂设计均被集成于Foveros封装中,为提高功率和互连密度形成有源芯片的3D堆叠。高速MDFI互连允许1到2个堆栈的扩展,其中计算单元是一个密集的多个Xe内核,是Ponte Vecchio的核心,一块单元有8个Xe内核,总共有4MB的一级缓存,是提供高效计算的关键,而基础单元是Ponte Vecchio的连接组织,Xe链路单元则提供了GPU之间的连接。

           架构日上,英特尔也展示了早期的Ponte Vecchio芯片性能,在一个流行的AI基准测试上创造了推理和训练吞吐量的纪录。A0芯片已经实现了超过每秒45万亿次浮点运算的FP 32吞吐量,超过5TBps的持续内存结构带宽以及超过2TBps的连接带宽。同时,英特尔分享了一段演示视频,展示了ResNet推理性能超过每秒43000张图像和超过每秒3400张图像的ResNet训练,这两项性能都有望实现行业领先。与Xe架构相同的是,Ponte Vecchio将由英特尔统一软件堆栈oneAPI支持。作为一个开放、规范、跨架构和跨厂商的统一软件栈,oneAPI提供了跨架构的兼容性,让开发者能够摆脱专有语言和编程模型的束缚。


    英特尔统一软件堆栈oneAPI

           Ponte Vecchio展示了英特尔直面超异构计算领域的强大设计能力,随着5G、AI与大数据的全面落地,数据洪流时代需要的计算能力无法估量,英特尔在超异构计算领域的深耕与技术突破,正是应对未来多样化的计算场景与数据形态的重要武器。

           IDM 2.0战略的稳步践行

           今年3月份,英特尔的掌门人PatGelsinger对外宣布了IDM2.0战略,即“英特尔面向大规模制造的全球化内部工厂网络、扩大采用第三方代工产能以及打造世界一流的代工业务——英特尔代工服务IFS),而今年的架构日上,英特尔推出众多产品的同时,也预示着IDM2.0战略的进一步深化。

           英特尔公司企业规划事业部高级副总裁Stuart Pann表示,目前英特尔20%的产品,诸如Wi-Fi模块、芯片组,或者以太网控制器等特定产品线都是交由外部代工厂生产的。作为英特尔CEO帕特·基辛格于今年3月宣布的IDM 2.0战略,英特尔正在演进IDM模式,以深化和扩大与主要代工厂的合作关系。Alchemist系列独显和Ponte Vecchio正是绝佳的IDM 2.0模式实践,在未来与代工厂的合作也会更加拓宽,例如面向客户端计算Meteor Lake计算单元将采用英特尔的Intel 4制程技术进行生产,部分支持性单元将交由台积电生产。

           “外部代工厂是英特尔的战略伙伴,也是我们IDM 2.0模式的关键一环。虽然我们的大部分产品将继续在内部工厂生产,但未来几年,我们将看到外部代工生产的芯片单元会在英特尔的模块化产品中扮演更重要的角色——包括采用先进制程节点的核心计算功能,以支持客户端、数据中心和其他领域的新兴工作负载。”Stuart Pann谈到。

           作为老牌计算芯片巨头和少有的半导体垂直整合型企业,在IDM 2.0战略的框架之下,英特尔在设计、制造、封装、测试一体化、IDM方面拥有了更多可选择的余地,可以快速推动产品进程并拓展生态合作。

           结语:以最优架构及平台创新,直面千倍算力增长

           “Intel is back, and this story is just beginning”,英特尔CEO PatGelsinger在架构日活动的最后谈到。他同时表示,“我们的战略和执行都在加速,我们正为英特尔创新与技术领先的新时代描绘蓝图。英特尔在软件、芯片和平台方面的深度与广度,在封装和制程工艺方面的技术,以及在大规模制造上的实力,赋予英特尔独特的位势,去抓住这一巨大的增长机遇。”

           正如PatGelsinger所说,在今年的架构日上,英特尔为消费者以及企业用户带来了海量的架构说明,可以说是干货十足,面向CPU、GPU、IPU等多个方向,从边缘和终端设备到网络、再到云与AI,英特尔这次全面的技术架构的改变和创新,无一不彰显着英特尔在软件、芯片和平台方面的深度与广度,在封装和制程工艺方面的技术,以及在大规模制造上的实力。

           未来十年将是计算架构的黄金十年。对此,业内众多企业也纷纷针对多计算架构进行了部署,而英特尔提供的创新技术与架构,无疑会成为驱动数字化时代的重要源动力之一。

    本文属于原创文章,如若转载,请注明来源:蓝色巨人归来 英特尔全新架构推进未来计算创新https://server.zol.com.cn/775/7753380.html

    server.zol.com.cn true https://server.zol.com.cn/775/7753380.html report 9054    我们熟悉的那个英特尔,似乎真的回来了。   很长时间里,英特尔都是技术力的代名词,作为半导体领域的巨头,英特尔自成立以来为业界带来了众多黑科技,但自从2017年英特尔确立了“以数据为中心”的转型目标之后,很多不明就里的围观群...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    周关注排行榜
    • 产品
    • 品牌
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错