对于IBM x86服务器业务出售之后,更多的精力将集中在Power产品线上。早在Hot Chip 2013大会上,IBM首次披露了其下一代Power8处理器架构。据了解,Power8处理器拥有相比上一代近2.5倍性能提升和基于云数据中心级别的高扩展性,预示Power8揭开了企业级市场高性能计算新台阶。
从IBM透露的相关资料,Power8处理器搭载有12个内核,每个处理器内核支持8个线程,相比Power7的4个线程翻番。这样一来,Power8处理器总共能支持96个线程。该处理器采用了22nm制程工艺制造,芯片晶圆面积为650mm^2。
另外,Power8还具备有16个执行单元(包括两个LSU、一个CRU、一个BRU、两个IFU、两个FXU和两个VMX、一个DFU和CR等),每个内核拥有64KB数据缓存和32KB指令缓存。二级缓存方面Power8每个内核提供有512KB、96MB eDRAM三级共享缓存和128MB eDRAM四级缓存。
在Power8晶圆结构图上可见,L3缓存、PCI-E和DDR内存控制器以及各种加速器以提升功能效率或者跨内核运行效率。通过Power8,IBM实现了从32nm到22nm制程工艺的改进和提升。更为重要的是,提升了工艺制程的Power8还拥有着与Power7+一样的4GHz高主频。
Power8处理器
提及4GHz主频,笔者了解到新的Power8产品允许从外部L4缓存中以128GB/s的速率传输至L3缓存中、L3缓存中以64GB/s速率传出。数据也可以128GB/s的速率传输至L2缓存(传出也是相同带宽)。从L2缓存传输到内核的带宽可以高达256GB/s,但其他方向的数据传输则只能达到64GB/s。而在横跨12个内核的Power8处理器上,能够在4TB/s的L2缓存和3TB/s的L3缓存直接传输。
就Power8技术规格,笔者对于IBM组建“OpenPower联盟”持续发展关注,作为联盟的一员,英伟达也将为连接Power8处理器开发全新GPU,Tyan也正在制造一种基于Power8芯片的服务器。IBM正通过开放Power芯片知识产权来挽救Power阵营的颓势。
提及产品技术,内存主控制器也内置在芯片中,不过Power8略有不同,并不是将DDR3或者DDR4控制器放入在晶圆中,而是创建了一个类内存控制器,通过高速总线传输到内存缓冲区,该芯片被称为Centaur,控制着一半的L4缓冲和一半的内存控制器。
在Power8中,Centaur执行DDR3主内存功能,但未来会新增DDR4的支持。此前Power芯片上的所有内存调度逻辑单元、缓存指令单元和能源管理单元,都被嵌入在Centaur芯片上。连接Power8封装包和Centaur内存缓存区的内存通道,其延迟为40ns,带宽为9.6GB/s。而且该Centaur芯片还包括有16MB缓存内存以供处理器当作L4缓存使用。
每一个Power8处理器都有8个这样的Centaur芯片,也就是在一个封装包中,总共有128MB容量的L4缓存可供使用。提供有8个内存通道,内存带宽为230GB/s,32个DDR内存接口,DRAM情况下可提供410GB/s峰值带宽。
如果采用32GB DDR3单个内存条的话,每个Power8处理器可支持扩展至1TB DDR3。而高端Power8处理器在基于Power的服务器中能提供32个插槽——比如在Power7服务器Power 795上,可升级到最高32TB DDR3内存,提供384个内核和3072个线程。
Power8还整合有PCI-E 3.0控制器,从而使得在PCE-E 3.0扩展插槽方面,可以与Sparc T5、M5芯片和至强E5(E7 v2)形成正面交锋。这些PCI-E插槽可提供48GB/s的I/O带宽,比Power7和Power7+本身所能支持的20GB/s要高出不少。
Power8晶圆上整合的PCI-E 3.0插槽提供CAPI(Coherence Attach Processor Interface)接口连接外部组件。CAPI端口与PCI-Express插槽连接用于图形处理器或者FPGAs(现场可编程门阵列)等外部组件与这种芯片之间的通讯。
对于Power8处理器应用前景,用户可以部署在原有的Power7+服务器平台上,也就是IBM Unix服务器系统上。此外,超级计算机系统“沃森”,也可以通过升级实现性能翻番,而这种超级计算机系统在大数据挖掘与分析、云计算部署、HPC等领域满足对更高性能的需求。