在上面的文章中我们简单回顾了英特尔单核心至强的发展过程,最后一代的“Nocona”单核心至强主频最高已近达到了3.8GHz,后期的Nocona单核心至强虽然从130纳米工艺过渡到了90纳米工艺,不过功耗还是达到了110w。单核心至强处理器在不断刷新频率记录的同时,也面临着高功耗、低执行效率的问题,虽然Nocona核心至强的升级版“Irwindale”至强将二级缓存提升到2MB,不过功耗没有降低,性能上也没有明显的提升。
2004年到2005年,单核心至强处理器已经发展到了一个瓶颈,提升频率和缓存并不能有效地提升处理器的能效。在2004年底,英特尔不得不停止了开发4GHz处理器的计划,转而投向双核处理器的研发。
Paxville DP至强处理器
2005年10月10日,英特尔推出了其首款双核心至强处理器,核心代号“Paxville”,主要面向双路服务器平台,故而代号也可称之为“Paxville DP”。Paxville至强依旧采用90纳米工艺,是采用将两颗“Irwindale”核心封装到一颗CPU中的方式,每个核心具备2MB独立的二级缓存,两个核心共享800MHz前端总线,处理器的带宽并没有得到提升。
Paxville核心至强处理器
Paxville DP至强处理器和上一代单核至强采用了相同的90纳米工艺,为了降低功耗,Paxville DP主频降低到2.8GHz,相对于单核心至强的3.8GHz降低了不少。不过在功耗上并没有因此而降低多少,达到了惊人的135W。但是通过DBS按需配电技术的动态调整,Paxville DP在运行中的功耗与单核心的Irwindale至强差距不大,可以使用为单核至强DP服务器设计的电源。
除了DBS按需配电技术外,Paxville DP至强还具有EM64T内存扩展技术、超线程技术和英特尔防病毒技术等。双核心的设计、双倍的二级缓存以及4个线程的并行计算能力使得Paxville DP相对单核至强性能上有了一定的提升,据英特尔测试,在其他配置相同的情况下,2.8GHz Paxville DP的性能比3.6GHz单核至强DP高约50%。
虽然性能上有了一定提升,但Paxville DP从特性上和单核至强没有本质的区别,从能效上看没有十分明显的提升。也因如此,用户可以从单核至强平滑升级到Paxville DP,可以保护用户资产。
Paxville MP至强处理器
在Paxville DP至强发布一个月后,2005年11月1日,英特尔提前发布了原定于2006年1月发布的Paxville MP处理器。Paxville MP面向多路服务器平台,被命名为Xeon 7000系列。
Paxville MP和Paxville DP一样均采用90纳米工艺,也是采用了将两个核心封装到一个CPU中的方式,每个核心独享2MB或1MB二级缓存。Paxville MP双核至强处理器有4个型号,分别为Xeon 7020/7030/7040/7041,主频从2.67GHz至3.0GHz,Xeon 7020和7030采用了2MB二级缓存,Xeon 7040和7041采用了4MB二级缓存。前端总线依旧采用双核心共享的方式,分别为667MHz或800MHz。
Paxville MP将双核性能引入到四路及四路以上平台,在其他特性上,Paxville MP也具备超线程技术、EM64T内存技术等,值得一提的是,Paxville MP是第一款引入Intel VT硬件虚拟化的技术的处理器。
Xeon LV低电压至强
虽然 Paxville MP和Paxville DP都采用了双核心设计,但是这种将两个核心集成到一个芯片中的技术没有太多的创新之处,并且均采用流水线冗长的NetBurst架构,高功耗高热量高流水线的弊病让这两款服务器在市场上并没有表现出优势。
2006年3月,英特尔在高端处理器上的思路有了转移,推出了一款基于移动双核处理器改造而来的双路至强“Sossaman”,这种双核芯片的名称为Xeon LV,它的功率只为其他Xeon芯片的1/5-1/3,最大功率为31瓦。
Sossaman低功耗至强处理器
Xeon LV处理器是英特尔Core微构架在Xeon系列处理器上的初次尝试,包含主频2.0GHz和1.66GHz的两个型号,前端总线为667MHz,共享2MB二级缓存,这也是英特尔首款共享二级缓存的双核处理器。由于Sossaman是由移动处理器改造而来,所以不具备超线程和EM64T技术,但是支持SpeedStep功耗调节技术,可根据负载而调节工作电压,节省电能。低电压并没有让Sossaman的性能表现不佳,据测试,2.0GHz主频的Sossaman至强性能可以和3.0Ghz的Xeon DP处理器相当。可以说Sossaman是英特尔至强处理器历史上一款成功的产品。
Dempsey核心Xeon 5000系列
随着英特尔芯片制程工艺进步到65纳米,2006年5月23日,英特尔发布了采用65纳米工艺的“Dempsey”双核至强处理器,面向双路服务器和工作站市场。虽然2006年更为先进的Core微构架已经出现,但Dempsey仍然采用了Netburst构架,是英特尔最后一代采用Netburst微构架的至强处理器。
Dempsey双核至强处理器
Dempsey采用了新的命名方式,称之为Xeon 5000系列,是第一个采用65纳米工艺的双核至强处理器系列。Dempsey不再采用Socket604封装,而采用LGA771封装。Dempsey共有5个型号,编号从Xeon 5030到5080,频率从2.67至3.73,前端总线有667MHz和1066MHz两种,每个核心集成2MB二级缓存。
虽然从规格上来看Dempsey和上一代的Paxville DP双核至强相比,频率并不突出,二级缓存也相同,但是Dempsey采用了双独立总线设计,前端总线提升到了1066Mhz,总带宽达最高达到了17Gbps,远远超出了上代的6.4Gbps,获得更高的数据传输速度。不过从功耗上来看,虽然工艺进步到了65纳米,但是由于Netburst架构的局限性,Dempsey至强功耗最高还是达到了130w。
Woodcrest核心至强5100系列
2006年以后,英特尔处理器全面向新一代Core微构架过渡,Core微构架多项先进的技术特性解决了处理器高功耗高热量的问题,也使处理器的执行效率大大提高。2006年6月26日,英特尔发布了全新一代采用Core微构架的双核至强DP处理器,代号“Woodcrest”,以Xeon 5100系列命名。
Woodcrest核心双核至强处理器
Xeon 5100系列包含7款处理器,从Xeon 5110到Xeon 5160,主频从1.6Ghz至3.0GHz,前端总线再次提升,包括1066Mhz和1333Mhz两种,和Dempsey不同,Woodcrest具备的4MB二级缓存是由两个核心共享,提高了二级缓存的利用率,大大降低了缓存数据延迟的问题。
Woodcrest仍然采用了双独立总线设计,前端总线提升到了1333Mhz,总带宽达到了21Gbps,相对Dempsey有了进一步的提升。第一代的Core微构架没有引入超线程技术,所以Woodcrest可以处理2个并发线程,除此之外,支持EM64T、XD bit、FB-DIMM以及Intel VT虚拟化技术。
Core微构架具备宽位动态执行、智能功率特性 、先进缓存管理、智能内存访问还有高级数字媒体增强这五大技术,大大降低了功耗,Woodcrest平均功耗只有65w,最高80w,相对上一代的Dempsey几乎降低了一半,获得了前所未有的能效提升。
Tulsa核心双核Xeon 7100系列
2006年8月29日,英特尔发布了面向多路服务器市场的Xeon 7100双核处理器,Xeon 7100系列采用65纳米工艺,这意味着在2006英特尔的至强处理器全面过渡到了65纳米时代。
Tulsa核心双核Xeon 7100
Xeon 7100系列处理器代号为“Tulsa”,没有采用Core微构架,而是采用了上一代的Netburst构架,虽然架构不是最新的,但是Tulsa在性能和功耗上都有不少的改进。Tulsa至强具有8个型号,主频从2.6Ghz到3.4Ghz,3GHz以上的功耗为150w,以下的为95w。Tulsa至强为每个核心设置了1MB的二级缓存,虽然二级缓存比上一袋的Xeon 7000系列减少了一半,但是Tulsa至强上增加了大容量的三级缓存,有4MB、8MB和16MB三种,完全弥补了二级缓存的不足。
Tulsa具有667和800MHz两种前端总线,支持超线程、EM64T、Intel VT虚拟化等技术特性,虽然特性上相对于Xeon 7000系列没有太多的创新,凭借制程工艺的进步和大容量的三级缓存,Tulsa至强相对之前的Xeon MP性能可以提升70%,性能/功耗比提升3倍。
Intel Xeon 3000双核系列
2006年9月,英特尔发布了面向中低端服务器市场的单路双核Xeon 3000系列处理器,取代之前的单路单核Pentium D处理器。Xeon 3000系列处理器代号为“Conroe”,与酷睿桌面处理器相同,采用了65纳米工艺和Core微构架,在能效上得到了长足的进步。
Xeon 3000系列双核处理器
Xeon 3000系列处理器包括7个型号,从Xeon 3040到3085,主频从1.86Ghz到3.0Ghz,前端总线为1066MHz和1333Mhz,共享2MB或4MB二级缓存,接口采用了和桌面处理器相同的Socket 775,支持Intel VT技术、EM64T技术等。
Clovertown四核Xeon 5300系列
2006年11月14日,英特尔在北京发布了面向服务器、工作站和高端个人电脑的英特尔至强5300系列处理器。从这一刻开始,处理器的四核新时代正式到来。代号“Clovertown”的四核至强是将两颗双核“Woodcrest”封装在一起,采用酷睿微构架,65纳米工艺,前端总线支持1333Mhz,二级缓存提高到8MB,但是功耗依旧为80W和65W,每瓦特性能相对Woodcrest有了巨大的进步,并且同属于“Bensely”平台,从双核Woodcrest可以实现无缝的升级,这也是四核至强的一个重要卖点。
Clovertown四核至强处理器
除了核心数量、二级缓存、前端总线、功耗上的进步外,Clovertown四核至强处理器支持对称式多重处理器(Symmetric Multi-Processor,SMP)技术,Intel虚拟化技术(Virtualization Technology),Intel病毒防护技术(Execute Disable Bit),Intel 64位扩展技术(Intel EM64T)及Streaming SIMD Extensions 4 (SSE4)指令集,提供了业界领先的性能和虚拟化能力,并获得了领先Woodcrest双核至强1.5倍的能效。凭借Clovertown优秀表现,英特尔在2006年迅速确立了在多核市场的领导地位,也将服务器市场引领到了四核时代。
Tigerton四核Xeon 7300系列
2007年9月6日下午,英特尔公司全球同步发布了四核英特尔至强处理器7300系列服务器处理器平台。该系列处理器用于配置四路及四路以上服务器,随着它的发布,英特尔公司为用户提供全线了基于英特尔酷睿平台的至强处理器产品。
四核至强7300处理器
代号为Tigerton的Xeon 7300系列处理器采用了Core微架构以及65纳米制造工艺,相比于现有的Xeon 7000/7100系列处理器,Tigerton四核处理器的功耗有了进一步的降低,用于刀片式服务器的处理器TDP为50瓦,用于机架式服务器的处理器TDP为80瓦,性能优化型处理器的TDP为130瓦。
Xeon 7300系列家族共有6位成员,它们分别是主频高达2.93GHz的X7350处理器,其功耗也达到了130瓦,四款功耗在80瓦的E7310、E7320、E7330、E7340处理器,和一款针对四插槽刀片式服务器和高密度机架式服务器优化的50瓦版L7345处理器,主频为1.86GHz。E7310和E7320的二级缓存为4MB,E7330为6MB,E7340和其他两款处理器的二级缓存均为8MB。
通过将英特尔酷睿架构、四核与英特尔虚拟化技术应用到高端服务器上,至强7300系列处理器为客户在虚拟化应用和服务器整合上提供了一个理想的平台。
Hapertown四核Xeon 5400系列
2007年11月16日,英特尔公司发布了采用高K金属栅技术的全新45纳米至强5400系列处理器,新的材料使处理器上的晶体管制程工艺冲破极限,解决了漏电和功耗问题,这也意味着英特尔的摩尔定律也许会再延长十年。
四核Xeon 5400系列
45纳米四核至强是英特尔历史上里程碑式的产品,一片晶圆上的晶体管数量从5.8亿个上升到8.2亿个,先进的制程工艺让晶体管密度提升近一倍,可以进一步的提升频率,或者降低芯片面积。高K金属栅技术也让晶体管开关动作所需电力更低,耗电量减少近30%。相较上代65纳米制程产品,在同一功耗表现下,45纳米工艺让处理器频率可提升约20%,或者也可以说在同一频率下功耗更低。
Xeon 5400代号“Hapertown”,系列包含17款处理器,从2.0GHz的Xeon 5405到主频3.2Ghz的Xeon 5482,其中包括3款低电压版本。从上面的表格可以看到,Xeon 5400系列至强二级缓存相对上一代的四核Xeon 5300系列有了进一步的提升,从8MB增加到12M。Hapertown依旧采用了双独立总线设计,前端总线为1333Mhz或者1600MHz,总线带宽高达25Gbps左右。从功耗上来看,高端的Hapertown功耗达到120w或150w,其余为80w,并不高于65纳米处理器,但是提供了前所未有的每瓦特性能。45纳米至强5400处理器也是英特尔首次采用无铅材料的产品,更加绿色环保,也会对芯片产业的发展起到非常大的推动作用。
Dunnington六核Xeon 7400系列
四核心并不是终点,在四核处理器取得巨大成功的同时,英特尔并没有停止脚步。2008年9月22日,英特尔在全球同步发布了采用45纳米工艺的六核至强7400服务器平台,应用于四路及以上的高端服务器,面向虚拟化、数据库、企业资源规划和电子商务等关键应用。
Dunnington六核Xeon 7400系列
Xeon 7400系列代号“Dunnington”,并不完全是六核产品,包括三款六核心和四款四核心产品。六个核心的Dunnington至强六个核心与三级缓存完全建立在一个晶片之上,也就是说,Dunnington采用“原生”设计,减少了性能的牺牲。在缓存上,Dunnington每两个核心共享3MB二级缓存,二级缓存总数为6MB。为了进一步推进处理器的性能,Dunnington还提供了最高16MB的三级缓存,前端总线为1066MHz,TDP最高为130W。
基于至强7400系列处理器的服务器平台可支持最多16个处理器插槽,以提供高达96个处理器核心的计算能力。它为企业数据中心提供了出色的可扩展性、充足的计算线程、丰富的内存资源和无与伦比的可靠性。
目前计算机面临着从单核处理器到多核处理器的变革,同时,也在面临着到虚拟化迁移的变革。至强7400发布会的主题被定为“虚拟照进现实”,可见英特尔对Dunnington在虚拟化应用上寄以了厚望。至强7400凭借先进的制程工艺、6个核心的设计以及对FlexMigration的加强,在某些虚拟化环境以及数据密集型工作负载应用程序(如数据库、商务智能、企业资源规划和服务器整合)可以获得最多高达50%的大幅性能提升,可以说Dunnington是目前最适合虚拟化应用,简化IT的一个理想平台。
小结:从1995年英特尔发布第一款服务器处理器Pentium Pro起,英特尔在服务器处理器上已经走过了14年,这期间英特尔的路途并不坦荡,出现过失败的产品,也经历过市场的惨淡。但是凭借对于创新的执着,英特尔不断刷新着记录,也在不断创造着奇迹,曾经在RISC的阴影下的婴儿已经成长为引领服务器产业发展的巨人。
凭借成功的摆钟式“Tick-Tock”发展步调,近年来英特尔有条不紊的实现着产品的更新,引领着芯片行业的发展。近期,英特尔全新Nehalem微构架至强处理器也将正式发布,势必又会在服务器产业中掀起一轮新的变化。