
规格和管理上的改进
前面的文章中我们介绍了惠普Proliant DL385 G7的结构设计,在本文中,我们将继续讨论这款AMD皓龙6100平台服务器的性能以及管理功能。
一、规格和管理上的改进
惠普Proliant DL385 G7精良的系统设计给我们留下了深刻的印象,风扇、处理器、导流风罩、硬盘、电源、I/O扩展等部分均采用模块化设计,便于拆装,并提供冗余,提高了服务器的可用性和可维护性。请点击《设计精巧 惠普DL385 G7评测之结构篇》。
模块化的系统设计并不是DL385 G7的专利,在惠普Proliant产品线上我们时常可以看到这样精巧的设计。和结构设计相比,DL385 G7更加值得称道的是系统规格的整体提升,以及升级的iLO3管理功能。

惠普Proliant DL385 G7
惠普DL385 G7支持双路代号“Magny-Cours”的AMD皓龙6100处理器,这使得DL385 G7成为惠普迄今为止核心数量最多的双路AMD平台——2U空间最多可以容纳24个物理核心,相比上代的“Istanbul”双路平台核心数量增加了一倍。处理器平台的升级带动了内存、I/O的大幅提升,DL385 G7内存插槽增加到24个,内存数量要比双路的至强5600平台多出6个,支持DDR3-1333内存,无论容量还是带宽都有明显改观。
管理功能的提升是惠普G7服务器的一大亮点。熟悉惠普Proliant服务器的网友对iLO管理功能应该不会陌生,iLO全称Integrated Lights-out,是惠普独特的远程管理技术,可以无需借助第三方软件,通过浏览器进行服务器状态的监控和控制,iLO将管理员从机房中解放了出来。惠普G7服务器将管理模块升级到iLO3,相对上一代平台速度大大提升,可以媲美现场操作,并且将并发响应的管理用户数增加到6个,对拥有多处分支机构的大型企业比较实用。
下面,我们就来具体看一下这款惠普Proliant DL385 G7服务器在性能和管理功能上的表现。
二、服务器规格
首先来看一下这台惠普DL385 G7的配置规格:
| 惠普Proliant DL385 G7(585335-AA1) | |
| 外形/高度 | 机架式/2U | 
| 处理器 | AMD Opteron 6136(8 core, 2.4 GHz, 12MB L3, 80W) | 
| 处理器数量/最大 | 1/2 | 
| 芯片组 | AMD SR5690 | 
| 内存/最大 | 4*2GB PC3-10600R/最高256GB DDR3-1066/1333 | 
| 内存插槽 | 24个DIMM插槽 | 
| 扩展插槽 | 2个x4插槽 1个x8插槽 | 
| 硬盘/托架 | 5*146GB SAS/16个2.5寸热插拔SAS/SATA驱动器托架 | 
| 网络适配器 | 四个嵌入式NC382i千兆以太网卡 | 
| 电源/最大 | 1个460W电源/2 | 
| RAID支持 | Smart Array P410i/256MB | 
| 嵌入式管理程序 | iLO3 | 
| 操作系统 | Microsoft Windows Server 2008 R2 EnterPrise | 
| 保修 | 三年金牌服务 | 
这款送测的惠普DL385 G7(585335-AA1)配置了1颗AMD Opteron 6136处理器,核心代号“Magny-Cours”,采用45nm工艺,具有8个核心,主频2.4GHz,集成4MB L2缓存和12MB L3缓存,采用G34接口,TDP为80W。

CPU-Z检测信息
09年第三季度,AMD推出了针对服务器/工作站平台的芯片组SR56x0/SP5100芯片组,终于拥有了自家的服务器芯片组,可以更加完美的支持新的G34/C32皓龙处理器。SR56x0共有三个型号,SR5650、SR5670和SR5690,SP5100是新发布的南桥芯片。
SR56x0系列都支持HT3总线,带宽最高5.2GT/s,主要区别在于I/O和PCI Express通道不同,SR5690支持42个PCI Express通道 ,支持PCI Express x16+PCI Express x16。SR5670支持30个PCI Express通道,SR5650支持22个PCI Express通道。
AMD皓龙6100处理器集成四通道DDR3内存控制器,每颗处理器支持12个DIMM,惠普DL385 G5内存上采用了最高规格设计,主板配备了24个DIMM,内存最大可以支持256GB。另外值得一提的是P410i阵列卡采用了主板集成的方式,这样少占用了一个PCI-E插槽。
三、性能测试
1、CPU性能测试
CPU性能测试采用了CineBench R10、CineBench R11.5、SiSoftware Sandra Pro Business 2010。
CineBench是一款以处理器的运算能力直接进行特定分辨率CG图片的渲染测试软件,可以测试多核心处理器效能以及多处理器协调性能的表现。我们通过CineBench主要测试的是处理器在进行多任务处理时候的性能表现,以及多核处理器在多任务处理时候的优势能有多大。R11.5是新发布的版本,采用了全新评分机制,并对新架构CPU进行优化,测试结果更加准确。
 
  
CineBench R10(左)和R11.5所渲染的CG图片
我们采用CineBench R10和CineBench R11.5,渲染特定分辨率的CG图片来测试处理器的运算能力,在单个核心情况和8个核心并发的情况下分别进行渲染测试,这样可以对比出多核处理与单核处理情况下性能的提升,并可以测试多处理器之间的协调能力,从而测试服务器的平台性能。
| 处理器渲染测试(AMD Opteron 6136、2.4GHz、8 Cores) | |||||
|---|---|---|---|---|---|
| CineBench R10 | CineBench R11.5 | ||||
| 单核心 | 多核心(8核) | 多核速度提升 | 单核心 | 多核心(8核) | 多核速度提升 | 
| 2586/5分42秒 | 15896/55秒 | 6.15x | 0.63pts | 5.61pts | 8.86x | 
CineBench R10测试结果我们需要关注三个数据,渲染得分、渲染时间和多核性能提升。分数越高越好,时间越短越好,多核性能提升越高越好。
如果从绝对数字来看,主频只有2.4GHz的AMD皓龙6136在8核心情况下15896/55秒的得分并不出众,但也绝不低,和之前测试的数据相比较,这个成绩比两颗四核心、主频2.4GHz的至强E5530(得分17656)略低一些。不过如果配置两颗皓龙6136的话,相信得分要比两颗6核心、主频同为2.4GHz的“Istanbul”皓龙2431要高上很多。
| 2*E5530(2.4GHz、8Cores、未开启HT)CineBench R10测试结果 | |
| 单核渲染得分/时间 | 2960/4分58秒 | 
| 8核渲染得分/时间 | 17656/50秒 | 
| 多核速度提升 | 5.94倍 | 
| 2*Opteron 2431(2.4GHz、12Cores)CineBench R10测试结果 | |
| 单核渲染得分/ 时间 | 2811/5分14秒 | 
| 12核渲染得分/时间 | 23845/37秒 | 
| 多核速度提升 | 8.48倍 | 
CineBench R11.5针对多核心的新处理器进行了优化,其结果更加准确。由于主频较低,AMD皓龙6136的单核心表现并不理想,如果从绝对数字来看,5.16pts的8核心成绩也不能说很高,但多核速度提升达到了8.86x,这表现出AMD皓龙6136多核心协作效率很高,多核心协作并不仅仅是性能的简单叠加。
SiSoftware Sandra Pro Business 2010是一款Windows系统上的分析软件,可以查看系统的软硬件信息,并可以对处理器、内存、网络、磁盘等子系统进行测试,如处理器数学计算、多媒体计算、多核计算等,内存带宽、延迟、缓存性能等。2010版本对Windows Server 2008 R2进行了优化,最高可以支持32/64路平台。
我们首先利用SiSoftware Sandra来测试配置了单颗AMD Opteron 6136处理器的惠普DL385 G7的算术性能、多媒体性能、多核效率和加密解密性能:
| SiSoftware Sandra Pro Business 2010 CPU测试 | 4*Opteron 6128HE(2.0GHz、32 Cores) | Opteron 6136(2.4GHz、8 Cores) | ||
|---|---|---|---|---|
| 算术性能测试 (越高越好) | Aggregate Arithmetic Performance | 205.17GOPS | 65.28GOPS | |
| Dhrysrone ALU | 227.69GIPS | 75.37GIPS | ||
| Whetstone iSSE3 | 182.65GFLOPS | 55.2GFLOPS | ||
| 多媒体性能测试(越高越好) | Aggregate Multi-Media Performance | 594.83MPixel/s | 180MPixel/s | |
| Multi-Media Int x16 aSSE2 | 746.78MPixel/s | 224.7MPixel/s | ||
| Multi-Media Float x8 iSSE2 | 442.87MPixel/s | 135.49MPixel/s | ||
| Multi-Media Double x4 iSSE2 | 243.48MPixel/s | 74.36MPixel/s | ||
| 多核效率测试 | Inter-Core Bandwidth | 8.71GB/s | 6.17GB/s | |
| Inter-Core Latency(越低越好) | 232ns | 121ns | ||
| 加密解密性能测试 | Cryptographic Bandwidth | 2.6GB/s | 806MB/s | |
| AES128-ECB iAES Cryptographic Bandwidth | 2.36GB/s | 728MB/s | ||
| SHA256 iSSE4 Hashing Bandwidth | 2.84GB/s | 884MB/s | 
算术性能、多媒体、加密解密这三个子项主要还是和CPU的主频、核心数量等因素有关,比较遗憾的是这款DL385 G7只配置了1颗处理器,绝对数值并没有多么的抢眼。SiSoftware Sandra Pro Business 2010中还提供了处理器面向.NET操作的测试,随着Vista/Server 2008系统的发布,移植到.NET的软件越来越多,.NET性能也随之变得越来越重要。.NET测试类似于处理器性能测试,包括算术性能测试和多媒体性能测试:
| SiSoftware Sandra Pro Business 2010 .NET测试 | .NET算术性能测试 | 4*Opteron 6128HE(2.0GHz、32 Cores) | Opteron 6136(2.4GHz、8 Cores) | |
|---|---|---|---|---|
| Aggregate .NET Performance | 80.83GOPS | 26.65GOPS | ||
| Dhrystone .NET | 74.4GIPS | 23.34GIPS | ||
| Whetstone .NET | 87.25GFLOPS | 30GFLOPS | ||
| .NET多媒体性能测试 | Aggregate .NET Multi-Media Performance | 65.75MPixel/s | 19.88MPixel/s | |
| Multi-Media Int x1 .NET | 111.37MPixel/s | 33.72MPixel/s | ||
| Multi-Media Float x1 .NET | 20.12MPixel/s | 6MPixel/s | ||
| Multi-Media Double x1 .NET | 65.72MPixel/s | 19.24MPixel/s | 
2、内存性能测试
惠普DL385 G7配置了4根2GB PC3-10600 DR3-1333)内存,皓龙6100和至强7500同样集成了四个内存控制器,HT总线也同样为6.4GT/s,理论上每颗CPU可以实现42.7GB/s的内存带宽。SiSoftware Sandra Pro Business 2010中提供了内存带宽、内存延迟和缓存性能的测试,我们继续用这个工具来考量惠普DL385 G7的内存性能:
| SiSoftware Sandra Pro Business 2010内存测试 | 内存带宽测试(越高越好) | 4*Opteron 6128HE(2.0GHz、32 Cores)/DDR3-1333 | Opteron 6136(2.4GHz、8 Cores)/DDR3-1333 | |
|---|---|---|---|---|
| Aggregate Memory Performance | 35GB/s | 10.55GB/s | ||
| Int Buff'd iSSE2 Memory Bandwidth | 35GB/s | 10.51GB/s | ||
| Float Buff'd iSSE2 Memory Bandwidth | 34.84GB/s | 10.6GB/s | ||
| 内存延时测试(随机) | Memory(Random Access) Latency(越低越好) | 95ns | 91ns | |
| Speed Factor(越低越好) | 63.00 | 72.40 | ||
| Internal Data Cache | 3clocks | 3clocks | ||
| L2 On-board Cache | 16clocks | 16clocks | ||
| L3 On-board Cache | 56clocks | 61clocks | ||
| 内存延时测试(线性) | Memory(Linear Access) Latency(越低越好) | 18ns | 17ns | |
| Speed Factor(越低越好) | 11.70 | 13.70 | ||
| Internal Data Cache | 3clocks | 3clocks | ||
| L2 On-board Cache | 9clocks | 9clocks | ||
| L3 On-board Cache | 18clocks | 21clocks | ||
| 缓存及内存测试 | Cache/Memory Bandwidth(越高越好) | 216.73GB/s | 85.63GB/s | |
| Speed Factor(越低越好) | 57.10 | 19.8 | ||
| Internal Data Cache | 753.73GB/s | 264.78GB/s | ||
| L2 On-board Cache | 537.52GB/s | 139.32GB/s | ||
| L3 On-board Cache | - | - | 
对比平台采用的是四颗AMD皓龙6128HE,每颗CPU搭配了1根DDR3-1333内存。相比之下,采用单路皓龙6136,搭配4根DDR3-1333在内存带宽上要相差不少,看来单路CPU配置并不能充分发挥皓龙在内存带宽上的优势,不过单路配置下内存延时上和四路配置没有明显差别。
3、磁盘系统测试
这款惠普DL385 G7配置了5块2.5寸万转146GB SAS硬盘,阵列卡采用集成的P410i,含256MB缓存。不过没有配置电池,故而默认情况下写缓存关闭。我们将5块硬盘组建RAID 5阵列模式,利用Iometer 2006.7.27来测试磁盘系统的最大读写IO。
IOMeter:IOMeter是一款功能非常强大的IO测试软件,它包含了负载发生器(IOMeter称其为Worker),提供一系列标准测试组件以模仿实际应用,如WebServer(网站服务器)、FileServer(文件服务器)和在OLTP(OnLine Transaction Processing,在线交易处理)服务器。这些测试组件产生不同大小的输入输出请求和读/写分布,以模仿实际应用中的行为。
    为了测试服务器的最大I/O性能,我们采用这样的脚本进行测试:
  Max IO(read):
  测试读取尺寸为512Bytes,100%读取操作,随机率为0%,即为100%连续读取,队列深度256,用于检测磁盘子系统的最大读能力。
  
    Max IO(write):
  测试写入尺寸为512Bytes,0%读取操作,随机率为0%,即为100%连续写入,队列深度256,用于检测磁盘子系统的最大写能力。

最大IO读取
最大读取IO接近10万,这是一个很好的成绩,不过写入IO和读取IO有很大的差距,这并不奇怪,在我们之前测试过的DL360 G5上也出现过类似情况。主要原因在于RAID卡没有配置电池,写缓存关闭,无法获得最佳的写入性能。所以在实际应用中还是建议为RAID卡缓存配置电池套件。
4、能耗测试
惠普从Proliant G6服务器开始引入了“海洋式传感器”,通过内部的32个智能传感器对整个系统进行环境监测,可以动态的调整系统部件如风扇、内存和I/O部件,从而优化系统散热提高电源效率,调整风扇转速防止过度散热浪费电力。G7服务器上沿用了这一优秀的设计,并且配合转化率超过92%的电源,有效的控制了服务器的能耗。
我们采用功耗测试仪对DL385 G7服务器的加电不开机、0% CPU使用率、100% CPU使用率状态的功耗进行了测试。

功耗测试仪
| 加电不开机 | 0% CPU使用率 | 100% CPU使用率 | 
|---|---|---|
| 7.3W | 109.9W | 192.77W | 
测试结果如上表,加电不开机状态73W左右,开机空闲状态109.9W,系统满载状态192.77W。

AMD皓龙6100系列处理器规格
一台服务器中主要的能耗大户是CPU、风扇、硬盘、芯片组等,当然,如果配置了多条内存,能耗也不容小觑。AMD皓龙6136的ACP(Average CPU Power)为80W,SR5690芯片组TDP在18W左右,这两个部件满载状态下要占据服务器一半的能耗。从结果来看DL385 G7空闲状态和满载状态的能耗都控制在了一个较低的水平。
四、管理功能试用
1、SmartStart导航管理系统
SmartStart是惠普服务器的部署工具,可以在统一的图形化平台完成服务器阵列卡的配置、iLO管理模块的设置、网络设置、安装操作系统、系统诊断等功能,这样就大大降低了管理员部署服务器的难度,在大规模服务器部署环境中非常实用,能够明显降低服务器部署所花费的时间。惠普DL385 G7服务器所附带的是SmartStart 8.4版本。

用随机附带的SmartStart引导光盘进行引导,登录SmartStart管理控制台

SmartStart管理控制台主界面,列出了安装、维护、擦除系统等主要功能选项

在“Maintenance”功能中包含了iLO配置、阵列卡配置、系统诊断等实用功能

在ACU中可以创建阵列、设置阵列卡属性、删除阵列、设置缓存属性等

SmartStart可以引导安装操作系统,支持多种OS类型,设置好之后可以进行无人值守安装,大大降低管理员的工作量

根据向导进行安装OS的预设置,系统收集好信息后会提示插入OS光盘,进行无人值守安装
    可以看出,惠普SmartStart堪称一个非常实用的服务器部署工具,功能十分丰富,通过友好的图形界面,能够实现配置阵列卡、组建阵列、设置iLO管理模块、安装OS、系统诊断等操作,并且免去了安装各种驱动的麻烦,能够明显降低服务器部署时间。
2、iLO3远程管理功能体验
前文中提到,iLO全称Integrated Lights-out,是惠普独特的远程管理技术,可以无需借助第三方软件,通过浏览器进行服务器状态的监控和控制。G7服务器中iLO升级到第三代,即iLO3,最大的提升在于速度可以达到上一代产品的8倍,足以媲美现场操作。另外并发响应的管理用户数增加到6个,对拥有多处分支机构的大型企业比较实用。
iLO3中还有一个重要的功能就是远程控制台,这种虚拟KVM的方式让管理员可以通过浏览器看到服务器桌面进行实时操控,降低服务器管理难度。应用iLO3首先需要设置iLO3模块的IP地址,可以通过SmartStart导航进行设置,或者在服务器自检过程中,根据屏幕提示按“Ctrl+H”,进入iLO控制台进行配置。

通过浏览器输入iLO3的IP地址即可登录控制台,默认的用户名和密码在服务器前面板的标签上
iLO3可以对服务器的健康状况进行监控,包括风扇、电源、内存、网卡等,还可以显示各主要部件的温度。
可以对电源进行控制,包括冷启、重启、Hold等。同时还可以监控能耗,计算一段时间内的平均能耗、最大/最小能耗。

iLO3最多可以支持6个并发用户,在这个界面可以添加管理用户
iLO3具备远程控制台功能,要实现这个功能需要管理员的客户端安装微软.NET Framework 3.5或更高,还需要安装Java Runtime Environment (JRE) 6.0,火狐浏览器用户需要安装iLO提供的插件。还需要注意的要实现远程管理功能,用户还需要额外购买License。
可以看出,iLO3是一个优秀的远程管理工具,其中包含了系统健康状况监控、系统日志、系统诊断等功能,还可以对电源进行远程控制,进行服务器重启等操作。远程管理控制台是一个非常实用的工具,让管理员在远程就可以对服务器进行实时操作,不过遗憾的是需要购买额外的License。
五、总结:整体提升,可满足企业多种需求
送测的惠普DL385 G7并没有采用较高的配置,单颗皓龙6136处理器、4根DDR3内存并不能充分发挥出AMD皓龙6100平台的性能。不过即使是单颗CPU,我们也能从测试结果中推断出一些信息:在CineBench测试结果来推断,如果配置两颗皓龙6136,性能应当会大幅领先相同主频的上一代“Istanbul”六核皓龙。另外皓龙6100的核心效率让我们印象深刻,多核速度提升得到了非常优秀的成绩。

AMD皓龙6100
内存带宽和延迟测试中,配置单颗CPU似乎并不能充分发挥皓龙6100的内存带宽优势,和四路皓龙6100相比,内存带宽还是差距明显,不过内存延迟上并没有明显差异。磁盘系统性能可以说是“冰火两重天”,P410i搭配5块万转SAS硬盘的磁盘系统在读取性能上相当优秀,但是由于没有配置电池套件,写缓存关闭,写入性能并不理想。所以在实际应用中,建议用户为阵列卡缓存配置电池套件。
惠普DL385 G7的管理功能值得称道,其中SmartStart服务器部署工具可以在一个统一的图形化平台完成阵列卡配置、iLO配置、网络配置、安装操作系统等操作,免去了以往部署服务器中需要加载RAID驱动、安装驱动程序等麻烦,在大规模部署环境中,相信这个工具可以节省大量的服务器部署时间。iLO3提供了丰富而齐全的远程管理功能,包括服务器健康状况的监控、查看日志、电源控制、远程KVM等,可以将管理员从机房中解放出来,通过桌面PC的浏览器即可完成不逊于现场操作的远程管理,美中不足的是远程KVM功能需要额外购买License。
总体来看,惠普DL385 G7在设计、规格、性能、管理功能上具有颇多亮点和提升,是一款可以满足企业多种应用需求的通用型服务器。

 明星编辑
明星编辑












 2022龙芯生态大会专题
2022龙芯生态大会专题 2021浪潮专题
2021浪潮专题 宝德 NVIDIA 协同赋能,为您的AI之旅保驾护
宝德 NVIDIA 协同赋能,为您的AI之旅保驾护 OCP CHINA DAY 2019
OCP CHINA DAY 2019