四、“饭量”太大,能耗惊人
俗话说,人是铁,饭是钢,一顿不吃饿得慌。HPC这个计算“超人”也一样,不过它消耗的是惊人的电能。随着人们对计算量、计算时间、处理问题的复杂度等要求越来越高,现在HPC系统规模也是越做越大,使用的CPU数量也是以成千上万的规模递增,用电量自然水涨船高,这让那些供养它的企事业单位不堪重负。例如,一套百万亿次级别的HPC系统每天光电费就是两三万元人民币,一年下来就得要好几百万!而性能达到千万亿次的HPC系统,消耗的电力更是赶得上一座小型城市。
五、“瘦身”难、提升计算密度挑战多
人到中年难免有发福的困扰,HPC系统也是一样,这个计算“超人”的身材很容易走形,特别是对于百万亿次以上的系统,如果还用传统1U或2U机架服务器来做节点,其体积会非常惊人,会让那些机房较小的用户叫苦不迭。而且这些节点的“屁股”上再带上一大堆线缆,不好看,也不容易管理。于是,人们开始尝试用刀片服务器或改良过的高密度服务器(如1机两主板的双胞胎服务器)来构建大规模HPC系统。可这种方式也带来了一些新的挑战,比如机房环境,尤其是机柜供电与机房散热必须要改造,还有刀片服务器没有统一标准的问题,也着实让人头痛。
六、生产厂家各行其是、缺乏统一标准
现在能制造HPC系统的厂商有很多,既有IBM、HP、戴尔、Sun这样的海外大鳄,也有曙光、浪潮、联想、宝德等民族企业,还有一些规模不大的地方军,甚至有些系统是由用户“DIY”出来的。如果它们是用x86机架服务器来做,情况还算好,毕竟这种产品有统一的标准,兼容与互操作没有大问题,配件也容易找到,服务不用愁;但如果是用刀片服务器来构建,其标准不统一的问题可就会引出大麻烦了。
与传统的机架服务器不同,刀片服务器诞生至今虽也有十年光景,但却一直没有一个统一标准,仅刀片服务器机箱就曾出现过五六十种不同的产品,现在还有十几种在市场上互掐,刀片服务器本身更是各行其道,相互之间别说可替代,连实现互操作都有困难,甚至有些厂家最新发布的刀片服务器都不兼容它以前推出的刀片机箱。显然,对于HPC系统用户来说,这种情况只会让它遭遇容易被一家厂商绑定、相关配件不好买、服务费用过高、平台切换代价太大,以及来自不同厂商的平台在HPC系统中只能独立运行,形不成合力等问题。
结语
上面列举的这六件烦心事,是目前绝大多数HPC系统用户都会遇到的“通病”。不解决掉它们,就会让HPC系统束手束脚,甚至使它在无奈之中甘于平庸,那么这个计算“超人”也就没有什么“过人”之处了。而为避免这种情况的出现,无论是HPC系统的用户,还是这些系统的制造商、处理器和计算平台提供商,以及应用软件开发商都必须找出这些问题的成因,才能有针对性地提出解决方案。
接下来,我们还会在即将发布的“IT号外之HPC深入分析”一文中,对这些焦点问题的症结进行详细剖析,敬请留意。
- 相关阅读:
- ·涨知识:英特尔服务器CPU编号是啥意思?
//server.zol.com.cn/554/5541995.html - ·多路至强之选 IBM x3850 X5服务器低价
//server.zol.com.cn/553/5537228.html - ·虐心!看IT男教女友区分PC、Server、HPC
//server.zol.com.cn/553/5530375.html - ·国内厂商都在讨论HPC 外企却反其道而行
//server.zol.com.cn/552/5520709.html - ·至强E7助力四路服务器 性能才是王道
//server.zol.com.cn/552/5520774.html
- 第2页:“饭量”太大,“瘦身”难