国际国内HPC性能排行榜所引发的思考

网络 【转载】 作者:王皓 责任编辑:褚士玮 07年12月29日

  11月是高性能计算机的收获季节——

  被国际高性能计算机界所期待的、每年两次的国际高性能计算机性能TOP500排行榜在这个时候新鲜出炉;中国高性能计算机性能TOP100排行榜也在这个时候二度推出。

  “外行看热闹,内行看门道。”这句在中国流传千古的俗语用在高性能计算机及相应排行榜身上是再恰当不过了。对于众多高性能计算机的“门外汉”来说,首先期待的无非是揭开最新排行榜桂冠花落谁家的谜底,看看谁是排行榜上的最大赢家;再专业一些的,还会通过这些排行榜来感受一下高性能计算机对我们日常工作生活的“入侵”程度,顺便衡量一下自己与高性能计算机的距离。但是,对于从事高性能计算机研究、研制、应用的人来说,不仅要从这些排行榜上感受高性能计算机的市场、应用水平进展,更重要的是要思索和探讨,在达到目前水平后,下一步超级计算机应该怎么去突破。

  就是在发布本届(第22届)TOP500排行榜的美国SC2003超级计算机会议上,中科院计算所的专家队被特邀参加了超级计算机及网格研制的演讲和讨论会,这是中国代表队首次被邀请参加国际高性能计算机界的盛会。记者通过对参会归来专家的采访获悉,来自世界各国的超级计算机专家们共同关注的并不是榜单上的亮点如何,也不是如何把成千上万的计算机连接起来,而是如何把10万个处理器连接起来、Petaflops(千万亿次)超级计算机怎么搭建等更具有前瞻性的技术问题。

  那么,亲身感受外面的奇妙世界以后,我们的差距究竟在哪里?中国的高性能计算机应该怎么发展?如何突破、掌握核心技术,以创新提高竞争力?如何以应用推动高性能计算机系统的研制?这些都是值得从政府到研制单位、企业等各界人士共同关注的问题。在本次专题采访的过程中,记者获悉,12月13日,中国计算机学会青年计算机科技论坛(YOCSEF)将在京举办2003年中国高性能计算机高峰论坛,届时业内从事超级计算机研制的科研单位和企业将与典型行业用户专家一起探讨这些问题,主题就定为中国高性能计算机的今天和明天。记者也特意采访了将要出席这次论坛的相关专家,深深感觉到,在这些专家的眼中,技术的研发是永无止境的,高性能计算机已经做到了什么并不是很重要,更重要的是要搞清楚下一步的方向。

  看来,收获高性能计算,不同的人有不同的方式。

TOP500榜单上的闪光点

  不论是来自何种行业,也不管是什么类型的排行,总会格外引人注目,因为这首先代表的是荣耀。

  11月15日~21日在美国菲尼克斯举行的SC2003超级计算机会议上,第22届国际高性能计算机性能TOP500排行榜如期揭晓。从榜单上看,虽然第一名仍被基于矢量技术的日本地球模拟器以35.86Tflop/s的Linpack性能值稳占,第二名也依然是Linpack值为13.88Tflop/s、安装于美国能源部洛斯阿拉莫斯国家实验室的ASCI Q,但是从第三名开始便引出了本届排行榜的第一个亮点——机群(Cluster)系统的提升,包括最高名次的提升和总数量的提升。

  排在第三位的是美国弗吉尼亚工学院和弗吉尼亚州立大学的师生们自己搭建的一套机群系统,这也是机群系统的Linpack值首次超过10万亿次(达到了10.28TFlop/s),该系统以Apple G5为构建模块,并使用了基于最新Infiniband技术的内部互联网络。紧跟其后的也是一套机群系统,基于Dell PowerEdge系统,使用的是Xeon处理器及Myrinet内部互联网络,距离10万亿次也只有一步之遥,达9.82TFlop/s。接下来是一套由惠普公司制造、安装在美国能源部太平洋西北国家实验室、基于Itanium2的高性能计算系统,使用了Quadrics公司的内部互联网络。排名第六的机器在为机群架构摇旗呐喊的同时,也引出了本届排行榜的第二个亮点——AMD Opteron处理器初战大捷,这是TOP500榜单上第一套基于AMD Opteron处理器芯片的系统,由Linux Networx为洛斯阿拉莫斯国家实验室搭建,使用的互联网络是Myrinet。位居TOP10的最后三套系统也都是机群架构,安装在美国能源部的另外两个国家实验室,前两套都是IBM的SP系统,最后一套是基于P4 Xeon处理器的机群,它把进入TOP10的门槛提高到了6.6Tflop/s。  


国际国内HPC性能排行榜所引发的思考

  这样,在TOP500排行榜的前10套机器中,机群结构的系统占到7套。在整个TOP500名单上,机群系统更是达到了208套,而在半年以前的21届排行榜上这个数字只有149套;这足以说明,这种用高速互联网络把工作站或PC连接起来的机群结构已经成为TOP500榜单中最普遍的超级计算机搭建架构,这块市场的重要性从近些年以DELL为典型代表的一些企业的积极态度中也显露无疑。

  那么,除了TOP10的荣耀外,谁又是整个榜单上的大赢家呢?这也就引出第三个亮点——属于Intel、IBM、HP的桂冠。在TOP500列表上,使用Intel处理器的机器数量已经从半年前的119套增加到189套,随之,Intel的处理器家族已经成为目前高性能计算系统使用最为广泛的处理器(紧跟其后的是HP的PA-RISC和IBM的Power架构);从安装系统的总性能来考核,IBM仍然是最大赢家,占了35.4%的份额(其后,HP占22.7%,NEC占8.7%);从安装系统的数量来看,HP又是最大赢家,共有165套(其后,IBM安装159套,SGI安装41套)。

  第四个亮点——美国的雄厚应用基础。高性能计算机之所以被提升到国家战略的高度,重要的意义是在于其应用层面,能否成功研制并充分应用高性能计算机将直接决定一个国家综合国力的提升速度。从本次榜单上看,高性能计算机研制实力最强、应用最为充分的还是美国,前10名中的9套系统、全部500套系统中的50%、总性能中的57%都是安装在美国,而且90%的机器是在美国研制。作为美国对日本地球模拟器应对措施之一的Cray X1高性能计算机,在本次榜单上已经有10套,最好的成绩是第19位。

  第五个亮点是摩尔定律的再现。在本次TOP500的机器中,已经有131套机器的Linpack值超过1Tflop/s,即万亿次;而500套机器的性能总值达到了528TFflop/s,六个月之前,这个数字只有375Tflop/s;最慢的机器性能也已经从半年前的245.1Gflop/s提升到403.4Gflop/s。

回读中国TOP100

  就是在国际高性能计算机性能TOP500排行榜发布的前一周,11月8日,中国软件行业协会数学软件分会也公开发布了2003年中国高性能计算机性能TOP100排行榜。作为国内公开发布的第二届高性能计算机(HPC)性能排行榜,虽然从数据收集的完整性以及成熟度方面还远远不能与历经十数载的国际TOP500相抗衡,但也给人们了解中国高性能计算机的应用状况提供了一个很好的参照。

国际国内HPC性能排行榜所引发的思考

  单从去年和今年的两次榜单来看,也是呈现出飞速发展的态势,2003年的榜单不仅从数量上由2002年的TOP50飚升到TOP100,从各个角度看计算性能也都有了大幅提升:排行榜中机器的平均Linpack性能为196.8Gflop/s,是2002年(92.07Gflop/s)的2.13倍;排行榜前50名机器的总性能为16.33Tflop/s(全部100套高性能计算的总性能是19.56 Tflop/s),是2002年(4.6Tflop/s)的3.55倍;第一名机器的Linpack性能为4.148Tflop/s,是2002年(1.046Tflop/s)的3.97倍;有10套系统的峰值达到了1Tflop/s以上(2002年只有1套),并有2套机器的Linpack性能达到了1Tflop/s以上(2002年是1套);TOP10的最低性能大于0.38Tflop/s(2002年是0.1Tflop/s),TOP50的最低性能大于113.8Gflop/s(2002年是13.17Gflop/s);Linpack效率平均为57.9%(2002年是59.3%)。同样,与国际发展趋势相吻合,机群系统的发展也是最快速的,由2002年的7套增长为2003年的26套。

  感受完增长的喜悦后,我们斗胆把国内刚刚起步的TOP100这只“小鸡”与国际TOP500“雄鹰”比较一下:我们榜单上的100套系统最多只能有7套出现在国际TOP500名单上,最好的成绩也不过是第14名;重要的是,我们的榜单上缺乏像地球模拟器、Cray X1一样的专用高性能计算机系统。从我们这次采访中,很多专家都认为这些专用系统才可以称得上是高性能计算机技术的代表!另外,还有一点值得关注的是,即使是在我们的TOP100榜单上,也同样是美国制造的机器占据绝对地位,达到总装机数量的73%……

荣誉与差距的背后

  “国内外高性能计算机发展水平的差距太大了”,这是记者见到从美国参加SC2003会议归来的中科院计算所副所长樊建平研究员时,他所说的第一句话。

  “不论是企业,还是国家科研单位,要想介入高性能计算机产业并有所作为,重点并不是如何搭建出一个高计算峰值的机器来攀越TOP500,而应当把主要精力放在应用上,我们国家落后的首先是应用,要比美国等发达国家差距15年左右。”李国杰院士对目前国内高性能计算机的发展状况更是表现出了担忧。

国际国内HPC性能排行榜所引发的思考

  李国杰院士表示,一讲到高性能计算机的应用,很多人首先想到的就是气象预报、石油等科学计算领域,也许是因为气象预报领域的高性能计算机相比较其他行业稍微多一些而已,但这也只是局限于中央城市,深入到地方仍然是很欠缺。他提醒大家应该注意到,目前很多大型企业对高性能计算机的需求很大,从汽车、飞机的制造,到药品的研制、电影动画的制作,甚至信息产业内部芯片的研发制造,以及银行、证券计算机规模的扩大等,这些需求并不是高性能计算机的研制人员编出来的,“高性能计算机已经远远不止是科研单位的工具,TOP500中一半以上的机器是在大型企业应用;根据现在的一些统计数字,高性能计算机真正用在科研领域的不足10%。”李国杰院士说,“就像Yahoo这样一个信息服务应用,支撑系统都是由成千上万个节点组成的大型计算机。”

  除了能够用得上高性能计算机以外,能否把高性能计算机用得好也是一个大问题。这也是我们国家的一个薄弱环节,因为很多行业应用软件都来自国外的。“高性能计算机用得好,不只是从国外购买一台机器、一套软件能够用起来,重要的是要消化、吸收,要增值”,李国杰院士认为无论是自行开发应用软件,还是引用国外的成熟软件,企业和科研单位必须积极行动起来,以改变我们国家这种落后状态,否则差距会越拉越大。

  说到用应用来衡量高性能计算机,李国杰院士认为大家应该客观对待TOP500这样的排名,因为在前期超级计算机主要是用于科学计算,衡量标准也一直是通用的Linpack这种解线形方程组的测试方法,但实际上目前90%的高性能计算机已经不是用于科学计算,从而更关注带宽、吞吐量等指标,用Linpack值来衡量已经有些片面。他认为,如果大家花点时间去关注一下TOP500名单上对高性能计算机用得好的企业,应该更有意义。

国际国内HPC性能排行榜所引发的思考

  樊建平告诉记者,除了应用领域外,目前人们对高性能计算机的使用模式也在发生变化。“以前人们需要高性能计算就会买一台回来放在计算中心,但现在这种模式在变,逐渐走向集成化和网格化,不仅要把自己的计算中心与其他计算中心集成在一起,而且要有标准互连互通,实现按需计算。”樊建平说,“有的用户甚至希望租用计算能力配给相应的项目,而不是购买高性能计算机。”

  正是因为围绕高性能计算机应用而来的这些千变万化,很多人已经意识到只有高的计算速度已经不能解决所有问题,从而有人开始对高性能计算机HPC(High Performance Computer)这个名字提出质疑。据李国杰院士介绍,现在国际上很多人建议把HPC中间字母“P”所代表的Performance(性能)改为Productivity(生产率),从而引导高性能计算机向高生产率计算机概念转变。与实际应用相结合,提高效率已经是国际上对高性能计算机提出的新要求,“评价一台机器的作用,不但要看它买来后做了多少事情,还要关注购买该机器后的使用成本,包括编写程序花了多少时间、使用过程中的维护需要多少时间等。”

  看来国际范围内对高性能计算机的认识和评估标准都在变化,如果我们国内市场再一味地去追求峰值,也许真的有可能与潮流背道而驰。

 

请您为本文做个评价:
文章评论
笔记本,台式机 拨打800-858-2339,为您量身打造!
您可以用以下几种方式找到此文章
服务器采购中心
品牌 
IBM  戴尔  惠普  联想  浪潮  强氧
Sun  华硕  曙光  技嘉  方正  宝德
类别
CPU
8个   4个   2个   1个

ZOL推荐经销商
华海永昌
010-51669189

联合泰克
010-51263399
服务器卖场
010-62642206

北京经纬恒通
010-82569408

IBM钻石分销商
010-62653208
迈拓晨峰
010-51659900