在硅晶圆技术逐渐接近极限的今天,人们开始关注下一代计算机芯片将会采用什么材料来制作?相比量子计算机、光计算机、DNA计算机等更加超前的概念,超导计算机的可行性要大得多。日前,上海超导科技股份有限公司(以下简称上海超导)开始利用浪潮TS10000高性能计算集群,开发新型的超导芯片。
神奇的超导计算机
目前制成的超导开关器件,其理论上开关动作所需时间为千亿分之一秒,是当今所有电子、半导体、光电器件都无法比拟的。这意味着超导计算机的运算速度将比现在的电子计算机快100倍,而电能消耗仅是电子计算机的千分之一。打个比方,如果目前一台大中型计算机每小时耗电10千瓦,那么同样计算力的超导计算机只需一节干电池就可以工作了,并且体积也只有原来的几十分之一。
不过,超导计算机的实现还有待于科学家们对高温乃至常温超导材料的研究。目前,科学家们已经发现有28种元素和几千种合金和化合物可以成为超导体,但这些超导材料最高的超导临界温度也要在零下140度以上。科学家们期望寻找到成本低廉的常温超导材料,利用它制成超导开关器件和超导存贮器,再利用这些器件制成超导计算机,从而改变整个计算机的世界。
胖瘦结合,加速超导芯片研究
超导材料的研究离不开高性能计算机。不过,超导材料理论较为复杂,从原理上决定了对高性能计算的要求不尽相同,如Materials Studio、ADF、PWSCF等计算方法对CPU主频和内存带宽要求比较高,而量化计算Gaussian则对共享内存并行效率有更高要求,需要SMP胖节点服务器。
根据上海超导的应用需求,浪潮按需定制了基于英特尔至强E5-2600V3系列的高性能天梭TS10000集群系统,整套系统采用胖瘦节点分工、高速网络和存储结合的设计。其中,瘦计算节点为满足高主频和大内存MPI并行计算应用需求,使用了浪潮2U双路机架服务器NF5280M4,配置了2.5 GHz主频、十二核心的E5-2680v3处理器,单节点128G内存,可轻松处理普通计算任务。而像Gaussian、ATK/VNL、MedeA等应用,随着计算规模的扩大,对内存的需求将随基函数数量的平方而增加,特别是支持Open-MP和TPC-Linda两种并行方式的Gaussian,在选择MP2计算方法时会产生大量临时文件常驻内存,通用计算节点将很难完成数据处理工作。为此,浪潮提供4U机架式服务器NF8460M3作为胖计算节点,配置4颗E7-4820v2处理器,内存可扩展至2TB,满足了大内存并行计算的需求。
存储系统采用浪潮TStor500存储系统,提供3GB/s的聚合带宽,在满足Gaussian MP2等计算方法对较高IO带宽要求的同时,也让整个系统数以千计的客户端、服务器和存储设备之间实现了完全并行。同时,元数据服务器和对象数据存储服务器在不同的服务器,两个对象存储服务器采用Actice-Active方式运行:元数据存储阵列采用浪潮光纤存储AS500H,两个MDS元数据节点保障HA高可用;数据存储节点采用浪潮4U机架式服务器SA5224H,全部采用高性能专用处理器,集成BMC智能控制芯片。为了与高速存储相匹配,整个集群采用56Gb/s FDR端到端的IB交换机,在1U空间提供36端口互联所有计算节点、管理节点、登录节点和存储系统,实现了超高的MPI信息传输率及微妙级的点对点延迟,提供更好的应用程序计算性能。
元数据服务器、对象存储服务器和客户端可以分别运行于独立的操作系统中,也可以运行于一个操作系统内部。最优的解决方案是元数据服务器位于一个单独的服务器中,对一个元数据存储对象提供服务,单独的对象存储服务器为多个对象存储对象提供服务,客户端也位于单独的服务器。其结构如下图所示,图中为一个元数据服务器,一个对象存储服务器,和一个客户端的示意图,元数据服务器服务于一个元数据存储对象,对象存储服务器服务于三个目标存储对象。
浪潮还为并行存储系统配备了自主开发的智能化、专用定制化的存储管理界面,支持图形化界面显示,支持图形化安装与部署,可实现存储资源的量化和用户配额制。
此外,浪潮还为用户配置了Cluster Engine云服务平台及集群部署还原软件,让用户管理整套集群系统就像管理一台计算机一样方便。
"胖瘦组合计算模式" 化解超导应用难题 ,多个超导科学领域专家在经过实际测试后,认为浪潮为上海超导量身定制的高性能集群提供了充足的总体计算能力,节点间的数据交换和系统的I/O带宽加速效果明显,系统可扩展性得到充分保障。同时,浪潮针对实际运算需求开发的不同级别的软件应用,促进了系统内部服务器、存储、应用之间最大限度趋近协同运算,显著提高了超导材料研究应用的运行效率。