构筑信息化基础平台——商用机群服务器以集中应对管理和应用挑战
机群分科学计算机群和非科学计算机群两类,前者主要用于科学工程计算,后者亦称商用机群,用于事务处理、信息服务等传统的服务器应用领域。目前,科学计算机群已成为科学计算用高端计算机的主流,而商用计算机群正处于方兴未艾的蓬勃发展阶段。管理集中和应用集中是商用机群服务器的主要技术特点。
问题与挑战
● IA服务器的尴尬:英特尔架构(IA)服务器或PC服务器在国际上已占整个服务器市场60%以上的份额,在国内服务器市场的份额也已接近并很快超过50%。但是在一些关键的商业应用领域如金融等仍然是Unix服务器的天下。究其原因,除了主要的应用软件仍基于Unix服务器平台外,IA服务器在性能,特别是I/O性能、可扩展性、可靠性、可用性、安全性等方面与Unix服务器仍有差距。而要消除这些差距,那就不是目前的IA服务器了,性能价格比将无优势可言。
● 系统管理员的苦恼: 一个单位目前拥有服务器少则几台十几台,多的则达几十台甚至几百台,放置在局域网甚至广域网的不同地方,具有多种操作系统平台:Windows NT、Linux、 Unix等,对这些服务器的管理、部署、监控、维护烦琐复杂,工作量极大。
● CIO的苦恼: 目前各单位往往根据需要随时购买,每台服务器一般固定做一种服务。随之产生这样的后果:服务器越来越多但仍不够用,管理员越聘越多,服务器后台系统越来越脆弱,信息安全漏洞越来越多,运营成本越来越高,系统总体拥有成本(TCO)往往达到系统硬件成本的三倍以上。
● 使用者的困惑: 由于整个后台服务器系统缺乏单一映像,需要记住许多IP地址,获得不同的服务要与不同的服务器打交道,系统响应时间越来越长,使用中途常常间断,服务器之间资源不共享也给使用带来诸多问题。
解决之道——“集中”
系统管理员的苦恼、CIO的苦恼以及使用者的苦恼通通来自于计算模式(或应用模式或管理模式)本身的问题。基本的计算模式有如下几种:
● 主机/终端模式:这是早期的模式。由于服务器极其昂贵,只能共享。其好处是服务集中管理效率高,缺点是技术复杂且开放性、可扩展性极差。
● 客户机/服务器(client/server)模式: 这是20世纪80年代中期以来直到现在仍广泛采用的模式,它是随着互联网和Unix/RISC服务器发展而发展起来的,是一种典型的网络计算模式。它具有很高的开放性和可扩展性,硬件成本也比较低。但是,它带来上述一系列的问题。
● 服务器集中(或称聚集或称整合)模式: 这是90年代中后期随着超级服务器(Unix机群)出现而兴起的模式。由于超级服务器价格昂贵,这种模式并未普及。近年来随着IA机群的发展及Unix (SMP)服务器分区问题的解决才真正有了普及的条件。这种模式吸收了前两种模式的优点而摈弃了他们的缺点。
● 网格计算模式:这是下一代模式,它以实现大范围内计算资源共享为目标。计算资源包括地理上分布的网格结点,而结点内均采用服务器集中模式。
网格计算不是本文的论题。本文只讨论前述问题的解决之道,从根本上变革服务器的应用模式,摈弃客户机/服务器模式,改进服务器集中(聚集)模式,使之具有如下特点:
1. 管理集中: 在统一的控制台界面上集中管理多种服务器平台,实现包括系统管理、系统部署、系统监控、安全管理、日志、备份、作业管理在内的各种管理功能,从而提高系统的可管理性、可用性和全系统的吞吐率。
2. 服务器(应用)集中:这里“服务”是广义的, 包括计算服务、基于数据库的服务、Web服务、email 服务、FTP、域名服务、文件服务、打印服务、ERP服务、CRM服务等等。这些服务可分布在不同的服务器上,同一种服务(如数据库服务)也可以有数台服务器(并行)执行。为便于服务器资源共享,所有服务器被分成若干区。服务器分区也为负载均衡和高可用提供了基础。
3. 物理集中:集中所有后台的IT设施如服务器、存储设备、网络交换机、视频设备、网络安全设备、机柜系统、电源与散热系统等,组成一个服务器系统——机群服务器。
如此高度集中的机群服务器很好地解决了系统管理员、CIO和使用者的困惑和问题,是代替Unix服务器的一种理想的商用(机群)服务器,而且具有前者所不具备的高可扩展性、可用性、安全性及优异的性能价格比。
商用机群服务器的特点和发展趋势
商用机群服务器主要解决交易(transaction processing)密集型、数据密集型、I/O密集型和通信密集型问题, 要求很高的服务器内部总线带宽、I/O带宽和对外通信带宽,其主要技术指标是系统的吞吐率和对用户作业的响应时间,对可靠性、可用性、安全性等更有特殊的要求。它具有的多机可用性比双机可用性有显著的优越性,但技术难度大得多。除了通常的安全网关和防火墙, 它还有特殊的安全算法和措施。
商用机群服务器产品的基础架构、IA服务器结点、存储设备、通信设备、安全设备、管理系统等必须满足上述各项要求。目前,世界上真正满足这些要求的机群服务器产品还不多。联想新近推出的深腾2600商用机群服务器继承了联想深腾1800科学计算机群的主要技术,其体现商用机群服务器特点的主要核心技术集中在集中管理器(或模块)和负载均衡器(或模块)上。这两个模块的功能由如下子系统实现: 机群管理系统、快速部署系统、机群监控系统、机群安全系统、日志管理系统、备份恢复系统、负载均衡系统、高可用系统和并行数据库系统。
在国外,中小规模的商用机群服务器已逐步取代Unix服务器。在集中管理方面, 前者已接近后者的水平,在服务(应用)集中和多机高可用等方面,机群系统有天然的优势,一套机群可同时执行多种服务,这些任务可在内部服务器结点上动态迁移。Unix(SMP)服务器虽然解决了分区问题,但服务集中的数目和效率远不及前者。商用机群服务器取代Unix服务器的关键在于无缝移植目前运行在Unix服务器上的重要行业(如金融)应用软件。由于很高的性能价格比和很好的行业适应性,商用机群服务器正在开辟越来越多的行业应用,如电子政务、企业、教育信息化建设等。