在服务器领域,系统运行的稳定性和可靠性是非常重要的。人们希望服务器24*365不间断运行,以便保证商业网站、电信系统、银行系统等的持续运转。
RAID技术、UPS、风扇冗余等都是为了在相关部件出现故障时,保证用户能够在系统正常运行的同时,进行在线维护。而热插拔(HotSwap、HotPlug、HotDock)是指在系统到店的工作状态下,将模组、卡或连接器查到系统上,而不影响系统的操作。
实现热插拔需要硬件软件两个方面的共同支持,包括有热插拔功能的硬件设备、支持热插拔功能的PCI系统总线、支持热插拔的操作系统和设备驱动,以及主板BIOS的支持。
热插拔技术在服务器、HPC等高端技术领域有着不可替代的重要作用,因为他能够极大提高服务器的可用性,灾备能力、灵活性和扩展性。
由于服务器需要保持7*24小时甚至24*365天的待机能力,所以热插拔就成为鉴别服务器可用性的关键因素。
比如浪潮英信NF8480M3的系统提供14个 PCI-E 3.0扩展插槽并支持热插拔,系统各个关键部件如内存、电源、系统风扇、硬盘及外插PCI-E卡等均支持热拔插技术,保证系统的不停顿运作能力,极大提升系统可用性。
因此我们可以在系统开机的状况下,将损坏的内存、电源、系统风扇、硬盘及外插PCI-E卡移除,还可以在开机的情况下做更新或扩容,不影响系统的操作。另外,由于热插拔零件的可靠度提高,很多热插拔芯片能为系统提供线路供电情况的信号,能够减少故障分析成本。