1磁带存储已到了暮年?
磁带存储技术似乎总被人提及,已到了暮年,但是惠普的解读是:来日方长,还有很多新把戏。走进惠普(HP)位于英国布里斯托、除了美国本土以外最大的StorageWorks研究室,触目可及的就是该公司引以为傲的磁带产品。虽然历经催生出现在中阶磁带机市场的标准格式LTO,迄今销出1700万台DDS/DAT磁带机的辉煌功绩,磁带市场近年来逐渐萎缩的现实,也让研究室开始研发磁盘备份技术。
走进惠普(HP)位于英国布里斯托、除了美国本土以外最大的StorageWorks研究室,触目可及的就是该公司引以为傲的磁带产品。虽然历经催生出现在中阶磁带机市场的标准格式LTO,迄今销出1700万台DDS/DAT磁带机的辉煌功绩,磁带市场近年来逐渐萎缩的现实,也让研究室开始研发磁盘备份技术。
不过,在谈到未来磁带市场的前景,惠普亚太区存储事业群副总裁暨总经理JimWagstaff仍然信心满满。该公司的首要策略是将原本用在大型企业的磁带产品,推到中小企业市场。
另外,在大型企业里的磁带应用,势必也会持续进行。“企业为了成本考量、法规遵循(Compliance)等因素,不可能舍弃磁带备份,”Wagstaff说。
磁带市场在近年来持续萎缩,主要的冲击来自于磁盘备份市场兴起。根据IDC(国际数据资讯)提供的资料,单以台湾省市场而言,磁带营收由2005年的3329万美金下滑至2361万美金;与此同时,外接磁盘的市场系由110万美金增长至109万美金。
市场持续传来磁盘终将取代磁带备份的声音,因为前者相比于磁带,原本就具有存取速度的优势,且成本由原本的10倍缩减到现在的3倍的差距。
“磁带市场不会消失,但是的确很难再有增长的新动力,”IDC(国际数据资讯)运算系统分析师钟尉彰说。
尽管如此,但对惠普、升阳、IBM这类原本即有磁带产品线的存储厂商而言,自然不可能轻易拋弃“祖产”。惠普存储事业群磁带机行销经理BobConway即表示,磁带存储容量和存取速度进展飞快,近年来并加入了加密技术,足以和磁盘备份相抗衡。
“虽然还无法预期成长速度,但是从近年来的发展即可推断,未来只会大幅成长,”Conway说。
根据HP提供的资料,在20年内,磁带的存储空间大幅增长了1330倍。从每卷磁带原本的134MB提高到1.6TB;转速则增加3636倍,由每秒66kB提升到240MB。与此同时的单位价格还能维持不变,从1988年的4000美金略微提升到4999美金。
“这就是为什么磁带的市场营收逐年下滑,市场没有看到的是,销出去的容量和单位量大幅增长,”Wagstaff说。
2磁盘辅助备份方案的第二种技术
企业可以将数据直接从磁盘备份到磁带(D-T)上,也可以采用D-D-T技术。那么,企业应该在什么应用条件下选择D-D-T或者D-T技术呢,因为一个方案并不适用于所有的应用情况。首先,磁盘和磁带的存储介质不同,数据格式不一样,从技术来看,磁盘基本作为在线的数据管理,磁带可以离线保存,避免了场所性的灾难,如水灾、火灾、地震或者电脑黑客、病毒的恶意毁坏。
从价格上来看,磁带的每GB价格一定比磁盘便宜很多,磁带一个GB的成本只有0.22美元,而最便宜的磁盘也在1.61美元。从数据密度来看,磁盘的数据密度是不能够提供硬件压缩的,而磁带可以根据不同的文档类型实现至少1.5倍的数据压缩,因此,数据存储在磁带上更加经济。从性能来比较,随着磁带驱动器性能的提高和新产品的推出,在给一个比较大容量的文档进行备份和恢复时,磁带的性能甚至超过磁盘驱动器,备份与恢复速度都很快;但在做逐个文件备份和恢复时,磁盘的速度要快于磁带的速度。
磁盘辅助备份方案的第二种技术
磁盘辅助备份方案的第二种技术是基于磁盘备份,它是将一个磁盘模拟为磁带库来实现的;它先将数据卷备份到另外一个廉价磁盘上,然后再备份到磁带上。从恢复上来讲,这种技术不是即时恢复,但它可以从廉价磁盘上将数据直接再读回去,这样速度肯定比磁带到磁盘要快。这种方式的优势可以基于单个文件的恢复,因为它是以备份的形式将数据备份到中间的磁盘上;这种方式可以实现增量、差量或者全备份,可以将数据负载全面降下来;同时,这种方式可以采用廉价的磁盘,因此,整个方案的成本可以相对较低。
对于磁盘辅助备份方案的第二种技术,HP提供了3种解决方案,分别是企业级、中端、入门级三种解决方案,包括方位的硬件、软件和服务。第一个是HP StorageWorks XP12000+MSA1000+ESL磁带库,这是基于企业级的磁盘辅助备份方案,面向对象是高端企业客户。第二个方案是HP StorageWorks EVA5000+FATA盘+MSL磁带库来实现,面向中档规模的用户;第三种方案HP StorageWorks MSA1000+MSA1500+自动加载磁带机,可以为用户提供入门级的D-D-T方案, 这三种方案都是通过HP OpenView Data Protector5.5备份软件进行管理的。
3企业使用磁盘辅助备份的四种情况
那么,企业在什么情况下可以使用磁盘辅助备份方案的第二种技术呢?首先,如果客户有大量慢服务器需要通过网络备份,同时,客户希望在发生灾难时,需要在一定时间内尽快恢复。而在传统的慢服务器备份中,这些服务器的备份速度很慢,而且需要顺序备份和恢复,因此,传统方式肯定无法满足客户要求;如果采用一些备份软件,如DP 5.5,可以实现服务器的多路复用备份,使用户的备份速度要求得到了满足,但依然无法满足用户的恢复时间要求,因为需要先将多路复用备份数据分解成相应的若干盘小磁带,然后再一个个恢复。在这种情况下,客户可以采用D-D-T的形式,利用廉价磁盘,可以直接恢复;通过磁盘到磁盘,大量的慢服务器可以并行工作,就解决了备份速度和恢复速度。
如果客户有大量小文件需要备份,如果要做整个磁盘备份,那么,可以通过D-T技术满足客户需求;但如果客户需要逐个备份与恢复,由于磁带逐个备份的速度非常慢,而磁盘基于文件格式,则能直接备份过来。
因此,采用D-D-T备份则可以实现满足用户需求。
第三种情况是,如果客户需要持续的备份,不能有任何时间间歇,而基于磁带的备份是基于时间段的,无法持续进行,因此,这种备份需要使用D-D实现持续备份,然后在允许的时候将廉价磁盘上的备份数据再备份到磁带上面。
第四种情况,如果客户在备份不能影响应用服务器的性能,或者要减少备份对应用服务器性能的影响,那么采用D-D-T的方式则是不错的选择。
根据客户需求决定具体方案
行业用户需要根据数据容量、备份策略、数据保留时间等,来架构真正适合应用需求的D-D-T方案。如果客户全备份的容量不是很大,每天增量的备份容量也不大,同时,客户希望保留在廉价磁盘的时间小于一个月,那么,客户可以将全备份和增量备份的数据备份到中间的廉价磁盘上,然后在离线的,比如在下班时间把全备份和增量备份数据再到磁带上,全面减少对应用服务器的影响,同时因为基于磁盘的备份可以持续进行, 增加了备份的可靠性。对于客户而言,廉价磁盘的容量是主要数据容量的2.5倍。
如果客户全备份的容量就很大,而每天增量的数据相对也比较大,同时我要在磁盘上保留的时间相对要长,可能我要保留到三个月的时间,那么,客户可以选择把全备份数据直接备份到磁带上,我把增量数据备份到磁盘上,那等于把它分解为D-T和D-D两种方式。这种备份策略的优势是将磁带和磁盘的备份特点与性价比高的优势全面结合在一起;在恢复的时候,客户可以整个把全备份磁带通过一个数据卷直接恢复,增量数据是通过磁盘上直接恢复过去。
4云中需要保留磁带
对于云存储的讨论通常是关注节约开支、在线保存所有的东西并在某个地方保证它们可以被访问,而且还不像磁带一样占用宝贵的空间。所以,是不是基于云的架构和应用的进步就意味着磁带终于要消失了呢?调查现在磁带的应用,结果是否定的——不管我们听到磁带的丧钟响过多少次。
最近几年,磁带集中精力于数据中心和中小企业市场的中高端,在这以下的市场中的占有率在下降。磁盘入侵了磁带的传统备份和恢复领域,利用的是看起来像是磁带库的更快的磁盘阵列——虚拟带库(VTL)和基于磁盘的去重来降低所需的存储量。
最近,磁带被很多企业用于访问较少的应用。这一技术正在把自己定位于正在迅速增长的3层存储市场,包括那些需要固定的内容和需要遵从法规而保留数据的要求。
磁带仍是数据存储架构的一部分,部分原因是它较低的每GB成本,降低运营成本和能源开销。而且磁带有额外的安全功能例如加密和WORM(一次写多次读),还有更长的介质寿命(某些情况中超过30年)。那些“磁带已死”的说法忽略了这些。在2011年早些时候听说Google承认从磁带上恢复4万个基于云的邮件账户时,我们发现磁带的这些优势即使在云时代仍然存在。
保护云中的数据
在考虑数据保护方法的时候,IT部门还需要考虑物理和逻辑数据保护。物理保护确保数据在磁盘、阵列或站点失效的时候数据受到保护。逻辑数据保护则保护数据不受最常见的数据丢失原因——机器或人为错误(数据损坏或意外删除)的威胁。一个好的备份计划可以同时提供两种保护,这也是为什么好的备份如此昂贵的原因。
对云,你的云服务提供商很可能通过某种镜像或者远程复制来提供物理数据保护(针对磁盘失效、阵列失效、站点事故),而这已经计算在你支付的每GB价格中了。不过供应商没有进行逻辑数据保护(人为或机器失误),这是云的一个关键缺点。
在很多情况下,基于磁盘和磁带的技术可以也应该一起使用来应对数据保护要求的广泛性(参见表1:数据保护方法和级别)。同步远程镜像可能对你公司的最核心业务的数据和全站、近零数据丢失灾难恢复来说很合适。磁盘备份则适合那些不那么关键、可以容忍一点数据丢失的数据,而磁带备份通常适用于更不关键的数据或者是低成本地长期保留数据拷贝。
为什么要在云中保留磁带?
多数公司都使用传统的备份软件,备份服务器软件和备份客户端软件(处于数据存在的系统上)通信。数据被通过本地网络(LAN)从客户端传送到存储设备上,或者直接通过存储网络(SAN)直接从客户端传到存储设备。
备份软件获取的数据可能是公司生产数据的完整拷贝(完全备份),或者只是自上次完全或者增量备份之后改变了的数据(增量和差异备份)。最佳实践建议保留备份数据的多个副本——一套放在站外一套放在站内——而且保留它们一定的时间。
备份可以首先直接做到磁带或者磁盘上,然后在备份窗口之外再向磁带上做一份拷贝。磁带是有很好的保存时间的流行介质;而且,随着时间的推移每GB的投入和维护成本都迅速下降。磁带有很好的扩展性,而且能提供真正的“随需容量”,因为你可以在需要的时候才买磁带,而不是像投入那些“旋转介质”那样一次性买来再一点一点地使用。磁带还是低成本和可移动的,使得它成为开始使用云存储或者转移云存储供应商时的一种理想的介质。磁带校验技术的进步使其成为一个恢复时的更可靠的媒介,而且磁带是可以被搜索的。可能最重要的是,磁带是一个非常好的多租户平台。它支持分区,加密并有很强壮的密钥管理,所以它可以打消用户对云存储的最大的疑虑——安全和私密性。
但是备份到磁带还有很多众所周知的问题。如果磁带保存在站外,获取它可能会需要数小时甚至数天。因为备份通常是一个每天进行一次的操作,恢复时间点是上次备份进行的时间,所以可能会存在一个24小时的时间差。磁带介质还可能由于种种的原因变得不可使用,例如暴露在磁场中,或者外壳受损。
不良或不足的介质管理和验证测试可能加剧这种情形。而且磁带可能会丢失。但是数据仍然需要针对逻辑错误的保护,例如意外删除和软件错误。如表1所示磁带可以提供所有的基本功能。除了它的缺点,由于对云安全的担忧和今天的电力、空调和空间价格,要无视一个站外加密媒介上的拥有备份数据的拷贝带来的长期价值,还是很难的。这就是为什么磁带可能会在云中获得第二次生命。