如今,闪存已经在一些互联网数据中心中大量采用,然而,对于用户来说,闪存与传统硬盘有着很大的区别,而在应用过程中,则会出现不同的挑战。
前段时间卡耐基梅隆大学基于Facebook数据中心大量的PCIe闪存使用环境写过一篇论文《Facebook闪存失效大规模研究》。这个研究的结果时间跨度非常长,而且监控的数量也足够大,非常具有代表意义。
闪存数据中心的应用
下面我们来看一下这个研究结果的几点重要结论:
(1)闪存与传统硬盘的失效性不同。
在传统磁盘的应用环境中,一般开机故障率比较高,然后是稳定期,故障率维持恒定,最后经过长时间使用,故障率又上升。
而闪存的失效与传统的饿磁盘并不相同,闪存的失效并不是单纯地随闪存芯片磨损增加。它们历经几个明显的时期,与失效如何出现和随后如何被检测到相一致。如下图,闪存是开机故障率低,之后故障率有所提高,然后又是稳定期,最后故障率又提高。
,
这种情况的出现是因为当闪存大规模使用时,质量不好的颗粒就会出现损坏,故障率上升。这时闪存可以通过OP(Over-provisioning,是指SSD给坏块预留的空间)的颗粒替换质量不高的颗粒,替换之后,闪存逐步进入稳定工作的状态,故障率降低,直至生命周期的末端,故障率提升。