专栏/SSD的寿命要怎么看?

SSD的寿命要怎么看?

2021年10月18日 03:57--浏览 · --点赞 · --评论
NVIDIA大法好
粉丝:8文章:14

从SLC、MLC,到今天的TLC乃至QLC,技术的迭代使得NAND存储密度越来越高,每GB的拥有成本也越来越低。如今,几TB甚至十几TB的NVMe SSD已经开始成为主流,但另一方面,NAND的Cell擦写寿命越来越短,也引发了对于SSD寿命的诸多讨论。

什么是SSD的寿命?

通常说的SSD寿命是指在SSD生命周期内允许的数据写入量。增大SSD的用户容量、选择更高可擦写次数的NAND颗粒,无疑都是延长SSD寿命的有效手段。同时,它还要求SSD的其它硬件、软件(固件)都不存在短板。

一块企业级SSD在其整个生命周期中,应当在各类复杂的负载及外界环境下,都能保证其关键指标的一致。它要求产品在设计时,就充分考虑复杂多样的用户使用场景,并在功能设计、电路设计、元器件选型、固件算法等方方面面均满足预定的寿命和可靠性指标。NAND寿命虽然是影响SSD寿命的因素之一,但二者并不等同。

为何NAND寿命如此受关注?

不论是SLC、MLC,还是TLC,它们都利用了量子力学的隧道效应,在控制门上加较高的编程电压,使电子穿越隧道氧化层到达浮栅,并聚集在浮栅上,存储信息。擦除时仍利用隧道效应,将电压反转,从而消除浮栅上的电子,达到清除信息的结果。电子在反复来回穿越的过程中会对隧道氧化层造成不可逆的磨损,使其不能再有效保持浮栅门中的电荷,并最终失效。

NAND寿命的量化指标为P/E Cycles,也就是写入/擦除(Program / Erase)次数,一写一擦就会消耗NAND的1个P/E。根据NAND厂商的要求,在P/E耗尽之前,NAND应满足以下特征:

  • NAND在正常工作温度下仍能保持要求的RBER(原始比特错误率)

  • NAND剩余的好块个数可继续满足其参数规格

  • 对温度的敏感度仍可满足使用要求

  • 数据Read Disturb的抵抗能力仍满足要求

  • 原定的读写擦各项性能参数仍能满足要求

  • ……

SLC NAND的P/E次数可达100000,MLC约为3000,主流的消费级TLC NAND大约在500~1000,而企业级SSD使用的eTLC则高得多,一般为5000~10000(这也是为什么企业级SSD寿命更长的根本原因)。假设SSD的用户容量并没有几何级的增加,NAND的可用P/E次数少了,用户对SSD整盘寿命的担心自然会增加。

加剧NAND损耗的原因

假如,我的SSD是1TB可用容量,P/E次数为1000,是否意味着,当我写完第1000TB数据的时候,SSD才会寿终?很遗憾,事实并非如此,甚至比你想的更加糟糕。写放大是导致这一问题的根本。

根据NAND工作原理,它以Page(页)为单位写入数据,以Block(块)为单位进行擦除,在新数据写入时,需要先对写入位置进行擦除操作,而不是像HDD那样可以直接覆盖。由于一个Block中含有多个Page,因此在擦除时需要先对里面的有效数据进行保留,重新写入,引发GC(Garbage Collection,垃圾回收)和写放大(WA,Write Amplification)。即,用户写1笔数据,真正写入到SSD中的可能是2~3笔,这样无疑会加剧NAND的P/E消耗。

企业应用的工作负载千差万别,不同工作负载所触发的写放大并不一样。在对硬盘的写入寿命测试中,我们通常会用到三种典型的负载模型:顺序、纯4K随机和JESD219中定义的IO模型,并引入WAF(写放大因子)的概念。

如上所示,顺序写入的WAF最小,约等于1(实际写入量约等于用户写入量),但由于现实业务场景很少有纯顺序工作负载,其测出的写入寿命并不具备实际可执行性;4K随机看似合理,但由于不含小于4K的IO操作,和用户实际场景也有一定差别;JESD219则对企业级用户的实际业务情况进行了参考和模拟,为SSD写入负载测试带来了行业参考标准,它包含从512 bytes到64K不同权重IO分布的组合,这些小于4K的IO也会进一步带来写放大。

此外,JESD219还根据企业级IO模型特点,对冷热数据进行了定义,借此触发磨损均衡(Wear-leveling),引入额外数据搬移,这也是JESD219标准下SSD的写放大会比纯 4K随机负载更高的原因。

不同测试方法导致不同的SSD寿命预估结果,WAF越高,其结果越具参考性。例如,市面上常见的企业级SSD,在纯顺序工作负载下的DWPD(硬盘生命周期内,全盘每天可写入的次数)可以达到5,在JESD219定义负载下,DWPD可能只有1。

以Memblaze PBlaze6 6920系列企业级SSD为例,其5年DWPD和PBW寿命是在JESD219工作负载下测试得出的。这样的测试标准显然更符合企业用户的实际使用场景,更具参考意义。

P/E Cycles可以被提升吗?

对于增加NAND的P/E可擦写次数,目前并没有好的办法,只能通过一些技术手段,让NAND在P/E耗尽之前,尽可能表现可靠。

NAND原厂对于数据纠错,会提供Retry Table,通过改变读数据的参考电压等各种参数供用户(SSD模组厂)使用。而对于那些合作足够紧密的厂商,甚至可以得到内部命令,进一步微调每一个波谷的位置,从而实现更强的数据纠错能力。

NAND的老化不以外界意志为转移,P/E Cycles,顾名思义只和Program & Erase动作相关,以优化读取电压为手段的提升P/E次数更是站不住脚。原厂每代NAND产品都经过了长时间的验证,得出了合适的参数固化成NAND产品投入市场。SSD厂商可以在所有与写放大的相关算法、技术中做出优化,但终不能突破P/E Cycles的最大数值。

当P/E Cycles达到厂商承诺的顶点时,SSD寿终。此时,你可能仍然可以对SSD进行读取、写入操作,但其中某个你注意不到的指标很可能已经发生“器官衰竭”,最明显的表现就是数据保持能力急剧下降,出现数据错误率上升、数据损坏甚至丢失等问题,这样的隐患仅通过读写测试很难得到。此时SSD已不具备可靠特性,不建议继续使用。

SSD寿命怎么看?PBW和DWPD

SSD寿命单位有两种,PBW(或TBW)和 DWPD:

  • PBW(或TBW):全称Petabytes Written(或Terabytes Written),在SSD的生命周期内允许的主机端数据写入量。1PBW = 1000TBW

  • DWPD:全称Drive Writes Per Day,在SSD的生命周期内,每天允许全盘写入的次数。

DWPD和PBW/TBW可以相互换算,公式如下:

假设一款SSD的用户容量为3.2TB,5年DWPD为3.4,那么其TBW为3.2TB*3.4*365*5,即19856TB。

DWPD的计算和硬盘服役时间有关,对企业级SSD来说,一般以5年产品保修期为参考。以PBlaze5 926系列企业级SSD为例,其每天3.4 DWPD写入量对应为5年生命周期,如果这块SSD只需要服役3年,那么其每天的DWPD可以达到5.7。

SSD的寿命和MTBF的关系?

寿命代表SSD可以用多久,MTBF(Mean Time between Failures,平均故障间隔时间)则代表了寿命期间,这块SSD是否可靠。在SSD生命周期内,其可靠性表现应始终满足行业标准(如企业级SSD需保证用户容量不变,UBER ≤ 10E-16,FFR≤ 3%,断电后40℃的室温下数据可以保持3个月);当SSD寿命耗尽,即达到预定的最大P/E次数,其可靠性会出现大幅下降。

不论是SSD的寿命PBW、TBW、DWPD,还是SSD的可靠性指标MTBF,它们都关乎到硬盘的实际可用性,并对用户的最终使用造成影响。SSD厂商也需站在用户立场,通过模拟真实用户使用场景,以敬畏而又严谨的态度,以相对保守的数字量化,为企业或个人用户做出保证,助其做出正确选择。

投诉或建议

4617作文网畅起名字配的字起名 曦姓苏的起女孩名周易哪些智慧周公解梦梦到丢钱造梦西游破解版内购破解版姓温取名起名大全王姓龙凤胎起名大全集赵文男孩起名鼠宝宝刘姓起名大全香港金马会一句梦解中华周易协会杨泽卯饭店起名大全 最新免费的五行缺火 起什么名字好听理发店起名什么名字好小孩起名带朔字好吗周公解梦签字起名叫店铺八字排盘算命详解算命龙隐周易论坛老版周公解梦原版实用免费人的命运测算新生儿免费起名字大全2019女孩的起名2019年胡取名起名大全煜起姓名大全《周易》中六十四卦小餐饮起名字周易测生辰八字算命园林公司 起名淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男子给前妻转账 现任妻子起诉要回网友建议重庆地铁不准乘客携带菜筐月嫂回应掌掴婴儿是在赶虫子重庆警方辟谣“男子杀人焚尸”国产伟哥去年销售近13亿新的一天从800个哈欠开始男孩疑遭霸凌 家长讨说法被踢出群高中生被打伤下体休学 邯郸通报男子持台球杆殴打2名女店员被抓19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警两大学生合买彩票中奖一人不认账德国打算提及普京时仅用姓名山西省委原副书记商黎光被逮捕武汉大学樱花即将进入盛花期今日春分张家界的山上“长”满了韩国人?特朗普谈“凯特王妃P图照”王树国3次鞠躬告别西交大师生白宫:哈马斯三号人物被杀代拍被何赛飞拿着魔杖追着打315晚会后胖东来又人满为患了房客欠租失踪 房东直发愁倪萍分享减重40斤方法“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火手机成瘾是影响睡眠质量重要因素考生莫言也上北大硕士复试名单了妈妈回应孩子在校撞护栏坠楼网友洛杉矶偶遇贾玲呼北高速交通事故已致14人死亡西双版纳热带植物园回应蜉蝣大爆发男孩8年未见母亲被告知被遗忘张立群任西安交通大学校长恒大被罚41.75亿到底怎么缴沈阳一轿车冲入人行道致3死2伤奥运男篮美国塞尔维亚同组周杰伦一审败诉网易国标起草人:淀粉肠是低配版火腿肠外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万杨倩无缘巴黎奥运男子被猫抓伤后确诊“猫抓病”春分“立蛋”成功率更高?记者:伊万改变了国足氛围奥巴马现身唐宁街 黑色着装引猜测

4617作文网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化