都说固态硬盘寿命短,那么有谁把使用寿命用完了吗?

[复制链接]
laji 发表于 2023-9-8 16:43:50|来自:中国 | 显示全部楼层 |阅读模式
都说固态硬盘寿命短,那么有谁把使用寿命用完了么?或者说用完之后的表现是什么?寿命快用完之前有什么表现?
全部回复5 显示全部楼层
bett_liu 发表于 2023-9-8 16:43:58|来自:中国 | 显示全部楼层
目前有两类人可以明确的把固态用完,一类是苹果的macbook air M1 8G内存用户,由于内存过小,会频繁的使用固态作为缓冲区,请自行搜索相关的新闻和讨论。另一类是特斯拉用户,自带的存储固态只有64G(经指正,实际上是8G),从最开始上市至今也有好几年时间了(从最开始算,不要从国产时间算),在行车记录仪的反复蹂躏下就逐渐到寿。近两年就有特斯拉因为闪存到寿召回的,已经有几个批次了,更换闪存。
至于是什么表显,就是记录数据出错,0变1或者1变0,比较保守的厂家(Intel)会有个硬寿命,到了就锁死硬盘,变成只读模式,强迫用户换硬盘。
tyzyf 发表于 2023-9-8 16:44:10|来自:中国 | 显示全部楼层
有 早期特斯拉车主 大面积的车机死机源于8G 闪存经过几年的高强度读写,寿命到了 哈哈哈
fxpk 发表于 2023-9-8 16:44:59|来自:中国 | 显示全部楼层
2022-9-27追加
appReadWriteCounter 又立功了, 昨天打开它就出差了一天, 今天早上一看, 昨天一天, 阿里这个狗都不曰的又在不要命的写硬盘. pc-sdk-setup.exe这个进程, 所谓的阿里安全服务, 昨日一天写硬盘高达14G.
在这里说明一下, 本人一直以来都是知乎小透明, 看到这个提问随口一答, 没想到小火了一把, 诚惶诚恐. 并对评论区一些回应:

  • 有关答非所问. 提问者是问有谁把使用寿命用完了么, 我回答说有TIM这个bug在, 如果我不发现, 3 个月就能写完理论寿命. 也不能算是太答非所问吧.
  • 还有很多朋友问如何查写入. 我不知道他们问的写入是指哪一个写入.(1) 如果是查硬盘的总写入, 我用的是三星SSD, 则可以安装三星魔法师软件, 一打开就显示硬盘总写入. 或者用CrystalDiskInfo之类的软件查看. (2) 当前实时写入. [任务管理器]-[性能]选项卡, 点对应磁盘, 能看到实时读取和写入, 左下角点打开资源管理器, [磁盘]选项卡, 可看到每个进程实时读写, 以及对应针对某个文件的实时读写.  当然, 有必要拿出我推荐的大杀器"appReadWriteCounter". 不但可以显示每一个进程的实时读写, 还能统计从"appReadWriteCounter"打开以来, 每一个进程累计读写. 谁是写硬盘的罪魁祸首, 一目了然.



如图, 我的新硬盘, 用了一年多, 总写入9.4T



资源监视器 可以看到每个进程/每个文件的读写



appReadWriteCounter 可以看到这该死的阿里, 一天就写了我1.4G, 哦不, 1.5G, 就在我写一段文字的期间, 又写了100M.

以下原答案:
-------------------------------------------------
2年前, 我主硬盘是一个256G的三星SSD. 而且我从来不关机.
直到有一天我发现, 才用了3个月, 写入量已经超过15T. 不对呀, 半个月前我才看的才2T.
后来下载了一个软件"appReadWriteCounter", 监控每个程序的写入, 发现罪魁祸首就是TM(所谓QQ的办公版,应该叫TIM,我记得以前叫TM的), 以每分钟2G的速度不停在写硬盘, 从不断歇. 不知道在写些什么东西. 后面改用QQ后, 问题解决.
要是我没有发现的话, 估计3个月就能过保(150TBW).
duanlihua 发表于 2023-9-8 16:45:31|来自:中国 | 显示全部楼层
我的工作是做操作系统存储驱动相关的东西,包括文件系统、存储驱动、USB都接触过,把盘写坏了的事情还是遇到过不少次的。
如果把写坏的盘做一个汇总,可以总结以下几个特点:
1. 基本上都是不出名的小厂的盘,大厂尤其是Intel的盘在压力测试下也没出过问题,Intel的盘不仅耐用,并且掉电丢数据的情况也很少。
2. 新产品更容易坏,比如NVMe刚出来的时候,各种杂牌子的盘很多,坏的也多,但过了一段时间以后,NVMe的稳定性比第一批盘要好。这个规则也适用于SATA-SSD(以下简称SSD),但是因为SSD已经比较成熟了,所以SSD的问题相对于NVMe来说要少一些。
3. 操作系统上层操作很难写坏一个盘,因为盘自身带缓存,解决方法是发送硬件的flush(SYNC)命令,并且不要使用TRIM命令。
早年(大概8年前)SSD刚开始普及的时候,杂牌子的SSD比较多,国外客户更是什么样的盘都有,寄过来一些故障盘,发现在持续烤机一段时间(大概一个月)以后,性能开始下降,文件系统(RTOS上的)性能从200MB/s左右下降到不到100MB/s,这个时候盘已经快要坏了,大版本release测试的时候发现性能有下降,会用不同的盘测一下,如果是某个特定的盘的问题,那么就会把这个盘从测试环境里取出来,不再继续使用。这些盘年代久远,印象不太深刻。
我印象深刻的是两年前我写坏过一个NVMe盘,盘不是我买的,但是因为我们文件系统的性能距离官方数据有一定差距,并且想研究一下TRIM(DISCARD)的影响,我就拿过来研究了一下(顺便说一下,有几个回答里有人提到过这个品牌,这个品牌名声一般)。为了避免硬件缓存的影响,我每次测试之前,会全盘写一遍0x55,再写一遍0xAA,每写一段就发一个SYNC命令,这样能迫使硬件缓存完全失效,并且会完全消耗一次PE次数。写完一遍55/AA之后,再进行后续性能测试(以每次256KB的数据块写2GB的内容)。
这个NVMe盘(PCI-E)裸写的速度大概是700-800MB/s,在我反复擦写0x55/0xAA大概5次左右的时候,盘的写速度突然掉到200MB/s,之后一直就保持在这个速度上了。
基本上可以认为这个盘已经坏了。
评论有人说SSD跟NVMe是一种东西,不应该这么比,我回答里的SSD特指SATA-SSD,二者的主控并不一样,NVMe刚流行的那两年,因为主控问题导致NVMe挂掉的盘很多,第一批NVMe的主控技术并不好。主控对闪存的性能和寿命影响是很大的。
<hr/>所以,要问固态盘快要坏了的时候是什么现象,那么首先可能遇到的是掉速问题,频繁擦写(尤其是写一轮55/AA)可能会导致固态盘的负载均衡算法失灵;也可能会零碎的丢失一些数据,但考虑到盘本身很大,如果不是像Chia那样P盘的话,未必能发现异常的数据块。
正常使用,尤其是用大厂的盘,一般不会有什么问题,我手头的Intel SSD 730 Series 240GB,是2014年买的,作为系统盘使用至今没有任何问题。但另外一块SanDisk的1T SSD,用了不到4年,已经有好几块坏快了(但还能用)。但是大厂的东西,贵是真的贵,一分钱一分货,十分钱两分货
<hr/>写废盘的测试流程(注:绕过文件系统,直接操作驱动):
1. 申请256KB的固定缓存;
2. 缓存填充0x55,从第一个扇区写到最后一个扇区;
2.1. 每写完1G,发送一次硬件Flush命令(NVMe:Flush Cmd 0x00,SATA:ATA_CMD_FLUSH 0xE7/0xEA)
3. 缓存填充0xAA,从第一个扇区写到最后一个扇区;
3.1. 每写完1G,发送一次硬件Flush命令(同上)
4. 准备1-2GB的内存,按偏移量对0x100求余填充数据
5. 计时,写入数据,计算性能
6. 计时,读取数据,计算性能,校验
7. 发送Flush命令,并重复4-6步骤多次(>5)求平均数
qswh 发表于 2023-9-8 16:46:07|来自:中国 | 显示全部楼层
我们把企业用的那种ssd写坏了,牛x不?
一切源于EMC的一个BUG,技术细节说的太细估计也没有用,我就尽可能简单的描述一下这个问题。
大概就是两个写入指令从不同的path过来之后磁盘阵列的主控会傻掉,会对着一个地方反反复复的写,最终把这个块写坏掉,这个问题只对16TB以上的LUN(你可以理解成分区)才会有,19年还是20年的事。
表现的话就是VMDK文件一部分读不出来。
解决办法就是先把虚拟机storage vmotion移动出去,重新把LUN弄到16TB以下,然后再移动回来。
EMC派了二十来个人干了俩个多月,场面极其欢乐。

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则