Диск NTFS с ошибкой в ​​SMART

У меня есть диск NTFS, на котором я храню свои данные, после проблемы с плохим адаптером IDE/SATA (который закрывал мой диск) SMART показывает ошибки.

Я хочу знать, что еще мне нужно сделать, чтобы проверить и исправить любую ошибку на этом диске.

Я использовал fsck для проверки диска, но это не слишком для меня.

    andre@PITCAIRN:~$ sudo fsck /dev/sdb1
fsck from util-linux 2.20.1
Mounting volume... OK
Processing of $MFT and $MFTMirr completed successfully.
Checking the alternate boot sector... OK
NTFS volume version is 3.1.
NTFS partition /dev/sdb1 was processed successfully.

СМАРТ

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   115   099   006    Pre-fail  Always       -       95292924
  3 Spin_Up_Time            0x0003   100   100   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   097   097   020    Old_age   Always       -       3419
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   067   060   030    Pre-fail  Always       -       5425551
  9 Power_On_Hours          0x0032   093   093   000    Old_age   Always       -       6345
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   099   099   020    Old_age   Always       -       1501
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   046   046   000    Old_age   Always       -       54
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   062   048   045    Old_age   Always       -       38 (Min/Max 31/39)
194 Temperature_Celsius     0x0022   038   052   000    Old_age   Always       -       38 (0 19 0 0 0)
195 Hardware_ECC_Recovered  0x001a   041   022   000    Old_age   Always       -       95292924
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       20
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       20
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       96499325213315
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       2999278438
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       866573403

И ошибка у SMART

SMART Error Log Version: 1
ATA Error Count: 54 (device log contains only the most recent five errors)
    CR = Command Register [HEX]
    FR = Features Register [HEX]
    SC = Sector Count Register [HEX]
    SN = Sector Number Register [HEX]
    CL = Cylinder Low Register [HEX]
    CH = Cylinder High Register [HEX]
    DH = Device/Head Register [HEX]
    DC = Device Command Register [HEX]
    ER = Error register [HEX]
    ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 54 occurred at disk power-on lifetime: 6088 hours (253 days + 16 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00      10:17:38.985  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      10:17:38.983  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      10:17:38.971  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      10:17:38.970  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      10:17:38.970  READ FPDMA QUEUED

Error 53 occurred at disk power-on lifetime: 6088 hours (253 days + 16 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00      10:17:35.999  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      10:17:35.999  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      10:17:35.998  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      10:17:35.998  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      10:17:35.998  READ FPDMA QUEUED

Error 52 occurred at disk power-on lifetime: 6088 hours (253 days + 16 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00      10:17:29.920  READ FPDMA QUEUED
  27 00 00 00 00 00 e0 00      10:17:29.918  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00      10:17:29.909  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00      10:17:29.909  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00      10:17:29.909  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]

Error 51 occurred at disk power-on lifetime: 6088 hours (253 days + 16 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00      10:17:27.106  READ FPDMA QUEUED
  27 00 00 00 00 00 e0 00      10:17:27.104  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00      10:17:27.095  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00      10:17:27.095  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00      10:17:27.095  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]

Error 50 occurred at disk power-on lifetime: 6088 hours (253 days + 16 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00      10:17:24.293  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      10:17:24.279  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      10:17:24.279  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      10:17:24.279  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      10:17:24.279  READ FPDMA QUEUED

Я запускаю расширенную самопроверку на этом диске с НЕМОНТИРОВАННЫМ.

2 ответа

Решение

У вас есть 20 плохих секторов на диске. Например, они могли просто испортиться из-за внезапного отключения питания во время записи. Вы можете попытаться написать им нули и посмотреть, вернутся ли они. Вам нужно будет идентифицировать номера секторов, о которых идет речь, что вы можете увидеть из журнала ошибок там, первый - 268435455. Сначала попробуйте прочитать его, чтобы убедиться, что он плохой:

sudo dd if=/dev/sdb bs=512 of=/dev/null count=1 iflag=direct skip=268435455

Если это 4-секторный диск, используйте 4096 для bs= вместо 512. Это должно выдать ошибку. Если это так, напишите это с нулями:

sudo dd if=/dev/zero bs=512 of=/dev/sdb seek=268435455 count=1 oflag=direct

Дважды проверьте команду, прежде чем нажать Enter; если вы не поняли это правильно, вы можете уничтожить данные.

Повторите это для каждого из секторов в журнале ошибок, затем снова проверьте состояние SMART. Число в ожидании должно уменьшиться. Если перераспределенное количество увеличивается, то сектора были физически повреждены, и вы должны заменить диск. Если нет, все должно быть в порядке. Вы можете попробовать запустить длинный SMART самотест, чтобы найти больше поврежденных секторов.

Вы уже сделали все, что нужно для ремонта диска. SMART - это система мониторинга, которая является функцией контроллера жесткого диска, поэтому единственное, что делает операционная система, это отображает данные, собранные системой SMART. Вы не можете сбросить его, поэтому, если SMART обнаружил что-то, что считается неправильным, оно запомнится навсегда. Обнаруженные SMART ошибки не обязательно являются признаком неисправного диска, однако, возможно, что-то действительно не так. В любом случае убедитесь, что вы создаете хорошие резервные копии, которые вы должны делать в любом случае.

Другие вопросы по тегам