Сбой диска, fsck ничего не делает

Примечание: это началось как вопрос, но пока я набирал текст, я пробовал разные вещи и в итоге все заработало. Я все еще хотел опубликовать это в случае, если это может помочь кому-либо еще

Проблема: Разбился диск, невозможно установить. Я предполагаю, что плохой USB в моем компьютере или кабеле вызвал этот сбой.

ОС: Ubuntu 12.04 Диск: внешний массив raid 5 "4 bay soho raid", возраст около 3 месяцев. Раздел: sde1, ext4, 8.2TB Диспетчер дисков показывает диск и раздел, включая тип и другую информацию. Данные SMART отображают "Самотестирование: завершено успешно" и "Общая оценка: диск исправен".

/ и т.д. / Fstab

UUID=9540030a-323d-483f-8fdc-20dbaa09bcaf /mnt/Data    ext4    defaults,async,errors=remount-ro  0  0

гора -а

wrong fs type, bad option, bad superblock on /dev/sde1,
missing codepage or helper program, or other error
In some cases useful info is found in syslog - try
dmesg | tail  or so

lsblk

NAME   MAJ:MIN RM   SIZE RO TYPE MOUNTPOINT
sde      8:64   0   8.2T  0 disk 
└─sde1   8:65   0   8.2T  0 part 

fdisk / dev / sde -l

WARNING: GPT (GUID Partition Table) detected on '/dev/sde'! The util fdisk doesn't support GPT. Use GNU Parted.


Disk /dev/sde: 9001.6 GB, 9001613918208 bytes
255 heads, 63 sectors/track, 1094383 cylinders, total 17581277184 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00000000

   Device Boot      Start         End      Blocks   Id  System
/dev/sde1               1  4294967295  2147483647+  ee  GPT

sfdisk -l / dev / sde

WARNING: GPT (GUID Partition Table) detected on '/dev/sde'! The util sfdisk doesn't support GPT. Use GNU Parted.


Disk /dev/sde: 1094383 cylinders, 255 heads, 63 sectors/track
Units = cylinders of 8225280 bytes, blocks of 1024 bytes, counting from 0

   Device Boot Start     End   #cyls    #blocks   Id  System
/dev/sde1          0+ 267349- 267350- 2147483647+  ee  GPT
        start: (c,h,s) expected (0,0,2) found (0,0,1)
/dev/sde2          0       -       0          0    0  Empty
/dev/sde3          0       -       0          0    0  Empty
/dev/sde4          0       -       0          0    0  Empty

Dmesg | хвост

[ 9605.609668] Buffer I/O error on device sdd1, logical block 17578328274
[ 9605.609671] Buffer I/O error on device sdd1, logical block 17578328275
[ 9605.609673] Buffer I/O error on device sdd1, logical block 17578328276
[ 9605.609676] Buffer I/O error on device sdd1, logical block 17578328277
[ 9605.609678] Buffer I/O error on device sdd1, logical block 17578328278
[ 9605.609681] Buffer I/O error on device sdd1, logical block 17578328279
[ 9605.670459] Buffer I/O error on device sdd1, logical block 17578328152
[ 9605.670466] Buffer I/O error on device sdd1, logical block 17578328153
[ 9806.549854] EXT4-fs (sde1): ext4_check_descriptors: Checksum for group 0 failed (59348!=46035)
[ 9806.549859] EXT4-fs (sde1): group descriptors corrupted!

расстались / dev / sde

GNU Parted 2.3
Using /dev/sde

Welcome to GNU Parted! Type 'help' to view a list of commands.
(parted) unit TB                                                          
(parted) print                                                            

Model: HzW RAID 5 (scsi)
Disk /dev/sde: 9.00TB
Sector size (logical/physical): 512B/512B
Partition Table: gpt

Number  Start   End     Size    File system  Name  Flags
 1      0.00TB  9.00TB  9.00TB  ext4

fsck -CfDy / dev / sde1 * Примечание: я выполнил это в общей сложности 4 раза, казалось, что ошибки повторялись, и fsck фактически ничего не делал, но между каждым запуском были небольшие различия. Также по продолжительности первые 2 часа заняли, последние 2 часа или меньше.

Это описание последнего запуска:

Многое из этого: (всего 4 пробега)

Group descriptor xxxxx checksum is invalid.  FIXED.

затем около часа этого (первые 2 пробега много часов, последние 2 около часа)

Pass 1: Checking inodes, blocks, and sizes

затем эти 2 в течение нескольких секунд

Pass 2: Checking directory structure                                           
Pass 3: Checking directory connectivity

несколько минут

Pass 3A: Optimising directories

с кучей этих около 98%

free blocks count wrong for group #59104 (28640, counted=28617).
Fix? yes

в ранних прогонах я получал совершенно разные сообщения об ошибках, здесь спрашивалось, не хочу ли я проигнорировать проблему, если я ввел "нет", тогда fsck просто вполне. если я ввел "да", то получил другой вопрос, на который я ответил "да". Я получил тысячи из них, поэтому я просто прибавил вес к моей клавише [enter] и оставил ее ей (это заняло довольно много времени).

после последнего запуска я получил

Data: ***** FILE SYSTEM WAS MODIFIED *****
Data: 716082/274710528 files (2.4% non-contiguous), 1193918074/2197659639 blocks

** sudo mount -a** диск был смонтирован, но каталоги и файлы не были видны. Было написано "доступное пространство" 3,8 ГБ, что было бы примерно правильно, но я не мог видеть файлы, которые должны были быть там, занимая остальное пространство. Это были Темные Данные! (он есть и его можно наблюдать по месту, которое он занимает, но вы не можете увидеть его напрямую).

** sudo umount / mnt / Data **

fdisk -l

Disk /dev/sde: 9001.6 GB, 9001613918208 bytes
255 heads, 63 sectors/track, 1094383 cylinders, total 17581277184 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00000000

   Device Boot      Start         End      Blocks   Id  System
/dev/sde1               1  4294967295  2147483647+  ee  GPT

** sudo mount -a** ах! наконец: D диск смонтирован, и я снова вижу каталоги. Не знаю, почему это сработало на этот раз, но я не жалуюсь! Я вижу 2 потерянных + найденных каталога, один с префиксом ".". Но оба кажутся пустыми. Я решил провести сравнение с моей резервной копией.

rsync -rvnc --delete [mountDir] [backupDir]

и, конечно, я также запустил sudo diff -qr [mountDir] [backupDir]

Потребовалось время, чтобы запустить их, но, кажется, все так, как и должно быть:)

1 ответ

Решение

Правило 1. не паникуйте правило 2. оставайтесь позитивными

продолжайте запускать fsck и следите за всеми различиями, указывающими на некоторый прогресс!

Отказ от ответственности, это сработало для меня, но никаких обещаний, что это сработает для вас. каждая ситуация отличается. различные команды, которые я запускал, могут дать вам указание, если ваши проблемы с дисками похожи.

Другие вопросы по тегам