Программный RAID 5 Disk Failure

Мне понадобится помощь специалиста - бесплатное пиво / кофе всем, кто поймает меня на моем пути!

Моя система Я использую Ubuntu 11.10 с программным обеспечением RAID 5 на 3 диска, с жесткими дисками 3 ТБ в формате ext4.

Что я сделал Я недавно проверил работоспособность дисков в Дисковой утилите и обнаружил, что на двух моих дисках были повреждены сектора. Все работало нормально, но я немного волновался. Когда я посмотрел на mdadm --detail, я увидел, что один из дисков вышел из строя, а рейд работал ухудшенным. Однако один из дисков с несколькими сбойными секторами фактически не сообщал о сбое mdadm.

Я купил новый жесткий диск и следовал инструкциям по замене неисправного диска в конфигурации программного обеспечения RAID 5. (Я пометил диск как сбойный, удалил его, выключил компьютер, заменил его, разбил на разделы новый диск и добавил его обратно в RAID). Процесс почти завершен (я думаю), но когда я снова просмотрел подробности mdstat, все выглядело намного хуже, чем было раньше.

Что у меня сейчас

Вот вывод команды mdstat --detail /dev/mda127

root@mediapc:/home/jason# mdadm --detail /dev/md127 
/dev/md127:
        Version : 1.2
  Creation Time : Sun Mar 10 08:57:16 2013
     Raid Level : raid5
     Array Size : 5860530176 (5589.04 GiB 6001.18 GB)
  Used Dev Size : 2930265088 (2794.52 GiB 3000.59 GB)
   Raid Devices : 3
  Total Devices : 3
    Persistence : Superblock is persistent

Update Time : Sun Mar 16 06:48:06 2014
      State : clean, FAILED
Active Devices : 1
Working Devices : 2
Failed Devices : 1
Spare Devices : 1

     Layout : left-symmetric
 Chunk Size : 512K

       Name : mediapc:127  (local to host mediapc)
       UUID : ffbed825:f397afb1:86535cd8:64f8c314
     Events : 373600

Number   Major   Minor   RaidDevice State
   0       8        1        0      active sync   /dev/sda1
   1       0        0        1      removed
   2       0        0        2      removed

   3       8       32        -      faulty spare   /dev/sdc
   4       8       17        -      spare   /dev/sdb1

Мой недавно добавленный диск (dev/sdb1) был добавлен как запасной. Раздел, который сообщал о некоторых проблемах сектора (в Дисковой утилите), но работал нормально в RAID, теперь сообщает как неисправный резерв.

Я почти уверен, что все / большинство данных все еще присутствуют, у меня просто нет возможности добраться до них. Я куплю больше дисков (внешних), если у кого-нибудь есть идея, как вернуть мои данные или как снова запустить мой рейд, если это вообще возможно.

Я хотел попытаться исправить сектора на теперь неисправном резервном диске (/dev/sdc), но fsck завершился ошибкой несколькими способами:

root@mediapc:/home/jason# fsck /dev/sdc
fsck from util-linux 2.19.1
fsck: fsck.linux_raid_member: not found
fsck: Error 2 while executing fsck.linux_raid_member for /dev/sdc

ИЛИ ЖЕ:

root@mediapc:/home/jason# fsck /dev/sdc1
fsck from util-linux 2.19.1
e2fsck 1.41.14 (22-Dec-2010)
fsck.ext4: Device or resource busy while trying to open /dev/sdc1
Filesystem mounted or opened exclusively by another program?

Я попытался добавить оба диска обратно в массив, как они есть, но оба не смогли добавить:

root@mediapc:/home/jason# mdadm --add /dev/md127 /dev/sdb1
mdadm: Cannot open /dev/sdb1: Device or resource busy

Я пытался найти способ запустить fsck, но я не хотел перезагружать систему, пока не убедился, что это был следующий правильный шаг.

На самом деле ищет помощь специалиста. Мне нужны мои данные, и я хочу, чтобы этот RAID 5 работал, но в первую очередь мне нужны данные. Заранее спасибо. Дайте мне знать, если есть что-то еще, что я могу предоставить.

С уважением, Джейсон

1 ответ

Вам нужно будет umount RAID-массив, прежде чем вы сможете запустить fsck на любом из устройств, которые являются его частью.

Я действительно надеюсь, что у вас есть резервная копия, потому что, похоже, вы собираетесь потерпеть крах.
Попытка восстановления после сбоя одного диска увеличивает вероятность сбоя других дисков в массиве, поскольку нагрузка на них увеличивается во время восстановления. (ссылка: http://www.zdnet.com/blog/storage/why-raid-5-stops-working-in-2009/162)

Другие вопросы по тегам