Поговорим о восстановлении массивов RAID наиболее простыми методами

Эта статья будет посвящена принципам восстановления данных из RAID массивов. Мы рассмотрим так называемые «простые» случаи, в которых используются методы, доступные практически каждому и не требующие особо глубоких знаний в области компьютера. Случаи, относимые к «сложным», слишком сильно отличаются друг от друга, и каждый из них требует индивидуального подхода. Именно поэтому мы не видим смысла описывать их все в рамках этой статьи. Тем не менее, можно обсудить каждую конкретную ситуацию в специально отведенных для этого ветках форумов.

ОСТОРОЖНО!!! Если потерянная вами информация важна невероятно, а Вы совсем не являетесь профи в областях восстановления данных, то очень рекомендуем вам сразу обратиться в соответствующую компанию, и не пытаться что-то исправить самостоятельно, ведь всего один неверный шаг способен уничтожить требуемую информация навсегда.

Но если дальнейшая судьба данных волнует Вас гораздо меньше, нежели желание попробовать восстановить их самостоятельно, тогда эта статья именно для Вас.

Мы обязаны упомянуть RAID контроллеры, коих сегодня выпускается великое множество, и разброс цен которых колеблется от двадцати тысяч рублей до пары тысяч долларов. Конечно, сравнение надёжности — это вопрос сложный, но суметь догадаться, что ценовые отличия «не просто так», думаю, сможет каждый.

Контроллеры самого низкого уровня, имеют наиболее упрощенный алгоритм производимой работы и восстановления после сбоев. Это выражается в заметно большей вероятности потери важной информации. Дорогие модели отличаются гораздо более заметной надёжностью, их алгоритмы обработки ошибок, несомненно, более совершенны, тем не менее, и они не совершенны.

RAID массив, разумеется, не может являться панацеей от утери информации. Да и практика наглядно показывает, что случаются и сбои, причем как в работе самого контроллера, так и сбои в работе ваших жестких дисков, или же одно абсолютно закономерно вытекает из другого. Так или иначе, если вы целиком и полностью положились на высокую надёжность массивов и не позаботились о резервных копиях, Вы сильно рискуете в один прекрасный день остаться без «надежно и бережно хранимой» информации.

Кстати, вероятность потери данных при этом можно заметно сократить, регулярно отслеживая состояние своих массивов и выполняя регулярные профилактические работы, но, к сожалению, так полностью свести к нулю опасность не получится.

Причины выхода из строя рассматриваемых массивов

Самой распространённой причиной из всех для выхода из строя массивов является халатность сисадминов, которые рассчитывают на то, что «молния не бьет 2 раза в одно место». Допустим, во время работы, например по системе RAID 5, «вылетает» один из дисков. Весь массив еще продолжает функционировать, хотя и с весьма заметным уменьшением скорости. Когда системный администратор, заметит такой сбой в работе, он обычно не очень-то спешит предпринимать какие-нибудь активные действия и рассчитывает, что весь массив пусть даже в таком виде еще сумеет проработать еще некоторое время. Порой это оказывается серьезным заблуждением.

Когда у Вас «вылетает» из строя диск, оптимальным решением будет немедленное резервное копирование особо ценных данных, а потом, заменив один накопитель, произведение ребилда массива.

Почему бэкап так необходим? Ответ прост — при попытке ребилда, иногда происходит «зависание» процесса. Чаще всего это происходит, когда в процессе чтения или записи на одном из ваших дисков система находит так называемый бэд-блок, и контроллер перестает вычитать информацию из этого сектора. Результатом длительного, нудного и бесполезного ожидания является перезагрузка сервера. После же выясняется, что массив «сошел со стапелей». Зависание в этих случаях связано с совершенно некорректной обработкой исключительной ситуации. Обычно, описанное явление гораздо более характерно для простых и дешевых моделей контроллеров, хотя встречается даже и при регулярном и вдумчивом использовании вполне дорогого «железа».

Другой очень распространённой причиной внезапного отказа массивов, можно назвать одновременный переход одного или нескольких дисков в off-line. Практика показала, наиболее велика вероятность такой ошибки при работе SMART, или накопления большого количества бэд-блоков. До тех пор, пока их число не превысит определённого значения, ваш диск работает вполне корректно, но вот в один прекрасный (или не очень) момент массив отказывается запускаться. Вроде бы все и хорошо, и диск, если судить по звуку, стартует нормально, и контроллер его определяет правильно, но непонятно, почему же статус диска остается off-line. Все это из-за того, что у контроллера не получается считывать нужные данные с диска, либо, при диагностике SMART, он определяет диск как «умерший».

Можем привести ещё множество разных примеров в работе массивов, но как поступить, если это все же свершилось? Необходимая информация потеряна, а её очень необходимо восстановить.

Теория

Сейчас чаще всего используют массивы разных уровней- 0, 1, 10, 5, 50, а в последнее время можно наблюдать все более возрастающий спрос на шестой уровень.

Ниже мы привели краткую информацию об основных принципах работы массивов. Если хотите знать больше — прочитайте в соответствующей теме.

RAID 0 – это использование принципа чередующейся записи (страйп). Строится он из двух или более накопителей, а информация запоминается на все диски вашего массива своеобразными блоками, которые вмещают определенный, например 8,16,32,64 или 128кб, размер данных.

По причине отсутствия избыточности и дублирования данных, при поломке одного из дисков, «отбэкапить» информацию полностью невозможно без использования данных неисправного диска. Исключение будут составлять лишь те файлы, размер которых сравнимо меньше размера блока. А для полноценного же восстановления информации в подобных случаях требуется сначала снять информацию с неисправного диска и только после этого восстанавливать RAID.

В случаях же, когда все ваши диски исправны, но массив отказывается корректно отображаться, восстановление обязательно должно производиться программными методами, варианты которых нами описаны ниже.

RAID 1 – так называемое, использование технологии зеркал. Строится массив из двух дисков, причем информация пишется одновременно на первый и второй накопитель, а каждый из дисков является полной копией собрата. В случае, когда вылетает один из дисков массив все равно остается работоспособным.

Если же происходит сбой работы контроллера, а наш массив перестает быть определяемым, то требуемое восстановление данных вполне можно выполнить, следуя простым советам, отраженным в статье «Простое восстановление данных».

RAID 10 – способ заключается в объединении уровня 0 и уровня 1, то есть два страйпа объединяются нами в зеркало. Этот массив использует как минимум 4 диска. Он останется работоспособным даже при отказе одного из составляющих RAID 0.

Когда возникают проблемы, вам в наипервейшую очередь необходимо узнать и понять, с чем именно в компьютере возникли проблемы – с вашим контроллером или же с дисками.

Если проблема лежит на уровне контроллера, то Вам стоит определить, какие винчестеры могут являться парами, которые составляют страйпы. Тут важно не спутать диски, так как это приведет к потере времени и к полному отсутствию результата. Сразу же после того, как вам станет это ясно, берем одну такую пару, и с неё снимаем информацию таким же способом, как и с самостоятельного RAID 0.

За время эксплуатации RAID 10, иногда случается, что вылетают сразу два диска. Тут возможны следующие варианты:

      1) диски принадлежат одному страйпу, а контроллер корректно обрабатывает свою исключительную ситуацию, массив продолжает функционировать абсолютно нормально.
      2) диски принадлежат одному страйпу, но, тем не менее, массив разваливается. Тут надо взять исправный страйп, а затем программно собрать. Мы скажем как, но ниже.
      3) оба диска приписаны к разным страйпам, причем в одном из них цел первый накопитель, а в другом второй. Попытайтесь программно собрать RAID 0 из них.
      4) Выпали одноимённые диски с разных страйпов. К сожалению, один из сломанных дисков вам придётся починить, или каким-нибудь ещё образом извлечь данные. Затем сборка программным путем.

    RAID 5 – это массивы с контролем четности. Главным его достоинством будет являться распределение блоков информации, а также контрольных блоков четности равномерно по всем дискам массива. Чтобы создать такой массив требуется как минимум три диска. При этом объём массива должен быть равен сумме объёмов составляющих накопителей, за вычетом одного диска. Блоки контроля чётности обычно используются для вычисления какой-то недостающей информации, в ситуациях, когда выходит из строя один из накопителей, которые составляют массив. Так, при потере одного из дисков информация не теряются, а массив способен продолжать работать.

    Но, случается иногда и такое, что после умирания одного накопителя, контроллер начинает неверно обрабатывать исключительную ситуацию, а массив перестает нормально работать, либо совсем «падает». Похожий сбой может возникнуть еще и во время выполняемого сразу после замены диска необходимого перестроения массива. И тогда, вскоре после смерти первого диска, умирает и следующий диск.

    Когда же массив не работает, а количество неисправных дисков насчитывает не более одного, то его вполне можно собрать программно, по аналогии со сборкой RAID 0. Тогда при выходе из строя сразу двух накопителей, вам сначала потребуется восстановить полную работоспособность, или же перевести информацию на исправный диск, согнав из одного на другой, а лишь затем можно заниматься сборкой массива.

    Практический курс или то чего делать не стоит

    Упомянем и то, чего совсем уж не стоит делать, для окончательной потери данных.

    Во первых, не стоит лепить новый массив, составляя его из старых дисков в ожидании запуска. Это может быть и сработает, но достаточно высока и сильна вероятность того, что ваш контроллер выполнит действия, которые могут привести к необратимому уничтожению данных.

    Как еще можно повредить массив? Например, запуском чекдиска можно или чего-то еще подобного. Вообще лучше всего помнить, что при потере информации на RAID требуется отказаться от записи на диски. Когда Вы не знаете на 100%, приведут ли определенные поползновения к утрате информации, лучше либо проконсультироваться у того, кто знает, либо отказаться от выполнения.

    Способы восстановления

    Основным способом восстановления с RAID является сборка образа массива. То есть при помощи программ блоки разных дисков выстраиваются точно в нужной последовательности и порядок блоков массива зависит лишь от расположения ваших дисков на каналах, а также от алгоритма работы непосредственно контроллера.

    Перед тем как приступать к работе, вам стоит создать клоны абсолютно всех дисков, которые участвуют в процессе, чтобы обезопасить себя и свой компьютер от неверных действий. Эти копии можно сделать и в виде файлов, и на другие накопители.

    С чем работать- с копиями или с оригиналами – решать только Вам. Я же настоятельно рекомендую, не использовать в работе оригинал, т.к. когда на исходных носителях расположены нечитаемые или нестабильные сектора, работа с ними может очень серьезно ухудшить их положение или привести отказу.

    Итак, мы приступаем.

    Для собирания массива, вам необходимо знать исходные параметры. Это размер блока и порядок последовательности дисков.

    Когда они Вам известны, можно считать, что большая половина работы сделана, и нами было сбережено много время для других, гораздо более приятных дел. Если же нет, то нам придётся их подобрать.

    На наше счастье существуют автоматические средства, которые ищут конфигурации и восстановления RAID, например, программа RAID Reconstructor. При задаче ей уровня массива, она будет пытаться найти изначальную последовательность дисков и размер блока, а также предположит алгоритм для записи информации на диски.

    Продолжим. Алгоритм мы нашли. Дальше вариантов несколько — это переписка образа массива в файл, запись его на диск или создание файл виртуального образа. Что выбрать – решать только Вам.

    Еще есть вариант, использования знаний о расположении дисков, об алгоритме записи и о размере блока. Так мы можем восстановить RAID, используя только программу UFS Explorer.

    Если массив собран правильно, а файловые системы, которые находятся на нём, не содержат логических повреждений, Вы сможете получить полный доступ этими стандартными способами. Например, если образ уже скопирован на жесткий диск, вам будет достаточно всего лишь подключить его к компьютеру, а потом перезагрузить ОС.

    Напомню, что изложенным способом можно восстановить систему RAID, но исключительно в самых простых случаях, а сложные ситуации выходят за рамки этой статьи, и подразумевают наличие спец. знаний.

    Аппаратное восстановление

    Приемлемой альтернативой созданию образа является аппаратная сборка. Оговоримся сразу – без должного понимания алгоритма работы контроллера или без наличия в запасах резервной копии всех дисков вашего массива, пользоваться данным методом мы категорически не советуем, так как можно так изменить диски, что никаких данных с них вы уже не получите, даже если обратитесь к профессионалам.

    Приведённая ниже информация даётся лишь ознакомительных целях, а не как руководство к действиям.

    Суть методы — в том, что массивы пересоздаются на контроллере заново, а конфигурация полностью аналогична прошлой.

    ОСТОРОЖНО! Если при работе будет запущен ребилд, есть очень большая вероятность полной потери данных.

    Некоторые же модели контроллеров сразу после создания нового массива начинают автоматически выполнять инициализацию, а это тоже может привести к потерям.

    Когда все диски вашего массива были полностью исправны, была вероятность получения обратно информации без использования каких- либо дополнительных действий. Также не исключаем, что файловая система окажется частично поврежденной.

    В случаях же с массивами 5 уровня, когда один из ваших дисков неисправен, есть вариант создания массива с заменой диска испорченного на аналогичный, но исправный.

    В результате, мы получаем вероятность возможности получения доступа к своим данным сразу же, либо через использование программ логического восстановления информации.

    Итоги

    В заключении отметим ещё раз – если важность данных для вас очень велика, отложите эксперименты, и обратитесь к специалистам.

    Напоминаем, какие действия необходимо производить для профилактики:

        1.Следует сразу запомнить простую истину — неправильные действия являются самой опасной угрозой для ваших сохраненных данных. Если же вы не в состоянии добраться до нужной информации через Windows Explorer, то это ещё не означает, что она потеряна навсегда. Невосстановимую потерю информации даёт только переписывание битов, либо физическое повреждение пластин и размагничивание. В большинстве же случаев мы с вами имеем дело лишь с вышедшей из эксплуатации платой жёсткого диска или со сбоем какого-то механического компонента. Но для этих двух случаев пути восстановления будут разниться.
        2.Вы в состоянии избежать головной боли. Для этого вам необходимо правильно настроить систему, задать расписание для автоматического резервирования и регулярно следить за данным процессом. Ведь даже самые лучшие системы резервирования не спасут в том случае, когда пользователь сам не замечает многочисленные сообщения об ошибке резервирования. Стоит помнить, что системы аварийного восстановления данных иногда не помогают, поэтому старайтесь тестировать резервные копии. Например, почаще восстанавливайте данные на другой носитель и проверяйте, всё ли работает должным образом.
        3.Что же касается аппаратного обеспечения, то здесь также следует выполнять определенные действия. В случае, когда жёстких дисков у вас несколько, вам обязательно стоит пронумеровать приводы, отсеки и кабели. Старайтесь не особо доверять нумерации существующих оснасток, а также их передних панелей. Ведь она может начинаться с единицы, тогда как контроллер ведет нумерацию с нуля. Из- за того, что подобные конфигурации собираются только вручную, мы имеем потенциальный источник ошибки, вызванный человеческим фактором. Небольшая метка с номером легко может предотвратить ошибочное извлечение диска.
        4.Разумеется, мы предполагаем, что вы со всей аккуратностью обращаетесь с жёсткими дисками и что они у вас установлены только в соответствующие отсеки. Когда вы используете несколько жёстких дисков, то есть смысл установить их в съёмные блоки, которые могут снижать воздействие вибрации на системный блок и на другие винчестеры. Обязательно убедитесь, что вентиляции в системе достаточно для высокоскоростных жёстких дисков и они не перегреваются. Вам нужно обезопасить корпус компьютера от любых ударов, то есть нужно расположить его таким образом, чтобы случайно не ударить его коленом или чтобы его не касалась тряпкой уборщица. Любые сервера вообще обязаны находиться исключительно в отдельных помещениях и быть свободными от любого повседневного воздействия.
        5.Регулярно выполняйте дефрагментацию данных. Дефрагментация поможет соединить фрагменты файлов, которые были распределены по всему объему жёсткого диска, и сможет записать их единым куском. Таким образом вы получаете сразу два преимущества: и более высокую производительность и гораздо менее сложный процесс восстановления необходимых данных в случае аварии. А вот когда данные разбросаны фрагментами по всему объему испорченного жёсткого диска, то компании, занимающейся восстановлением, будет куда сложнее удачно собирать их обратно.

      Напоминаем, что все указанные в этой статье неприятности случились из-за появления ошибок в таблицах разделов или в структурах разных файловых систем. Произойти это может, например, после некорректного отключения устройства, сбоев в работе программного и аппаратного обеспечения или в результате деятельности вредоносных программ. К тому же одной из часто встречающихся причин появления подобных неполадок может стать жесткий диск, с частично вышедшей из строя поверхностью диска — возникновение «битых секторов». К несчастью, для современных устройств это не даже для новых жестких дисков, используемых в течение первых недель и даже дней.

      Помните эти простые правила и все у вас будет хорошо, ведь кто предупрежден — тот вооружен! Удачи вам на всех электронных поприщах. А если что-то все же произойдет, перечитайте эту статью и не поленитесь задавать вопросы на нашем форуме.

      источник: http://rlab.ru/doc/raid_recovery.htm


      При использовании материалов сайта ссылка обязательна! (Copyright by www.avs-info.ru 2006)