Почему ломаются жесткие диски

3. РАЗРУШЕНИЕ СЛУЖЕБНОЙ ИНФОРМАЦИИ ДИСКА.

Это одна из самых популярных неисправностей на современных HDD. Восстановление
служебной информации производится полностью программным методом, но
это отнюдь не говорит о том, что сложность работ и затраченное время
менее велико, чем, например, при электронных работах. К тому же, методы
восстановления служебной информации при простом ремонте и при восстановлении
данных кардинально отличаются, т.к. в последнем случае необходимо восстановить
служебную информацию полностью на основе лишь оставшихся частей или
разрушенных блоков-модулей. При простом ремонте служебную информацию
собирать по кускам вовсе не обязательно, т.к. есть специальная технология,
позволяющая записать полный комплект из похожей служебной информации,
например, от живого диска такой же модели, а затем запустить процедуру
полного заводского самотестирования для полной калибровки накопителя,
иначе из-за несоответствия настроек накопитель либо вообще не будет
работать, либо график скорости чтения у него будет представлять собой
эдакий "лес", что совершенно неприемлемо. Для оперативной
работы центром создана своя база служебной информации от всевозможных
моделей HDD (практически ото всех), которая постоянно пополняется. Естественно,
что информация на жестком диске при такой процедуре полностью уничтожается,
о чем сервис-центр обязательно предупреждает при любом ремонте HDD.

В случае восстановления данных, метод, описанный выше
совершенно неприемлем по понятным причинам. Восстанавливается именно
то, что разрушилось, причем это делается исключительно вручную, поэтапно,
каждый раз контролируя результаты, так как процедуру подобного восстановления
автоматизировать просто невозможно. Порой, восстановление некоторых
модулей очень трудоемко, например восстановление адаптивных настроек,
(из-за их потери или несоответствия накопитель может не то, что не читать,
а даже не позиционироваться, т.е. не видеть сервоинформацию, и как следствие
— стучать блоком головок об упор), потому что подобные процедуры полноценно
может настраивать только встроенный заводской калибратор накопителя,
при этом естественно стирается информация пользователя, т.к. необходимо
производить серию записей на диск для регулировки тока записи и подбора
соответствующего усиления для сигналов с головки. Поэтому применяется
ручной подбор, который работает, естественно, без записи, поэтому является
очень долгим.

Очень часто в служебной информации повреждается таблица
дефектов накопителя. Она записана в служебной зоне любого HDD и представляет
собой список координат дефектных или нестабильных секторов или целых
дорожкек конкретного накопителя в целях исключения попадания этих участков
в пользовательскую зону. Напомним, что повреждение служебной информации,
в основном, вызвано сбоями диска (или его питания) при записи, а часто
запись в служебную область производится постоянно, например, при обновлении
параметров SMART. Именно поэтому мы советуем ВЫКЛЮЧАТЬ от греха подальше
включенный на заводе SMART, хотя это не всегда приводит к нужным результатам,
так как анализ фрагментов микропрограмм от некоторых моделей HDD явным
образом указывает на то, что иногда накопитель все равно обновляет служебную
область SMART, даже если он находится в выключенном состоянии. Видимо,
это банальная недоработка программистов. Загрузить утилиту, с помощью
которой можно поглядеть параметры SMART Вашего накопителя, а также,
отключить SMART можно здесь.

Ну а запись в таблицу дефектов может происходить в
момент автоматического переназначения сбойного сектора (т.н. REMAP,
процесс абсолютно прозрачен для пользователя). Соответственно, при нестабильной
работе системы в целом можно получить yепредсказуемые результаты. Например,
при повреждении таблицы дефектов мы полностью теряем карту расположения
сбойных участков диска, соответственно, если эту таблицу теперь обнулить
или записать чистую — доступ к данным просто невозможен, т.к. оказывается,
что многие сектора или группы секторов на диске перемешаны, так как
изначально таблица формируется на заводе изготовителе (да, именно так,
на любом диске УЖЕ есть дефекты, даже если он только что вышел с завода,
об этом в другом обзоре). Соответственно, первоначальная запись данных
пользователем происходит именно с учетом первичной таблицы. Разумеется,
нет смысла говорить, что содержание таблицы абсолютно уникально для
любого HDD.

Осталось упомянуть про симптомы подобных неисправностей.
Они могут быть самые разные. Рассмотрим основные.

1. Отсутствие нормальной рекалибровки накопителя при
включении питания. Процесс устроен так, что накопитель сначала считывает
большую часть жизненно важной служебной информации для того, чтобы настроиться
на дальнейшую нормальную работу. В случае повреждения служебных модулей
накопитель прерывает рекалибровку, но не останавливает шпиндельный двигатель.
Доступ к такому накопителю возможен только в технологическом режиме,
в пользовательском же будет выдаваться ошибка определения параметров
в BIOS.
2. Рекалибровка нормальная, но название модели или параметры накопителя
не соответствуют реальным. При этом в названии модели не присутствуют
непонятные символы, как например это бывает при неисправности интерфейсной
шины. Например, частый случай с "тонкими" Maxtor, когда модель
при детекте называется Maxtor ATHENA вместо 2В020Н1. Подобные названия
моделей являются внутренними названиями семейств накопителей среди разработчиков
служебного программного обеспечения диска (FirmWare). Таким образом,
если накопитель отдает такое название, это означает, что накопитель
переключился в специальный безопасный режим, в котором также можно работать
только с помощью технологического режима диска. А в безопасный режим
накопители переключаются только при неисправности служебной информации.

3. Надпись "Primary master harddisk fail". эта надпись выдается
при старте компьютера и свидетельствует о невозможности считать с диска
нулевой сектор с таблицей разделов. Обычно при этом рекалибровка проходит
нормально и накопитель корректно детектируется BIOSом, но из-за разрушения
таблиц дефектов накопитель заблокировал доступ к данным.

Несмотря на то, что мы всегда советуем в случае важности
Ваших данных не предпринимать самостоятельные попытки лечения и не относить
его в фирмы, не специализирующиеся на ремонте дисков, в данном случае
можно отметить, что восстановление служебных модулей происходит только
программным способом. А при этом любые программные эксперименты пользователя
с диском практически полностью безопасны, так как из доступных программ
нет ничего, что может позволить войти в технологический режим накопителя,
т.к. накопитель как бы закрыт. Исключение составляют некоторые виды
программного обеспечения, которое можно встретить на сайтах фирм-производителей
HDD. В основном это относится к так называемым обновлениям Firmware,
т.е. микропрограммы накопителя, являющейся частью служебной информации,
и служащим для устранения каких-либо недочетов и ошибок в программе
диска. Несмотря на то, что эти программы не используют технологические
режимы накопителя, с помощью них косвенно возможна перезапись служебной
области диска, что может привести к совершенно непредсказуемым последствиям,
если эта самая область была до этого повреждена. Хотя, стоит признать,
что в подобных программах производители встраивают тщательную предварительную
проверку работоспособности диска и в абсолютном большинстве случаев
программа откажется выполнять процедуру обновления, если обнаружена
хоть одна неполадка в служебной зоне накопителя или в его электронике.

Также хотим предупредить, что перезапись служебной
области происходит при переключении режимов UDMA накопителя с помощью
специальных утилит, которые многие производители также выкладывают на
своих сайтах. Поэтому будьте осторожны. К тому же, переключение режима
UDMA — операция, которую , в основном, делать просто не нужно даже на
исправных накопителях. Причины просты. Дело в том, что изначально на
заводе накопитель устанавливается в режим максимального трансфера, а
если vатеринская плата включает меньший режим, то это говорит только
о том, что есть проблемы с чипсетом (устаревшая модель платы или драйвера),
либо о том, что у Вас накопитель подключен 40-жильным интерфейсным кабелем,
если речь идет об UDMA mode 4 или mode 5 (UDMA66 и UDMA100 соответственно).
Накопители, поддерживающие такие режимы необходимо подключать только
80-жильным кабелем (разумеется, если материнская плата тоже поддерживает
эти режимы контроллера).

4. ФИЗИЧЕСКОЕ ПОВРЕЖДЕНИЕ ДИСКА ИЛИ ЕГО МЕХАНИЧЕСКИХ
УЗЛОВ.

Так как механическая часть HDD, особенно при современных плотностях,
довольно нежна, подобные неисправности также встречаются довольно часто,
и далеко не всегда механические повреждения происходят из-за естественного
износа накопителя, хотя он тоже имеет место быть. Рассмотрим популярные
неисправности, связанные с поверхностью диска.

Бэд-блоки, или плохие, сбойные сектора. Как правило,
пользователь узнает от них несколькими путями. Например, решив сделать
профилактическую проверку диска с помощью программ, наподобие этой,
или запустив в системе новый чистый накопитель и отформатировав его,
получив при этом сообщение о сбойных кластерах, либо когда ни с того
ни с сего "слетела" система и выдает ошибку, свидетельствующую
о невозможности дальнейшей загрузки.

Сектор считается сбойным, если контроллер винчестера
выдал какую-либо ошибку на команду его чтения, а ошибка в дальнейшем
была зафиксирована либо функциями BIOS, если накопитель тестируется
и работает в ОС, либо специальными утилитами, которые , как правило
работают помимо биоса, напрямую через порты контроллера. Ошибка эта,
в свою очередь, чаще всего вызвана несоответствием ЕСС сектора. Реже
— сбоями сервосистемы. Аббревиатура "ЕСС" наверняка знакома
Вам, если Вы относительно давно вращаетесь в компьютерных кругах. Расшифровывается
как Error Correction Code. Представляет из себя сложный алгоритм, с
помошью которого повышается вероятность сохранения данных в секторе,
если, например, повреждена незначительная его часть. Для осуществления
этого алгоритма каждый физический сектор, хранящийся на диске, занимает
на самом деле не 512 байт, а несколько больше. Ошибка ЕСС, в свою очередь,
в основном вызвана физическим повреждением участка диска, где расположен
этот сектор. Это может быть, например, радиальный отрезок, длиной всего
0.1 мм. Повреждения могут возникнуть отчего угодно, от попавшей в гермозону
микрочастицы, от удара или оттого, что головка записи постепенно деградирует,
соответственно, неточно записывая информацию, искажая сигнал.

Статистика показывает, что обычно подобные дефекты
не прогрессируют. Причина проста — среди всех разновидностей повреждений
поверхности большинство из них не связаны с образованием микрорельефа
на защитном слое пластины (от которого, в последствии, возможно задирание
головки), а представляют из себя участки, у которых просто-напросто
изменились магнитные свойства. Поэтому технология ремонта , т.е. скрытия
плохих участков, основана на занесении физических координат дефектных
секторов в заводскую таблицу дефектов с последующим заводским внутренним
форматированием. Это основной принцип. На практике нами применяется
технология заводского самотестирования, которая досконально проверяет
весь накопитель и заносит в таблицу дефектов не только текущие, но и
прогнозируемые дефекты. Также, выясняется, по возможности, причина возникновения
дефекта и с накопителем перед пост-тестированием проводятся профилактические
работы во избежание дальнейшего выхода из строя.

Если ошибка ЕСС возникла в следствие сбоя сервосистемы,
то это уже серьезнее. Кстати, при этом, кроме ЕСС ошибки контроллер
выдает еще и более серьезные знаки, которые не обрабатываются BIOS,
а наблюдаемы только в программах для низкоуровнегого тестирования HDD.
Обычно это означает физическое повреждение дорожки или микроцарапины
на ней и сопровождается посторонними звуками при позиционировании, например
легкое гудение, скрежет или стук. Скрыть при этом дефектный трэк также
возможно, но специалисты центра в этих случаях предупреждают, что на
диске есть физические повреждения и присутствует вероятность выхода
из строя в дальнейшем. Хотя, все зависит от результатов углубленной
диагностики. Иногда бывает так, что подобные дефекты вызваны вовсе не
физическими разрушениями поверхности а расстройкой адаптивных параметров
калибровки, которые, в свою очередь, можно восстановить с помощью специальных
средств. Стереть сервоинформацию программными методами без модификации
микропрограммы диска невозможно. Даже из-за сбоя в питании подобное
не может произойти, т.к. схема аппаратно защищена и стереть сервометки
также возможно только при аппаратной модификации электроники.

Стоит ли бить тревогу при появлении дефектных секторов
— зависит от углубленной диагностики. Если же на диске важные данные
— крайне рекомендуем срочно сделать их BACKUP на другой носитель.Следующий
симптом физических повреждений — смещение пакета дисков в следствие
удара накопителя, т.е. превышения максимально допустимой перегрузки.
При этом сервосистема полностью расстаривается и чаще всего просто неспособна
вообще позиционироваться на трэке из-за биений. При этом накопитель
может срываться в стук. Опровергнем популярное заблуждение, что при
смещенном пакете дисков возникает дополнительная вибрация, которую можно
ощутить даже держа накопитель в руках. Это в корне неверно. Закреплен
диск на оси очень прочно, поэтому даже сильным ударом его нельзя сдвинуть
на расстояние, в следствие которого возникнут ощутимые биения. Ширина
дорожки в современных дисках составляет около 1 микрона, поэтому для
расцентровки достаточно самое мизерное механическое смещение, которое
"руками" ощутить просто невозможно. Диагностика расстройки
системы в данном случае может осуществляться только электронными приборами,
хотя на некоторых моделях HDD возможен программный контроль (если накопитель
вышел в готовность и не стучит).

Симптом номер три — выход из строя головок. Многие
головки представляют из себя сложную микроконструкцию, катушки записи
во многих случаях выполнены микротравлением, а читающий элемент — магнито-резистивный,
также состоящий из напыления композитного материала-проводника. Из-за
работы в повышенном температурном режиме, трения при парковке и прочих
факторов конструкция легко уязвима и выходит из строя, иногда постепенно.
Таким образом, чем больше головок в Вашем накопителе, тем больше вероятность
выхода из строя одной из них.

Проявляется дефект простой неспособностью читать или
писать, причем, в отличие от локальных физических дефектов неспособность
чтения проявляется по всей поверхности, т.е. в любом месте диска. Если
в накопителе больше одной головки, то организация их переключения при
последовательном чтении варьируется, но в основном у многих накопителей
она выполнена "змейкой", т.е. сначала читаются трэк 0 по головке
0, потом по головке 1, затем трэк 1 по этой же головке и только потом
трэк 1 по нулевой головке и так в цикле, пока трэки не кончатся 🙂 Таким
образом, при одной неисправной головке и одной исправной тест поверхности
будет постоянно вставать и идти рывками — у ремонтников на это есть
жаргонное выражение — "сыпет голова".

Иногда повреждается не сама головка, а ее слайдер —
опора, непосредственно контактирующая с поверхностью диска во время
парковки, а форма ее оптимально подобрана для того, чтобы при работе
диска образовывалась воздушная подушка с нужным зазором и головка физически
не касалась диска, иначе, понятное дело, диск мгновено будет испорчен.
Слайдер может стачиваться о парковочную зону, где для значительного
ослабления трения нанесена специальная полимерная смазка или микрорельеф
с помощью лазера. Поэтому переносить винчестеры в карманах и сумках
нужно крайне осторожно, т.к. при ходьбе диск работает как маятник, постепенно
стачивая слайдер, хотя и незначительно. В любом случае подобное укорачивает
жизнь накопителя. В этом плане чрезвычайно удобны накопители, у которых
система парковки головок реализована так, что они паркуются за пределами
диска на специальный держатель-защелку и если диск в выключенном состоянии,
головки вообще физически не контактируют с поверхностью. Подобный механизм
берет начало от накопителей для NoteBook, т.к. там приходится постоянно
"усыплять" накопитель в целях сокращения потребления электроэнергии.
Поэтому переносить подобные накопители совершенно безопасно. Например,
подобный механизм есть практически во всех моделях IBM.

К слову, дополнительно упомянем про "усыпление"
накопителя, режима, в котором он практически не потребляет электроэнергии
и не издает никаких шумов из-за того, что после подачи операционной
системой соответствующей команды диск производит парковку головок и
останавливает шпиндельный двигатель. Как мы уже упоминали, этот режим
больше всего нужен в автономных устройствах. В настольных же или домашних
системах накопители к такому режиму совершенно не приспособлены, и,
надо заметить, переносят его не очень хорошо. В основном это связано
с особенностью механизма парковки головок и его электронного управления.
В штатном режиме при выключении питания электроника HDD использует кинетическую
энергию дисков вместе с двигателем как генератор тока, силой которого
головки перемещаются в безопасную зону, т.е. запарковываются. При этом,
диски останавливаются довольно быстро, не нанося ощутимых повреждений
головкам от трения. В случае программного останова двигателя, как это
происходит при "засыпании", электроника просто отключает двигатель
и паркует головки за счет тока на шине питания, поэтому двигатель еще
довольно долго продолжает вращаться (раза в 2-3 дольше, чем при штатном
выключении), соответственно, повышается износ головок. В следствие этого
мы настоятельно рекомендуем НЕ использовать режим энергосбережения и
отключить его после установки Windows, которая включает его по умолчанию.
К тому же, форма слайдера при стачивании может меняться, и при полете
может возникнуть самый натуральный крен, который может привести к быстро
прогрессирующей физической царапине на диске. Именно поэтому мы рекомендуем
лишний раз НЕ ВКЛЮЧАТЬ отказавший накопитель, если на нем есть важные
данные — легко может получиться так, что в следующий раз накопитель
не отрекалибруется а застучит — такое мы наблюдали неоднократно.

Еще у накопителей бывает неисправность, при которой
двигатель сильно гудит или вибрирует, а то и вовсе заклинивает и не
вращается. Происходить такое может от удара, либо от банального заводского
брака. Часто в таких случаях бывает, что разрушаются подшипники или
появляются выщербины на их шариках и, как правило, подобные неисправности
не поддаются ремонту. Но в случае восстановления данных с такого накопителя
у специалистов центра есть технология, позволяющая переставить диск
в исправную гермозону и в последствии откалибровать положение диска.
Но подобная процедура очень сложна и стоимость восстановления данных
в таком случае получается несколько дороже стандартного тарифа из-за
того, что отсутствует 100 процентная гарантия успеха. То же самое можно
сказать и про перестановку головок от исправного диска — для этого исправный
донор оплачивается клиентом.

Также, у всех без исключения накопителей часто втречается
следующий симптом — накопитель издает громкий монотонный стук при распарковке,
или при обращении к определенным участкам диска. В последнем случае
можно практически смело утверждать, что на поверхности диска присутствуют
физические повреждения или царапины, которые могут прогрессировать при
каждом включении питания. В первом же случае неисправность нельзя однозначно
классифицировать без применения углубленной диагностики. Стук возникает
из-за того, что головка не может позиционироваться на трэке и продолжает
искать сигнал далее, доходя до упора и издавая при этом звон. Не находить
сигнал сервосистема может по нескольким причинам. Вот основные из них,
расположенные в порядке приоритета, т.е. статистики выхода из строя.

1. Неисправность читающего элемента головки. Подобное
может возникать из-за банального износа головки или ее слайдера. Раньше,
на старых накопителях еще бывало, что слайдер головки попросту загрязнялся
ферромагнитным составом от покрытия диска, в следствие чего головка
теряла свои аэродинамические характеристики. При этом меняется воздушный
зазор между слайдером и поверхностью и сигнал сильно искажается, не
поддаваясь коррекции.
2. Неисправность коммутатора головок — микросхемы, расположенной непосредственно
на позиционере. Подобное может возникать, как правило, только в двух
случаях. Первый — это неисправность питания накопителя (блока питания
компьютера). Даже кратковременное превышение питающего напряжения в
1.5 раза иногда достаточно, чтобы коммутатор вышел из строя. Также при
этом выходит из строя контроллер накопителя. Второй случай — длительный
перегрев, т.е. работа без охлаждения. Такое сильно сказывается, в основном,
в жаркий климатический период. К тому же, гермозона диска при активной
работе может сильно нагреваться (варьируется у разных моделй HDD) из-за
микросхем на плате контроллера и из-за сильного нагрева самой катушки
позиционирования.
3. Несоответствие или потеря адаптивных настроек или физической конфигурации
накопителя реальному. Такое в основном бывает, если настройки записаны
в энергонезависимую память в контроллере накопителя, а родной контроллер
утерян или вышел из строя. Подобное часто имеет место быть в случае
с Fujitsu MPG или любыми IBM. Иногда эффект стука можно получить, если
неграмотно перезаписать служебную информацию диска или в последствии
не произвести полную калибровку и специальные заводские тесты.
4. Расцентровка, т.е. смещение дискового пакета. Об этом мы упоминали
выше.
5. Неисправность контроллера диска. Такое, по статистике, бывает чрезвычайно
редко и легко диагностируется с помощью временной замены контроллера,
хотя на некоторых моделях HDD это делать совершенно не имеет никакого
смысла и даже опасно, но об этом в другом обзоре.

В заключение хочется призвать пользователей НЕ ВСКРЫВАТЬ
гермоблок накопителя самостоятельно, ибо в большинстве случаев вскрытие
без специальных средств кардинально ухудшает работу накопителя или делает
его вообще неремонтопригодным. Есть накопители, которые выходят из строя
сразу-же при снятии крышки. В наш сервисный центр нередки обращения
пользователей с накопителями, на которых имеются явные следы вскрытия,
и практически во всех случаях специалисты центра сделать с таким диском
ничего не могли или покупали диск на запчасти. Хотя на многих таких
дисках устранение неисправности вскрытия вовсе не требовало, и вероятность
восстановления была высокой.

Итак, мы рассмотрели основные проблемы современных
накопителей на жестких магнитных дисках и некоторые способы их профилактики.
Абсолютное большинство рекомендаций полностью применимо и к старым HDD.
Остается подвести резюме. Оно будет кратким. При обнаружении первых
признаков неисправности Вашего HDD — первое, что нужно сделать — немедленно
скопировать важные данные на другой носитель, либо, если это сделать
невозможно — хотя бы не включать лишний раз накопитель до того, как
с ним не проведут диагностику компетентные люди, которые ЗНАЮТ, что
делают. Мы уж не говорим о том, что резервную копию рабочих данных нужно
делать как можно чаще, и самое главное — независимо от подозрений на
исправность Вашего HDD. И несмотря на то, что подобные элементарные
требования зачастую не соблюдаются в силу особенностей человеческой
психологии — мы искренне желаем Вам никогда не иметь повод, чтобы стать
клиентом сервис-центра.


При использовании материалов сайта ссылка обязательна! (Copyright by www.avs-info.ru 2006)