Radeon.ru
https://forum.radeon.ru/

Бэды на RAID5. Как найти битый диск.
https://forum.radeon.ru/viewtopic.php?f=21&t=15331
Страница 1 из 1

Автор:  Dimka [ 19:05 10.11.2005 ]
Заголовок сообщения:  Бэды на RAID5. Как найти битый диск.

Вопрос в заголовке.
Подробностей мало, но могу узнать.
Есть аппаратный RAID5 из 3 70 гигабайтных дисков на сервере IBM (не помню).
Полезли бед секторы. Состояние массива нормальное, контроллер проблем не видит.
Как вычислить сыплющийся диск ?

Автор:  AndreyPopov [ 22:18 10.11.2005 ]
Заголовок сообщения: 

Dimka бэды могут быть и логические, а не только физические.

Автор:  Dimka [ 23:08 10.11.2005 ]
Заголовок сообщения: 

AndreyPopov
Похоже на физические. Массив вялый какой-то стал. Бэдов мало, но сильные. Повреждена была system32.
Функциональность восстановил легко. Полного бэкапа нет.

Вопрос в том, как вычислить умирающий, если такой там есть.

Автор:  AndreyPopov [ 23:45 10.11.2005 ]
Заголовок сообщения: 

Dimka
Массив вялый какой-то стал. — один из винтов хандрит. были у меня такие IBM SCSI — как один на шине — вопросов нет, как RAID без него — все в норме. только втыкаешь в RAID — произволительность падает раза в два.

Автор:  Dimka [ 23:55 10.11.2005 ]
Заголовок сообщения: 

AndreyPopov
Именно IBM.
Попробую вытаскивать по одному, но сначала надо хороший бэкап сделать.
К сожалению, после вытаскивания на восстановление нужно несколько часов.

Автор:  Micca [ 06:28 11.11.2005 ]
Заголовок сообщения: 

Dimka а если попробовать вытаскивать их по одному — и MHDD сотоварищи?

Автор:  seRyoga [ 11:50 11.11.2005 ]
Заголовок сообщения: 


а если попробовать вытаскивать их по одному — и MHDD сотоварищи?
Самый простой вариант, если можно остановить сервак. Для начала Смарт глянуть.

Автор:  Micca [ 12:02 11.11.2005 ]
Заголовок сообщения: 

seRyoga а разве можно в массиве глядеть СМАРТ каждого диска?

Автор:  Dimka [ 13:50 11.11.2005 ]
Заголовок сообщения: 

Micca
Особенно когда диски не знают что такое Смарт.
По моему на SCSI его не бывает.
Если бывает, то это решение.

Автор:  AndreyPopov [ 14:02 11.11.2005 ]
Заголовок сообщения: 

Dimka
По моему на SCSI его не бывает. — там это называется по другому и софта к RAID должна все ошибки винтов отлавливать, а также есть поставить ASPI Layer то можно будет стандартными утилитами достать всю инфу с винтов — дело в том, что SCSI винты умеют САМИ ремэпить битые физические сектора. и обычно встретить SCSI винты без ремепов — невозможно.

Автор:  Dimka [ 14:14 11.11.2005 ]
Заголовок сообщения: 

AndreyPopov
В понедельник посмотрю, как IBMовский техник его вычислит.
Сервер на втором году гарантии из 3.
Боюсь, что он начнёт меня убеждать, что бэды логические.

Автор:  Micca [ 14:49 11.11.2005 ]
Заголовок сообщения: 

AndreyPopov авторемап вроде есть и в "бытовых" (ИДЕ-САТА) винтах.
Dimka что есть "логический" бэд, простите мою неграмотность? Бэд, который лечится форматированием?

Автор:  seRyoga [ 14:56 11.11.2005 ]
Заголовок сообщения: 

Dimka Active Smart SCSI Edition. Рейд ему должен быть безразличен, поскольку читает физику, хотя х.з. Если G-List больше нуля, то это первый подозреваемый.

Автор:  seRyoga [ 15:02 11.11.2005 ]
Заголовок сообщения: 

Micca Есть.
Логический бэд — сектор с неправильной CRC данных. Лечится записью в этот сектор (CRC пересчитывается).

Автор:  AndreyPopov [ 15:43 11.11.2005 ]
Заголовок сообщения: 

Micca
авторемап вроде есть и в "бытовых" (ИДЕ-САТА) винтах. — то что там можно сделать рэмеп, еще не означает, что они сами это делать умеют.


seRyoga
Лечится записью в этот сектор — а как же его, это сектор перезаписать, если он в файловой системе помечен как БЭД? ;) можно или только форматированием или скажем в виндах командой chkdsk с опцией /R (проверять плохие сектора и восстанавливать по возможности).

Автор:  seRyoga [ 17:26 11.11.2005 ]
Заголовок сообщения: 

Функции записи в бэд-сектора есть в MHDD и Victoria. Поскольку они работают с винтом напрямую, то файловая система значения не имеет.

Автор:  B.R@ven [ 19:20 11.11.2005 ]
Заголовок сообщения: 

Dimka
что тулзы рейдовые кажут,
а то у меня тут тоже с пятым трабл был на Футжиковских винтах
тоже то "беды" появлялись пропадали вместе с "медиа егогами", потом один винт стал вообще оффлайн(рейд интеловый 320й :) ), но при помощи все той же тулзы стал онлайн

помучился и отдал всю партию(3 винта) поставщику, тот тоже не особо морочился написал отказ и вернул деньгу(не сразу правда :( )

а так рекомендуется всегда проверять винты отдельно от рейда , правда никто еще не говорил как это сделать в отсутствие окромя как рейд-контроллера какого-либо СКАЗИ :)

Автор:  Dimka [ 19:41 11.11.2005 ]
Заголовок сообщения: 

B.R@ven
Тулзы говорят, что всё нормально.
Удалённо запустил chkdsk /r (нерабочее время), посмотрю, что он скажет.

Сказал, что количество бэдов увеличилось с 3 до 16 к.

Диск сыпется.

Автор:  B.R@ven [ 20:04 11.11.2005 ]
Заголовок сообщения: 

Dimka
странно
у меня так все пучком по производительности было(даже когда один винт в "офф" ушел, только контроллер пищать начал), а контроллер кричал о "меди егогах"

Автор:  Dimka [ 08:40 14.11.2005 ]
Заголовок сообщения: 

Значит так.
Пришёл спец с IBM. Почесал репу. Дал запасной диск (один). Взял клятву, что вернём что-нибудь.

Теперь делаю хот-своп дисков в массиве, освободившийся ставлю stand alone, заполняю до отказа большими файлами (использую акронисовский образ этого массива и мелочёвкой до максимально полного заполнения. Гоняю chkdsk /r. Меняю следующий.
Первый уже проверил. Исправен. Осталось ещё 2.

Тем временем на сайте IBM появилось не мало обновлённых прошивок и дров. Может апдейт решит все проблемы.
После тестирования дисков обновлю.

Автор:  Dimka [ 22:06 24.11.2005 ]
Заголовок сообщения: 

Проблема решилась.
Может кому-то интересно, рассказываю:

Для начала проверил все диски и не нашёл никаких проблем.
Потом проапдейтил и проапгрейдил всё, дрова, firmware конторллеров и дисков, BIOSы, начиная с матери и заканчивая видео. Проблема то исчезала, то появлялась снова. Она как будто (оказалось вполне реально)
зависела от погоды (реально зависела от влажности воздуха.
Потом потребовал замены контроллера, получил запасной и сняв старый обнаружил ЭТО !!!

Изображение

при этом ничего подобного в других местах нет. Разъём на кабеле абсолютно чистый. То есть сгнил он ещё до установки в сервер, а проявилось это при повышении влажности воздуха.
Бывает и такое, оказывается, а ведь брэнд. IBM, его мать.

Автор:  Micca [ 06:54 25.11.2005 ]
Заголовок сообщения: 

Dimka сильно.... Активный флюс + плохая промывка после пайки?

Автор:  seRyoga [ 10:05 25.11.2005 ]
Заголовок сообщения: 

Мда, флюс был зверский. Непойму только почему на микрухах пайка не растворилась. Или разъемы после отмывки ставят (что не логично) или не обошлось без ремонта народными умельцами.

Автор:  Dimka [ 12:48 25.11.2005 ]
Заголовок сообщения: 

seRyoga
Разъёмы, похоже, поставили после.

Ну и чтобы знали на будующее.
Это ServeRAID 4Lx, стоявший в IBM XSeries 225.
Умельцы там не лазили. Корпус только я открывал. Фирменную упаковку тоже.

Автор:  Dimka [ 09:09 08.12.2005 ]
Заголовок сообщения: 

Продолжаю тему.
В общем проблема решена, но секторы, помеченные системой как плохие, остались.
Хозяин сервера хочент избавится от них.
Я, кроме форматирования дисков ничего предложить не могу.
Может есть какая-то утилитка (желательно виндовая, чтобы сделать это без перезагрузки и геморроя с досовскими драйверами этого контроллера, которых может и не быть в природе), которая может очисить таблицы плохих блоков на NTFS.
Если кто-то встречал такое — подскажите.

Автор:  Micca [ 10:53 08.12.2005 ]
Заголовок сообщения: 

Dimka я так понимаю, винты — тоже 1ВМ? Для Фуджиков есть утиль для сокрытия бэд-блоков...

Автор:  Dimka [ 22:22 08.12.2005 ]
Заголовок сообщения: 

Micca
Винты абсолютно целые и скрывать там нечего.
Записи о повреждённых секторах существуют только в файловой системе, реальных бэд секторов на них нет.
Это проверено.

Автор:  Micca [ 06:20 09.12.2005 ]
Заголовок сообщения: 

Dimka Значит, один путь — побайтовое копирование файлов, квикформат + восстановление из образа.

Автор:  Monsterof3D [ 10:44 09.12.2005 ]
Заголовок сообщения: 

Dimka
Для IBM есть такой инструмент под Вынь — "HITACHI IBM DDD-SI"
Может он тебе поможет.
Берётся у производителя ;)

Страница 1 из 1 Часовой пояс: UTC + 3 часа
Copyright © 2001 - 2012, Radeon.ru Team
Powered by phpBB® Forum Software © phpBB Group
http://www.phpbb.com/