Конференция работает на сервере Netberg

Radeon.ru

Конференция Radeon.ru

Страница 1 из 1 [ Сообщений: 29 ]  Версия для печати [+]
Показать сообщения за  Поле сортировки  
Вопрос в заголовке.
Подробностей мало, но могу узнать.
Есть аппаратный RAID5 из 3 70 гигабайтных дисков на сервере IBM (не помню).
Полезли бед секторы. Состояние массива нормальное, контроллер проблем не видит.
Как вычислить сыплющийся диск ?
Dimka бэды могут быть и логические, а не только физические.
AndreyPopov
Похоже на физические. Массив вялый какой-то стал. Бэдов мало, но сильные. Повреждена была system32.
Функциональность восстановил легко. Полного бэкапа нет.

Вопрос в том, как вычислить умирающий, если такой там есть.
Dimka
Массив вялый какой-то стал. — один из винтов хандрит. были у меня такие IBM SCSI — как один на шине — вопросов нет, как RAID без него — все в норме. только втыкаешь в RAID — произволительность падает раза в два.
AndreyPopov
Именно IBM.
Попробую вытаскивать по одному, но сначала надо хороший бэкап сделать.
К сожалению, после вытаскивания на восстановление нужно несколько часов.
Dimka а если попробовать вытаскивать их по одному — и MHDD сотоварищи?

а если попробовать вытаскивать их по одному — и MHDD сотоварищи?
Самый простой вариант, если можно остановить сервак. Для начала Смарт глянуть.
seRyoga а разве можно в массиве глядеть СМАРТ каждого диска?
Micca
Особенно когда диски не знают что такое Смарт.
По моему на SCSI его не бывает.
Если бывает, то это решение.
Dimka
По моему на SCSI его не бывает. — там это называется по другому и софта к RAID должна все ошибки винтов отлавливать, а также есть поставить ASPI Layer то можно будет стандартными утилитами достать всю инфу с винтов — дело в том, что SCSI винты умеют САМИ ремэпить битые физические сектора. и обычно встретить SCSI винты без ремепов — невозможно.
AndreyPopov
В понедельник посмотрю, как IBMовский техник его вычислит.
Сервер на втором году гарантии из 3.
Боюсь, что он начнёт меня убеждать, что бэды логические.
AndreyPopov авторемап вроде есть и в "бытовых" (ИДЕ-САТА) винтах.
Dimka что есть "логический" бэд, простите мою неграмотность? Бэд, который лечится форматированием?
Dimka Active Smart SCSI Edition. Рейд ему должен быть безразличен, поскольку читает физику, хотя х.з. Если G-List больше нуля, то это первый подозреваемый.
Micca Есть.
Логический бэд — сектор с неправильной CRC данных. Лечится записью в этот сектор (CRC пересчитывается).
Micca
авторемап вроде есть и в "бытовых" (ИДЕ-САТА) винтах. — то что там можно сделать рэмеп, еще не означает, что они сами это делать умеют.


seRyoga
Лечится записью в этот сектор — а как же его, это сектор перезаписать, если он в файловой системе помечен как БЭД? ;) можно или только форматированием или скажем в виндах командой chkdsk с опцией /R (проверять плохие сектора и восстанавливать по возможности).
Функции записи в бэд-сектора есть в MHDD и Victoria. Поскольку они работают с винтом напрямую, то файловая система значения не имеет.
Dimka
что тулзы рейдовые кажут,
а то у меня тут тоже с пятым трабл был на Футжиковских винтах
тоже то "беды" появлялись пропадали вместе с "медиа егогами", потом один винт стал вообще оффлайн(рейд интеловый 320й :) ), но при помощи все той же тулзы стал онлайн

помучился и отдал всю партию(3 винта) поставщику, тот тоже не особо морочился написал отказ и вернул деньгу(не сразу правда :( )

а так рекомендуется всегда проверять винты отдельно от рейда , правда никто еще не говорил как это сделать в отсутствие окромя как рейд-контроллера какого-либо СКАЗИ :)
B.R@ven
Тулзы говорят, что всё нормально.
Удалённо запустил chkdsk /r (нерабочее время), посмотрю, что он скажет.

Сказал, что количество бэдов увеличилось с 3 до 16 к.

Диск сыпется.
Dimka
странно
у меня так все пучком по производительности было(даже когда один винт в "офф" ушел, только контроллер пищать начал), а контроллер кричал о "меди егогах"
Значит так.
Пришёл спец с IBM. Почесал репу. Дал запасной диск (один). Взял клятву, что вернём что-нибудь.

Теперь делаю хот-своп дисков в массиве, освободившийся ставлю stand alone, заполняю до отказа большими файлами (использую акронисовский образ этого массива и мелочёвкой до максимально полного заполнения. Гоняю chkdsk /r. Меняю следующий.
Первый уже проверил. Исправен. Осталось ещё 2.

Тем временем на сайте IBM появилось не мало обновлённых прошивок и дров. Может апдейт решит все проблемы.
После тестирования дисков обновлю.
Проблема решилась.
Может кому-то интересно, рассказываю:

Для начала проверил все диски и не нашёл никаких проблем.
Потом проапдейтил и проапгрейдил всё, дрова, firmware конторллеров и дисков, BIOSы, начиная с матери и заканчивая видео. Проблема то исчезала, то появлялась снова. Она как будто (оказалось вполне реально)
зависела от погоды (реально зависела от влажности воздуха.
Потом потребовал замены контроллера, получил запасной и сняв старый обнаружил ЭТО !!!

Изображение

при этом ничего подобного в других местах нет. Разъём на кабеле абсолютно чистый. То есть сгнил он ещё до установки в сервер, а проявилось это при повышении влажности воздуха.
Бывает и такое, оказывается, а ведь брэнд. IBM, его мать.
Dimka сильно.... Активный флюс + плохая промывка после пайки?
Мда, флюс был зверский. Непойму только почему на микрухах пайка не растворилась. Или разъемы после отмывки ставят (что не логично) или не обошлось без ремонта народными умельцами.
seRyoga
Разъёмы, похоже, поставили после.

Ну и чтобы знали на будующее.
Это ServeRAID 4Lx, стоявший в IBM XSeries 225.
Умельцы там не лазили. Корпус только я открывал. Фирменную упаковку тоже.
Продолжаю тему.
В общем проблема решена, но секторы, помеченные системой как плохие, остались.
Хозяин сервера хочент избавится от них.
Я, кроме форматирования дисков ничего предложить не могу.
Может есть какая-то утилитка (желательно виндовая, чтобы сделать это без перезагрузки и геморроя с досовскими драйверами этого контроллера, которых может и не быть в природе), которая может очисить таблицы плохих блоков на NTFS.
Если кто-то встречал такое — подскажите.
Dimka я так понимаю, винты — тоже 1ВМ? Для Фуджиков есть утиль для сокрытия бэд-блоков...
Micca
Винты абсолютно целые и скрывать там нечего.
Записи о повреждённых секторах существуют только в файловой системе, реальных бэд секторов на них нет.
Это проверено.
Dimka Значит, один путь — побайтовое копирование файлов, квикформат + восстановление из образа.
Dimka
Для IBM есть такой инструмент под Вынь — "HITACHI IBM DDD-SI"
Может он тебе поможет.
Берётся у производителя ;)
Новая тема    Ответить  [ Сообщений: 29 ] 


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 9


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  

Удалить cookies конференции

Пишите нам | Radeon.ru