On Thu, Jul 09, 2015 at 07:29:32AM +0300, Vasiliy P. Melnik wrote:
Ну и да - raid обладает противной особенностью выпадения второго (и третьего, если это raid6) диска в процессе ребилда, если это > 1Tb диски и на них (OMFG!) есть нагрузка. Диски отваливаются от каждого чиха: кабель, неровный shutdown, timeout при ремапе и т.п. В этом смысле zfs ттт на высоте.
Ну техника разная бывает, рейды тоже. Индусы иногда не кривые прошивки делают. Ну все как обычно. У меня за все время пул зфс-а умер только один раз - ну я вообще ничего не смог с него вытянуть, рекавери нет никакого как класса. Виновата в этом была планка памяти.
Один раз - на солярке, я отключил чексумы, пожил пол-годика, диск помер, поменял - и оно исполнило бесплатный цирк - "восстановило" данные на других дисках читая с пустого. Результат был фееричен - вылезли ещё грабли с gzip - читаешь файл, ОС крэшится пытаясь разжать мусор. С полудохлым диском и стукнутой статикой планкой памяти (может она, конечно, и сама сдохла) - всё более-менее пахало и ошибки детектились :)... На заре моей ЗФС-о-мании был случай с IDE-дисками, один сдох, другой исполнил непонятную команду и повредил данные. В итоге - колупание ядра, убирание "фатальности" в ошибках - всё смонтировалось, фигдесят файлов были нечитаемы, их имена/пути можно было получить. Рекавери - только всякие полицаи писали - "очень классно, данные не перезаписываются". Короче, это возможно, но никакая крупная контора не заморачивалась. -- Best regards, Paul Arakelyan.