hi. smartctl -a /dev/ad0 что-то я не сильно понял в этих надписях, но насколько я понял винт на помойку ? SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 119 094 006 Pre-fail Always- 211131708 3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always- - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always- 356 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always- - 0 7 Seek_Error_Rate 0x000f 087 060 030 Pre-fail Always- 570783058 9 Power_On_Hours 0x0032 068 068 000 Old_age Always- - 28796 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always- 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always- - 339 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always- 0 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always- - 0 190 Airflow_Temperature_Cel 0x0022 077 050 045 Old_age Always- 23 (Min/Max 19/23) 194 Temperature_Celsius 0x0022 023 050 000 Old_age Always- - 23 (0 17 0 0) 195 Hardware_ECC_Recovered 0x001a 084 069 000 Old_age Always- 214444055 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always- - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline- 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always- - 27 200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline- 0 202 Data_Address_Mark_Errs 0x0032 100 253 000 Old_age Always- - 0 -- ------------------------------------------------------------------------------- Vasiliy P. Melnik VPM-UANIC
Hi! 15 июля 2011, в 10:25, Vasiliy P. Melnik написал(а):
hi. smartctl -a /dev/ad0
что-то я не сильно понял в этих надписях, но насколько я понял винт на помойку ?
SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 119 094 006 Pre-fail Always- 211131708 3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always- - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always- 356 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always- - 0 7 Seek_Error_Rate 0x000f 087 060 030 Pre-fail Always- 570783058 9 Power_On_Hours 0x0032 068 068 000 Old_age Always- - 28796 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always- 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always- - 339 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always- 0 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always- - 0 190 Airflow_Temperature_Cel 0x0022 077 050 045 Old_age Always- 23 (Min/Max 19/23) 194 Temperature_Celsius 0x0022 023 050 000 Old_age Always- - 23 (0 17 0 0) 195 Hardware_ECC_Recovered 0x001a 084 069 000 Old_age Always- 214444055 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always- - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline- 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always- - 27 200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline- 0 202 Data_Address_Mark_Errs 0x0032 100 253 000 Old_age Always- - 0
Нормальный винт. Смотреть нужно в основном на 5, 197 и 198. Как там начнет быстро рости -- хана. PS Сигейт? ;-) -- Victor Cheburkin VC319-RIPE, VC1-UANIC
On Fri, Jul 15, 2011 at 10:25:57AM +0300, Vasiliy P. Melnik wrote:
SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 119 094 006 Pre-fail Always- 211131708 3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always- - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always- 356 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always- - 0 7 Seek_Error_Rate 0x000f 087 060 030 Pre-fail Always- 570783058 9 Power_On_Hours 0x0032 068 068 000 Old_age Always- - 28796 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always- 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always- - 339 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always- 0 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always- - 0 190 Airflow_Temperature_Cel 0x0022 077 050 045 Old_age Always- 23 (Min/Max 19/23) 194 Temperature_Celsius 0x0022 023 050 000 Old_age Always- - 23 (0 17 0 0) 195 Hardware_ECC_Recovered 0x001a 084 069 000 Old_age Always- 214444055 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always- - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline- 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always- - 27 200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline- 0 202 Data_Address_Mark_Errs 0x0032 100 253 000 Old_age Always- - 0
Винт вроде нормальный Критерием конца будет VALUE <= THRESH, ну и WHEN_FAILED будет со значением. Значение VALUE нормализованное 1 <= VALUE <= 253, получается из значения RAW_VALUE для каждого винта своим способом. Для атрибутов типа Pre-fail "срабатывание" означает что время жизни "менее 24 часов"
-- ------------------------------------------------------------------------------- Vasiliy P. Melnik VPM-UANIC
Hi,
Винт вроде нормальный
Согласен. Советую поставить smartmontools и запустить все встроенные тесты, по-очереди, потом смотреть test log. И вообще, советую его демоном ставить с регулярными тестами, если не мешает производительности. -- Mike Границу рабства нельзя пересечь нелегально.
всем спасибо - я разобрался.
там он внизу еще что-то написал - я на это не обратил внимания, думал
какая-то технологическая информация, а оказалось что ошибки. А потом
когда посмотрел смарт с рабочего компа понял что клиенту точно пушной
зверек приснился.
Вывод с рабочего винта оказался гораздо короче - раза в 3
15.07.11, Mike Petrusha
Hi,
Винт вроде нормальный
Согласен.
Советую поставить smartmontools и запустить все встроенные тесты, по-очереди, потом смотреть test log.
И вообще, советую его демоном ставить с регулярными тестами, если не мешает производительности.
-- Mike Границу рабства нельзя пересечь нелегально.
On Fri, Jul 15, 2011 at 11:39:14AM +0300, Vasiliy P. Melnik wrote:
всем спасибо - я разобрался. там он внизу еще что-то написал - я на это не обратил внимания, думал какая-то технологическая информация, а оказалось что ошибки. А потом когда посмотрел смарт с рабочего компа понял что клиенту точно пушной зверек приснился.
Не факт. Ошибки азные бывают - мож у чела кабели хреново контачат или блок питания фигню выдаёт. Ещё похоже на перегрев при работе. релокейтед и ошибок чтения - нету (есс восстановленых - у сигейтов эт нормально, разве у одних - больше, у других - меньше), соответственно винт вроде бы физически нормальный и нужно б ошибки запостить чтоб подумать и не гадать. можно dd прочитать весь винт в /dev/null для теста, попутно контролировать скорость (iostat/gstat/...) на предмет резких изменений. После прочтения всего винта - глянуть смат ещё раз. Если есть опасения, что ему крышка - то образ на другой диск сразу писать. -- Best regards, Paul Arakelyan.
если кому интересно - новые подробности в dmesg ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=6176768, length=2048)]error = 5 ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=114688, length=16384)]error = 5 капец ему в общем On Fri, Jul 15, 2011 at 10:26:10PM +0300, Paul Arakelyan wrote:
On Fri, Jul 15, 2011 at 11:39:14AM +0300, Vasiliy P. Melnik wrote:
всем спасибо - я разобрался. там он внизу еще что-то написал - я на это не обратил внимания, думал какая-то технологическая информация, а оказалось что ошибки. А потом когда посмотрел смарт с рабочего компа понял что клиенту точно пушной зверек приснился.
Не факт. Ошибки азные бывают - мож у чела кабели хреново контачат или блок питания фигню выдаёт. Ещё похоже на перегрев при работе. релокейтед и ошибок чтения - нету (есс восстановленых - у сигейтов эт нормально, разве у одних - больше, у других - меньше), соответственно винт вроде бы физически нормальный и нужно б ошибки запостить чтоб подумать и не гадать. можно dd прочитать весь винт в /dev/null для теста, попутно контролировать скорость (iostat/gstat/...) на предмет резких изменений. После прочтения всего винта - глянуть смат ещё раз.
Если есть опасения, что ему крышка - то образ на другой диск сразу писать.
-- Best regards, Paul Arakelyan.
-- ------------------------------------------------------------------------------- Vasiliy P. Melnik VPM-UANIC
Sat, Jul 16, 2011 at 08:35:37, basil wrote about "Re: [uanog] smart":
ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=6176768, length=2048)]error = 5 ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=114688, length=16384)]error = 5
капец ему в общем
Не обязательно - можно попробовать записать нулями подбитые блоки. Иногда проходит не с первого раза, но проходит. Хотя после этого я его таки в серьёзное пользование не ставил бы. -netch-
2011/7/16 Valentin Nechayev
Sat, Jul 16, 2011 at 08:35:37, basil wrote about "Re: [uanog] smart":
ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=6176768, length=2048)]error = 5 ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=114688, length=16384)]error = 5
капец ему в общем
Не обязательно - можно попробовать записать нулями подбитые блоки. Иногда проходит не с первого раза, но проходит. Хотя после этого я его таки в серьёзное пользование не ставил бы. Ох, dear netch, эти Ваши шаманские штучки. При нынешней стоимости винтов - проще выкинуть.
-netch-
-- wbr, Alex
On Sat, Jul 16, 2011 at 09:38:25AM +0300, Alex Belinsky wrote:
2011/7/16 Valentin Nechayev
: Sat, Jul 16, 2011 at 08:35:37, basil wrote about "Re: [uanog] smart":
ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=6176768, length=2048)]error = 5 ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=114688, length=16384)]error = 5
капец ему в общем
Не обязательно - можно попробовать записать нулями подбитые блоки. Иногда проходит не с первого раза, но проходит. Хотя после этого я его таки в серьёзное пользование не ставил бы. Ох, dear netch, эти Ваши шаманские штучки. При нынешней стоимости винтов - проще выкинуть.
особенно когда есть новый нормальный сервер на замену :) -- ------------------------------------------------------------------------------- Vasiliy P. Melnik VPM-UANIC
On Sat, Jul 16, 2011 at 09:38:25AM +0300, Alex Belinsky wrote:
2011/7/16 Valentin Nechayev
: Sat, Jul 16, 2011 at 08:35:37, basil wrote about "Re: [uanog] smart":
ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=6176768, length=2048)]error = 5 ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=114688, length=16384)]error = 5
капец ему в общем
Не обязательно - можно попробовать записать нулями подбитые блоки. Иногда проходит не с первого раза, но проходит. Хотя после этого я его таки в серьёзное пользование не ставил бы. Ох, dear netch, эти Ваши шаманские штучки. При нынешней стоимости винтов - проще выкинуть.
В штатах - не проще, там одно Г меняют на другое, сходного возраста, и ещё не известно, что хуже. Жаба их давит 160ГБ диск махнуть на 320/500ГБ нашару. Только раз предлагали апгрейд нашару всего сервера - с П4 на целерон коре2 - так это объяснимо, электричество... -- Best regards, Paul Arakelyan.
On Sat, Jul 16, 2011 at 08:54:14AM +0300, Valentin Nechayev wrote:
Sat, Jul 16, 2011 at 08:35:37, basil wrote about "Re: [uanog] smart":
ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=6176768, length=2048)]error = 5 ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=114688, length=16384)]error = 5
капец ему в общем
Не обязательно - можно попробовать записать нулями подбитые блоки. Иногда проходит не с первого раза, но проходит. Хотя после этого я его таки в серьёзное пользование не ставил бы.
Да нету там битых и даже намёков на них - pending=0, reallocated=0. -- Best regards, Paul Arakelyan.
On Sat, Jul 16, 2011 at 08:35:37AM +0300, Vasiliy P. Melnik wrote:
если кому интересно - новые подробности в dmesg
ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=6176768, length=2048)]error = 5 ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=114688, length=16384)]error = 5
Это шлейфы-разъёмы-контроллер-блок питания, но точно не поверхности-головы, в смарте ICRC - это "общение ПК с диском". Короче, сменить SATA cable и посмотреть, как он физически "висит" - плохой контакт часто к таким вещам приводит. Вероятность "какая-то деталюшка отваливается" - тоже есть, правда. -- Best regards, Paul Arakelyan.
ок, поступаем просто :) я переношу все на новый сервак - он все равно есть. Не поленюсь и поеду погоняю винт сеатулзом On Sun, Jul 17, 2011 at 04:59:53AM +0300, Paul Arakelyan wrote:
On Sat, Jul 16, 2011 at 08:35:37AM +0300, Vasiliy P. Melnik wrote:
если кому интересно - новые подробности в dmesg
ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=6176768, length=2048)]error = 5 ata1: timeout waiting to issue command ata1: error issuing READ_DMA command g_vfs_done():ad2s1d[READ(offset=114688, length=16384)]error = 5
Это шлейфы-разъёмы-контроллер-блок питания, но точно не поверхности-головы, в смарте ICRC - это "общение ПК с диском". Короче, сменить SATA cable и посмотреть, как он физически "висит" - плохой контакт часто к таким вещам приводит. Вероятность "какая-то деталюшка отваливается" - тоже есть, правда.
-- Best regards, Paul Arakelyan.
-- ------------------------------------------------------------------------------- Vasiliy P. Melnik VPM-UANIC
On Fri, Jul 15, 2011 at 09:51:04AM +0200, Mike Petrusha wrote:
Hi,
Винт вроде нормальный
Согласен.
Советую поставить smartmontools и запустить все встроенные тесты, по-очереди, потом смотреть test log.
И вообще, советую его демоном ставить с регулярными тестами, если не мешает производительности.
хм. кажись они (те, что диск читают) при работе будут просто абортиться при первом же обращении к диску - т.е. для рабочих дисков не сильно подходит. -- Best regards, Paul Arakelyan.
Hi Paul,
И вообще, советую его демоном ставить с регулярными тестами, если не мешает производительности.
хм. кажись они (те, что диск читают) при работе будут просто абортиться при первом же обращении к диску - т.е. для рабочих дисков не сильно подходит.
Есть captive и non-captive tests. Non-captive во время работы... -- Mike
participants (7)
-
Alex Belinsky
-
Andrew Ivanov
-
Mike Petrusha
-
Paul Arakelyan
-
Valentin Nechayev
-
Vasiliy P. Melnik
-
Victor Cheburkin