Доброе утро всем! Коллеги, у меня есть проблема, может кто-то сталкивался. named перестал отвечать на запросы в моменты, когда сервер на котором он живет имеет loadavg: > 10. Раньше такого за ним не замечалось. named -t /chroot/dns -u named -n 1 Обновил до net-dns/bind-9.2.2 с последними патчами имени gentoo. Вроде ни одного security announce не пропускаю. Я что-то пропустил все-таки или ? Спасибо. -- Alex Radetsky AR2657-RIPE RAD-UANIC =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
Коллеги, у меня есть проблема, может кто-то сталкивался.
named перестал отвечать на запросы в моменты, когда сервер на котором он живет имеет loadavg: > 10. Раньше такого за ним не замечалось.
Да, есть такое неприятное свойство named-а. Сообщений об этом в рассылках я тоже не видела, но проблема случается регулярно. Приходится ограничивать нагрузку, если начинает зашкаливать.
named -t /chroot/dns -u named -n 1
Обновил до net-dns/bind-9.2.2 с последними патчами имени gentoo. Вроде ни одного security announce не пропускаю.
Я что-то пропустил все-таки или ?
Спасибо.
-- Alex Radetsky AR2657-RIPE =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Sun, Dec 26, 2004 at 02:41:02PM +0200, Svetlana Tkachenko wrote: ST> > ST> > Коллеги, у меня есть проблема, может кто-то сталкивался. ST> > ST> > named перестал отвечать на запросы в моменты, когда сервер на ST> > котором он живет имеет loadavg: > 10. Раньше такого за ним не ST> > замечалось. ST> > ST> ST> Да, есть такое неприятное свойство named-а. ST> Сообщений об этом в рассылках я тоже не видела, но проблема ST> случается регулярно. Приходится ограничивать нагрузку, ST> если начинает зашкаливать. Спасибо, Света, буду пробовать разносить нагрузку. -- Alex Radetsky AR2657-RIPE RAD-UANIC =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Sun, Dec 26, 2004 at 02:41:02PM +0200, Svetlana Tkachenko wrote:
Коллеги, у меня есть проблема, может кто-то сталкивался.
named перестал отвечать на запросы в моменты, когда сервер на котором он живет имеет loadavg: > 10. Раньше такого за ним не замечалось.
Да, есть такое неприятное свойство named-а. Сообщений об этом в рассылках я тоже не видела, но проблема случается регулярно. Приходится ограничивать нагрузку, если начинает зашкаливать. На толстенном резолвере такое наблюдается раз в пол-часа или час - по-моему, это что-то из серии перестройки базы, которую он там себе насоставлял (ну нету у меня толстых primary/secondary) Толстый - это типа под 400M memory (не, до 400 оно ещё не доходило - 392 кажется видел). Выход - второй резолвер :). На небыстром (P3,1GHz,512M RAM, ничего активного кроме named9) - такое всерьёз клинило оный процесс. Вобщем - у меня нынче "двухуровневая" архитектура резолвинга: те, кому надо резолвить смотрят в named, который forward-only и смотрит в 1-2 других, которые собственно и растут немерянно. Те, которые forward-only - до 180M наростали (ну - точнее тут немного приврал - с forward-only - только 130M было, эти уже без forward-only, ну нету тама лишнего тазика - бюджет аднака :( ). На AXP-2600+ такое вполне чудно крутится... На тазике, в который все named'ы смотрят - более ничего не вертится. Ежели вертеть и это что-то много-много (1000+)процессов, кои что-то непрерывно резолвят - то заметно сильно становится хотя вроде не клинит совсем.
-- Best regards, Paul Arakelyan. =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Sun, Dec 26, 2004 at 03:00:55PM +0200, Alexey Radetsky wrote:
On Sun, Dec 26, 2004 at 02:41:02PM +0200, Svetlana Tkachenko wrote: ST> > ST> случается регулярно. Приходится ограничивать нагрузку, ST> если начинает зашкаливать.
Спасибо, Света, буду пробовать разносить нагрузку. BTW, сборка named'а с ключиками оптимизации помогает (но не радикально)...
-- Best regards, Paul Arakelyan. =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Sun, Dec 26, 2004 at 02:41:02PM +0200, Svetlana Tkachenko wrote:
Коллеги, у меня есть проблема, может кто-то сталкивался.
named перестал отвечать на запросы в моменты, когда сервер на котором он живет имеет loadavg: > 10. Раньше такого за ним не замечалось.
Да, есть такое неприятное свойство named-а. Сообщений об этом в рассылках я тоже не видела, но проблема случается регулярно. Приходится ограничивать нагрузку, если начинает зашкаливать. На толстенном резолвере такое наблюдается раз в пол-часа или час - по-моему, это что-то из серии перестройки базы, которую он там себе
Если раз в час, то это что-то не то. У меня такие проблемы случались раз в месяц-два. Никаких других симптомов, кроме большого loadavg не наблюдается Лечится убиванием лишних программ: уменьшается заглузка --> named приходит в норму даже без перезагрузки.
насоставлял (ну нету у меня толстых primary/secondary) Толстый - это типа под 400M memory (не, до 400 оно ещё не доходило - 392 кажется видел). Выход - второй резолвер :). На небыстром (P3,1GHz,512M RAM, ничего активного кроме named9) - такое всерьёз клинило оный процесс. Вобщем - у меня нынче "двухуровневая" архитектура резолвинга: те, кому надо резолвить смотрят в named, который forward-only и смотрит в 1-2 других, которые собственно и растут немерянно. Те, которые forward-only - до 180M наростали (ну - точнее тут немного приврал - с forward-only - только 130M было, эти уже без forward-only, ну нету тама лишнего тазика - бюджет аднака :( ). На AXP-2600+ такое вполне чудно крутится... На тазике, в который все named'ы смотрят - более ничего не вертится. Ежели вертеть и это что-то много-много (1000+)процессов, кои что-то непрерывно резолвят - то заметно сильно становится хотя вроде не клинит совсем.
-- Best regards, Paul Arakelyan. =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Sunday 26 December 2004 14:41, Svetlana Tkachenko wrote:
Коллеги, у меня есть проблема, может кто-то сталкивался.
named перестал отвечать на запросы в моменты, когда сервер на котором он живет имеет loadavg: > 10. Раньше такого за ним не замечалось.
Да, есть такое неприятное свойство named-а. Сообщений об этом в рассылках я тоже не видела, но проблема случается регулярно. Приходится ограничивать нагрузку, если начинает зашкаливать.
опыт показывает, что резкий вспеск LA в случае одинокого bind может быть вызван либо огромным кол-вом "тяжелых" queries, ответ на которые не может быть закеширован и занимает время (например ServFail) либо потерей bind-ом некоторых рутовых серверов (падения внешних каналов или траблы по дороге) -- Dimitry Не верь светофору - верь идущему на тебя транспорту. =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Mon, Dec 27, 2004 at 10:31:38AM +0200, Svetlana Tkachenko wrote:
On Sun, Dec 26, 2004 at 02:41:02PM +0200, Svetlana Tkachenko wrote:
Коллеги, у меня есть проблема, может кто-то сталкивался.
named перестал отвечать на запросы в моменты, когда сервер на котором он живет имеет loadavg: > 10. Раньше такого за ним не замечалось.
Да, есть такое неприятное свойство named-а. Сообщений об этом в рассылках я тоже не видела, но проблема случается регулярно. Приходится ограничивать нагрузку, если начинает зашкаливать. На толстенном резолвере такое наблюдается раз в пол-часа или час - по-моему, это что-то из серии перестройки базы, которую он там себе
Если раз в час, то это что-то не то. У меня такие проблемы случались раз в месяц-два. Вы ж не пытаетесь сделать несколько сотен тысяч уникальных запросов в час, несколько часов напролёт, при этом часть запросов - вообще левизна полная - типа домен.jpg?
вот так выглядит на AMD Athlon(tm) XP 2600+ (1908.94-MHz 686-class CPU) 31988 bind 2 -20 361M 336M RUN 35.2H 7.13% 7.13% named9 в него вот типа так смотрят 173 bind 2 -10 197M 193M select 894:40 5.57% 5.57% named9 При этом иногда %% до 30+ подскакивают - на P3-1GHz это было бы уже более 60%, и где-то начинается эффект "снежного кома" - когда нагрузка начинает возрастать, а обрабатываться не успевает - в итоге получаем полный затык (а если ещё и свопаться оно начнёт...). Когда не было промежуточных резолверов - 30+%% cpu load на XP2600 и заметные тормоза при резолвинге (3000-5000 одновременных запросов).
Никаких других симптомов, кроме большого loadavg не наблюдается Лечится убиванием лишних программ: уменьшается заглузка --> named приходит в норму даже без перезагрузки. killall -9 named9 было самым быстрым решением - только потом он при взлёте опять быстро-быстро кушал память и вначале существенно (~35% P3-1Ghz) жрал CPU.
-- Best regards, Paul Arakelyan. =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Mon, Dec 27, 2004 at 11:54:11AM +0200, Dmitry Alyabyev wrote:
On Sunday 26 December 2004 14:41, Svetlana Tkachenko wrote:
Коллеги, у меня есть проблема, может кто-то сталкивался.
named перестал отвечать на запросы в моменты, когда сервер на котором он живет имеет loadavg: > 10. Раньше такого за ним не замечалось.
Да, есть такое неприятное свойство named-а. Сообщений об этом в рассылках я тоже не видела, но проблема случается регулярно. Приходится ограничивать нагрузку, если начинает зашкаливать.
опыт показывает, что резкий вспеск LA в случае одинокого bind может быть вызван либо огромным кол-вом "тяжелых" queries, ответ на которые не может быть закеширован и занимает время (например ServFail) либо потерей bind-ом некоторых рутовых серверов (падения внешних каналов или траблы по дороге) Вобщем - если он не занимает в памяти много - то наверно так, а если 300+M memory - то там какие-то процедуры типа очисткии перестройки кэшей или что-то подобное - очень ресурсоёмкое - происходит.
-- Best regards, Paul Arakelyan. =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Monday 27 December 2004 13:07, Paul Arakelyan wrote:
On Mon, Dec 27, 2004 at 11:54:11AM +0200, Dmitry Alyabyev wrote:
On Sunday 26 December 2004 14:41, Svetlana Tkachenko wrote:
Коллеги, у меня есть проблема, может кто-то сталкивался.
named перестал отвечать на запросы в моменты, когда сервер на котором он живет имеет loadavg: > 10. Раньше такого за ним не замечалось.
Да, есть такое неприятное свойство named-а. Сообщений об этом в рассылках я тоже не видела, но проблема случается регулярно. Приходится ограничивать нагрузку, если начинает зашкаливать.
опыт показывает, что резкий вспеск LA в случае одинокого bind может быть вызван либо огромным кол-вом "тяжелых" queries, ответ на которые не может быть закеширован и занимает время (например ServFail) либо потерей bind-ом некоторых рутовых серверов (падения внешних каналов или траблы по дороге)
Вобщем - если он не занимает в памяти много - то наверно так, а если 300+M memory - то там какие-то процедуры типа очисткии перестройки кэшей или что-то подобное - очень ресурсоёмкое - происходит.
то, что я говорил, замечено на bind9 c max-cache-size 600M и текущим vsize 320M -- Dimitry Спорить с тренером по борьбе может только тренер по стрельбе =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
participants (4)
-
Alexey Radetsky
-
Dmitry Alyabyev
-
Paul Arakelyan
-
Svetlana Tkachenko