Добрый день. Ситуация - имеется некая сетка не самого маленького размера. Маршрутизация внутри - ospf. В качестве маршрутизаторов - в основном линуксы с gated (gated - это так сложилось исторически, "это еще до вас, в 15 веке") и несколько тазиков с w2k (увы и ах, тоже сложилось исторически). С недавнего времени появилась необходимость исполнять на одном из линуксов не только ospf, но и bgp. Вследствие чего на одной конкретно взятой машине gated был заменен на zebra. Изначально версия зебры - 0.92a (штатная для debian woody). После установки зебры стабильно наблюдается следующая картина - какое-то количество времени ospfd работает гладко (на глаз - в среднем до получаса), после чего зебра удаляет из таблицы маршрутизации все маршруты, полученные via ospf и сама перестает что-либо отдавать своим соседям. В логах это обычно сопровождается записями вида AS-external-LSA is MAXAGE для каждого маршрута и последующей руганью про LSA от Unknown neighbour. При этом sh ip ospf nei показывает полный и корректный список neighbours, а в выводе sh ip ospf data продолжают присутствовать все удаленные из таблицы маршрутизации маршруты. После перезапуска ospfd все снова на какое-то время оживает, но через некоторое время опять падает с вышеописанными симптомами. gated, работавший на этой же машине раньше - исполнял ospf без малейших проблем. В процессе эксеприментов текущий линуховый kernel 2.2.25-ow2 был заменен на 2.4.25-ow1, а штатная для woody зебра - на quagga 0.96.4. Ситуация осталась без изменений. Соответственно, вопрос - сталкивался ли кто-то еще с таким поведением zebra/quagga (гугглинг выдает пару ссылок на описание похожей ситуации в lkml, но там вопросы остаются без ответа) ? Если да - то лечится ли это ? Возможно, в настройке zebra/quagga есть какие-то тонкости, которые я не учел ? (честно говоря, гонять ospf на zebra до этого не доводилось). Возможно, это я просто на такие "удачные" версии софта попал ? Если нужно что-то показать из логов - готов. Только уточните, что именно, по причине отсутствия практического опыта использования ospf на зебре в логах зебры я еще "несколько" путаюсь :) P.S. Куски из конфига, которые касаются собственно ospf : ! interface eth1 ip ospf authentication-key <hidden> ip ospf priority 254 ! router ospf ospf router-id x.y.z.b redistribute connected redistribute static passive-interface dummy0 passive-interface eth0 passive-interface gre0 passive-interface lo passive-interface shaper0 passive-interface tunl0 network x.y.z.a/24 area 0.0.0.0 area 0 authentication ! -- Andrey Elperin =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Tue, Apr 06, 2004 at 12:15:45PM +0300, Andrey Elperin wrote:
Добрый день.
Ситуация - имеется некая сетка не самого маленького размера. Маршрутизация внутри - ospf. В качестве маршрутизаторов - в основном линуксы с gated (gated - это так сложилось исторически, "это еще до вас, в 15 веке") и несколько тазиков с w2k (увы и ах, тоже сложилось исторически).
С недавнего времени появилась необходимость исполнять на одном из линуксов не только ospf, но и bgp. Вследствие чего на одной конкретно взятой машине gated был заменен на zebra. Изначально версия зебры - 0.92a (штатная для debian woody).
just a wild guess: а тама они с разными интервалами времени чего-то типа синхронизации таблиц делали (helo interval или что-то такое). "они" - default configured gated и cisco. в зебре вроде как дефолтный helo interval тоже как в cisco. Но это всё только догадки(более того - зебру я никак не крутил вообще ни разу). Но смотрел бы я в такой ситуации (дохнет всё строго через пол-часа) именно в эту сторону. -- Best regards, Paul Arakelyan. =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Tue, Apr 06, 2004 at 03:00:47PM +0300, Paul Arakelyan wrote:
just a wild guess: а тама они с разными интервалами времени чего-то типа синхронизации таблиц делали (helo interval или что-то такое). "они" - default configured gated и cisco. в зебре вроде как дефолтный helo interval тоже как в cisco. Но это всё только догадки(более того - зебру я никак не крутил вообще ни разу). Но смотрел бы я в такой ситуации (дохнет всё строго через пол-часа) именно в эту сторону.
Смотрел в эту сторону. Но у gated'ов все timers выставлены а-ля cisco. Да и adjacency вроде никуда не девается, а должно бы в случае проблемы с таймерами. И дохнет не строго через полчаса, а как получится. Просто случаев жизни больше чем на полчаса пока зафиксировано не было :)
-- Best regards, Paul Arakelyan.
-- Andrey Elperin =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Tue, Apr 06, 2004 at 03:16:55PM +0300, Andrey Elperin wrote:
On Tue, Apr 06, 2004 at 03:00:47PM +0300, Paul Arakelyan wrote:
И дохнет не строго через полчаса, а как получится. Просто случаев жизни больше чем на полчаса пока зафиксировано не было :) fast workaround :) #!/bin/sh while() do sleep 900 killall ospfd& killall bgpd& (или чего там надо прибивать?) sleep 5 (запустить то, чего прибили, если оно само не перезапускается) done
жестоко, но само уже не сдохнет :) Опционально разбираться в тихой спокойной обстановке. :) -- Best regards, Paul Arakelyan. =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Wed, Apr 07, 2004 at 02:22:04PM +0300, Paul Arakelyan wrote:
И дохнет не строго через полчаса, а как получится. Просто случаев жизни больше чем на полчаса пока зафиксировано не было :) fast workaround :) #!/bin/sh while() do sleep 900 killall ospfd& killall bgpd& (или чего там надо прибивать?) sleep 5 (запустить то, чего прибили, если оно само не перезапускается) done жестоко, но само уже не сдохнет :) Опционально разбираться в тихой спокойной обстановке. :)
Да, но это же не наш метод (с) :) Вобщем, учитывая то, что доступ к тем машинам у меня на 95% ремотный, то пока что была изображена схема, когда quagga занимается только bgp, а ospf исполняет по-прежнему gated. Буду поближе к эпицентру событий - можно будет уже более детально поковыряться и таки попробовать превратить стройную систему костылей и подпорок в нормальное решение. Хотя, конечно, нет ничего более постоянного, чем временное :)
-- Best regards, Paul Arakelyan.
-- Andrey Elperin =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
participants (2)
-
Andrey Elperin
-
Paul Arakelyan