On Mon, Nov 11, 2013 at 11:02:01AM +0200, Александр Троцай wrote:
Доброго дня всем
Никто не нарывался
Есть такая схема
Juniper MX80 <--vlan--> extreme 670 <--свичи cisco--> Cisco ASR1001 x 2
С MTU по дороге всё в порядке ? С жужипера ping <cisco> size 1472 do-not-frag что показывает ? Конфиг интерфейса в сторону extreme какого-нибудь криминала типа "mtu физического интерфейса - 9192, а для inet на этом vlan'е mtu поправить забыли" не содержит ?
Juniper, Extreme и 2 ASR - L3 устройства Построены bgp между кисками и экстримом и джуном
Проблема в следующем Рандомно падает bgp между джуном и цисками
С такой вот диагностикой
Nov 8 07:05:46 world rpd[1342]: RPD_BGP_NEIGHBOR_STATE_CHANGED: BGP peer 212.26.xx.xx (Internal AS 8788) changed state from Established to Idle (event RecvNotify)
расшифровываю: cisco прислала NOTIFICATION Hold Time Expired
Nov 8 07:05:46 world rpd[1342]: bgp_read_v4_message:10151: NOTIFICATION received from 212.26.xxx.xxx (Internal AS 8788): code 4 (Hold Timer Expired Error), socket buffer sndcc: 12129 rcvcc: 0 TCP state: 4, snd_una: 3438598557 snd_nxt: 3438600017 snd_wnd: 15244 rcv_nxt: 3317969328 rcv_adv: 3317985691, hold timer out 90s, hold timer remain 43.757000s
при том, что у жужипера не только holdtime еще не истёк, но и в send buffer'е данных "более чем на пакет" (sndcc: 12129).
Nov 8 07:05:55 world rpd[1342]: RPD_BGP_NEIGHBOR_STATE_CHANGED: BGP peer 212.26.xx.xx (Internal AS 8788) changed state from OpenConfirm to Established (event RecvKeepAlive)
Причем с обеими, но далеко не всегда обновременно
При это 1. bgp между эктримом и кисками стоит как вкопанная Ie-- 212.26.xxx.xxx 8788 1 ESTABLISHED 39704 89830 (0 ) 25:1:42:08 Ie-- 212.26.xxx.xxx 8788 1 ESTABLISHED 39989 89848 (0 ) 25:1:42:13 2. на это джуне около 30 bgp сессий (в том числе и IPv6), но так себя ведут ТОЛЬКО сессии это клиента. Все вланы с этими сессиями идут по той же физике джун-экстрим 3. mtr с моего сервера на обе cisco за выходные не потерял ни одного пакета (правда трафик не проходит черех jun, чтобы прошел мне не откуда mtr запустить)
Падения выглядят как notify от cisco, что мол все keep-alive ку-ку
На cisco версия ПО - 03.09.01.S На джуне - JUNOS Base OS Software Suite [11.4R7.5]
Традиционный вопрос - как найти виноватого и вправить ему мозг
Пробовал включить bgp trace mage@world# show routing-instances WORLD protocols bgp group xxx type internal; traceoptions { flag all; } description xxx; import ( xxx && set-next-hop && normal-client ); export ( FullView-def && no-community ); peer-as 8788; neighbor 212.26.xxx.xxx; neighbor 212.26.xxx.xxx;
[edit]
Но толи не могу найти куда пишет, толи ничего интересного не пишет
На cisco в логах hold timer expire
-- Best regard, Aleksander Trotsai aka MAGE-RIPE aka MAGE-UANIC My PGP key at ftp://tower.adamant.ua/pub/mage/mage-adamant.ua.pgp-key.txt Продам: Сторожевого хомячка с трехлитровой будкой
-- In theory, there is no difference between theory and practice. But, in practice, there is.