On Tue, 10 Feb 2009, Andrey Zarechansky wrote:
On Tue, Feb 10, 2009 at 09:40:11PM +0200, Anton Turygin wrote:
Привет,
Привет
1) Аппаратная проблема 2) Проблемная конфигурация 3) Проблемное окружение
По описанию похоже на композит 2 и 3. Снимаешь CPU load? Есть DFC на 6704?
Да. WS-F6700-DFC3CXL. CPU в порядке. Увеличу дискретность съема, может есть всплеск на момент начала проблемы (но это обычно дело пары секунд).
Заземлена ли коробка? Развязана галванически с незаземленными элементами?
С этим проблема. Железка в ДЦ в штатах. Само шасси уже меняли. Может таки отправить их менять RSP? Забыл только один факт упомянуть. Если через нее зароутить трафик только с некоторых сетей (получается ~30% от общего и только исходящий) - стоит как вкопаная и никаких проблем.
Я бы начанал копать сначала CPU load на RP/SP в сторону: - unknown unicast flood - arp flood - l2 loop
Она как-то и в кольце не участвует. Один интерфейс - внутрь с SVI. Второй интерфейс - no switchport в аплинка. Может убить нафиг SVI?
- агрессивные таймера старения/хелло
На OSPF timers throttle spf 20 100 3000 timers throttle lsa 50 100 3000 timers lsa arrival 20 int XXX ip ospf dead-interval minimal hello-multiplier 4 но всего один интерфейс участвует. И в датабазе только лупбек нейбора да интерфейс.
- влияние других устройств на агрессивное проливание rib'а в fib/lfib
Например что может влиять?
- pbr? - nat?
Не-не. Никаких.
Попробуй посмотреть не встречается ли в момент проблем трафик не отрабатоный cef'ом.
Дык в момент проблем вообще трафика нет ;-) Железка выводится из ступора только hard reload-ом. Но таки да. Статистику посмотрю, куда оно изначально начинает трафик швырять.
Если озвученный танцы не помогут, гаси коробку, доставай пылесос и перебирай память и тщательно защелкивай разъемы.
Если и это не поможет, открывай case и смотри как с тобой будет бороться инженер TAC'а.
Да уж собираюсь. Только опять же сложно с разницей во времени. И держать ее долго в таком состоянии не могу (забиваются интерфейсы на другой железке). Потому сюда сначала пришел ;-)
Привет. Господа, может кто умное чего посоветует. Бо я уже шишку набил ;-(
Имеется: 7606 RSP720-10GE + WS-X6704-10GE + WS-X6748-SFP
Трафика ~9 гигабит. Весь трафик, собственно, крутится на WS-X6704-10GE (в один порт пришел, в другой ушел).
Из всякого исполняет на себе HSRP, spanning tree. 2 BGP нейбора. Немного OSPF.
Так вот, раза два-три в день она зависает. Причем зависает не намертво (консолью попасть можно). Дропает HSRP, BGP и роутинг, как таковой. Причем на обеих платах. Интерфейсные пинги не ходят.
В этот момент она отлично видит MAC-и на своих портах. Но вот на железках, подключеных к ней, MAC-ов на соответствующих портах нет. Если попытаться запихнуть в нее трафик, который надо свичевать - нормально свичует.
В логах пусто (кроме, собственно, падения HSRP, BGP и OSPF).
show platform hardware capacity странностей не показывают.
IOS-ы пробовал 122-33.SRC1 и 122-33.SRD. Везде одна картина.
Вот и что с такой бедой посоветуете делать? ;-(
-- RAZ-UANIC RAZ-RIPE