Управление неисправностями
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
В сетевом управлении управление отказами — это набор функций, которые обнаруживают, изолируют и исправляют неисправности в телекоммуникационной сети, компенсируют изменения окружающей среды и включают ведение и проверку ошибок журналов , прием и реагирование на уведомления об обнаружении ошибок, отслеживание и выявление неисправностей, выполнение последовательностей диагностических тестов, исправление ошибок, сообщение об ошибочных состояниях, а также локализацию и отслеживание неисправностей путем изучения и манипулирования базы данных информацией . [1]
При возникновении неисправности или события сетевой компонент часто отправляет уведомление оператору сети с использованием такого протокола, как SNMP . Аварийный сигнал — это постоянное указание на неисправность, которое исчезает только после устранения условия срабатывания. Текущий список проблем, возникающих в сетевом компоненте, часто хранится в форме списка активных сигналов тревоги, например, определенного в RFC 3877, MIB сигналов тревоги . Список устраненных неисправностей также поддерживается большинством систем управления сетью . [2]
Системы управления неисправностями могут использовать сложные системы фильтрации для присвоения тревогам уровней серьезности. По степени серьезности они могут варьироваться от отладочных до аварийных, как в протоколе системного журнала . [3] В качестве альтернативы они могут использовать поле воспринимаемой серьезности функции оповещения ITU X.733. Это принимает значения очищенного, неопределенного, критического, серьезного, незначительного или предупреждения. Обратите внимание, что последняя версия проекта протокола системного журнала, разрабатываемого в IETF, включает сопоставление между этими двумя различными наборами серьезностей. Хорошей практикой считается отправлять уведомление не только о возникновении проблемы, но и о ее устранении. Последнее уведомление будет иметь степень серьезности «ясно».
Консоль управления сбоями позволяет сетевому администратору или системному оператору отслеживать события в нескольких системах и выполнять действия на основе этой информации. В идеале система управления неисправностями должна быть способна правильно идентифицировать события и автоматически предпринимать действия, либо запуская программу или сценарий для принятия корректирующих мер, либо активируя программное обеспечение для уведомлений, которое позволяет человеку принять надлежащее вмешательство (например, отправить электронное письмо или текстовое сообщение SMS). на мобильный телефон ). Некоторые системы уведомлений также имеют правила эскалации, которые уведомляют группу лиц в зависимости от доступности и серьезности сигнала тревоги.
Типы
[ редактировать ]Существует два основных способа управления отказами: активный и пассивный. Пассивное управление сбоями осуществляется путем сбора сигналов тревоги от устройств (обычно через ловушки SNMP ), когда что-то происходит в устройствах. В этом режиме система управления неисправностями знает только, достаточно ли интеллектуально устройство, которое она контролирует, чтобы сгенерировать ошибку и сообщить об этом инструменту управления. Однако если отслеживаемое устройство полностью выйдет из строя или заблокируется, оно не подаст сигнал тревоги и проблема не будет обнаружена. Активное управление сбоями решает эту проблему путем активного мониторинга устройств с помощью таких инструментов, как проверка связи , чтобы определить, активно ли устройство и отвечает ли оно. Если устройство перестает отвечать, активный мониторинг выдаст сигнал тревоги, указывающий, что устройство недоступно, и позволит заранее устранить проблему.
Управление сбоями включает в себя любые инструменты или процедуры для тестирования, диагностики или восстановления сети в случае возникновения сбоя.
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ «Что такое управление отказами? — Определение с сайта WhatIs.com» . Проверено 06 октября 2015 г.
- ^ «Что такое управление отказами? Определение и вводное руководство» . Анализ журналов XpoLog, управление ими и просмотр . 07.04.2020 . Проверено 15 ноября 2020 г.
- ^ RFC 3164
Ссылки
[ редактировать ]В этой статье использованы общедоступные материалы из Федеральный стандарт 1037C . Управление общего обслуживания . Архивировано из оригинала 22 января 2022 г. (в поддержку MIL-STD-188 ).