Единая точка отказа
Эта статья нуждается в дополнительных цитатах для проверки . ( май 2014 г. ) |

Единая точка отказа ( SPOF ) — это часть системы, выход из строя которой приведет к прекращению работы всей системы . [1] SPOF нежелательны в любой системе, где требуется высокая доступность или надежность , будь то бизнес-практика, программное приложение или другая промышленная система.
Обзор [ править ]
Системы можно сделать более надежными, добавив избыточность во все потенциальные SPOF. Резервирование может быть достигнуто на различных уровнях.
Оценка потенциального SPOF включает идентификацию критических компонентов сложной системы, которые в случае неисправности могут спровоцировать полный отказ системы . Высоконадежные системы не должны полагаться на какой-либо отдельный компонент.
Например, владелец небольшой компании по уходу за деревьями может владеть только одной измельчителем древесины . Если измельчитель сломается, они, возможно, не смогут выполнить свою текущую работу, и им, возможно, придется отменить будущие работы, пока они не смогут получить замену. Владелец компании по уходу за деревьями может иметь наготове запасные части для ремонта измельчителя древесины на случай, если он выйдет из строя. На более высоком уровне у них может быть вторая дробилка древесины, которую они смогут привезти на стройплощадку. Наконец, на самом высоком уровне у них может быть достаточно оборудования, чтобы полностью заменить все на рабочем месте в случае многочисленных сбоев.
- Возможные SPOF в простой настройке
- Использование избыточности, чтобы избежать некоторых SPOF
- Полностью резервированная система без SPOF (примечание: предполагается, что генератор и сетевые источники имеют рейтинг N, каждый ИБП имеет рейтинг N, а «A/C» и «Электрические» сами по себе являются полностью отказоустойчивыми системами)
Вычисление [ править ]
![]() | Этот раздел необходимо обновить . Причина: Требуется обновление для общедоступных облачных вычислений. ( май 2022 г. ) |
Отказоустойчивая компьютерная система может быть достигнута на уровне внутренних компонентов, на уровне системы (несколько машин) или на уровне площадки (репликация).
Обычно необходимо развернуть балансировщик нагрузки , чтобы обеспечить высокую доступность кластера серверов на уровне системы. В кластере серверов высокой доступности каждый отдельный сервер может обеспечить внутреннюю избыточность компонентов за счет наличия нескольких источников питания, жестких дисков и других компонентов. Избыточность на уровне системы может быть достигнута за счет наличия резервных серверов, готовых принять на себя работу другого сервера в случае его отказа.
Поскольку центр обработки данных часто является центром поддержки других операций, таких как бизнес-логика, он сам по себе представляет собой потенциальный SPOF. Таким образом, на уровне сайта весь кластер может быть реплицирован в другое место, откуда к нему можно будет получить доступ в случае, если основное местоположение станет недоступным. Обычно эта проблема рассматривается как часть программы аварийного восстановления ИТ .
Пол Бэран и Дональд Дэвис разработали коммутацию пакетов , ключевую часть «живущих сетей связи». Такие сети, включая ARPANET и Интернет , спроектированы таким образом, чтобы не иметь единой точки отказа. Множественные пути между любыми двумя точками в сети позволяют этим точкам продолжать взаимодействовать друг с другом, пакеты, «маршрутизирующиеся вокруг» повреждаются , даже после любого единичного сбоя любого конкретного пути или любого одного промежуточного узла.
Программная инженерия [ править ]
В разработке программного обеспечения узкое место возникает, когда мощность приложения или компьютерной системы ограничена одним компонентом. Узкое место имеет самую низкую пропускную способность среди всех частей пути транзакции.
Проектирование производительности [ править ]
Отслеживание узких мест (иногда называемых «горячими точками» — разделами кода, которые выполняются наиболее часто, т. е. имеют наибольшее количество выполнений) называется анализом производительности . Сокращение обычно достигается с помощью специализированных инструментов, известных как анализаторы производительности или профилировщики. Цель состоит в том, чтобы заставить эти отдельные участки кода работать как можно быстрее, чтобы повысить общую эффективность алгоритма .
Компьютерная безопасность [ править ]
Уязвимость или эксплойт безопасности только в одном компоненте может поставить под угрозу всю систему.
Другие поля [ править ]
Концепция единой точки отказа также применялась к областям, выходящим за рамки проектирования, компьютеров и сетей, например, к корпоративной цепочкой поставок . управлению [2] и управление транспортом. [3]
Структуры проектирования, создающие единые точки отказа, включают узкие места и последовательные схемы (в отличие от параллельных цепей ).
В области транспорта некоторые отмеченные недавние примеры недавнего применения концепции включают мост через реку Нипигон в Канаде, где частичный обвал моста в январе 2016 года полностью прервал дорожное движение между Восточной Канадой и Западной Канадой на несколько дней, поскольку он расположен вдоль части Трансканадское шоссе , где нет альтернативного объездного маршрута для транспортных средств; [4] и железнодорожный мост через реку Норуолк в Норуолке , штат Коннектикут , устаревший разводной мост , который иногда застревает при открытии или закрытии, нарушая железнодорожное движение на линии Северо-восточного коридора . [3]
Концепция единой точки отказа также применяется в сфере разведки. Эдвард Сноуден говорил об опасностях быть тем, что он назвал «единой точкой отказа» – единственным хранилищем информации. [5]
Системы жизнеобеспечения [ править ]
![]() | Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( октябрь 2019 г. ) |
Компонент системы жизнеобеспечения , который будет представлять собой единую точку отказа, должен быть чрезвычайно надежным.
См. также [ править ]
Концепции [ править ]
- Каскадный сбой – системный риск сбоя
- Резервирование – дублирование критически важных компонентов для повышения надежности системы.
- Фактор автобуса – Концепция управления рисками
- Закон Люссера - Закон вероятностного произведения компонентов ряда.
- Соглашение об уровне обслуживания – официальное обязательство между поставщиком услуг и клиентом.
Приложения [ править ]
- Аварийный выключатель – механизм безопасности для быстрого отключения системы.
- Гайка Иисуса - жаргонный термин, обозначающий гайку, удерживающую несущий винт некоторых вертолетов.
- Проектирование надежности - раздел системной инженерии, в котором особое внимание уделяется надежности.
- Инженерия безопасности - инженерная дисциплина, которая гарантирует, что инженерные системы обеспечивают приемлемый уровень безопасности.
- Выключатель мертвеца - оборудование, которое активируется или деактивируется при выходе оператора из строя.
В литературе [ править ]
- Ахиллесова пята – критическая слабость, которая может привести к падению, несмотря на общую силу.
- Гамартия – ошибка главного героя в греческой теории драмы
Ссылки [ править ]
- ^ 1: Проектирование крупномасштабных локальных сетей - стр. 31, К. Дули, О'Рейли, 2002 г.
- ^ Гэри С. Линч (7 октября 2009 г.). Единая точка отказа: 10 основных законов управления рисками в цепочке поставок . Уайли. ISBN 978-0-470-42496-4 .
- ^ Перейти обратно: а б «Важнейший, столетний, а иногда и застрявший: мост Коннектикута является ключом к северо-восточному коридору» . Общественное радио Коннектикута , 8 августа 2017 г.
- ^ «Мост через реку Нипигон и другие узкие места Трансканады» . Глобальные новости , 11 января 2016 г.
- ^ «Эдвард Сноуден: правдивая история утечек информации из АНБ» . Телеграф.co.uk . Архивировано из оригинала 12 января 2022 г. Проверено 13 декабря 2016 г.