Цель уровня обслуживания
Эта статья нуждается в дополнительных цитатах для проверки . ( декабрь 2013 г. ) |
Целевой уровень обслуживания ( SLO ), согласно книге O'Reilly Site Reliability Engineering, представляет собой «целевое значение или диапазон значений для уровня обслуживания , который измеряется SLI ». [1] SLO — это ключевой элемент соглашения об уровне обслуживания (SLA) между поставщиком услуг и клиентом . SLO согласованы как средство измерения эффективности работы поставщика услуг и рассматриваются как способ избежать споров между двумя сторонами, основанных на недопонимании.
Обзор
[ редактировать ]Часто возникает путаница в использовании SLA и SLO. SLA — это полное соглашение, в котором указывается, какая услуга должна быть предоставлена, как она поддерживается, время, место, стоимость, производительность и обязанности участвующих сторон. SLO — это конкретные измеримые характеристики SLA, такие как доступность, пропускная способность, частота, время отклика или качество. Эти SLO вместе предназначены для определения ожидаемого обслуживания между поставщиком и клиентом и различаются в зависимости от срочности, ресурсов и бюджета услуги. SLO предоставляют количественные средства для определения уровня обслуживания, которое клиент может ожидать от поставщика. [2]
SLO формируются путем установки целей для метрик (обычно называемых индикаторами уровня обслуживания , SLI). Например, SLO доступности может быть определен как ожидаемое измеренное значение SLI доступности в течение заданного периода времени (например, четырех недель). Используемый SLI доступности будет зависеть от характера и архитектуры службы. Например, простой веб-сервис может использовать соотношение количества успешных ответов и общего количества полученных действительных запросов. (общее_успех/общее_действительное) [3]
Примеры
[ редактировать ]Штурм и Моррис спорят [4] что СРБ должны быть:
- Достижимый
- Повторяемый
- Измеримый
- Понятно
- Значимый
- Управляемый
- Доступный
- Взаимоприемлемо
Хотя Андриё и др. определить SLO как «аспект качества обслуживания соглашения. Синтаксически это утверждение условий соглашения, а также таких качеств, как дата и время». [5] Келлер и Людвиг более кратко определяют SLO как «обязательство поддерживать определенное состояние службы в течение заданного периода» в отношении состояния параметров SLA. [6] Келлер и Людвиг далее заявляют, что, хотя поставщики услуг чаще всего будут ведущей организацией, берущей на себя SLO, четкого определения как такового не существует, и ответственность за SLO может нести любая организация. Наряду с этим SLO можно разбить на ряд различных компонентов.
- Обязан — организация, которая обязана предоставить SLO.
- Срок действия — время, в течение которого SLO будет доставлено.
- Выражение. Это фактический язык, который определяет, каким будет SLO.
При необходимости SLO может быть назначено событие EvaluationEvent. EvaluationEvent определяется как мера, по которой SLO будет проверяться на предмет соответствия выражению.
SLO обычно следует указывать с точки зрения ценности достижения или уровня обслуживания, целевого измерения, периода измерения, а также места и способа их измерения. [2] Например, «на 90% звонков в службу поддержки необходимо ответить менее чем за 20 секунд за период в один месяц, как сообщает система ACD ». Результаты могут быть представлены в виде процента времени достижения целевого времени ответа, а затем сравниваться с желаемым уровнем обслуживания (90%).
Тип меры | Пример требования к SLO | Период измерения |
---|---|---|
Доступность | Приложение будет доступно 99,95% времени. | Более года |
Ответ службы поддержки | На 75% обращений в службу поддержки будут даны ответы менее чем за минуту. На 85% обращений в службу поддержки будут даны ответы в течение двух минут. На 100% обращений в службу поддержки будет дан ответ в течение трех минут. | Больше месяца |
Время реагирования на инцидент | 99% заявок уровня серьезности 1 будут решены в течение трех часов. 98% заявок уровня серьезности 2 будут решены в течение восьми часов. 98% заявок уровня серьезности 3 будут решены в течение трех рабочих дней. 98% заявок 4-й степени тяжести будут решены в течение пяти рабочих дней. | Более четверти |
Время ответа | 85% TCP отвечают в течение 1,5 секунд после получения запроса. 99,5% TCP отвечают в течение 4 секунд после получения запроса. | Больше месяца |
Использование термина
[ редактировать ]Термин SLO встречается в различных научных работах, например, в эталонной архитектуре проекта SLA@SOI. [7] и он используется в документе Open Grid Forum по WS-соглашению. [5]
Ссылки
[ редактировать ]- ^ Бейер, Джонс, Петофф, Мерфи. «Проектирование надежности сайта: как Google управляет производственными системами» . Проектирование надежности сайта Google . О'Рейли . Проверено 9 июня 2023 г.
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Jump up to: а б Растегари, Юсеф; Шамс, Ферейдун (29 декабря 2015 г.). «Оптимальное разложение целей уровня обслуживания на утверждения политики» . Научный мировой журнал . 2015 : 465074. doi : 10.1155/2015/465074 . ISSN 2356-6140 . ПМК 4709918 . ПМИД 26962544 .
- ^ Идальго, Алекс (август 2020 г.). Реализация целей уровня обслуживания (1-е изд.). O'Reilly Media, Inc. ISBN 9781492076766 .
- ^ Рик Штурм, Уэйн Моррис «Основы управления уровнем обслуживания», апрель 2000 г., Пирсон.
- ^ Jump up to: а б Ален Андрие, Карл Чайковски, Асит Дэн, Кейт Кихи , Хейко Людвиг, Тошиюки Наката, Джим Прюйн, Джон Рофрано, Стив Туке, Мин Сюй «Спецификация соглашения о веб-сервисах (WS-соглашение)», GFD-RP.107, март 2007 г., Открытый грид-форум.
- ^ Александр Келлер, Хайко Людвиг «Структура WSLA: определение и мониторинг соглашений об уровне обслуживания для веб-служб», Журнал управления сетями и системами, Том 11, n. 1 марта 2003 г.
- ^ Йенс Хаппе, Вольфганг Тейлманн, Эндрю Эдмондс и Кевен Т. Кирни «Эталонная архитектура для многоуровневого управления SLA» в «Соглашения об уровне обслуживания для облачных вычислений», ред. Видер, Филипп и Батлер, Джо М. и Тейлманн, Вольфганг и Яхьяпур, Рамин, Springer New York, 2011, DOI: 10.1007/978-1-4614-1614-2_2