Независимая эталонная модель
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти сообщения )
|
Независимая эталонная модель ( IRM ) — концептуальная модель, используемая при анализе систем хранения : дисковых накопителей, кэшей и т. д.
В этой модели ссылки на хранимые объекты являются независимыми случайными величинами . [ 1 ]
Описание
[ редактировать ]Мотивом создания этой модели (и ей подобных) является компенсация отсутствия «следов» в таких устройствах хранения данных.
«Трассировка» — это просто регистрация набора данных о производительности устройства хранения с упором на запросы ввода-вывода : количество операций чтения/записи, размер каждого запроса, точный адрес ( LUN ). и отметка времени.
Точные, достоверные и подробные трассировки реальных систем хранения данных очень сложно получить для целей академического анализа (по причинам, выходящим за рамки данной статьи), и именно поэтому такие модели необходимы.
Обычно доступные данные гораздо более грубые и низкого качества по сравнению с полной трассировкой: например, данные могут записывать за каждую единицу времени T количество операций ввода-вывода, произошедших на каждом LUN (или трек), а также общее соотношение попаданий/промахов.
Например: Для диска с 4 дорожками A, B, C и D и после 15 минут работы запросы ввода-вывода были следующими: 7600, 20, 50, 6000 для A, B, C и D соответственно. .
Легко понять, почему этих данных недостаточно для определения фактической рабочей нагрузки: Рассмотрим второй, еще более простой пример: две дорожки, A и B, каждая из которых имеет 1000 операций ввода-вывода в течение 15 минут.
Чтобы ответить на простой вопрос: «Насколько интенсивно работал диск в течение этих 15 минут?» затем рассмотрите эти два следующих сценария:
- (I) Диск сначала получил и ответил на все 1000 запросов ввода-вывода на дорожке A, а затем на все 1000 запросов ввода-вывода на дорожке B.
- (II) Диск получал и отвечал на запрос ввода-вывода с разных дорожек попеременно: сначала на A, затем на B, затем снова на A, чередуя A/B до 1000 раз.
Легко видеть, что в каждом из этих сценариев объем работы, выполняемой дисками, сильно различается (в первом сценарии диск выполняет минимальный объем работы, не перемещаясь между дорожками более чем один раз, а во втором сценарии — максимальный объем работы).
IRM была впервые представлена Э. Коффманом и П. Деннингом. [ 2 ] и он до сих пор активно используется. Это самая упрощенная модель.
В этой модели «без памяти» каждая ссылка ввода-вывода представляет собой полиномиальную случайную величину iid , результатом которой является местоположение следующей опорной дорожки. Таким образом, приходы на любой данный трек должны происходить с определенной средней скоростью, которая прямо пропорциональна вероятности запроса трека. Более конкретно, частота поступления запросов на данную дорожку равна вероятности доступа к ней, на которую она ссылается, умноженной на общую скорость запросов.
То есть мы обозначаем N как сумму всех запросов ввода-вывода (как на чтение, так и на запись) и присваиваем каждой дорожке вероятность количества произошедших с нее операций ввода-вывода, деленную на N. В случае нашего первого примера: N = 7600 + 20 + 50 + 6000 = 13 670, и мы назначим каждому треку следующие вероятности:
- А → 7600/Н, В → 20/Н, С → 50/Н и D → 6000/Н.
Преимущество этой модели, помимо простоты и удобства работы, заключается в ее консервативности. Это означает, что при анализе наихудшего сценария мы не можем сильно отклониться от результата модели, как показано в следующем примере:
- Возвращаясь ко второму примеру:
- В лучшем случае диск переместился из А в Б только один раз, а в худшем — 2000 раз туда и обратно.
- Если использовать модель IRM (технические расчеты, которые здесь не приводятся), то ожидание составит 1000 перемещений между путями.
- То есть: результат отличался от наихудшего сценария в два раза, тогда как в лучшем сценарии он фактически сэкономил кратно 1000!
Действительно, можно доказать, что модель IRM всегда удовлетворяет требованию, что она всегда «отклоняется» максимум на величину, кратную двум.
Ссылки
[ редактировать ]- ^ Флажоле, Филипп (1992). «Парадокс дня рождения, сборщики купонов, алгоритмы кэширования и самоорганизующийся поиск» . Дискретная прикладная математика . 39 (3): 207–229. дои : 10.1016/0166-218x(92)90177-c .
- ^ Коффман, Эдвард Дж. младший; Деннинг, Питер Дж. (1 января 1973 г.). Теория операционных систем . Профессиональный технический справочник Прентис Холл. ISBN 978-0136378686 .