Независимая эталонная модель

Независимая эталонная модель ( IRM ) — концептуальная модель, используемая при анализе систем хранения : дисковых накопителей, кэшей и т. д.

В этой модели ссылки на хранимые объекты являются независимыми случайными величинами . ^{[ 1 ]}

Описание

Мотивом создания этой модели (и ей подобных) является компенсация отсутствия «следов» в таких устройствах хранения данных.

«Трассировка» — это просто регистрация набора данных о производительности устройства хранения с упором на запросы ввода-вывода : количество операций чтения/записи, размер каждого запроса, точный адрес ( LUN ). и отметка времени.

Точные, достоверные и подробные трассировки реальных систем хранения данных очень сложно получить для целей академического анализа (по причинам, выходящим за рамки данной статьи), и именно поэтому такие модели необходимы.

Обычно доступные данные гораздо более грубые и низкого качества по сравнению с полной трассировкой: например, данные могут записывать за каждую единицу времени T количество операций ввода-вывода, произошедших на каждом LUN (или трек), а также общее соотношение попаданий/промахов.

Например: Для диска с 4 дорожками A, B, C и D и после 15 минут работы запросы ввода-вывода были следующими: 7600, 20, 50, 6000 для A, B, C и D соответственно. .

Легко понять, почему этих данных недостаточно для определения фактической рабочей нагрузки: Рассмотрим второй, еще более простой пример: две дорожки, A и B, каждая из которых имеет 1000 операций ввода-вывода в течение 15 минут.

Чтобы ответить на простой вопрос: «Насколько интенсивно работал диск в течение этих 15 минут?» затем рассмотрите эти два следующих сценария:

(I) Диск сначала получил и ответил на все 1000 запросов ввода-вывода на дорожке A, а затем на все 1000 запросов ввода-вывода на дорожке B.
(II) Диск получал и отвечал на запрос ввода-вывода с разных дорожек попеременно: сначала на A, затем на B, затем снова на A, чередуя A/B до 1000 раз.

Легко видеть, что в каждом из этих сценариев объем работы, выполняемой дисками, сильно различается (в первом сценарии диск выполняет минимальный объем работы, не перемещаясь между дорожками более чем один раз, а во втором сценарии — максимальный объем работы).

IRM была впервые представлена Э. Коффманом и П. Деннингом. ^{[ 2 ]} и он до сих пор активно используется. Это самая упрощенная модель.

В этой модели «без памяти» каждая ссылка ввода-вывода представляет собой полиномиальную случайную величину iid , результатом которой является местоположение следующей опорной дорожки. Таким образом, приходы на любой данный трек должны происходить с определенной средней скоростью, которая прямо пропорциональна вероятности запроса трека. Более конкретно, частота поступления запросов на данную дорожку равна вероятности доступа к ней, на которую она ссылается, умноженной на общую скорость запросов.

То есть мы обозначаем N как сумму всех запросов ввода-вывода (как на чтение, так и на запись) и присваиваем каждой дорожке вероятность количества произошедших с нее операций ввода-вывода, деленную на N. В случае нашего первого примера: N = 7600 + 20 + 50 + 6000 = 13 670, и мы назначим каждому треку следующие вероятности:

А → 7600/Н, В → 20/Н, С → 50/Н и D → 6000/Н.

Преимущество этой модели, помимо простоты и удобства работы, заключается в ее консервативности. Это означает, что при анализе наихудшего сценария мы не можем сильно отклониться от результата модели, как показано в следующем примере:

Возвращаясь ко второму примеру:

В лучшем случае диск переместился из А в Б только один раз, а в худшем — 2000 раз туда и обратно.

Если использовать модель IRM (технические расчеты, которые здесь не приводятся), то ожидание составит 1000 перемещений между путями.

То есть: результат отличался от наихудшего сценария в два раза, тогда как в лучшем сценарии он фактически сэкономил кратно 1000!

Действительно, можно доказать, что модель IRM всегда удовлетворяет требованию, что она всегда «отклоняется» максимум на величину, кратную двум.

Ссылки

^ Флажоле, Филипп (1992). «Парадокс дня рождения, сборщики купонов, алгоритмы кэширования и самоорганизующийся поиск» . Дискретная прикладная математика . 39 (3): 207–229. дои : 10.1016/0166-218x(92)90177-c .
^ Коффман, Эдвард Дж. младший; Деннинг, Питер Дж. (1 января 1973 г.). Теория операционных систем . Профессиональный технический справочник Прентис Холл. ISBN 978-0136378686 .

[1] Флажоле, Филипп (1992). «Парадокс дня рождения, сборщики купонов, алгоритмы кэширования и самоорганизующийся поиск» . Дискретная прикладная математика . 39 (3): 207–229. дои : 10.1016/0166-218x(92)90177-c .

[2] Коффман, Эдвард Дж. младший; Деннинг, Питер Дж. (1 января 1973 г.). Теория операционных систем . Профессиональный технический справочник Прентис Холл. ISBN 978-0136378686 .

[ 1 ]

[ 2 ]