Правило пяти минут
В информатике правило пяти минут — это практическое правило, позволяющее решить, следует ли хранить элемент данных в памяти или хранить на диске и считывать обратно в память, когда это необходимо. Впервые он был сформулирован Джимом Греем и Джанфранко Путцолу в 1985 году. [1] [2] а затем впоследствии пересмотрено в 1997 г. [3] и 2007 г. [4] для отражения изменений в относительной стоимости и производительности памяти и постоянного хранилища.
Правило следующее:
Правило 5-минутной случайности: кэшируйте случайно доступные страницы диска, которые повторно используются каждые 5 минут или меньше.
Грей также ввел аналогичное одноминутное правило для последовательного доступа : [5]
Правило 1 минуты: кэшируйте страницы диска с последовательным доступом, которые повторно используются каждые 1 минуту или реже.
Хотя правило 5 минут было изобретено в сфере баз данных, оно также применялось и в других местах, например, при планировании емкости кэша сетевой файловой системы . [6]
Первоначальное правило 5 минут было получено на основе следующих расчетов затрат и выгод: [4]
- BreakEvenIntervalinSeconds = (PagesPerMBofRAM / AccessesPerSecondPerDisk) × (PricePerDiskDrive / PricePerMBofRAM)
Применение этого метода к данным 2007 года дает интервал примерно 90 минут для кэширования магнитного диска в DRAM, 15 минут для SSD в DRAM и 2 кэширования 1 ⁄ часа для кэширования с диска на SSD. Таким образом, интервал между диском и DRAM был немного меньше того, что Грей и Путцолу ожидали в 1987 году, поскольку в 2007 году для оперативной памяти и дисков должно было действовать «правило пяти часов». [4]
Согласно расчетам инженера NetApp Дэвида Дейла, опубликованным в The Register , показатели кэширования диска в DRAM в 2008 году были следующими: «Безубыточность страницы размером 50 КБ составляла пять минут, страница 4 КБ — один час, а страница 1 КБ — потребовалось пять часов. Чтобы достичь безубыточности за пять минут, размер страницы должен был увеличиться в 50 раз». Что касается кэширования с диска на SSD в 2010 году, тот же источник сообщил, что «разрыв страницы размером 250 КБ с SLC составлял пять минут, но пять часов с размером страницы 4 КБ. Это было пять минут с размером страницы 625 КБ с флэш-памятью MLC и 13 часов с размером страницы MLC 4 КБ». [7]
В 2000 году Грей и Шеной применили аналогичный расчет для кэширования веб-страниц и пришли к выводу, что браузер должен «кэшировать веб-страницы, если есть хоть малейшая вероятность, что на них будут повторно ссылаться в течение жизни». [8]
Ссылки
[ редактировать ]- ^ Грей, Джим; Путзолу, Франко (май 1985 г.), Правило 5 минут для обмена памяти на доступ к диску и правило 5 байт для обмена памяти на время процессора (PDF)
- ^ Грей, Джим; Путцолу, Джанфранко Р. (1987), «Правило 5 минут для обмена памяти на доступ к диску и Правило 10 байт для обмена памяти на время процессора», Труды конференции ACM SIGMOD , стр. 395–398, CiteSeerX 10.1.1.624 .3312 , doi : 10.1145/38713.38755 , ISBN 978-0897912365 , S2CID 10770251
- ^ Грей, Джим; Грефе, Гетц (1997), «Правило пяти минут десять лет спустя и другие практические правила хранения данных на компьютере», ACM SIGMOD Record , 26 (4): 63–68, arXiv : cs/9809005 , doi : 10.1145/271074.271094 , S2CID 21524661
- ^ Jump up to: а б с Грефе, Гетц (2007), «Правило пяти минут двадцать лет спустя, и как флэш-память меняет правила», DaMoN '07: Материалы 3-го международного семинара по управлению данными на новом оборудовании , стр. 1–9, doi : 10.1145/1363189.1363198 , ISBN 9781595937728 , S2CID 14991801 Бесплатная версия в очереди ACM , сентябрь 2008 г. .
- ^ Рене Дж. Шеванс (2004). Серверные архитектуры: мультипроцессоры, кластеры, параллельные системы, веб-серверы, решения для хранения данных . Цифровая пресса. п. 542. ИСБН 978-0-08-049229-2 .
- ^ Джан-Паоло Д. Мусумечи; Майк Лукидес (2002). Настройка производительности системы . О'Рейли Медиа, Инк. с. 263. ИСБН 978-0-596-55204-6 .
- ^ «Флэш и правило пяти минут • The Register» . Регистр .
- ^ Джим Грей, Прашант Шеной, « Практические правила разработки данных », MS-TR-99-100