Jump to content

Распределение данных

В компьютерном хранении данных чередование данных — это метод сегментации логически последовательных данных, таких как файл, так, чтобы последовательные сегменты сохранялись на разных физических устройствах хранения.

Пример чередования данных. Файлы A и B по четыре блока каждый распределены по дискам от D1 до D3.

Чередование полезно, когда устройство обработки запрашивает данные быстрее, чем одно устройство хранения может их предоставить. Распределяя сегменты по нескольким устройствам, к которым можно получить доступ одновременно, общая пропускная способность данных увеличивается. Это также полезный метод для балансировки нагрузки ввода-вывода на массив дисков. Чередование используется на дисках в хранилищах резервных массивов независимых дисков (RAID), контроллерах сетевых интерфейсов , дисковых массивах, различных компьютерах в кластерных файловых системах и сетевых хранилищах , а также в оперативной памяти в некоторых системах.

Один из методов чередования осуществляется путем чередования последовательных сегментов на устройствах хранения в циклическом порядке с начала последовательности данных. Это хорошо работает для потоковой передачи данных, но для последующего произвольного доступа потребуется знание того, какое устройство содержит данные. Если данные хранятся таким образом, что физическому адресу каждого сегмента данных назначается однозначное сопоставление с конкретным устройством, устройство для доступа к каждому запрошенному сегменту может быть рассчитано на основе адреса, не зная смещения данных внутри полная последовательность.

Могут использоваться и другие методы, при которых последовательные сегменты не сохраняются на последовательных устройствах. Такое непоследовательное перемежение может иметь преимущества в некоторых схемах исправления ошибок .

Преимущества и недостатки

[ редактировать ]

Преимущества чередования включают производительность и пропускную способность. Последовательное временное чередование доступа к данным позволяет кумулятивно умножать меньшую пропускную способность доступа к данным каждого устройства хранения на количество используемых устройств хранения. Повышенная пропускная способность позволяет устройству обработки данных продолжать свою работу без перерывов и тем самым быстрее завершать свои процедуры. Это проявляется в повышении производительности обработки данных.

Поскольку разные сегменты данных хранятся на разных устройствах хранения, отказ одного устройства приводит к повреждению всей последовательности данных. По сути, частота отказов массива устройств хранения равна сумме частоты отказов каждого устройства хранения. Этот недостаток чередования можно преодолеть за счет хранения избыточной информации, такой как четность , с целью исправления ошибок. В такой системе этот недостаток преодолевается за счет необходимости дополнительного хранилища.

Терминология

[ редактировать ]

Сегменты последовательных данных, записываемых на диск или считываемых с него перед продолжением операции на следующем диске, обычно называются кусками , страйдами или блоками страйпа , а их логические группы, образующие отдельные чередующиеся операции, называются полосами или страйпами . Объем данных в одном фрагменте (единице страйпа), часто выраженный в байтах, по-разному называется размером фрагмента , размером шага , размером страйпа , глубиной страйпа или длиной страйпа . Количество дисков данных в массиве иногда называют шириной полосы , но оно также может относиться к объему данных в полосе. [1] [2] [3] [4]

Количество данных за один шаг, умноженное на количество дисков с данными в массиве (т. е. глубину полосы , умноженную на ширину полосы , что в геометрической аналогии дает площадь), иногда называют размером полосы или шириной полосы . [5] Широкое чередование происходит, когда фрагменты данных распределяются по нескольким массивам, возможно, по всем дискам в системе. Узкое чередование происходит, когда фрагменты данных распределяются по дискам в одном массиве.

Приложения

[ редактировать ]

Распределение данных используется в некоторых базах данных , таких как Sybase , и в некоторых RAID-устройствах под программным или аппаратным управлением, таких как подсистема IBM 9394 RAMAC Array . Файловые системы кластеров также используют чередование. Oracle Автоматическое управление хранилищем позволяет файлам ASM быть грубыми или мелкими.

Рейд
В некоторых конфигурациях RAID, таких как RAID 0 , выход из строя одного диска массива RAID приводит к потере всех сохраненных данных. В других конфигурациях RAID, таких как RAID 5 , который содержит распределенную четность и обеспечивает избыточность , в случае сбоя одного диска-члена данные можно восстановить с использованием других дисков в массиве.
LVM2
Linux Чередование данных также может быть достигнуто с помощью управления логическими томами (LVM). Система LVM позволяет регулировать грубость рисунка полос. Инструменты LVM позволят реализовать чередование данных в сочетании с зеркалированием . LVM предлагает дополнительное преимущество кэширования чтения и записи на NVM Express для медленно вращающегося хранилища. У LVM есть и другие преимущества, не связанные напрямую с чередованием данных (например, снимки, динамическое изменение размера и т. д.).
Btrfs и ZFS
Имеет функции, подобные RAID, но с безопасностью целостности фрагментов для обнаружения плохих блоков и дополнительной гибкостью добавления произвольного количества дополнительных дисков. У них есть и другие преимущества, не связанные напрямую с чередованием данных (копирование при записи и т. д.).

См. также

[ редактировать ]
  1. ^ «Руководство по администрированию хранилища Red Hat Enterprise Linux 6, глава 6. Файловая система ext4» . Красная шляпа . 9 октября 2014 года . Проверено 8 февраля 2015 г.
  2. ^ «mdadm(8) — справочная страница Linux» . linux.die.net . Проверено 8 февраля 2015 г.
  3. ^ «Документация по ядру Linux: настройка RAID» . ядро.орг . 11 ноября 2014 года . Проверено 8 февраля 2015 г.
  4. ^ «Размер RAID-блока» (PDF) . xyratex.com . Январь 2008 г. стр. 6–7. Архивировано из оригинала (PDF) 1 августа 2014 года . Проверено 8 февраля 2015 г.
  5. ^ «Глубина страйпа — это размер страйпа, иногда называемый единицей страйпа. Ширина страйпа — это произведение глубины страйпа и количества дисков в чередующемся наборе».
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 39e4f7231b3e79248cb8af16f9844e64__1707265080
URL1:https://arc.ask3.ru/arc/aa/39/64/39e4f7231b3e79248cb8af16f9844e64.html
Заголовок, (Title) документа по адресу, URL1:
Data striping - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)