Избыточность данных
В основной памяти компьютера , вспомогательной памяти и компьютерных шинах — избыточность данных это наличие данных, которые являются дополнительными к фактическим данным и позволяют исправлять ошибки в хранимых или передаваемых данных. Дополнительные данные могут быть просто полной копией реальных данных (тип кода повторения ) или только выбранными фрагментами данных, которые позволяют обнаруживать ошибки и восстанавливать потерянные или поврежденные данные до определенного уровня.
Например, за счет включения вычисленных контрольных битов память ECC способна обнаруживать и исправлять однобитовые ошибки в каждом слове памяти , а RAID 1 объединяет два жестких диска (HDD) в логическое запоминающее устройство, которое позволяет сохраненным данным сохраняться в течение всего процесса хранения. выход из строя одного диска. [1] [2] Избыточность данных также может использоваться как мера против скрытого повреждения данных ; например, файловые системы, такие как Btrfs и ZFS, используют контрольную сумму данных и метаданных в сочетании с копиями сохраненных данных для обнаружения скрытого повреждения данных и устранения его последствий. [3]
В системах баз данных [ править ]
и отличается по своей природе, Хотя избыточность данных она также возникает в системах баз данных , в которых значения повторяются без необходимости в одной или нескольких записях или полях , внутри таблицы или где поле реплицируется/повторяется в двух или более таблицах. Часто это встречается в ненормализованных структурах баз данных и приводит к усложнению управления базами данных, возникновению риска повреждения данных и увеличению необходимого объема хранилища . Если это делается намеренно на основе ранее нормализованной схемы базы данных, это можно рассматривать как форму денормализации базы данных ; используется для повышения производительности запросов к базе данных (сокращение времени ответа базы данных).
Например, когда данные о клиентах дублируются и прикрепляются к каждому купленному продукту, избыточность данных является известным источником несогласованности , поскольку данный клиент может появиться с разными значениями для одного или нескольких своих атрибутов. [4] Избыточность данных приводит к аномалиям и повреждению данных , и ее, как правило, следует избегать при проектировании; [5] применение нормализации базы данных предотвращает избыточность и обеспечивает максимально эффективное использование хранилища. [6]
См. также [ править ]
- Обслуживание данных
- Дедупликация данных
- Очистка данных
- Комплексная защита данных
- Резервирование (инжиниринг)
- Избыточность (теория информации)
Ссылки [ править ]
- ^ Синь Ли; Майкл С. Хуанг; Кай Шен; Линкун Чу (9 мая 2010 г.). «Реалистичная оценка аппаратных ошибок памяти и восприимчивости программной системы» (PDF) . cs.rochester.edu . Проверено 16 января 2015 г.
- ^ Ремзи Х. Арпачи-Дюссо; Андреа К. Арпачи-Дюссо (3 января 2015 г.). «Операционные системы – три простых элемента: избыточные массивы недорогих дисков (RAID)» (PDF) . cs.wisc.edu . Проверено 16 января 2015 г.
- ^ Маргарет Бирман; Ленц Гриммер (август 2012 г.). «Как я использую расширенные возможности Btrfs» . Корпорация Оракл . Проверено 26 января 2015 г.
- ^ Хорхе Х. Доорн; Лаура К. Риверо (2002). Целостность базы данных: проблемы и решения . Идея Групп Инк (IGI). стр. 4–5. ISBN 978-1-930708-38-9 . Проверено 23 января 2011 г.
- ^ Питер Роб; Карлос Коронель (2009). Системы баз данных: проектирование, внедрение и управление . Cengage Обучение. п. 88. ИСБН 978-1-4239-0201-0 . Проверено 22 января 2011 г.
- ^ ITL Education Solutions Limited; Итл (2009). Введение в информационные технологии . Пирсон Образовательная Индия. п. 522. ИСБН 978-81-7758-118-8 . Проверено 4 февраля 2011 г.