Хранение компьютерных данных
Было предложено энергонезависимую память объединить в эту статью. ( Обсудить ) Предлагается с апреля 2024 г. |
Хранение компьютерных данных или хранение цифровых данных — это технология, состоящая из компьютерных компонентов и носителей записи , которые используются для хранения цифровых данных . Это основная функция и фундаментальный компонент компьютеров. [1] : 15–16
Центральный процессор (ЦП) компьютера — это то, что манипулирует данными, выполняя вычисления. На практике почти все компьютеры используют иерархию хранения данных . [1] : 468–473 который помещает быстрые, но дорогие и небольшие варианты хранения данных рядом с процессором, а более медленные, но менее дорогие и более крупные варианты — дальше. Как правило, быстрый [а] технологии называются «памятью», а более медленные постоянные технологии называются «хранилищем».
Даже первые компьютерные разработки, Чарльза Бэббиджа » «Аналитическая машина и «Аналитическая машина Перси Ладгейта », четко различали обработку и память (Бэббидж хранил числа как вращения шестерен, а Ладгейт хранил числа как перемещения стержней в шаттлах). Это различие было расширено в архитектуре фон Неймана , где ЦП состоит из двух основных частей: блока управления и арифметико-логического блока (АЛУ). Первый контролирует поток данных между ЦП и памятью, а второй выполняет арифметические и логические операции с данными.
Функциональность
[ редактировать ]Без значительного объема памяти компьютер мог бы просто выполнять фиксированные операции и немедленно выводить результат. Чтобы изменить его поведение, его придется перенастроить. Это приемлемо для таких устройств, как настольные калькуляторы , процессоры цифровых сигналов и другие специализированные устройства. Машины фон Неймана отличаются наличием памяти, в которой хранятся инструкции по эксплуатации и данные. [1] : 20 Такие компьютеры более универсальны, поскольку им не нужно перенастраивать свое оборудование для каждой новой программы, их можно просто перепрограммировать с помощью новых инструкций в памяти; их также проще спроектировать, поскольку относительно простой процессор может сохранять состояние между последовательными вычислениями для получения сложных процедурных результатов. Большинство современных компьютеров представляют собой машины фон Неймана.
Организация и представление данных
[ редактировать ]Современный цифровой компьютер представляет данные в двоичной системе счисления . Текст, числа, изображения, аудио и практически любая другая форма информации могут быть преобразованы в строку битов или двоичных цифр, каждая из которых имеет значение 0 или 1. Наиболее распространенной единицей хранения является байт , равный до 8 бит. Часть информации может обрабатываться любым компьютером или устройством, объем памяти которого достаточно велик для размещения двоичного представления части информации или просто данных . Например, полное собрание сочинений Шекспира , около 1250 печатных страниц, может храниться примерно в пяти мегабайтах (40 миллионов бит) по одному байту на символ.
Данные кодируются путем присвоения битового шаблона каждому символу , цифре или мультимедийному объекту. Существует множество стандартов кодирования (например, кодировки символов, такие как ASCII , кодировки изображений, такие как JPEG , и кодировки видео, такие как MPEG-4 ).
Добавляя биты к каждой закодированной единице, избыточность позволяет компьютеру обнаруживать ошибки в закодированных данных и исправлять их на основе математических алгоритмов. Ошибки обычно возникают с низкой вероятностью из-за случайного переворота значения бита или «усталости физического бита», потери физического бита в хранилище его способности поддерживать различимое значение (0 или 1) или из-за ошибок во внутренних или внутренних -компьютерное общение. Случайный переворот битов (например, из-за случайного излучения ) обычно корректируется при обнаружении. Бит или группа неисправных физических битов (конкретный неисправный бит не всегда известен; определение группы зависит от конкретного запоминающего устройства) обычно автоматически выгораживается, выводится из использования устройством и заменяется другой функционирующей эквивалентной группой в устройство, на котором восстанавливаются исправленные значения битов (если это возможно). Метод проверки циклическим избыточным кодом (CRC) обычно используется в системах связи и хранения для обнаружения ошибок . Обнаруженная ошибка затем повторяется.
Методы сжатия данных позволяют во многих случаях (например, в базе данных) представлять строку битов более короткой строкой битов («сжимать») и при необходимости восстанавливать исходную строку («распаковывать»). При этом используется значительно меньше места (десятки процентов) для многих типов данных за счет большего количества вычислений (сжатие и распаковка при необходимости). Анализ компромисса между экономией затрат на хранение и затратами на соответствующие вычисления и возможными задержками в доступности данных проводится до принятия решения о том, следует ли сохранять определенные данные в сжатом виде или нет.
По соображениям безопасности некоторые типы данных (например, информация о кредитной карте ) могут храниться в хранилище в зашифрованном виде , чтобы предотвратить возможность несанкционированного восстановления информации из фрагментов снимков хранилища.
Иерархия хранения
[ редактировать ]Как правило, чем ниже в иерархии находится хранилище, тем меньше его пропускная способность и тем больше задержка доступа со стороны ЦП. Это традиционное разделение хранилища на первичное, вторичное, третичное и автономное хранилище также определяется стоимостью за бит.
В современном использовании память обычно представляет собой быструю, но временную полупроводниковую память для чтения и записи , обычно DRAM (динамическое ОЗУ) или другие подобные устройства. Хранилище не имеет прямого доступа состоит из устройств хранения данных и их носителей, к которым ЦП ( вторичное или третичное хранилище ), обычно жестких дисков , приводов оптических дисков и других устройств, более медленных, чем ОЗУ, но энергонезависимых (сохраняющих содержимое при выключении питания). [2]
Исторически память , в зависимости от технологии, называлась центральной памятью , основной памятью , основной памятью , барабаном , основной памятью , реальной памятью или внутренней памятью . Между тем, более медленные постоянные запоминающие устройства называются вторичными запоминающими устройствами , внешней памятью или вспомогательными/периферийными запоминающими устройствами .
Основное хранилище
[ редактировать ]Первичная память (также известная как основная память , внутренняя память или основная память ), часто называемая просто памятью , является единственной памятью, напрямую доступной для ЦП. ЦП постоянно считывает хранящиеся там инструкции и выполняет их по мере необходимости. Любые данные, с которыми активно ведется работа, также хранятся там единообразно.
Исторически первые компьютеры использовали линии задержки , трубки Вильямса или вращающиеся магнитные барабаны в качестве основного хранилища. К 1954 году эти ненадежные методы были в основном заменены памятью на магнитных сердечниках . Основная память оставалась доминирующей до 1970-х годов, когда достижения в области технологий интегральных схем позволили полупроводниковой памяти стать экономически конкурентоспособной.
Это привело к созданию современной оперативной памяти (ОЗУ). Он малогабаритный, легкий, но при этом достаточно дорогой. Конкретные типы оперативной памяти, используемые в качестве основного хранилища, являются энергозависимыми , что означает, что они теряют информацию при отключении питания. Помимо хранения открытых программ, он служит дисковым кешем и буфером записи для улучшения производительности чтения и записи. Операционные системы заимствуют объем оперативной памяти для кэширования до тех пор, пока он не требуется для запуска программного обеспечения. [3] Запасную память можно использовать в качестве RAM-накопителя для временного высокоскоростного хранения данных.
Как показано на схеме, традиционно помимо основной оперативной памяти большой емкости существуют еще два подслоя первичной памяти:
- Регистры процессора расположены внутри процессора. Каждый регистр обычно содержит слово данных (часто 32 или 64 бита). Инструкции ЦП предписывают арифметико-логическому устройству выполнять различные вычисления или другие операции над этими данными (или с их помощью). Регистры — самая быстрая из всех форм хранения компьютерных данных.
- Кэш процессора — это промежуточный этап между сверхбыстрыми регистрами и гораздо более медленной основной памятью. Он был введен исключительно для улучшения производительности компьютеров. Наиболее активно используемая информация в основной памяти просто дублируется в кэш-память, которая быстрее, но гораздо меньшей емкости. С другой стороны, основная память намного медленнее, но имеет гораздо большую емкость, чем регистры процессора. многоуровневая иерархическая настройка кэша Также широко используется : основной кэш является самым маленьким, самым быстрым и расположен внутри процессора; вторичный кэш несколько больше и медленнее.
Основная память прямо или косвенно связана с центральным процессором через шину памяти . На самом деле это две шины (на схеме нет): адресная шина и шина данных . ЦП сначала отправляет через адресную шину число, называемое адресом памяти , которое указывает желаемое расположение данных. Затем он считывает или записывает данные в ячейки памяти с помощью шины данных. Кроме того, блок управления памятью (MMU) — это небольшое устройство между ЦП и ОЗУ, пересчитывающее фактический адрес памяти, например, для обеспечения абстракции виртуальной памяти или других задач.
Поскольку типы ОЗУ, используемые для основного хранилища, являются энергозависимыми (неинициализируются при запуске), компьютер, содержащий только такое хранилище, не будет иметь источника для чтения инструкций для запуска компьютера. Следовательно, энергонезависимая первичная память, содержащая небольшую программу запуска ( BIOS ), используется для начальной загрузки компьютера, то есть для чтения более крупной программы из энергонезависимой вторичной памяти в ОЗУ и начала ее выполнения. Энергонезависимая технология, используемая для этой цели, называется ПЗУ, что означает постоянное запоминающее устройство (терминология может быть несколько запутанной, поскольку большинство типов ПЗУ также допускают произвольный доступ ).
Многие типы «ПЗУ» не предназначены только для чтения , поскольку их обновления возможны; однако он медленный, и память приходится стирать большими частями, прежде чем ее можно будет перезаписать. Некоторые встроенные системы запускают программы непосредственно из ПЗУ (или аналогичного), поскольку такие программы редко изменяются. Стандартные компьютеры не хранят неэлементарные программы в ПЗУ, а, скорее, используют большую емкость вторичной памяти, которая также энергонезависимы и не так дорога.
В последнее время первичное хранилище и вторичное хранилище в некоторых случаях относятся к тому, что исторически называлось соответственно вторичным хранилищем и третичным хранилищем . [4]
Вторичное хранилище
[ редактировать ]Вторичная память (также известная как внешняя память или вспомогательная память ) отличается от основной памяти тем, что процессор не имеет прямого доступа к ней. Компьютер обычно использует свои каналы ввода-вывода для доступа к вторичному хранилищу и передачи нужных данных в основное хранилище. Вторичное хранилище является энергонезависимым (сохраняет данные даже при отключении питания). Современные компьютерные системы обычно имеют на два порядка больше вторичного хранилища, чем первичное, поскольку вторичное хранилище дешевле.
В современных компьютерах жесткие диски (HDD) или твердотельные накопители в качестве вторичного хранилища обычно используются (SSD). Время доступа к одному байту для жестких дисков или твердотельных накопителей обычно измеряется в миллисекундах (тысячные доли секунды), тогда как время доступа к одному байту для основного хранилища измеряется в наносекундах (миллиардные доли секунды). Таким образом, вторичное хранилище работает значительно медленнее, чем первичное. Вращающиеся оптические устройства хранения данных, такие как приводы компакт-дисков и DVD- дисков, имеют еще большее время доступа. Другие примеры технологий вторичного хранения включают USB-накопители , дискеты , магнитную ленту , бумажную ленту , перфокарты и RAM-диски .
Как только головка чтения/записи жесткого диска достигает нужного места и данных, доступ к последующим данным на дорожке становится очень быстрым. Чтобы сократить время поиска и задержку вращения, данные передаются на диски и с дисков большими смежными блоками. Последовательный или блочный доступ к дискам на порядки быстрее, чем произвольный доступ, и было разработано множество сложных парадигм для разработки эффективных алгоритмов, основанных на последовательном и блочном доступе. Другой способ уменьшить узкое место ввода-вывода — параллельное использование нескольких дисков для увеличения пропускной способности между основной и вторичной памятью. [5]
Вторичное хранилище часто форматируется в соответствии с форматом файловой системы , который обеспечивает абстракцию, необходимую для организации данных в файлы и каталоги , а также предоставляет метаданные, описывающие владельца определенного файла, время доступа, права доступа и другую информацию.
Большинство компьютерных операционных систем используют концепцию виртуальной памяти , позволяющую использовать больший объем первичной памяти, чем физически доступно в системе. По мере заполнения основной памяти система перемещает наименее используемые фрагменты ( страницы ) в файл подкачки или файл подкачки во вторичном хранилище, извлекая их позже, когда это необходимо. Если большое количество страниц перемещается в более медленное вторичное хранилище, производительность системы снижается.
Третичное хранение
[ редактировать ]Третичное хранилище или третичная память [6] находится на уровень ниже вторичного хранилища. Обычно это включает в себя роботизированный механизм, который будет монтировать (вставлять) и отключать съемные носители данных в запоминающее устройство в соответствии с требованиями системы; такие данные часто копируются во вторичное хранилище перед использованием. Он в основном используется для архивирования редко используемой информации, поскольку он намного медленнее, чем вторичное хранилище (например, 5–60 секунд против 1–10 миллисекунд). Это в первую очередь полезно для чрезвычайно больших хранилищ данных, доступ к которым осуществляется без участия человека-оператора. Типичные примеры включают ленточные библиотеки и оптические музыкальные автоматы .
Когда компьютеру необходимо прочитать информацию из третичного хранилища, он сначала обращается к базе данных каталога, чтобы определить, на какой ленте или диске содержится информация. Затем компьютер даст команду роботизированной руке извлечь носитель и поместить его в привод. Когда компьютер завершит чтение информации, роботизированная рука вернет носитель на место в библиотеке.
Третичное хранилище также известно как «ближнее» хранилище , поскольку оно «близко к онлайновому». Формальное различие между онлайновым, ближним и автономным хранилищем заключается в следующем: [7]
- Онлайн-хранилище сразу же доступно для ввода-вывода.
- Оперативное хранилище недоступно сразу, но его можно быстро организовать в режиме онлайн без вмешательства человека.
- Автономное хранилище недоступно сразу и требует некоторого вмешательства человека, чтобы подключиться к сети.
Например, постоянно включенные вращающиеся жесткие диски представляют собой онлайн-хранилища, а вращающиеся диски, которые автоматически останавливают вращение, например, в массивных массивах простаивающих дисков ( MAID ), — это почти онлайн-хранилища. Съемные носители, такие как ленточные картриджи, которые могут загружаться автоматически, как в ленточных библиотеках , представляют собой оперативные хранилища, тогда как ленточные картриджи, которые необходимо загружать вручную, представляют собой автономные хранилища.
Автономное хранение
[ редактировать ]Автономное хранение — это хранение компьютерных данных на носителе или устройстве, не находящемся под контролем процессора . [8] Носитель записывается, обычно на вторичном или третичном запоминающем устройстве, а затем физически удаляется или отключается. Он должен быть вставлен или подключен человеком-оператором, прежде чем компьютер сможет снова получить к нему доступ. В отличие от третичного хранилища, доступ к нему невозможен без участия человека.
автономное используется Для передачи информации хранилище , поскольку отсоединенный носитель можно легко физически транспортировать. Кроме того, это полезно в случае катастрофы, когда, например, пожар уничтожает исходные данные, носитель в удаленном месте не будет затронут, что позволяет выполнить аварийное восстановление . Автономное хранилище повышает общую информационную безопасность, поскольку оно физически недоступно с компьютера, а на конфиденциальность или целостность данных не могут повлиять методы компьютерных атак. Кроме того, если к информации, хранящейся в архивных целях, доступ осуществляется редко, автономное хранение обходится дешевле, чем третичное хранилище.
В современных персональных компьютерах большинство вторичных и третичных носителей данных также используются для автономного хранения. Оптические диски и устройства флэш-памяти являются наиболее популярными, и в гораздо меньшей степени съемные жесткие диски; более старые примеры включают дискеты и Zip-диски. На предприятиях преобладают картриджи с магнитной лентой; более старые примеры включают магнитную ленту с открытой катушкой и перфокарты.
Характеристики хранилища
[ редактировать ]Технологии хранения данных на всех уровнях иерархии хранения данных можно дифференцировать путем оценки определенных основных характеристик, а также измерения характеристик, специфичных для конкретной реализации. Этими основными характеристиками являются нестабильность, изменчивость, доступность и адресуемость. Для любой конкретной реализации любой технологии хранения характеристиками, которые стоит измерить, являются емкость и производительность.
Характеристика | Жесткий диск | Оптический диск | Флэш-память | Оперативная память | Линейная лента-открытая |
---|---|---|---|---|---|
Технология | Магнитный диск | Лазерный луч | Полупроводник | Магнитная лента | |
Волатильность | Нет | Нет | Нет | Неустойчивый | Нет |
Произвольный доступ | Да | Да | Да | Да | Нет |
Задержка (время доступа) | ~15 мс (быстро) | ~150 мс (умеренный) | Нет (мгновенно) | Нет (мгновенно) | Отсутствие произвольного доступа (очень медленно) |
Контроллер | Внутренний | Внешний | Внутренний | Внутренний | Внешний |
Сбой с неизбежной потерей данных | Авария на голове | — | Схема | — | |
Обнаружение ошибок | Диагностика ( СМАРТ ) | Измерение частоты ошибок | На это указывают резкие скачки скорости переводов. | (Кратковременное хранение) | Неизвестный |
Цена за место | Низкий | Низкий | Высокий | Очень высокий | Очень низкие (но дорогие диски) |
Цена за единицу | Умеренный | Низкий | Умеренный | Высокий | Умеренные (но дорогие диски) |
Основное приложение | Среднесрочное архивирование, регулярное резервное копирование, расширение хранилища на сервере и рабочей станции. | Долгосрочное архивирование, печатных копий. распространение | Портативная электроника; Операционная система | В режиме реального времени | Долгосрочное архивирование |
Волатильность
[ редактировать ]Энергонезависимая память сохраняет хранимую информацию даже при отсутствии постоянного электропитания. Он подходит для длительного хранения информации. Энергозависимая память требует постоянного питания для сохранения хранимой информации. Самые быстрые технологии памяти энергозависимы, хотя это не универсальное правило. Поскольку основное хранилище должно быть очень быстрым, оно преимущественно использует энергозависимую память.
Динамическая оперативная память — это форма энергозависимой памяти, которая также требует, чтобы хранимая информация периодически перечитывалась и перезаписывалась или обновлялась , иначе она исчезнет. Статическая оперативная память — это форма энергозависимой памяти, похожая на DRAM, за исключением того, что ее никогда не нужно обновлять, пока подается питание; он теряет свое содержимое при потере питания.
Источник бесперебойного питания (ИБП) можно использовать, чтобы дать компьютеру короткий промежуток времени для перемещения информации из основного энергозависимого хранилища в энергонезависимое хранилище до того, как батареи разрядятся. Некоторые системы, например EMC Symmetrix , имеют встроенные батареи, обеспечивающие энергозависимое хранение в течение нескольких минут.
Мутабельность
[ редактировать ]- Хранилище для чтения/записи или изменяемое хранилище
- Позволяет перезаписать информацию в любое время. Компьютер без некоторого объема памяти для чтения/записи в качестве основного хранилища будет бесполезен для многих задач. Современные компьютеры обычно используют хранилище для чтения/записи также в качестве вторичного хранилища.
- Медленная запись, быстрое чтение
- Хранилище для чтения/записи, которое позволяет перезаписывать информацию несколько раз, но операция записи выполняется намного медленнее, чем операция чтения. Примеры включают CD-RW и SSD .
- Напишите один раз хранилище
- «Запись один раз, чтение многих » (WORM) позволяет записывать информацию только один раз в определенный момент после изготовления. Примеры включают полупроводниковое программируемое постоянное запоминающее устройство и CD-R .
- Хранилище только для чтения
- Сохраняет информацию, хранящуюся на момент изготовления. Примеры включают микросхемы ПЗУ маски и компакт-диски .
Доступность
[ редактировать ]- Произвольный доступ
- К любому месту хранения можно получить доступ в любой момент примерно за одно и то же время. Такая характеристика хорошо подходит для первичного и вторичного хранения. Большинство полупроводниковых запоминающих устройств , флэш-памяти и жестких дисков обеспечивают произвольный доступ, хотя и полупроводниковая, и флэш-память имеют минимальную задержку по сравнению с жесткими дисками, поскольку не требуется перемещать никакие механические части.
- Последовательный доступ
- Доступ к частям информации будет осуществляться в последовательном порядке, один за другим; поэтому время доступа к определенной части информации зависит от того, к какой части информации обращались в последний раз. Такая характеристика типична для автономного хранилища.
Адресуемость
[ редактировать ]- Адресуемый по местоположению
- Каждая индивидуально доступная единица информации в хранилище выбирается по ее числовому адресу памяти . В современных компьютерах хранилище с адресацией по местоположению обычно ограничивается основным хранилищем, к которому осуществляется внутренний доступ с помощью компьютерных программ, поскольку адресация по местоположению очень эффективна, но обременительна для людей.
- Адресный файл
- Информация разбивается на файлы переменной длины, и выбирается конкретный файл с удобочитаемыми именами каталога и файла. Базовое устройство по-прежнему адресуется по местоположению, но операционная система компьютера предоставляет абстракцию файловой системы , чтобы сделать операцию более понятной. В современных компьютерах вторичные, третичные и автономные хранилища используют файловые системы.
- Контентно-адресуемый
- Каждая индивидуально доступная единица информации выбирается на основе (части) хранящегося там содержимого. Хранилище с адресацией по содержимому может быть реализовано с использованием программного обеспечения (компьютерной программы) или аппаратного обеспечения (компьютерного устройства), причем аппаратное обеспечение является более быстрым, но более дорогим вариантом. компьютера Адресуемая память аппаратного содержимого часто используется в кэше ЦП .
Емкость
[ редактировать ]- Первичная мощность
- Общий объем хранимой информации, который может хранить устройство хранения или носитель. Он выражается в количестве бит или байтов (например, 10,4 мегабайта ).
- Плотность памяти
- Компактность хранимой информации. Это емкость носителя, разделенная на единицы длины, площади или объема (например, 1,2 мегабайта на квадратный дюйм).
Производительность
[ редактировать ]- Задержка
- Время, необходимое для доступа к определенному месту в хранилище. Соответствующей единицей измерения обычно является наносекунда для первичного хранения, миллисекунда для вторичного хранения и секунда для третичного хранения. Возможно, имеет смысл разделить задержку чтения и задержку записи (особенно для энергонезависимой памяти), а в случае хранения с последовательным доступом — минимальную, максимальную и среднюю задержку.
- Пропускная способность
- Скорость, с которой информация может быть прочитана или записана в хранилище. При хранении компьютерных данных пропускная способность обычно выражается в мегабайтах в секунду (МБ/с), хотя скорость передачи данных также может использоваться . Как и в случае с задержкой, возможно, потребуется различать скорость чтения и скорость записи. Кроме того, последовательный доступ к мультимедиа, а не случайный, обычно обеспечивает максимальную пропускную способность.
- Детализация
- Размер наибольшего «куска» данных, к которому можно эффективно получить доступ как к единому блоку, например, без дополнительной задержки.
- Надежность
- Вероятность самопроизвольного изменения значения бита при различных условиях или общая частота отказов .
Такие утилиты, как hdparm и sar, можно использовать для измерения производительности ввода-вывода в Linux.
Использование энергии
[ редактировать ]- Устройства хранения данных, которые уменьшают использование вентиляторов, автоматически отключаются во время бездействия, а также жесткие диски с низким энергопотреблением могут снизить потребление энергии на 90 процентов. [9] [10]
- 2,5-дюймовые жесткие диски часто потребляют меньше энергии, чем более крупные. [11] [12] малой емкости Твердотельные накопители не имеют движущихся частей и потребляют меньше энергии, чем жесткие диски. [13] [14] [15] Кроме того, память может потреблять больше энергии, чем жесткие диски. [15] Большие кэши, которые используются для предотвращения переполнения памяти , также могут потреблять большое количество энергии.
Безопасность
[ редактировать ]Полное шифрование диска , шифрование тома и виртуального диска, а также шифрование файлов и папок легко доступно для большинства устройств хранения данных. [16]
Аппаратное шифрование памяти доступно в архитектуре Intel, поддерживающей полное шифрование памяти (TME) и страничное шифрование памяти с несколькими ключами (MKTME). [17] [18] и в SPARC M7 с октября 2015 года. поколении [19]
Уязвимость и надежность
[ редактировать ]Различные типы хранилищ данных имеют разные точки сбоя и различные методы прогнозного анализа сбоев .
Уязвимости, которые могут мгновенно привести к полной потере данных, — это поломка головки механических жестких дисков и выход из строя электронных компонентов флэш-накопителей.
Обнаружение ошибок
[ редактировать ]Надвигающийся сбой жестких дисков можно оценить с помощью диагностических данных SMART, которые включают часы работы и количество раскруток, хотя их достоверность оспаривается. [20]
Скорость передачи данных во флэш-накопителе может снижаться из-за накопления ошибок, которые контроллер флэш-памяти пытается исправить.
Состояние оптических носителей можно определить путем измерения исправимых незначительных ошибок , большое количество которых означает ухудшение качества носителя и/или его качество. Слишком много последовательных мелких ошибок может привести к повреждению данных. Не все производители и модели оптических приводов поддерживают сканирование ошибок. [21]
Носители данных
[ редактировать ]По состоянию на 2011 год [update]Наиболее часто используемыми носителями данных являются полупроводниковые, магнитные и оптические носители, тогда как бумага по-прежнему используется ограниченно. Предлагаются к разработке некоторые другие фундаментальные технологии хранения данных, такие как флэш-массивы (AFA).
Полупроводник
[ редактировать ]Полупроводниковая память использует полупроводниковые ( интегральные схемы ИС) для хранения информации. Данные обычно хранятся в металл-оксид-полупроводник (МОП) ячейках памяти . Полупроводниковый чип памяти может содержать миллионы ячеек памяти, состоящих из крошечных полевых МОП-транзисторов (МОП-транзисторов) и/или МОП-конденсаторов . Существуют как энергозависимые , так и энергонезависимые формы полупроводниковой памяти: в первой используются стандартные МОП-транзисторы, а во второй — МОП-транзисторы с плавающим затвором .
В современных компьютерах первичная память почти исключительно состоит из динамической энергозависимой полупроводниковой памяти с произвольным доступом (RAM), в частности динамической памяти с произвольным доступом (DRAM). С начала века тип энергонезависимой полупроводниковой памяти с плавающим затвором, известный как флэш-память, постепенно набирает популярность в качестве автономного хранилища для домашних компьютеров. Энергонезависимая полупроводниковая память также используется в качестве вторичной памяти в различных современных электронных устройствах и специализированных компьютерах, предназначенных для них.
Еще в 2006 году производители ноутбуков и настольных компьютеров начали использовать твердотельные накопители (SSD) на основе флэш-памяти в качестве параметров конфигурации по умолчанию для вторичного хранилища либо в дополнение к более традиционным жестким дискам, либо вместо них. [22] [23] [24] [25] [26]
Магнитный
[ редактировать ]Магнитное хранилище использует различные схемы намагничивания на поверхности с магнитным покрытием для хранения информации. Магнитный накопитель энергонезависимый . Доступ к информации осуществляется с использованием одной или нескольких головок чтения/записи, которые могут содержать один или несколько записывающих преобразователей. Головка чтения/записи покрывает только часть поверхности, поэтому для доступа к данным головку или носитель, или оба, необходимо перемещать относительно другого. В современных компьютерах магнитное хранилище будет иметь следующие формы:
- Магнитный диск ;
- Дискета , используемая для автономного хранения;
- Жесткий диск , используемый в качестве вторичного хранилища.
- Магнитная лента , используемая для третичного и автономного хранения;
- Карусельная память (магнитные рулоны).
В ранних компьютерах магнитное хранилище также использовалось как:
- Первичное хранилище в форме магнитной памяти , или сердечниковой памяти , сердечниковой веревочной памяти , тонкопленочной памяти и/или твисторной памяти ;
- Третичное (например, NCR CRAM ) или автономное хранение в виде магнитных карт;
- Магнитная лента тогда часто использовалась для вторичного хранения.
Магнитное хранилище не имеет определенного ограничения на циклы перезаписи, как флэш-память и перезаписываемые оптические носители, поскольку изменение магнитных полей не вызывает физического износа. Скорее, срок их службы ограничен механическими частями. [27] [28]
Оптический
[ редактировать ]Оптическое хранилище , типичный оптический диск , хранит информацию в деформациях на поверхности круглого диска и считывает эту информацию, освещая поверхность лазерным диодом и наблюдая за отражением. Оптический диск является энергонезависимым . Деформации могут быть постоянными (носитель только для чтения), однократно сформированными (носитель для однократной записи) или обратимыми (носитель для записи или чтения/записи). С 2009 года широко используются следующие формы: [update]: [29]
- CD , CD-ROM , DVD , BD-ROM : хранилище только для чтения, используемое для массового распространения цифровой информации (музыки, видео, компьютерных программ);
- CD-R , DVD-R , DVD+R , BD-R : хранилище с однократной записью, используется для третичного и автономного хранения;
- CD-RW , DVD-RW , DVD+RW , DVD-RAM , BD-RE : хранилище с медленной записью и быстрым чтением, используется для третичного и автономного хранения;
- Оптический сверхплотности или UDO по емкости аналогичен BD-R или BD-RE и представляет собой хранилище с медленной записью и быстрым чтением, используемое для третичного и автономного хранения.
Магнитооптический диск — это накопитель на оптических дисках, в котором магнитное состояние ферромагнитной поверхности хранит информацию. Информация считывается оптически и записывается с помощью сочетания магнитных и оптических методов. Магнитооптический диск является энергонезависимым хранилищем с последовательным доступом , медленной записью и быстрым чтением, используемым для третичного и автономного хранения.
оптическое 3D-хранилище данных Также было предложено .
Светоиндуцированное намагниченное плавление в магнитных фотопроводниках также было предложено для высокоскоростного магнитооптического хранения с низким энергопотреблением. [30]
Бумага
[ редактировать ]Бумажное хранилище данных , обычно в виде бумажной ленты или перфокарт , издавна использовалось для хранения информации для автоматической обработки, особенно до появления компьютеров общего назначения. Информация записывалась путем пробивания отверстий в бумажном или картонном носителе и считывалась механически (или позже оптически), чтобы определить, было ли конкретное место на носителе твердым или содержало отверстие. Штрих-коды позволяют надежно прикрепить к объектам, которые продаются или транспортируются, некоторую машиночитаемую информацию.
Относительно небольшие объемы цифровых данных (по сравнению с другими хранилищами цифровых данных) могут быть сохранены на бумаге в виде матричного штрих-кода для очень долгосрочного хранения, поскольку срок службы бумаги обычно превышает даже срок хранения магнитных данных. [31] [32]
Другие носители информации или подложки
[ редактировать ]- Ламповая память
- В трубке Вильямса использовалась электронно-лучевая трубка , а в трубке Селектрона использовалась большая вакуумная трубка для хранения информации . Эти первичные запоминающие устройства просуществовали на рынке недолго, поскольку лампа Уильямса была ненадежной, а лампа Селектрона была дорогой.
- Электроакустическая память
- В памяти линии задержки использовались звуковые волны в таком веществе, как ртуть для хранения информации . Память линии задержки была динамически энергозависимой, имела циклическое последовательное чтение/запись и использовалась в качестве основного хранилища.
- Оптическая лента
- — это носитель оптического хранения, обычно состоящий из длинной и узкой полоски пластика, на которой можно записывать узоры и с которых узоры можно считывать обратно. Он разделяет некоторые технологии с кинопленкой и оптическими дисками, но не совместим ни с одним из них. Мотивом разработки этой технологии была возможность создания гораздо большей емкости хранения, чем магнитная лента или оптические диски.
- Память с фазовым изменением
- использует различные механические фазы материала с фазовым переходом для хранения информации в адресной матрице X – Y и считывает информацию, наблюдая за меняющимся электрическим сопротивлением материала. Память с фазовым изменением будет энергонезависимым хранилищем с произвольным доступом для чтения и записи и может использоваться в качестве первичного, вторичного и автономного хранилища. Большинство перезаписываемых и многие оптические диски с однократной записью уже используют материал с фазовым переходом для хранения информации.
- Голографическое хранилище данных
- хранит информацию оптически внутри кристаллов или фотополимеров . Голографическое хранилище может использовать весь объем носителя информации, в отличие от хранилища на оптических дисках, которое ограничено небольшим количеством поверхностных слоев. Голографическое хранилище будет энергонезависимым, с последовательным доступом и хранилищем с однократной записью или чтением/записью. Его можно использовать для вторичного и автономного хранения. См. «Голографический универсальный диск» (HVD).
- Молекулярная память
- хранит информацию в полимере , способном хранить электрический заряд. Молекулярная память может быть особенно подходящей для первичного хранения. Теоретическая емкость молекулярной памяти составляет 10 терабит на квадратный дюйм (16 Гбит/мм). 2 ). [33]
- Магнитные фотопроводники
- хранить магнитную информацию, которая может быть изменена при слабом освещении. [30]
- ДНК
- хранит информацию в нуклеотидах ДНК . Впервые это было сделано в 2012 году, когда исследователи достигли соотношения 1,28 петабайт на грамм ДНК. В марте 2017 года ученые сообщили, что новый алгоритм под названием «Фонтан ДНК» достиг 85% теоретического предела — 215 петабайт на грамм ДНК. [34] [35] [36] [37]
Связанные технологии
[ редактировать ]Резервирование
[ редактировать ]Хотя неисправность группы битов может быть устранена с помощью механизмов обнаружения и исправления ошибок (см. выше), неисправность устройства хранения требует других решений. Следующие решения обычно используются и подходят для большинства устройств хранения данных:
- устройства Зеркальное отображение (репликация) . Распространенным решением проблемы является постоянное сохранение идентичной копии содержимого устройства на другом устройстве (обычно того же типа). Обратной стороной является то, что это удваивает объем хранилища, и оба устройства (копии) необходимо обновлять одновременно с некоторыми накладными расходами и, возможно, с некоторыми задержками. Плюсом является возможность одновременного чтения одной и той же группы данных двумя независимыми процессами, что повышает производительность. Когда одно из реплицированных устройств обнаруживается как неисправное, другая копия все еще работает и используется для создания новой копии на другом устройстве (для этой цели обычно доступном в рабочем состоянии в пуле резервных устройств).
- Избыточный массив независимых дисков ( RAID ). Этот метод обобщает описанное выше зеркалирование устройств, позволяя одному устройству в группе устройств выйти из строя и заменить его восстановленным содержимым (зеркалирование устройств — это RAID с n=2 ). Группы RAID n=5 или n=6 являются обычными. n>2 экономит хранилище по сравнению с n=2 за счет увеличения объема обработки как во время обычной работы (с часто сниженной производительностью), так и при замене неисправного устройства.
Зеркальное отображение устройств и типичный RAID предназначены для обработки сбоя одного устройства в группе устройств RAID. Однако если второй сбой произойдет до того, как группа RAID будет полностью восстановлена после первого сбоя, данные могут быть потеряны. Вероятность единичного сбоя обычно невелика. Таким образом, вероятность двух сбоев в одной и той же RAID-группе во времени существенно меньше (примерно квадрат вероятности, т. е. умноженная сама на себя). Если база данных не может вынести даже такой меньшей вероятности потери данных, то сама RAID-группа реплицируется (зеркалируется). Во многих случаях такое зеркалирование выполняется географически удаленно, в другом массиве хранения, для обеспечения восстановления после сбоев (см. Аварийное восстановление выше).
Сетевое подключение
[ редактировать ]Вторичное или третичное хранилище может подключаться к компьютеру с использованием компьютерных сетей . Эта концепция не относится к основной памяти, которая в меньшей степени используется несколькими процессорами.
- СХД с прямым подключением (DAS) — это традиционное запоминающее устройство большой емкости, не использующее сеть. Это по-прежнему самый популярный подход. Этот ретроним был придуман недавно вместе с NAS и SAN.
- Сетевое хранилище (NAS) — это запоминающее устройство большой емкости, подключенное к компьютеру, к которому другой компьютер может получить доступ на уровне файлов через локальную сеть , частную глобальную сеть или, в случае онлайн-хранилища файлов , через Интернет . NAS обычно ассоциируется с протоколами NFS и CIFS/SMB .
- Сеть хранения данных (SAN) — это специализированная сеть, которая предоставляет другим компьютерам емкость хранения. Принципиальное различие между NAS и SAN заключается в том, что NAS предоставляет файловые системы и управляет ими клиентским компьютерам, в то время как SAN обеспечивает доступ на уровне блочной адресации (необработанный), оставляя его на усмотрение подключения систем для управления данными или файловыми системами в пределах предоставленной емкости. SAN обычно ассоциируется с сетями Fibre Channel .
Роботизированное хранилище
[ редактировать ]Большие количества отдельных магнитных лент, а также оптических или магнитооптических дисков могут храниться в роботизированных третичных запоминающих устройствах. В области ленточных хранилищ они известны как ленточные библиотеки , а в области оптических хранилищ — оптические музыкальные автоматы или библиотеки оптических дисков, по аналогии. Наименьшие формы любой технологии, содержащие только одно приводное устройство, называются автозагрузчиками или авточейнджерами .
Устройства хранения данных с роботизированным доступом могут иметь несколько слотов, каждый из которых содержит отдельный носитель, и обычно одного или нескольких роботов-сборщиков, которые перемещаются по слотам и загружают носители на встроенные накопители. Расположение прорезей и устройств захвата влияет на производительность. Важными характеристиками такого хранилища являются возможные варианты расширения: добавление слотов, модулей, накопителей, роботов. Ленточные библиотеки могут иметь от 10 до более 100 000 слотов и обеспечивать терабайты или петабайты оперативной информации. Оптические музыкальные автоматы представляют собой несколько меньшие по размеру решения, до 1000 слотов.
Роботизированное хранилище используется для резервного копирования и архивов большой емкости в сфере обработки изображений, медицины и видео. Иерархическое управление хранилищем — это наиболее известная стратегия архивирования, позволяющая автоматически переносить давно неиспользуемые файлы из хранилища на быстром жестком диске в библиотеки или музыкальные автоматы. Если файлы необходимы, они возвращаются на диск.
См. также
[ редактировать ]Основные темы хранения
[ редактировать ]- Диафрагма (память компьютера)
- Динамическая оперативная память (DRAM)
- Задержка памяти
- Массовое хранилище
- Ячейка памяти (значения)
- Управление памятью
- Защита памяти
- Регистр адреса страницы
- Стабильное хранение
- Статическая оперативная память (SRAM)
Темы вторичного, третичного и автономного хранения
[ редактировать ]- Облачное хранилище [38]
- Гибридное облачное хранилище
- Дедупликация данных
- Распространение данных
- Тег хранения данных, используемый для сбора данных исследований
- Дисковая утилита
- Файловая система
- Флэш-память
- Геоплексирование
- Информационный репозиторий
- Обнаружение максимального правдоподобия с прогнозированием шума
- Объектное (на основе) хранилище
- Съемные носители
- Твердотельный накопитель
- Шпиндель
- Виртуальная ленточная библиотека
- Состояние ожидания
- Буфер записи
- Защита от записи
- Холодные данные
Конференции по хранению данных
[ редактировать ]Примечания
[ редактировать ]- ^ Большинство современных компьютеров используют энергозависимые технологии (которые теряют данные при отключении питания); Первые компьютеры использовали как энергозависимые, так и устойчивые технологии.
Ссылки
[ редактировать ]В этой статье использованы общедоступные материалы из Федеральный стандарт 1037C . Управление общего обслуживания . Архивировано из оригинала 22 января 2022 года.
- ^ Jump up to: а б с Паттерсон, Дэвид А.; Хеннесси, Джон Л. (2005). Организация и проектирование компьютера: Аппаратно-программный интерфейс (3-е изд.). Амстердам : Издательство Морган Кауфманн . ISBN 1-55860-604-1 . OCLC 56213091 .
- ^ Хранилище согласно определению в Компьютерном словаре Microsoft, 4-е изд. (c) 1999 г. или в Авторитетном словаре стандартных терминов IEEE, 7-е изд., (c) 2000 г.
- ^ «Документация для /proc/sys/vm/ — документация по ядру Linux» .
- ^ «Основное хранилище или оборудование для хранения данных (показано использование термина «основное хранилище», означающего «хранилище на жестком диске»)» . searchstorage.techtarget.com . Архивировано из оригинала 10 сентября 2008 года . Проверено 18 июня 2011 г.
- ^ Дж. С. Виттер (2008). Алгоритмы и структуры данных для внешней памяти (PDF) . Серия об основах и тенденциях теоретической информатики. Ганновер, Массачусетс: теперь Издательства. ISBN 978-1-60198-106-6 . Архивировано (PDF) из оригинала 4 января 2011 года.
- ^ «Диссертация о третичном хранении» (PDF) . Архивировано (PDF) из оригинала 27 сентября 2007 г. Проверено 18 июня 2011 г.
- ^ Пирсон, Тони (2010). «Правильное использование термина «рядом»» . Работы разработчиков IBM, внутри системного хранилища . Архивировано из оригинала 24 ноября 2015 года . Проверено 16 августа 2015 г.
- ^ Национальная система связи (7 августа 1996 г.). Федеральный стандарт 1037C – Телекоммуникации: Глоссарий терминов телекоммуникаций (Технический отчет). Управление общего обслуживания. ФС-1037С. Архивировано из оригинала 2 марта 2009 года . Проверено 8 октября 2007 г. См. также статью Федеральный стандарт 1037С .
- ^ «Калькулятор энергосбережения» . Архивировано из оригинала 21 декабря 2008 года.
- ^ «Насколько [пере]драйв на самом деле экологически чистый?» . Простая технология . Архивировано из оригинала 5 августа 2008 года.
- ^ Майк Чин (8 марта 2004 г.). «Будет ли будущее Silent PC шириной 2,5 дюйма?» . Архивировано из оригинала 20 июля 2008 года . Проверено 2 августа 2008 г.
- ^ Майк Чин (18 сентября 2002 г.). «Рекомендуемые жесткие диски» . Архивировано из оригинала 5 сентября 2008 года . Проверено 2 августа 2008 г.
- ^ «2,5-дюймовый флэш-накопитель IDE Super Talent» . Технический отчет . 12 июля 2006 г. стр. 13. Архивировано из оригинала 26 января 2012 г. Проверено 18 июня 2011 г.
- ^ «Энергопотребление – аппаратное обеспечение Тома: устаревание обычных жестких дисков? Предварительный просмотр флэш-накопителя Samsung на 32 ГБ» . tomshardware.com . 20 сентября 2006 г. Проверено 18 июня 2011 г.
- ^ Jump up to: а б Алексей Меев (23 апреля 2008 г.). «SSD, i-RAM и традиционные жесткие диски» . X-битные лаборатории. Архивировано из оригинала 18 декабря 2008 года.
- ^ Карен Скарфон; Муругия Суппайя; Мэтт Секстон (ноябрь 2007 г.). «Руководство по технологиям шифрования хранилища для устройств конечных пользователей» (PDF) . Национальный институт стандартов и технологий.
- ^ «Характеристики шифрования» (PDF) . программное обеспечение.intel.com. Архивировано (PDF) из оригинала 9 октября 2022 года . Проверено 28 декабря 2019 г.
- ^ «Предлагаемый API для шифрования всей памяти» . Lwn.net . Проверено 28 декабря 2019 г.
- ^ «Введение в SPARC M7 и кремниевую защищенную память (SSM)» . swisdev.oracle.com. Архивировано из оригинала 21 января 2019 года . Проверено 28 декабря 2019 г.
- ^ «О чем на самом деле говорят нам ошибки жесткого диска SMART» . Бэкблэйз . 6 октября 2016 г.
- ^ «QPxTool — проверьте качество» . qpxtool.sourceforge.io .
- ^ «Новый ноутбук Samsung заменяет жесткий диск флэш-памятью» . Экстремальная техника . 23 мая 2006 г. Архивировано из оригинала 30 декабря 2010 г. Проверено 18 июня 2011 г.
- ^ «Toshiba бросает шляпу в флэш-память ноутбука» . technewsworld.com . Архивировано из оригинала 18 марта 2012 года . Проверено 18 июня 2011 г.
- ^ «Mac Pro — варианты хранения и RAID для вашего Mac Pro» . Яблоко. 27 июля 2006 г. Архивировано из оригинала 6 июня 2013 г. Проверено 18 июня 2011 г.
- ^ «MacBook Air – лучшее от iPad сочетается с лучшими от Mac» . Яблоко. Архивировано из оригинала 27 мая 2013 года . Проверено 18 июня 2011 г.
- ^ «MacBook Air заменяет стандартный жесткий диск ноутбука твердотельным флэш-накопителем» . news.inventhelp.com . 15 ноября 2010 года. Архивировано из оригинала 23 августа 2011 года . Проверено 18 июня 2011 г.
- ^ «Сравнение долговечности твердотельных накопителей и жестких дисков в эпоху твердотельных накопителей QLC» (PDF) . Микронная технология. Архивировано (PDF) из оригинала 9 октября 2022 года.
- ^ «Сравнение SSD и HDD — комплексное сравнение накопителей» . www.stellarinfo.co.in .
- ^ «Часто задаваемые вопросы по DVD — исчерпывающий справочник по технологиям DVD» . Архивировано из оригинала 22 августа 2009 года.
- ^ Jump up to: а б Нафради, Балинт (24 ноября 2016 г.). «Оптически переключаемый магнетизм в фотоэлектрическом перовските CH3NH3(Mn:Pb)I3» . Природные коммуникации . 7 : 13406. arXiv : 1611.08205 . Бибкод : 2016NatCo...713406N . дои : 10.1038/ncomms13406 . ПМК 5123013 . ПМИД 27882917 .
- ^ «Решение для резервного копирования на бумажном носителе (не так глупо, как кажется)» . 14 августа 2012 г.
- ^ Стерлинг, Брюс (16 августа 2012 г.). «Резервное копирование бумаги PaperBack» . Проводной .
- ^ «Новый метод самосборки наноразмерных элементов может изменить индустрию хранения данных» . sciencedaily.com . 1 марта 2009 г. Архивировано из оригинала 1 марта 2009 г. Проверено 18 июня 2011 г.
- ^ Йонг, Эд. «Этот кусочек ДНК содержит фильм, компьютерный вирус и подарочную карту Amazon» . Атлантика . Архивировано из оригинала 3 марта 2017 года . Проверено 3 марта 2017 г.
- ^ «Исследователи хранят операционную систему компьютера и короткометражный фильм на ДНК» . физ.орг . Архивировано из оригинала 2 марта 2017 года . Проверено 3 марта 2017 г.
- ^ «ДНК могла бы хранить все мировые данные в одной комнате» . Научный журнал. 2 марта 2017 года. Архивировано из оригинала 2 марта 2017 года . Проверено 3 марта 2017 г.
- ^ Эрлих, Янив; Зелински, Дина (2 марта 2017 г.). «DNA Fountain обеспечивает надежную и эффективную архитектуру хранения данных» . Наука . 355 (6328): 950–954. Бибкод : 2017Sci...355..950E . дои : 10.1126/science.aaj2038 . ПМИД 28254941 . S2CID 13470340 .
- ^ «Аварийное восстановление в облаке AWS» . 18 августа 2023 г.
Дальнейшее чтение
[ редактировать ]- Года, К.; Кицурегава, М. (2012). «История систем хранения» . Труды IEEE . 100 : 1433–1440. дои : 10.1109/JPROC.2012.2189787 .
- Память и хранилище , Музей истории компьютеров