Память ECC
Память кода исправления ошибок ( память ECC ) - это тип хранилища данных компьютера , который использует код коррекции ошибок [ А ] (ECC) для обнаружения и исправления коррупции N-Bit Data , которая возникает в памяти.
Как правило, память ECC поддерживает систему памяти, невосприимчивую к однобитовым ошибкам: данные, которые считываются из каждого слова , всегда такие же, как и данные, которые были записаны для него, даже если один из битов фактически хранился неправильное состояние. Большая часть памяти, не являющейся ECC, не может обнаружить ошибки, хотя некоторая память, не имеющая ECC с поддержкой паритета, позволяет обнаружить, но не коррекция.
Память ECC используется в большинстве компьютеров, где нельзя допустить повреждение данных, например, приложения для управления промышленным управлением, критические базы данных и кэши инфраструктурной памяти.
Концепция
[ редактировать ]Коды коррекции ошибок защищают от невыразимой повреждения данных и используются в компьютерах, где такая коррупция недопустима, примерами являются научные и финансовые приложения, или на серверах базы данных и файлов . ECC также может уменьшить количество сбоев в приложениях многопользовательских серверов и систем максимальной доступности.
Электрические или магнитные помехи внутри компьютерной системы могут привести к тому, что один бит динамической случайной памяти (DRAM) может спонтанно перевернуться в противоположное состояние. Первоначально считалось, что это произошло в основном из-за альфа-частиц, выделяемых загрязняющими веществами в материале упаковки чипов, но исследования показали, что большинство одноразовых мягких ошибок в чипах DRAM возникают в результате фонового излучения , в основном нейтроны из космических второстепенных лучей. , который может изменить содержимое одной или нескольких ячеек памяти или мешать схеме, используемой для чтения или написания им. [ 2 ] Следовательно, частота ошибок быстро увеличивается с повышением высоты; Например, по сравнению с уровнем моря, скорость потока нейтронов в 3,5 раза выше на 1,5 км и в 300 раз выше при 10–12 км (крейсерская высота коммерческих самолетов). [ 3 ] В результате системы, работающие на больших высотах, требуют особых положений для надежности.
Например, космический корабль Cassini -Huygens , запущенный в 1997 году, содержал два идентичных полета полета, каждый из которых с 2,5 гигабитами памяти в виде массивов коммерческих чипов DRAM. Из-за встроенной функциональности EDAC инженерная телеметрия космического корабля сообщила о количестве (исправляемых) ошибках с одним битом на слова и (некорректируемых) ошибок с двумя битами на слова. В течение первых 2,5 лет полета космический корабль сообщил о почти постоянной частоте ошибок с одним битом около 280 ошибок в день. Однако 6 ноября 1997 года, в течение первого месяца в космосе, количество ошибок увеличилось более чем на четыре в этот день. Это было связано с соревнованием солнечной частицы , которое было обнаружено спутником Goe 9 . [ 4 ]
Была некоторая обеспокоенность тем, что по мере дальнейшего увеличения плотности DRAM, и, следовательно, компоненты на чипах становятся меньше, в то время как рабочие напряжения продолжают падать, чипы DRAM будут влиять на такое излучение чаще, поскольку частицы с более низкой энергией смогут менять память Состояние клеток. [ 3 ] С другой стороны, более мелкие клетки ставят меньшие мишени и перемещаются к таким технологиям, как SOI, могут сделать отдельные клетки менее восприимчивыми и таким образом противодействовать или даже обратить вспять эту тенденцию. Недавние исследования [ 5 ] Покажите, что расстройства одного события из-за космического излучения резко падают с геометрией процесса, и предыдущие опасения по поводу увеличения частоты ошибок битовых ячеек необоснованы.
Исследовать
[ редактировать ]Работа, опубликованная в период с 2007 по 2009 год −10 Ошибка/бит · ч (примерно один бит ошибки в час на гигабайт памяти) до 10 −17 Ошибка/бит · ч (примерно один бит ошибки на тысячелетие на гигабайт памяти). [ 5 ] [ 6 ] [ 7 ] Масштабное исследование, основанное на Google, было представлено на конференции Sigmetrics/Performance '09. очень большом количестве серверов [ 6 ] Фактический показатель ошибок был на несколько порядков выше, чем в предыдущих мелкомасштабных или лабораторных исследованиях, с 25 000 (2,5 × 10 −11 ошибка/бит · ч) и 70 000 (7,0 × 10 −11 Ошибка/бит · H, или 1 бит ошибки на гигабайт оперативной памяти за 1,8 часа) Ошибки на миллиард устройств часы на мегабит. Более 8% модулей памяти DIMM были затронуты ошибками в год.
Следствие ошибки памяти зависит от системы. В системах без ECC ошибка может привести либо к сбою, либо к повреждению данных; На крупномасштабных производственных сайтах ошибки памяти являются одной из самых коммерческих аппаратных причин сбоев машины. [ 6 ] Ошибки памяти могут вызвать уязвимости безопасности. [ 6 ] Ошибка памяти не может иметь никаких последствий, если она немного изменяется, что не вызывает наблюдаемой неисправности и не влияет на данные, используемые в расчетах или сохраненные. Имитационное исследование 2010 года показало, что для веб -браузера лишь небольшая часть ошибок памяти вызывала развращение данных, хотя, поскольку многие ошибки памяти являются прерывистыми и коррелированными, эффекты ошибок памяти были больше, чем ожидалось для независимых мягких ошибок. [ 8 ]
Некоторые тесты приходят к выводу, что выделение ячеек памяти DRAM можно обойти непреднамеренными побочными эффектами специально созданных доступа к соседним клеткам. Таким образом, доступ к данным, хранящимся в DRAM, заставляет ячейки памяти вытекать их заряды и взаимодействовать электрически, в результате высокой плотности ячейки в современной памяти, изменяя содержание близлежащих строк памяти, которые фактически не были рассмотрены в исходном доступе к памяти. Этот эффект известен как Row Hammer , и он также использовался в некоторых привилегиях эскалации безопасности компьютерной . [ 9 ] [ 10 ]
Пример однобийной ошибки, которая будет проигнорирована система без проверки ошибок, остановит машину с проверкой паритета или будет невидимо исправлен ECC: один бит застрял на 1 из-за неисправного чипа, или становится измененным на 1 из -за фона или космического излучения; Загружено номера хранения электронной таблицы в формате ASCII, а символ «8» (десятичное значение 56 в кодировании ASCII) хранится в байте, который содержит застрявший бит в самом низком положении бита; Затем изменение вносится в таблицу, и оно сохраняется. В результате «8» (0011 100 0 двоичный) молча стал «9» (0011 100 1 ).
Решения
[ редактировать ]Было разработано несколько подходов для борьбы с нежелательными битами, включая программирование с учетом иммунитета, память паритета ОЗУ и память ECC .
Эта проблема может быть смягчена с помощью модулей DRAM, которые включают дополнительные биты памяти и контроллеры памяти, которые используют эти биты. Эти дополнительные биты используются для записи паритета или для использования кода, корректирующего ошибки (ECC). Паритет позволяет обнаружить все однобитовые ошибки (на самом деле, любое нечетное количество неправильных битов). Самый коммерческий код исправления ошибки, обнаружения с двумя ошибками (SECDED) однопородная коррекция и код , позволяющий исправить однобитульную ошибку и (в обычной конфигурации, с дополнительным битом паритета) с двумя битными ошибками. быть обнаруженным. Chipkill ECC - более эффективная версия, которая также исправляет для нескольких битных ошибок, включая потерю всего чипа памяти.
Реализации
[ редактировать ]
Сеймур Крей, как известно, сказал: « Паритет для фермеров », когда его спросили, почему он оставил это из CDC 6600 . [ 11 ] Позже он включил паритет в CDC 7600 , из -за чего эксперты отметили, что «по -видимому, многие фермеры покупают компьютеры». Оригинальный IBM PC и все ПК до начала 1990 -х годов использовали проверку паритета. [ 12 ] Позднее в основном нет.
Контроллер памяти с поддержкой ECC, как правило, может [ А ] Обнаружение и правильные ошибки одного бита за слово [ B ] (Единица передачи шины ) и обнаружить (но не правильно) ошибки двух битов на слово. BIOS Linux в некоторых компьютерах, при сопоставлении операционных систем, таких как некоторые версии , BSD и Windows ( Windows 2000 и позже [ 13 ] ), позволяет подсчитать обнаруженные и исправленные ошибки памяти, частично, чтобы помочь определить сбой модулей памяти, прежде чем проблема станет катастрофической.
Некоторые чипы DRAM включают в себя «внутренние» цепи коррекции ошибок, которые позволяют системам с контроллерами памяти, не имеющих ECC, по-прежнему получать большинство преимуществ памяти ECC. [ 14 ] [ 15 ] В некоторых системах аналогичный эффект может быть достигнут с помощью модулей памяти EOS .
Обнаружение ошибок и коррекция зависит от ожидания возникновения ошибок. Неявно предполагается, что отказ каждого бита в словах памяти является независимым, что приводит к невероятности двух одновременных ошибок. Раньше это было так, когда чипы памяти были шириной в один раз, что было типичным в первой половине 1980-х годов; Более поздние события переместили много битов в один и тот же чип. Эта слабость учитывается различными технологиями, в том числе , Sun IBM Chipkill Microsystems ' ECC , Chipspare -Packard Hewlett от коррекции Intel и данных (SDDC).
Память DRAM может обеспечить повышенную защиту от мягких ошибок , полагаясь на коды исправления ошибок. Такая исправляющая ошибка память , известная как память, защищенная EDAC или EDAC , особенно желательна для приложений с высоким уровнем устойчивости к сбоям, таких как серверы, а также приложения с глубоким пространством из-за повышенного излучения . Некоторые системы также « очищают » память, периодически читая все адреса и записывая исправленные версии, если это необходимо для удаления мягких ошибок.
Чередование позволяет распределять эффект одного космического лучей, потенциально расстраивая несколько физически соседних битов по нескольким словам, связывая соседние биты с разными словами. Пока расстройство одного события (SEU) не превышает порог ошибки (например, одна ошибка) в каком-либо конкретном слове между доступом, его можно исправить (например, с помощью кода по исправлению ошибки) и эффективно Бесплатная система памяти может быть поддержана. [ 16 ]
Управляющие ошибками контроллеры памяти традиционно используют коды Хэмминга , хотя некоторые используют тройную модульную избыточность (TMR). Последнее предпочтительнее, потому что его аппаратное обеспечение быстрее, чем схема коррекции ошибок Хэмминга. [ 16 ] Космические спутниковые системы часто используют TMR, [ 17 ] [ 18 ] [ 19 ] Хотя спутниковая оперативная память обычно использует коррекцию ошибок Хэмминга. [ 20 ]
Многие ранние реализации маски памяти ECC исправляют ошибки, действующие «как если бы» не возникала ошибка, и сообщают только о некорректных ошибках. Современные реализации регистрируются как исправляемые ошибки (CE), так и некорректируемые ошибки (UE). Некоторые люди активно заменяют модули памяти, которые демонстрируют высокую частоту ошибок, чтобы снизить вероятность некорректных событий ошибок. [ 21 ]
Многие системы памяти ECC используют «внешнюю» схему EDAC между процессором и памятью. Несколько систем с памятью ECC используют как внутренние, так и внешние системы EDAC; Внешняя система EDAC должна быть разработана для исправления определенных ошибок, которые внутренняя система EDAC не может исправить. [ 14 ] Современные процессоры настольного компьютера и сервера интегрируют схему EDAC в процессор, [ 22 ] Еще до перехода к контроллерам памяти, интегрированных ЦП, которые связаны с архитектурой NUMA . Интеграция процессора обеспечивает систему EDAC с нулевой пенностью во время без ошибок.
По состоянию на 2009 год в кодах коррекции ошибок используются коды HAMMING или HSIAO, которые обеспечивают однобиточную коррекцию ошибок и обнаружение ошибок с двойным битом (SEC-DED). Другие коды коррекции ошибок были предложены для защиты памяти-коррекция по ошибке с двойным битом и коды обнаружения ошибок с тройным битом (декабря), коды по ошибке с одним ножом и детектирование погрешности с двойным ножом (SNC-DND), тростник Коды коррекции ошибок в Соломоне и т. Д. Однако на практике многобиточная коррекция обычно реализуется путем чередования нескольких кодов SEC. [ 23 ] [ 24 ]
Ранние исследования попытались минимизировать область и задержать накладные расходы на схемы ECC. Хэмминг впервые продемонстрировал, что коды SEC-DED возможны с одной конкретной матрицей проверки. HSIAO показал, что альтернативная матрица с столбцами с нечетным весом обеспечивает возможности SEC с меньшей аппаратной площадью и более короткой задержкой, чем традиционные коды, посвященные сертификации. Более поздние исследования также пытаются минимизировать власть в дополнение к минимизации области и задержки. [ 25 ] [ 26 ] [ 27 ]
Кеш
[ редактировать ]Многие циферблаты используют коды коррекции ошибок в кэше в онколе , включая Intel Itanium , Xeon , Core и Pentium (с помощью микроархитектуры P6 ) [ 28 ] [ 29 ] Процессоры, AMD Athlon , Opteron , All Zen - [ 30 ] и дзен+ -основанная [ 31 ] Процессоры ( EPYC , EPYC Excedded , Ryzen и Ryzen Threadripper ) и Dec Alpha 21264. [ 23 ] [ 32 ]
По состоянию на 2006 г. [update], EDC/ECC и ECC/ECC являются двумя наиболее коммерческими методами защиты ошибок кэша, используемыми в коммерческих микропроцессорах. Техника EDC/ECC использует код, определяющий ошибки (EDC) в кэше уровня 1. Если обнаружена ошибка, данные восстанавливаются из кэша, защищенного ECC, уровня 2. Метод ECC/ECC использует кэш, защищенный ECC, и кэш, защищенный ECC, уровень 2. [ 33 ] ЦП, которые используют методику EDC/ECC, всегда проводятся через все хранилища в кэше уровня 2, так что при обнаружении ошибки во время чтения из кэта данных уровня 1 копия этих данных может быть восстановлена из кэша уровня 2 Полем
Зарегистрированная память
[ редактировать ]
Зарегистрированная или буферная память не такая же, как ECC; Технологии выполняют разные функции. Обычно для зарегистрированных на серверах память, используемая на серверах, позволяет использовать многие модули памяти без проблем с электричеством и ECC для целостности данных. Память, используемая на настольных компьютерах, обычно не является ни одной для экономики. Тем не менее, недоступна (не зарегистрированная) память ECC доступна, [ 34 ] И некоторые не серверные материнские платы поддерживают функциональность ECC таких модулей при использовании с процессором, который поддерживает ECC. [ 35 ] Зарегистрированная память не работает надежно на материнских платках без буферизации схемы, и наоборот.
Преимущества и недостатки
[ редактировать ]В конечном счете, существует компромисс между защитой от необычной потери данных и более высокой стоимостью.
Память ECC обычно включает в себя более высокую цену по сравнению с памятью без ECC из-за дополнительного оборудования, необходимого для производства модулей памяти ECC, и из-за более низких объемов производства памяти ECC и связанного системного оборудования. Материнские платы, чипсеты и процессоры, которые поддерживают ECC, также могут быть дороже.
Поддержка ECC варьируется среди производителей материнской платы, поэтому память ECC может быть просто не распознана с помощью ECC-несогласной материнской платы. Большинство материнских плат и процессоров для менее важных приложений не предназначены для поддержки ECC. Некоторые платы и процессоры с поддержкой ECC способны поддерживать небефферы (незарегистрированные) ECC, но также будут работать с памятью без ECC; Системная прошивка обеспечивает функциональность ECC, если установлена память ECC.
ECC может снизить производительность памяти примерно на 2–3 процента в некоторых системах, в зависимости от приложения и реализации, из -за дополнительного времени, необходимого для контроллеров памяти ECC для выполнения проверки ошибок. [ 36 ] Тем не менее, современные системы интегрируют тестирование ECC в процессор, генерируя никакой дополнительной задержки в доступе к памяти, если ошибки не обнаруживаются. [ 22 ] [ 37 ] [ 38 ] Это не относится к ECC в диапазоне , в котором хранится таблицы, используемые для защиты в зарезервированной области основной системной памяти, [ 39 ] [ 40 ] При поддержке Intel для Chromebook , который показал небольшое влияние на задачи просмотра в Интернете и производительности, но приводило к снижению уровня игр и редактирования видео и редактирования видео . [ 41 ]
Поддерживающая память ECC может способствовать дополнительному энергопотреблению из -за исправления ошибок.
Примечания
[ редактировать ]- ^ Jump up to: а беременный Большая часть памяти ECC использует код SEC .
- ^ В то время как 72-битное слово с 64 битами данных и 8 проверяющих биты распространены, ECC также используется с меньшими и большими размерами.
Ссылки
[ редактировать ]- ^ Вернер Фишер. «Рам раскрыл» . admin-magazine.com . Получено 20 октября 2014 года .
- ^ Одно событие расстроено на уровне земли, Юджин Норманд, член IEEE, Boeing Defense & Space Group, Сиэтл, Вашингтон 98124-2499
- ^ Jump up to: а беременный « Обзор методов моделирования и повышения надежности вычислительных систем », IEEE TPDS, 2015
- ^ Гэри М. Свифт и Стивен М. Гертин. «Наблюдения за расстройством нескольких ударов в драмах». Столеточная лаборатория
- ^ Jump up to: а беременный Borucki, «Сравнение ускоренных показателей мягких ошибок DRAM, измеренных на компонентах и системном уровне», 46 -й ежегодный международный симпозиум физики надежности, Phoenix, 2008, с. 482–487
- ^ Jump up to: а беременный в дюймовый Шредер, Бьянка ; Пинхайро, Эдуардо; Weber, Wolf-Dietrich (2009). Ошибки DRAM в дикой природе: крупномасштабное полевое исследование (PDF) . ACM. ISBN 978-1-60558-511-6 .
{{cite book}}
:|journal=
игнорируется ( помощь )- Робин Харрис (4 октября 2009 г.). «Трип ошибок: кошмар на Димм -стрит» . Zdnet .
- ^ «Измерение мягкой ошибки памяти в производственных системах» . Архивировано из оригинала 2017-02-14 . Получено 2011-06-27 .
- ^ Ли, Хуан; Шен, Чу (2010). « Реалистичная оценка ошибок аппаратного обеспечения памяти и чувствительности к программной системе». Годовая техническая конференция USENIX 2010 » (PDF) .
- ^ Юнгу Ким; Росс Дейли; Джереми Ким; Крис Фаллин; Джи Хе Ли; Донгюк Ли; Крис Уилкерсон; Конрад Лай; Onur Mutlu (2014-06-24). «Переключение битов в памяти без доступа к ним: экспериментальное исследование ошибок нарушения драма» (PDF) . Ece.cmu.edu . IEEE . Получено 2015-03-10 .
- ^ Дэн Гутин (2015-03-10). «Передовый хак дает статус супер пользователя, используя слабость DRAM» . Ars Technica . Получено 2015-03-10 .
- ^ "CDC 6600" . Microsoft Research . Получено 2011-11-23 .
- ^ «Проверка паритета» . Pcguide.com. 2001-04-17 . Получено 2011-11-23 .
- ^ Домары. "
!mca
" . Docs.microsoft.com . Получено 2021-03-27 . - ^ Jump up to: а беременный Ах Джонстон. «Эффекты космического излучения в передовых воспоминаниях о вспышке» Аархивировал 2016-03-04 на машине Wayback . Электронные и упаковочные программы НАСА (NEPP). 2001.
- ^ "ECC DRAM" . IntelligentMemory.com . Архивировано с оригинала 2019-02-12 . Получено 2021-06-12 .
- ^ Jump up to: а беременный «Использование сильного SA-1110 в бортовом компьютере нанозателлита» . Космический центр Цингхуа, Университет Цинхуа, Пекин. Архивировано из оригинала 2011-10-02 . Получено 2009-02-16 .
- ^ «Инженеры Actel используют избыточность тройного модуля в новой Rad-Hard FPGA» . Военная и аэрокосмическая электроника. Архивировано из оригинала 2012-07-14 . Получено 2009-02-16 .
- ^ «SEU затвердевание полевых программируемых массивов затворов (FPGAS) для космических приложений и характеристики устройства» . Klabs.org. 2010-02-03. Архивировано из оригинала 2011-11-25 . Получено 2011-11-23 .
- ^ "FPGA в космосе" . TechFocusMedia.net . Получено 2011-11-23 . [ Постоянная мертвая ссылка ]
- ^ «Коммерческие микроэлектроники технологии для применений в спутниковой радиационной среде» . Radhome.gsfc.nasa.gov. Архивировано из оригинала 2001-03-04 . Получено 2011-11-23 .
- ^ Даг Томпсон, Мауро Карвальо Чехаб. «EDAC-обнаружение и коррекция ошибок» Аархивировал 2009-09-05 на машине Wayback . 2005 - 2009. «Цель модуля ядра EDAC - обнаружить и сообщать об ошибках, которые возникают в компьютерной системе, работающей под Linux. "
- ^ Jump up to: а беременный «AMD-762 ™ System Controller Software/Guide Design, стр. 179» (PDF) .
- ^ Jump up to: а беременный Доу Хён Юн; Маттан Эрез. «Память отображена ECC: недорогая защита от ошибок для кэша последнего уровня» . 2009. с. 3
- ^ Даниэле Росси; Никола Тимончини; Майкл Спика; Сесилия Метра . «Анализ коррекции кода ошибки для кэш-памяти высокая надежность и производительность» Аархивировал 2015-02-03 на машине Wayback .
- ^ Шалини Гош; Сугато Басу; и Нур А. Туба. «Выбор кодов исправления ошибки для минимизации мощности в цепях проверки памяти» Аархивировал 2015-02-03 на машине Wayback . п. 2 и р. 4
- ^ Chrill Willerson; Это был Р. Аламель; Zshan Chishti; Мы Динеш Сомасы; Ши-инн Лу. «Rec Yert Ispan, прибывающая AR-Cost, Tar-of Borge кодов» . doi : 10.1145/1816038.1815973 .
- ^ Мой HSIAO. «Класс оптимальных минимальных кодов с нечетными колонками» . 1970.
- ^ Intel Corporation. «Интэл Xeon Processore E7 Family: надежность, доступность и обслуживаемость» . 2011 год п. 12
- ^ «Биос и кеш» . www.custom-build-compusters.com . Получено 2021-03-27 .
- ^ «Микроархитектура AMD Zen - иерархия памяти» . Wikichip . Получено 15 октября 2018 года .
- ^ «Амд дзен+ микроархитектура - иерархия памяти» . Wikichip . Получено 15 октября 2018 года .
- ^ Jangwoo Kim; Никос Хардавеллас; Кен Май; Бабак Фальсафи; Джеймс С. Моэ. «Многопользовательские толерантные кеши с использованием двухмерной кодирования ошибок» . 2007. п. 2
- ^ Натан Н. Садлер и Даниэль Дж. Сорин. «Выбор схемы защиты ошибок для кэша данных L1 микропроцессора» . 2006. п. 1
- ^ «Типичный модуль RAM ECC ECC: решающий CT25672BA1067» .
- ^ Спецификация материнской платы настольных компьютеров, которая поддерживает как ECC, так и без ECC, не разобщенная оперативная память с совместимыми процессорами
- ^ «Обсуждение ECC на PCGuide» . Pcguide.com. 2001-04-17 . Получено 2011-11-23 .
- ^ Бланка платформы AMD-762/Athlon с и без архивирования ECC 2013-06-15 на машине Wayback
- ^ «ECCPLOIT: ECC память, уязвимая для атак Rowhammer» . Системные и сетевые группы безопасности в VU Amsterdam. 12 ноября 2018 года . Получено 2018-11-22 .
- ^ США заброшены 20190332469A1 , Амир А. Раджай, Наги Абуленин, Стив Л. Гейгер, Сатьяджит А. Джадхав, Безан Дж. Кападия, Вивек Козхиккотту, Рашми Лаккур Субраманьям, Сритар Рамс, Джеймс М. Шехади, Джасон Д. Ванкен, Адреса, Адреса, Адреса, Диапазон, основанный на диапазоне памяти, корректирующий модуль защиты кода с буфером синдрома », опубликованный 2019-10-31, назначенный Intel
- ^ Патент США 11768731B2 , Hartlieb, Heimo & Heiling, Christian, «Система и метод для прозрачного обнаружения ошибок и коррекции данных регистрации через коммуникационную шину», опубликованная 2020-11-05, назначенные технологиям Infineon
- ^ Ганеш Т.С. (2023-01-29). «Asrock Industrial Nucs Box-1360p/D4 Обзор: впечатления от Raptor Lake-P, плюс неожиданный ECC» . С. 2–6 . Получено 2024-01-29 .
Внешние ссылки
[ редактировать ]- SoftEcc: система проверки целостности программного памяти памяти
- Настраиваемая программная библиотека ошибок и коррекции DRAM для HPC
- Обнаружение и коррекция немойной коррупции для крупномасштабных высокопроизводительных вычислений
- Ошибки с одним битом: перспектива поставщика модуля памяти на причину, воздействие и обнаружение
- Руководство по конфигурации памяти семейства Intel Xeon E3 - 1200
- Линус Торвальдс о важности ECC RAM, вызывает «плохие политики» Intel над ECC