Программная ошибка
Эта статья нуждается в дополнительных цитатах для проверки . ( ноябрь 2011 г. ) |
В электронике и вычислительной технике мягкая ошибка — это тип ошибки , при которой сигнал или данные неверны. Ошибки могут быть вызваны дефектом , под которым обычно понимают ошибку в проектировании или изготовлении, или неисправный компонент. Мягкая ошибка также является неправильным сигналом или данными, но не предполагается, что она подразумевает такую ошибку или поломку. После обнаружения программной ошибки не возникает никаких сомнений в том, что система стала менее надежной, чем раньше. Одной из причин мягких ошибок являются единичные нарушения, вызванные космическими лучами.
В системе памяти компьютера программная ошибка изменяет инструкцию в программе или значение данных. Программные ошибки обычно можно исправить путем холодной перезагрузки компьютера. Мягкая ошибка не повредит аппаратное обеспечение системы; единственный ущерб наносится обрабатываемым данным.
Существует два типа программных ошибок: программная ошибка на уровне чипа и программная ошибка на уровне системы . Мягкие ошибки на уровне чипа возникают, когда частицы попадают в чип, например, когда вторичные частицы космических лучей попадают на кремниевый кристалл . Если частица с определенными свойствами попадает в ячейку памяти , это может привести к изменению состояния ячейки на другое значение. Атомная реакция в этом примере настолько мала, что не повреждает физическую структуру чипа. Мягкие ошибки системного уровня возникают, когда обрабатываемые данные подвергаются воздействию шума, обычно когда данные находятся на шине данных. Компьютер пытается интерпретировать шум как бит данных, что может вызвать ошибки при адресации или обработке программного кода. Бит неверных данных может даже быть сохранен в памяти и вызвать проблемы в дальнейшем.
В случае обнаружения программную ошибку можно исправить путем перезаписи правильных данных вместо ошибочных. Высоконадежные системы используют коррекцию ошибок для исправления «мягких» ошибок «на лету». Однако во многих системах может оказаться невозможным определить правильные данные или даже обнаружить наличие ошибки вообще. Кроме того, прежде чем произойдет исправление, в системе мог произойти сбой , и в этом случае процедура восстановления должна включать перезагрузку . Мягкие ошибки включают изменения в данных — например, в электронах в цепи хранения, — но не в самой физической схеме, в атомах . Если данные перезаписать, схема снова будет работать идеально. Мягкие ошибки могут возникать в линиях передачи, в цифровой логике, аналоговых схемах, магнитных запоминающих устройствах и т. д., но наиболее часто они встречаются в полупроводниковых запоминающих устройствах.
Критический заряд [ править ]
Возникнет ли в схеме мягкая ошибка, зависит от энергии входящей частицы, геометрии удара, места удара и конструкции логической схемы. Логические схемы с более высокой емкостью и более высокими логическими напряжениями с меньшей вероятностью будут подвержены ошибкам. Эта комбинация емкости и напряжения описывается критическим параметром заряда Q crit , минимальным возмущением электронного заряда, необходимым для изменения логического уровня. Более высокий показатель Q означает меньше мягких ошибок. К сожалению, более высокий уровень добротности также означает более медленный логический элемент и более высокую рассеиваемую мощность. Уменьшение размера микросхемы и напряжения питания, желательное по многим причинам, снижает Qкрит . Таким образом, важность «мягких» ошибок возрастает по мере развития технологии микросхем.
В логической схеме Q крит определяется как минимальная величина индуцированного заряда, необходимая в узле схемы, чтобы вызвать распространение импульса напряжения от этого узла к выходу и иметь достаточную длительность и величину для надежной фиксации. Поскольку логическая схема содержит множество узлов, которые могут быть поражены, и каждый узел может иметь уникальную емкость и расстояние от выхода, критическая добротность обычно характеризуется для каждого узла отдельно.
Причины программных ошибок [ править ]
от распада упаковки Альфа - частицы
Мягкие ошибки стали широко известны с появлением динамической оперативной памяти в 1970-х годах. В этих ранних устройствах упаковочные материалы из керамических чипов содержали небольшое количество радиоактивных примесей. Чтобы избежать чрезмерных программных ошибок, необходимы очень низкие скорости затухания, и с тех пор производители микросхем время от времени сталкиваются с проблемами загрязнения. Чрезвычайно трудно поддерживать необходимую чистоту материала. Контроль уровня выбросов альфа-частиц для критически важных упаковочных материалов до уровня менее 0,001 импульса в час на см 2 (cph/см 2 ) требуется для надежной работы большинства схем. Для сравнения, скорость счета типичной подошвы обуви составляет от 0,1 до 10 импульсов в час/см. 2 .
Радиоактивный распад упаковки обычно вызывает мягкую ошибку из-за испускания альфа-частиц . Положительно заряженная альфа-частица проходит через полупроводник и нарушает там распределение электронов. Если помехи достаточно велики, цифровой сигнал может измениться с 0 на 1 или наоборот. В комбинационной логике этот эффект является временным, возможно, длящимся доли наносекунды, и это привело к тому, что мягкие ошибки в комбинационной логике по большей части остаются незамеченными. В последовательной логике, такой как защелки и ОЗУ , даже это кратковременное нарушение может сохраняться на неопределенное время, чтобы быть считанным позже. Таким образом, проектировщики обычно гораздо лучше осведомлены о проблемах схем хранения данных.
2011 года В документе Black Hat обсуждаются реальные последствия таких перестановок битов в системе доменных имен Интернета для безопасности . В документе обнаружено до 3434 неправильных запросов в день из-за изменений бит-инвертирования для различных общих доменов. Многие из этих переворотов, вероятно, могут быть связаны с аппаратными проблемами, но некоторые могут быть связаны с альфа-частицами. [1] Этими ошибками переворота битов могут воспользоваться злоумышленники в форме битсквоттинга .
Айзек Азимов получил письмо, в котором его поздравляли со случайным предсказанием ошибок оперативной памяти альфа-частиц в романе 1950-х годов. [2]
и Космические протоны лучи создают энергичные нейтроны
Как только электронная промышленность определила, как контролировать загрязнение упаковки, стало ясно, что действуют и другие причины. Джеймс Ф. Зиглер руководил программой работы в IBM , кульминацией которой стала публикация ряда статей (Ziegler and Lanford, 1979), демонстрирующих, что космические лучи также могут вызывать мягкие ошибки. Действительно, в современных устройствах преобладающей причиной могут быть космические лучи. Хотя первичная частица космических лучей обычно не достигает поверхности Земли, она создает поток энергичных вторичных частиц. На поверхности Земли примерно 95% частиц, способных вызывать мягкие ошибки, представляют собой энергичные нейтроны, а остальная часть состоит из протонов и пионов. [3] одна ошибка в месяц на 256 МБ ОЗУ. По оценкам IBM в 1996 году, для настольного компьютера ожидалась [4] Этот поток энергичных нейтронов в литературе по мягким ошибкам обычно называют «космическими лучами». Нейтроны не заряжены и не могут нарушить цепь сами по себе, но подвергаются захвату нейтрона ядром атома в чипе. Этот процесс может привести к образованию заряженных вторичных частиц, таких как альфа-частицы и ядра кислорода, которые затем могут вызвать мягкие ошибки.
Поток космических лучей зависит от высоты. Для обычного эталонного местоположения 40,7° с.ш., 74° з.д. на уровне моря ( Нью-Йорк , штат Нью-Йорк, США) поток составляет примерно 14 нейтронов/см. 2 /час. Захоронение системы в пещере снижает уровень мягких ошибок, вызванных космическими лучами, до незначительного уровня. В нижних слоях атмосферы поток увеличивается примерно в 2,2 раза на каждые 1000 м (1,3 на каждые 1000 футов) увеличения высоты над уровнем моря. Компьютеры, работающие на вершинах гор, испытывают на порядок более высокий уровень программных ошибок по сравнению с уровнем моря. Частота сбоев в самолетах может более чем в 300 раз превышать частоту сбоев на уровне моря. В этом отличие от мягких ошибок, вызванных распадом упаковки, которые не меняются в зависимости от местоположения. [5] По мере увеличения плотности чипов . Intel ожидает, что ошибки, вызванные космическими лучами, будут увеличиваться и станут ограничивающим фактором при проектировании [4]
Средняя скорость мягких ошибок космических лучей обратно пропорциональна активности солнечных пятен. То есть среднее количество мягких ошибок космических лучей уменьшается во время активной части цикла солнечных пятен и увеличивается во время спокойной части. Этот противоречивый результат возникает по двум причинам. Солнце обычно не производит частиц космических лучей с энергией выше 1 ГэВ, способных проникать в верхние слои атмосферы Земли и создавать ливни частиц, поэтому изменения солнечного потока не влияют напрямую на количество ошибок. Кроме того, увеличение солнечного потока в период активного Солнца действительно приводит к изменению формы магнитного поля Земли, обеспечивая некоторую дополнительную защиту от космических лучей более высокой энергии, что приводит к уменьшению количества частиц, создающих ливни. В любом случае эффект довольно мал, что приводит к модуляции потока энергичных нейтронов в Нью-Йорке на ±7%. Другие локации затронуты аналогичным образом. [ нужна ссылка ]
В одном эксперименте частота мягких ошибок на уровне моря составила 5950 сбоев во времени (FIT = сбоев на миллиард часов) на один чип DRAM. Когда ту же самую испытательную установку перенесли в подземное хранилище, защищенное каменной стеной высотой более 50 футов (15 м), которая эффективно устраняла все космические лучи, не было зарегистрировано никаких мягких ошибок. [6] В этом тесте все другие причины мягких ошибок слишком малы, чтобы их можно было измерить, по сравнению с частотой ошибок, вызванных космическими лучами.
Энергичные нейтроны, производимые космическими лучами, могут потерять большую часть своей кинетической энергии и достичь теплового равновесия с окружающей средой, поскольку они рассеиваются материалами. Образующиеся нейтроны называются просто тепловыми нейтронами и имеют среднюю кинетическую энергию около 25 миллиэлектронвольт при 25 °C. Тепловые нейтроны также производятся источниками радиации окружающей среды, включая распад встречающихся в природе радиоактивных элементов, таких как уран и торий . Поток тепловых нейтронов от источников, отличных от ливней космических лучей, все еще может быть заметен в подземных местах и вносить важный вклад в мягкие ошибки для некоторых схем.
Тепловые нейтроны [ править ]
Нейтроны, которые потеряли кинетическую энергию до тех пор, пока не пришли в тепловое равновесие с окружающей средой, являются важной причиной мягких ошибок в некоторых схемах. При низких энергиях многие реакции захвата нейтронов становятся гораздо более вероятными и приводят к делению определенных материалов с образованием заряженных вторичных частиц в качестве побочных продуктов деления. Для некоторых схем захват теплового нейтрона ядром 10 B Изотоп бора особенно важен. Эта ядерная реакция является эффективным производителем альфа-частицы . 7 Ядро Ли и гамма-лучи . Любая из заряженных частиц (альфа или 7 Li) может вызвать мягкую ошибку, если производится в очень непосредственной близости, примерно 5 мкм , от критического узла схемы. Сечение захвата для 11 B на 6 порядков меньше и не способствует мягким ошибкам. [7]
Бор использовался в BPSG , изоляторе в соединительных слоях интегральных схем, особенно в самом нижнем. Включение бора снижает температуру плавления стекла, обеспечивая лучшие характеристики оплавления и планаризации. В этой заявке стекло изготавливается с содержанием бора от 4 до 5% по весу. Природный бор составляет 20%. 10 B с остатком 11 Изотоп Б. Мягкие ошибки вызваны высоким уровнем 10 B на этом критическом нижнем уровне некоторых старых процессов интегральных схем. Бор-11, используемый в низких концентрациях в качестве легирующей примеси p-типа, не вносит вклада в мягкие ошибки. Производители интегральных схем отказались от борированных диэлектриков к тому времени, когда размеры отдельных компонентов схемы уменьшились до 150 нм, во многом из-за этой проблемы.
В критически важных конструкциях используется обедненный бор, почти полностью состоящий из бора-11, чтобы избежать этого эффекта и, следовательно, снизить частоту мягких ошибок. Бор-11 — побочный продукт атомной промышленности .
Для приложений в медицинских электронных устройствах этот механизм мягких ошибок может быть чрезвычайно важен. Нейтроны производятся во время высокоэнергетической лучевой терапии рака с использованием энергии пучка фотонов выше 10 МэВ. Эти нейтроны замедляются, поскольку они рассеиваются от оборудования и стен в процедурном кабинете, в результате чего поток тепловых нейтронов составляет около 40 × 10 6 выше, чем нормальный поток нейтронов окружающей среды. Этот высокий поток тепловых нейтронов обычно приводит к очень высокому количеству мягких ошибок и, как следствие, к нарушению работы схемы. [8] [9]
Другие причины [ править ]
Мягкие ошибки также могут быть вызваны случайным шумом или проблемами целостности сигнала , такими как индуктивные или емкостные перекрестные помехи . Однако в целом эти источники вносят небольшой вклад в общую частоту мягких ошибок по сравнению с эффектами излучения.
Некоторые тесты приходят к выводу, что изоляцию ячеек памяти DRAM можно обойти из-за непредвиденных побочных эффектов специально созданного доступа к соседним ячейкам. Таким образом, доступ к данным, хранящимся в DRAM, приводит к утечке зарядов ячеек памяти и электрическому взаимодействию в результате высокой плотности ячеек в современной памяти, изменяя содержимое соседних строк памяти, которые фактически не были адресованы при первоначальном доступе к памяти. [10] Этот эффект известен как «молоток строк» , и он также использовался в некоторых для повышения привилегий компьютерной безопасности эксплойтах . [11] [12]
Проектирование с учетом мягких ошибок [ править ]
Мягкое устранение ошибок [ править ]
Разработчик может попытаться свести к минимуму количество «мягких» ошибок, разумно спроектировав устройство, выбрав правильные полупроводники, материалы корпуса и подложки, а также правильную геометрию устройства. Однако зачастую это ограничивается необходимостью уменьшить размер устройства и напряжение, увеличить рабочую скорость и уменьшить рассеиваемую мощность. Подверженность устройств сбоям описывается в отрасли с использованием стандарта JEDEC JESD-89 .
Один из методов, который можно использовать для снижения частоты мягких ошибок в цифровых схемах, называется радиационной стойкостью . Это предполагает увеличениеемкости в выбранных узлах схемы с целью повышения ее эффективного критического значения добротности . Это уменьшает диапазон энергий частициз-за чего логическое значение узла может быть нарушено. Радиационная стойкость часто достигается за счет увеличения размера транзисторов, которые имеютобласть стока/истока в узле. Поскольку площадь и мощность радиационной защиты могут быть ограничены при проектировании, этот метод часто применяется выборочно к узлам, которые, по прогнозам, имеют наибольшую вероятность привести к мягким ошибкам в случае удара. Инструменты и модели, которые могутпредсказать, какие узлы наиболее уязвимы, являются предметом прошлых и текущих исследований в области мягких ошибок.
Обнаружение программных ошибок [ править ]
Была проведена работа по устранению программных ошибок в ресурсах процессора и памяти с использованием как аппаратных, так и программных методов. Несколько исследовательских усилий были направлены на устранение программных ошибок, предлагая обнаружение и восстановление ошибок с помощью аппаратной избыточной многопоточности. [13] [14] [15] В этих подходах использовалось специальное оборудование для репликации выполнения приложения с целью выявления ошибок в выходных данных, что увеличивало сложность и стоимость конструкции оборудования, включая высокие затраты на производительность. С другой стороны, программные схемы, устойчивые к мягким ошибкам, являются гибкими и могут применяться к серийным коммерческим микропроцессорам. Во многих работах предлагается репликация инструкций на уровне компилятора и проверка результатов для обнаружения мягких ошибок. [16] [17] [18]
Исправление программных ошибок [ править ]
Проектировщики могут принять тот факт, что возникнут мягкие ошибки, и спроектировать системы с соответствующим обнаружением и исправлением ошибок для корректного восстановления. Обычно в конструкции полупроводниковой памяти может использоваться упреждающее исправление ошибок , включающее избыточные данные в каждое слово для создания кода исправления ошибок . В качестве альтернативы можно использовать коррекцию ошибок с откатом , обнаруживая мягкую ошибку с помощью кода обнаружения ошибок, такого как четность , и перезаписывая правильные данные из другого источника. Этот метод часто используется для со сквозной записью кэш-памяти .
Мягкие ошибки в логических схемах иногда обнаруживаются и исправляются с использованием методов отказоустойчивого проектирования . Они часто включают использование резервных схем или вычислений данных и обычно достигаются за счет площади схемы, снижения производительности и/или более высокого энергопотребления. Концепция тройного модульного резервирования (TMR) может использоваться для обеспечения очень высокой надежности от мягких ошибок в логических схемах. В этом методе три идентичные копии схемы обрабатывают одни и те же данные параллельно, а выходные данные передаются в логику мажоритарного голосования , возвращая значение, которое возникло как минимум в двух из трех случаев. Таким образом, отказ одной схемы из-за программной ошибки отбрасывается при условии, что две другие схемы работают правильно. Однако на практике лишь немногие проектировщики могут позволить себе требуемую площадь схемы и накладные расходы на мощность более 200%, поэтому обычно это применяется только выборочно. Другой распространенной концепцией исправления мягких ошибок в логических схемах является временная (или временная) избыточность, при которой одна схема обрабатывает одни и те же данные несколько раз и сравнивает последующие оценки на предмет согласованности. Однако этот подход часто влечет за собой накладные расходы на производительность, накладные расходы на область (если для хранения данных используются копии защелок) и накладные расходы на электропитание, хотя он значительно более эффективен по площади, чем модульная избыточность.
Традиционно DRAM уделялось наибольшее внимание в стремлении уменьшить или обойти программные ошибки, поскольку DRAM занимает большую часть уязвимой поверхности устройств в настольных и серверных компьютерных системах (см. распространенность ECC). ОЗУ в серверных компьютерах). Трудно получить точные данные о чувствительности DRAM, и они значительно различаются в зависимости от конструкции, процесса изготовления и производителя. Технология 1980-х годов. 256-килобитные DRAM могли иметь кластеры из пяти или шести бит, образующих одну альфа-частицу . Современные DRAM имеют гораздо меньшие размеры элементов, поэтому накопление аналогичного количества заряда может легко привести к переворачиванию гораздо большего количества битов.
Разработке схем обнаружения и исправления ошибок способствует тот факт, что мягкие ошибки обычно локализуются на очень небольшой площади кристалла. Обычно затрагивается только одна ячейка памяти, хотя события высокой энергии могут вызвать расстройство многих ячеек. Традиционная структура памяти обычно размещает один бит из множества различных корректирующих слов, расположенных рядом на кристалле. Таким образом, даже сбой с несколькими ячейками приводит только к ряду отдельных однобитовых сбоев в нескольких корректирующих словах, а не с многобитовым сбоем в одном корректирующем слове. Таким образом, коду исправления ошибок достаточно справиться только с одним битом ошибки в каждом корректирующем слове, чтобы справиться со всеми вероятными мягкими ошибками. Термин «многоячеечный» используется для обозначения сбоев, затрагивающих несколько ячеек памяти, независимо от того, в какие слова коррекции эти ячейки попадают. «Многобитный» используется, когда несколько битов в одном корректирующем слове содержат ошибку.
Мягкие ошибки в комбинационной логике [ править ]
Три естественных маскирующих эффекта в комбинационной логике , которые определяют, будет лиодно сбой в событии (SEU) будет распространяться и становиться мягкой ошибкой: электрическая маскировка , логическая маскировка и временная (или временная) маскировка . SEU логически маскируется, если егораспространение заблокировано от достижения выходной защелки, поскольку затвор вне путивходы предотвращают логический переход выхода этого вентиля. СЭУ – это электрически маскируется , если сигнал ослабляется электрическими свойствамизатворы на пути распространения так, что результирующий импульс имеет недостаточную амплитуду для того, чтобы его можно былонадежно защелкивается. SEU временно маскируется, если ошибочный импульс достигаетвыходная защелка, но она не происходит достаточно близко к тому моменту, когда защелка фактически срабатывает и удерживается.
Если все три эффекта маскировки не реализуются, распространяющийся импульс фиксируется и на выходе логической схемы появляется ошибочное значение. В контексте работы схемы это ошибочное выходное значение можно рассматривать как событие программной ошибки. Однако с точки зрения микроархитектуры затронутый результат может не изменить выходные данные выполняющейся в данный момент программы. Например, ошибочные данные могут быть перезаписаны перед использованием, замаскированы в последующих логических операциях или просто никогда не использоваться. Если ошибочные данные не влияют на выходные данные программы, это считается примером микроархитектурной маскировки .
Частота мягких ошибок [ править ]
Коэффициент мягких ошибок (SER) — это частота, с которой устройство или система сталкивается или прогнозируется, что столкнется с мягкими ошибками. Обычно оно выражается либо количеством отказов за время (FIT), либо средним временем между отказами (MTBF). Единица, принятая для количественной оценки сбоев во времени, называется FIT, что эквивалентно одной ошибке на миллиард часов работы устройства. MTBF обычно выражается в годах эксплуатации устройства; для сравнения: один FIT равен примерно 1 000 000 000 / (24 × 365,25) = 114 077 раз дольше между ошибками, чем один год безотказной работы.
Хотя у многих электронных систем среднее время безотказной работы превышает ожидаемый срок службы схемы, SER все равно может быть неприемлемым для производителя или потребителя. Например, в полевых условиях можно ожидать большого количества отказов на миллион цепей из-за программных ошибок, если система не имеет адекватной защиты от программных ошибок. Неисправность даже нескольких продуктов в данной области, особенно катастрофическая, может запятнать репутацию продукта и компании, которая его разработала. Кроме того, в приложениях, критичных к безопасности или затратам, где стоимость отказа системы намного превышает стоимость самой системы, 1% риск сбоя программной ошибки за весь срок службы может быть слишком высоким, чтобы быть приемлемым для заказчика. Поэтому выгодно проектировать систему с низким SER при крупносерийном производстве системы или при необходимости чрезвычайно высокой надежности.
См. также [ править ]
Ссылки [ править ]
- ^ Артем Динабург (июль 2011 г.). «Битсквоттинг — захват DNS без эксплуатации» (PDF) . Архивировано из оригинала (PDF) 11 июня 2018 г. Проверено 26 декабря 2011 г.
- ^ Голд (1995): «Это письмо предназначено для того, чтобы проинформировать вас и поздравить вас с еще одним замечательным научным предсказанием будущего, а именно с вашим предвидением проблемы логического нарушения динамической памяти с произвольным доступом (DRAM), вызванной испусканием альфа-частиц, впервые наблюдавшейся в 1977 года, но написано вами в «Стальных пещерах» в 1957 году». [Примечание: на самом деле, 1952 год.] ... «Эти неисправности вызваны следами радиоактивных элементов, присутствующих в упаковочном материале, используемом для герметизации кремниевых устройств... в вашей книге «Пещеры стали», опубликованной в 1950-х годах, вы использовать излучатель альфа-частиц, чтобы «убить» одного из роботов в этой истории, уничтожив («рандомизируя») его позитронный мозг. Это, конечно, лучший способ описания нарушения логики, чем любой другой, который я слышал. ..наши миллионы долларов исследований, завершившиеся несколькими международными наградами за наиболее важный научный вклад в области надежности полупроводниковых приборов в 1978 и 1979 годах, были предсказаны в достаточно точной форме на двадцать лет [Примечание: на самом деле двадцать пять лет ] до того, как произошли события
- ^ Зиглер, Дж. Ф. (январь 1996 г.). «Земные космические лучи». Журнал исследований и разработок IBM . 40 (1): 19–39. дои : 10.1147/рд.401.0019 . ISSN 0018-8646 .
- ↑ Перейти обратно: Перейти обратно: а б Симонит, Том (март 2008 г.). «Должен ли каждый компьютерный чип иметь детектор космических лучей?» . Новый учёный . Архивировано из оригинала 2 декабря 2011 г. Проверено 26 ноября 2019 г.
- ^ Гордон, MS; Гольдхаген, П.; Родбелл, КП; Забель, TH; Тан, HHK; Клем, Дж. М.; Бейли, П. (2004). «Измерение потока и энергетического спектра нейтронов, индуцированных космическими лучами на Земле». Транзакции IEEE по ядерной науке . 51 (6): 3427–3434. Бибкод : 2004ИТНС...51.3427Г . дои : 10.1109/TNS.2004.839134 . ISSN 0018-9499 . S2CID 9573484 .
- ^ Делл, Тимоти Дж. (1997). «Белая книга о преимуществах Chipkill-Correct ECC для основной памяти ПК-сервера» (PDF) . ece.umd.edu . п. 13 . Проверено 3 ноября 2021 г.
- ^ Бауманн, Р.; Хоссейн, Т.; Мурата, С.; Китагава, Х. (1995). «Соединения бора как основной источник альфа-частиц в полупроводниковых устройствах». 33-й Международный симпозиум по физике надежности IEEE . стр. 297–302. дои : 10.1109/RELPHY.1995.513695 . ISBN 978-0-7803-2031-4 . S2CID 110078856 .
- ^ Уилкинсон, доктор медицинских наук; Баундс, К.; Браун, Т.; Герби, Би Джей; Пельтье, Дж. (2005). «Оборудование для лучевой терапии рака как причина мягких ошибок в электронном оборудовании». Транзакции IEEE по надежности устройств и материалов . 5 (3): 449–451. дои : 10.1109/TDMR.2005.858342 . ISSN 1530-4388 . S2CID 20789261 .
- ^ Франко, Л., Гомес, Ф., Иглесиас, А., Пардо, Дж., Пасос, А., Пенья, Дж., Сапата, М., SEUs на коммерческом SRAM, индуцированные нейтронами низкой энергии, производимыми в клиническом линейном ускорителе объект, Труды RADECS, сентябрь 2005 г.
- ^ Пак, Кёнбэ; Бэг, Санхён; Вэнь, Шицзе; Вонг, Ричард (октябрь 2014 г.). «Активная предварительная зарядка при отказе, вызванном строкой, в DDR3 SDRAM по технологии 3 × нм». Итоговый отчет Международного семинара по комплексной надежности IEEE 2014 г. (IIRW) . ИИЭЭ . стр. 82–85. дои : 10.1109/IIRW.2014.7049516 . ISBN 978-1-4799-7308-8 . S2CID 14464953 .
- ^ Ким, Юнгу; Дейли, Росс; Ким, Джереми; Фоллин, Крис; Ли, Джи Хе; Ли, Донхёк; Вилкерсон, Крис; Лай, Конрад; Мутлу, Онур (24 июня 2014 г.). «Переключение битов в памяти без доступа к ним: экспериментальное исследование ошибок возмущения DRAM» (PDF) . ece.cmu.edu . ИИЭЭ . Проверено 10 марта 2015 г.
- ^ Гудин, Дэн (10 марта 2015 г.). «Современный хак дает статус суперпользователя, используя слабость DRAM» . Арс Техника . Проверено 10 марта 2015 г.
- ^ Рейнхардт, Стивен К.; Мукерджи, Шубхенду С. (2000). «Обнаружение переходных неисправностей посредством одновременной многопоточности». Новости компьютерной архитектуры ACM SIGARCH . 28 (2): 25–36. CiteSeerX 10.1.1.112.37 . дои : 10.1145/342001.339652 . ISSN 0163-5964 .
- ^ Мукерджи, Шубхенду С.; Конц, Майкл; Рейнхардт, Стивен К. (2002). «Детальное проектирование и оценка альтернатив избыточной многопоточности». Новости компьютерной архитектуры ACM SIGARCH . 30 (2): 99. CiteSeerX 10.1.1.13.2922 . дои : 10.1145/545214.545227 . ISSN 0163-5964 . S2CID 1909214 .
- ^ Виджайкумар, Теннесси; Померанц, Ирит ; Ченг, Карл (2002). «Восстановление переходных сбоев с использованием одновременной многопоточности». Новости компьютерной архитектуры ACM SIGARCH . 30 (2): 87. дои : 10.1145/545214.545226 . ISSN 0163-5964 . S2CID 2270600 .
- ^ Намсук, о; Ширвани, Филип П.; Маккласки, Эдвард Дж. (2002). «Обнаружение ошибок по дублированным инструкциям в суперскалярных процессорах». Транзакции IEEE о надежности . 51 : 63–75. дои : 10.1109/24.994913 .
- ^ Рейс А., Джордж А.; Чанг, Джонатан; Вачхараджани, Нил; Ранган, Рам; Август, Дэвид И. (2005). «SWIFT: Программно реализованная отказоустойчивость». Международный симпозиум по генерации и оптимизации кода . Материалы международного симпозиума по генерации и оптимизации кода. стр. 243–254. CiteSeerX 10.1.1.472.4177 . дои : 10.1109/CGO.2005.34 . ISBN 978-0-7695-2298-2 . S2CID 5746979 .
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Дидебан, мусульманин; Шривастава, Авирал (2016), «NZDC: метод компилятора для почти нулевого незаметного повреждения данных», Труды 53-й ежегодной конференции по автоматизации проектирования , Материалы 53-й ежегодной конференции по автоматизации проектирования (DAC): ACM, стр. 48, номер домена : 10.1145/2897937.2898054 , ISBN 9781450342360 , S2CID 5618907
{{citation}}
: CS1 maint: местоположение ( ссылка )
Дальнейшее чтение [ править ]
- Зиглер, Дж. Ф.; Лэнфорд, Вашингтон (1979). «Влияние космических лучей на компьютерную память». Наука . 206 (4420): 776–788. Бибкод : 1979Sci...206..776Z . дои : 10.1126/science.206.4420.776 . ISSN 0036-8075 . ПМИД 17820742 . S2CID 2000982 .
- Мукерджи, С., «Архитектурное проектирование с учетом мягких ошибок», Elsevier, Inc., февраль 2008 г.
- Мукерджи, С., «Сбои компьютера из-за программных ошибок: проблема с множественными решениями», Microprocessor Report, 19 мая 2008 г.
Внешние ссылки [ править ]
- Мягкие ошибки в электронной памяти - Технический документ - Хороший сводный документ со множеством ссылок - Теззарон, январь 2004 г. Делается вывод, что 1000–5000 FIT на Мбит (0,2–1 ошибка в день на Гбайт) является типичной частотой мягких ошибок DRAM.
- Преимущества Chipkill-Correct ECC для основной памяти сервера ПК . Обсуждение надежности SDRAM в 1997 году. Некоторая интересная информация о «мягких ошибках» космических лучей , особенно в отношении кода с коррекцией ошибок. схем
- Влияние мягких ошибок на надежность системы - Ритеш Мастипурам и Эдвин К. Ви, Cypress Semiconductor, 2004 г.
- Проблемы масштабирования и технологии снижения уровня мягких ошибок - Джонстон - 4-я ежегодная исследовательская конференция по надежности, Стэнфордский университет, октябрь 2000 г.
- Оценка мягких ошибок LSI, вызванных земными космическими лучами и альфа-частицами - Х. Кобаяши, К. Сираиси, Х. Цучия, Х. Усуки (все из Sony) и Ю. Нагаи, К. Такахиса (Университет Осаки), 2001 г.
- Веб-сайт семинара SELSE — веб-сайт семинара по системным эффектам логических программных ошибок.