Jump to content

Исключение машинной проверки

(Перенаправлено из исключения проверки машины )

( Исключение проверки компьютера MCE ) — это тип компьютерной ошибки компьютера проблемы, связанной с аппаратным обеспечением , которая возникает при обнаружении . Для большинства персональных компьютеров массового рынка MCE указывает на неисправное или неправильно сконфигурированное оборудование.

Природа и причины MCE могут различаться в зависимости от архитектуры и поколения системы. В некоторых проектах MCE всегда представляет собой неисправимую ошибку, которая останавливает работу машины и требует перезагрузки . В других архитектурах некоторые MCE могут быть нефатальными, например, однобитовые ошибки, исправляемые памятью ECC . В некоторых архитектурах, таких как PowerPC , определенные ошибки программного обеспечения могут вызывать MCE, например неверный доступ к памяти. В других архитектурах, таких как x86 , MCE обычно создаются только аппаратно.

Отчетность

[ редактировать ]

Операционные системы для мэйнфреймов IBM

[ редактировать ]

Операционная система IBM System/360 ( OS/360 ) записывает ошибки ввода-вывода в наборе данных под названием SYS1.LOGREC. С тех пор IBM ввела термин « набор данных записи ошибок» ( ERDS ) для последующих версий, которые позволяют установке выбирать имя, а также для операционных систем, не являющихся производными от OS/360. [ 1 ]

В OS/360 при установке можно выбрать несколько уровней поддержки обработки машинных проверок. Самый сложный обработчик проверки компьютера (MCH) записывает данные об ошибках в SYS1.LOGREC и пытается выполнить восстановление. Установка может распечатать эти данные с помощью сервисной программы редактирования и печати экологических записей (EREP) или автономной версии SEREP. MCH может обрабатывать сбои памяти в обновляемых разделах управления ядром, считывая новую копию из SYS1.ASRLIB, а также может обрабатывать ошибки памяти в переходных областях SVC, считывая новую копию модуля SVC из SYS1.SVCLIB.

В z/OS установка может либо использовать ERDS, либо определить поток журнала системного журнала z/OS. [ 2 ] для хранения данных об ошибках. Как и в случае с OS/360, для печати этих данных при установке используется EREP; SEREP больше не доступен. MCH больше не является необязательным и обрабатывает гораздо больше режимов сбоя, чем OS/360 MCH.

Microsoft Windows

[ редактировать ]

На платформах Microsoft Windows в случае неисправимого MCE система генерирует ошибку BugCheck, также называемую STOP-ошибкой или « синим экраном смерти» .

Более поздние версии Windows используют архитектуру аппаратных ошибок Windows (WHEA) и генерируют код STOP 0x124, WHEA_UNCORRECTABLE_ERROR. Четыре параметра (в скобках) будут различаться, но для MCE первый всегда равен 0x0. [ 3 ] Пример:

   STOP: 0x00000124 (0x0000000000000000, 0x0000000000000000, 0x0000000000000000, 0x0000000000000000)

Более старые версии Windows используют архитектуру машинной проверки с кодом STOP 0x9C, MACHINE_CHECK_EXCEPTION. [ 4 ] Пример:

   STOP: 0x0000009C (0x00000030, 0x00000002, 0x00000001, 0x80003CBA)

В Linux ядро системную ​​записывает сообщения о MCE в журнал сообщений ядра и на консоль . Если MCE не являются фатальными, они также обычно копируются в системный журнал и/или журнал systemd . Для некоторых систем ECC и другие исправимые ошибки могут сообщаться через средства MCE. [ 5 ]

Пример:

   CPU 0: Machine Check Exception: 0000000000000004
   Bank 2: f200200000000863
   Kernel panic: CPU context corrupt

Типы проблем

[ редактировать ]

Некоторые из основных аппаратных проблем, вызывающих MCE, включают:

Возможные причины

[ редактировать ]

Машинные проверки — это аппаратная проблема, а не программная. Зачастую они являются результатом разгона или перегрева. В некоторых случаях ЦП отключается после достижения температурного предела, чтобы избежать необратимого повреждения. Но они также могут быть вызваны ошибками шины, вызванными другими неисправными компонентами, такими как память или устройства ввода-вывода. Возможные причины включают в себя:

  • Плохое охлаждение процессора из-за того, что радиатор процессора и корпусные вентиляторы (или фильтры) забиты пылью или отсоединились.
  • Разгон сверх максимальной тактовой частоты, при которой процессор по-прежнему надежен.
  • Неисправная материнская плата.
  • Неисправный процессор.
  • Память подвела.
  • Неисправные контроллеры ввода-вывода либо на материнской плате, либо на отдельных картах.
  • Неисправные устройства ввода-вывода.
  • Недостаточный или неисправный источник питания.

Проблемы с охлаждением обычно очевидны при осмотре. Неисправную материнскую плату или процессор можно определить, заменив их исправными деталями. Память можно проверить, загрузив диагностический инструмент, например memtest86 . Несущественные неисправные устройства ввода-вывода и контроллеры можно выявить, отключив их, если это возможно, или отключив устройства, чтобы проверить, исчезнет ли проблема. Если сбои обычно возникают вскоре после загрузки ОС, или не происходят вообще, или не происходят в течение нескольких дней, это может указывать на проблему с электропитанием. При проблемах с электропитанием сбой часто происходит, когда потребность в энергии достигает пика, когда ОС запускает любые внешние устройства для использования.

Декодирование MCE

[ редактировать ]

Информацию о процессорах IA-32 и Intel 64 см. в Руководстве разработчика программного обеспечения для архитектур Intel 64 и IA-32. [ 6 ] Глава 15 (Архитектура машинной проверки) или статья базы знаний Microsoft об исключениях Windows. [ 7 ]

Программы для декодирования Intel и AMD MCE

[ редактировать ]
  • расдемон [ 8 ] — это инструмент журналирования RAS ( надежность, доступность и удобство обслуживания ) для Linux . Он записывает ошибки памяти, используя события трассировки EDAC. EDAC — это подсистема ядра Linux, которая обрабатывает обнаружение ошибок ECC от контроллеров памяти для большинства наборов микросхем на архитектурах i386 и x86_64. Также существуют драйверы EDAC для других архитектур, таких как Arm. Рекомендуется использовать rasdaemon для сбора информации MCE в системах Linux, поскольку mcelog устарел с 2017 года. [ 9 ] [ 10 ] [ 11 ] [ 12 ]
  • мцелог [ 13 ] — это демон Linux от Энди Клина для управления MCE для процессоров x86. mcelog также может декодировать машинные проверки. mcelog считается функционально устаревшим с 2017 года. [ 11 ] [ 12 ] Заменой mcelog для систем Linux является rasdaemon. [ 9 ] [ 10 ]
  • парсемце [ 14 ] — это программа для Linux, разработанная Дэйвом Джонсом, для декодирования MCE процессоров AMD K7 .
  • Макд [ 15 ] (mcedaemon) — это программа Linux от Тима Хокина, предназначенная для сбора MCE из ядра и оповещения заинтересованных приложений. Обратите внимание, что он не пытается интерпретировать данные MCE, а просто предупреждает другие программы.
  • mcat — это программа командной строки Windows от AMD для декодирования MCE процессоров AMD K8 , семейства 0x10 и 0x11 .

См. также

[ редактировать ]
  1. ^ «Глава 1. Знакомство с EREP» (PDF) . Программа редактирования и печати экологических записей (EREP) 3.5 — Руководство пользователя (PDF) . ИБМ . 30 сентября 2021. с. 1. ГЦ35-0151-50 . Проверено 20 февраля 2023 г.
  2. ^ Руководство системного программиста: z/OS System Logger (PDF) (второе изд.). ИБМ . Июль 2007 г. SG24-6898-01 . Проверено 20 февраля 2023 г. {{cite book}}: |work= игнорируется ( помогите )
  3. ^ «Проверка ошибок 0x124: WHEA_UNCORRECTABLE_ERROR» . Майкрософт. 03.11.2022 . Проверено 11 декабря 2022 г.
  4. ^ «Проверка ошибок 0x9C: MACHINE_CHECK_EXCEPTION» . Майкрософт. 14 декабря 2021 г. Проверено 11 декабря 2022 г.
  5. ^ «mcelog не работает с процессорами AMD семейства 16 и выше на SLES11 SP3» . СуСЕ. 27 сентября 2022 г. Проверено 11 декабря 2022 г.
  6. ^ «Архитектура машинной проверки» . Руководство разработчика программного обеспечения для архитектур Intel® 64 и IA-32, том 3B: Руководство по системному программированию, часть 2 . Корпорация Интел . Ноябрь 2018.
  7. ^ «Сообщение об ошибке в Windows XP, которое вы можете получить: «0x0000009C (0x00000004, 0x00000000, 0xb2000000, 0x00020151)» « . MSDN . 07.12.2015 . Проверено 13 июля 2017 г.
  8. ^ Мауро Карвалью Чехаб (mchehab) (20 февраля 2023 г.). «rasdaemon — это инструмент журналирования RAS (надежность, доступность и удобство обслуживания)» . github.com . Проверено 20 февраля 2023 г.
  9. ^ Jump up to: а б «Исключение машинной проверки» . wiki.archlinux.org . 08.05.2021 . Проверено 21 февраля 2023 г.
  10. ^ Jump up to: а б «ECC RAM» . wiki.gentoo.org . 30 декабря 2022 г. Проверено 21 февраля 2023 г.
  11. ^ Jump up to: а б «x86/mce: исключить драйвер /dev/mcelog и объявить его устаревшим» . git.kernel.org . 28 марта 2017 г. Проверено 21 февраля 2023 г.
  12. ^ Jump up to: а б «x86/mce: исключить драйвер /dev/mcelog и объявить его устаревшим» . github.com/torvalds/linux/ . 28 марта 2017 г. Проверено 21 февраля 2023 г.
  13. ^ «mcelog: Расширенная обработка аппаратных ошибок для Linux x86» . 20 апреля 2015 г. Проверено 13 июля 2017 г.
  14. ^ «parsemce: анализатор обработчика исключений машинной проверки Linux» . 22 июля 2003 г. Проверено 13 июля 2017 г.
  15. ^ mcedaemon на GitHub
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f262834c38cbdfa34763583200ca19ca__1720623660
URL1:https://arc.ask3.ru/arc/aa/f2/ca/f262834c38cbdfa34763583200ca19ca.html
Заголовок, (Title) документа по адресу, URL1:
Machine-check exception - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)