Jump to content

Анализ первопричин

В области науки и техники используемый анализ первопричин ( RCA ) — это метод решения проблем, для выявления коренных причин неисправностей или проблем. [1] Он широко используется в ИТ-операциях , производстве, телекоммуникациях , управлении производственными процессами , анализе аварий (например, в авиации , [2] железнодорожный транспорт , или атомные станции ), медицина (для медицинской диагностики ), отрасль здравоохранения (например, для эпидемиологии ) и т. д. Анализ первопричин — это форма индуктивного (сначала создайте теорию [корень] на основе эмпирических данных [причин]) и дедуктивный (проверка теории [основных причинных механизмов] на эмпирических данных) вывод.

RCA можно разбить на четыре этапа:

  • Четко определите и опишите проблему
  • Установите временной график от нормальной ситуации до возникновения проблемы.
  • Различать первопричину и другие причинные факторы (например, используя корреляцию событий ).
  • Установите причинно-следственную связь между основной причиной и проблемой.

RCA обычно служит входом в процесс исправления, в ходе которого предпринимаются корректирующие действия для предотвращения повторения проблемы. Имя этого процесса варьируется от одного домена приложения к другому. Согласно ISO/IEC 31010 , RCA может включать методы «Пять почему» , анализ видов и последствий отказов (FMEA), анализ дерева отказов , диаграмму Исикавы и анализ Парето .

Определения

[ редактировать ]

По сути, существует два способа устранения неисправностей и решения проблем в науке и технике.

Реактивное управление

[ редактировать ]

Реактивное управление заключается в быстром реагировании после возникновения проблемы путем устранения симптомов. Этот тип управления реализуется реактивными системами, [3] [4] самоадаптивные системы, [5] самоорганизующиеся системы и сложные адаптивные системы . Цель здесь — быстро отреагировать и как можно скорее смягчить последствия проблемы.

Проактивное управление

[ редактировать ]

Проактивное управление, наоборот, состоит в предотвращении возникновения проблем. Для этой цели можно использовать множество методов, начиная от передового опыта проектирования и заканчивая детальным анализом уже возникших проблем и принятием мер, чтобы они никогда не повторились. Здесь не так важна скорость, как точность и точность диагноза. Основное внимание уделяется устранению реальной причины проблемы, а не ее последствий.

Анализ первопричин часто используется в упреждающем управлении для выявления основной причины проблемы, то есть фактора, который был основной причиной. Обычно «коренную причину» называют в единственном числе, но один или несколько факторов могут составлять основную причину(ы) изучаемой проблемы.

Фактор считается «основной причиной» проблемы, если его устранение предотвращает повторение проблемы. И наоборот, «причинный фактор» — это способствующее действие, которое влияет на результат инцидента/события, но не является основной причиной. Хотя устранение причинного фактора может улучшить исход, оно не предотвращает его повторение с уверенностью.

Отличный способ взглянуть на картину проактивного/реактивного реагирования — рассмотреть модель оценки рисков с галстуком-бабочкой . В центре модели находится событие или несчастный случай. Слева показаны ожидаемые опасности и линия защиты, созданная для предотвращения возникновения событий из-за этих опасностей. Линия защиты — это нормативные требования, применимые процедуры, физические барьеры и кибербарьеры, которые существуют для управления операциями и предотвращения событий. Отличный способ использовать анализ первопричин — это заранее оценить эффективность этих средств защиты, сравнивая фактическую производительность с применимыми требованиями, выявляя пробелы в производительности, а затем устраняя их для усиления этой защиты. Если событие происходит, то мы находимся на правой стороне модели, на стороне реагирования, где упор делается на выявление коренных причин и смягчение ущерба.

Представьте себе расследование машины, которая остановилась из-за перегрузки и перегорания предохранителя. [6] Расследование показало, что машина была перегружена из-за недостаточной смазки подшипника. Расследование продолжается дальше и обнаруживает, что в механизме автоматической смазки был насос, который качал недостаточно, отсюда и отсутствие смазки. Исследование насоса показывает, что у него изношен вал. Исследование причин износа вала выявило отсутствие адекватного механизма, предотвращающего попадание металлического лома в насос. Это позволило металлу попасть в насос и повредить его.

Очевидная основная причина проблемы заключается в том, что металлический лом может загрязнить систему смазки. Решение этой проблемы должно предотвратить повторение всей последовательности событий. Настоящей основной причиной может быть проблема конструкции , если нет фильтра, предотвращающего попадание металлического лома в систему. Или, если у него есть фильтр, который был заблокирован из-за отсутствия планового осмотра, то настоящей основной причиной является проблема с обслуживанием.

Сравните это с расследованием, которое не выявило первопричину: замена предохранителя, подшипника или смазочного насоса, вероятно, позволит машине вернуться в работу на некоторое время. Однако существует риск, что проблема будет повторяться до тех пор, пока не будет устранена первопричина.

Вышеупомянутое не включает анализ затрат/выгод : превышает ли стоимость замены одной или нескольких машин стоимость простоя до замены предохранителя? Эту ситуацию иногда называют лекарством хуже болезни . [7] [8]

В качестве несвязанного примера выводов, которые можно сделать в отсутствие анализа затрат/выгод, рассмотрим компромисс между некоторыми заявленными выгодами от сокращения населения: в краткосрочной перспективе будет меньше плательщиков в пенсионные/пенсионные системы; тогда как прекращение роста населения потребует более высоких налогов, чтобы покрыть расходы на строительство большего количества школ. Это может помочь объяснить, почему лекарство хуже самой болезни. [9]

Затраты, которые следует учитывать, выходят за рамки финансов при рассмотрении персонала, обслуживающего оборудование. В конечном итоге цель состоит в том, чтобы предотвратить простои; но в большей степени предотвратить катастрофические травмы. Профилактика начинается с инициативы.

Общие принципы

[ редактировать ]
Пример метода анализа первопричин

Несмотря на разные подходы в разных школах анализа первопричин и специфику каждой области применения, RCA обычно следует одним и тем же четырем шагам:

  1. Идентификация и описание. Эффективные формулировки проблем и описания событий (например, сбоев) полезны и обычно необходимы для обеспечения выполнения соответствующего анализа первопричин. Постановка задачи — это Полярная звезда RCA, поскольку она позволяет команде сосредоточиться на том, что они исследуют, и не дает им сбиться с пути.
  2. Сбор, организация и анализ информации. Большинство RCA начинаются с сеанса по установлению фактов для сбора доступной информации, такой как показания свидетелей, хронология событий и применимые требования к изменениям, которые происходили во время события. Эта информация может использоваться для установления последовательности событий или временных рамок события, а также для определения линии защиты, которая должна была предотвратить событие (т. е. административные требования, а также физические и кибербарьеры). Также следует запрашивать и анализировать доступные базы данных (например, базы данных программ корректирующих действий и программ безопасности), а также инструменты анализа данных, такие как диаграммы Парето, карты процессов, деревья отказов и другие инструменты, которые дают нам представление о пробелах в производительности. Можно использовать любое количество инструментов анализа данных, включая инструменты анализа данных из Lean Six Sigma, инструменты статистического анализа и другие, такие как иерархическая кластеризация и решения для интеллектуального анализа данных (например, основанные на теории графов). интеллектуальный анализ данных). Другой заключается в сравнении расследуемой ситуации с прошлыми ситуациями, хранящимися в библиотеках дел, с использованием инструментов рассуждения на основе прецедентов и может включать анализ изменений, сравнительный анализ временных рамок и анализ задач.
  3. Анализ средств защиты: после определения имеющихся средств защиты, которые должны были предотвратить событие или несчастный случай, настоятельно рекомендуется провести анализ средств защиты (традиционно называемый анализом барьеров ) в каждом случае, включая расследования, не связанные с RCA. Один из методов — перечислить средства защиты на диаграмме или виртуальной доске. Затем для каждой защиты просмотрите информацию и данные, собранные для подтверждения эффективности этой защиты. На самом деле мы ищем недостатки или пробелы в работе там, где не были соблюдены административные требования или где были обойдены физические или кибербарьеры. Эти первоначальные пробелы в производительности являются всего лишь симптомами более глубоких причин. Мы используем эти симптоматические пробелы в производительности для разработки ряда вопросов, как описано ниже, чтобы проследить симптомы до их источника (т.е. коренных причин), используя причинно-следственный анализ.
  4. Создание целенаправленных, беспристрастных вопросов для запроса: после сбора доступной информации, ее организации в виде диаграмм с временными рамками и другими данными, после анализа имеющихся данных и проведения анализа нашей защиты мы используем эти идеи для создания хороших вопросов. Эти вопросы станут нашими направлениями для причинно-следственного анализа. Вопросы должны быть беспристрастными, и чтобы не допустить, чтобы какая-либо предвзятость со стороны команды RCA испортила расследование, вопросы должны быть привязаны к конкретной защите или к конкретному выводу, полученному в результате нашего анализа данных (например, диаграммы Парето , карты процессов , деревья ошибок , контрольные диаграммы ) и другие инструменты, которые дают нам представление о пробелах в производительности. Не должно быть никаких любопытных вопросов, вопросов, отражающих «предвзятость подтверждения» (т. е. задаваемых наводящих вопросов, чтобы ответить на то, что, по мнению команды RCA, являются причинами), или вопросов, носящих обвинительный характер, которые заставят тех, кто помогает расследованию, закрыть дело. вниз и уйти.
  5. Причинно-следственный анализ: как только мы разработаем надежный набор вопросов для запроса на основе собранных фактических данных, применимых требований и анализа доступных данных, мы можем передать эти вопросы профильным экспертам организации. С этого начинается процесс причинно-следственного анализа. Как только мы задаем вопрос затронутой организации, мы используем ее ответ, чтобы задать последующие сократические вопросы . Сократовские вопросы заставляют расследование переходить к следующим, более глубоким причинным факторам, пока у организации не закончатся ответы или пока последний причинный фактор не выйдет из-под контроля организации. Для проведения эффективного причинно-следственного анализа необходимо множество навыков, в том числе навыки фасилитации, коммуникативные навыки и сократовские вопросы. При правильном проведении это поможет RCA выявить самые глубокие коренные причины. Небольшое предостережение: Исикава или диаграмма «рыбья кость», а также методы «5 почему» недостаточно строги для проведения анализа первопричин. «Рыбная кость» появилась в 1940-х годах, а «5 почему» — в 1930-х, и существуют гораздо более продвинутые методы. Ищите методы, которые были разработаны в этом столетии (2000 год и позже), поскольку они с большей вероятностью объясняют новую динамику современной социотехнической рабочей среды.
  6. Составление диаграммы результатов RCA. Лучший способ отразить результаты расследования RCA — начать заполнять окончательную диаграмму с самого начала. Этот процесс стал намного проще с появлением виртуальных досок. На одной виртуальной доске мы можем отображать сроки, линии защиты, анализ данных, линии вопросов, причинно-следственный анализ, коренные причины и план корректирующих действий.
  7. Корректирующие действия для предотвращения повторения: с точки зрения управления усилия RCA не будут полными без комплексного плана корректирующих действий для устранения коренных причин, способствующих факторов и «масштаба причин». План корректирующих действий должен быть разработан владельцами проблем и не требует участия команды RCA, хотя эта группа является отличным источником рекомендаций для владельцев проблем. Анализ масштабов причин проводится для определения степени ущерба или воздействия, которое первопричины и способствующие факторы оказали на людей, оборудование или объекты. Проверки степени причин являются ахиллесовой пятой в подавляющем большинстве организаций и основной причиной того, что RCA и планы корректирующих действий не могут предотвратить повторение проблем. Кроме того, необходимо проявлять осторожность, чтобы избежать планов корректирующих действий, которые просто добавляют организации больше административных требований и дополнительного обучения. Чтобы избежать этого, используйте иерархию контроля рисков и бережливую защиту от ошибок. в качестве руководства по разработке эффективных корректирующих действий, которые с гораздо большей вероятностью предотвратят повторение.
  8. Обзоры эффективности. По истечении заранее определенного периода после реализации плана корректирующих действий планируется провести анализ эффективности для оценки результативности этих корректирующих действий . Для этого необходимо указать набор показателей или индикаторов, которые будут отслеживаться до и после реализации корректирующих действий, чтобы мы могли измерить их влияние. Если желаемые результаты не достигнуты, что в большинстве случаев означает значительное снижение масштабов или частоты событий или проблем, то RCA необходимо открыть заново, поскольку оно не было эффективным.

Чтобы быть эффективным, анализ первопричин должен проводиться систематически. Этот процесс дает возможность не упустить другие важные детали. Обычно требуются командные усилия, и в идеале все участвующие лица должны прийти к одному и тому же выводу. Например, при анализе авиационных происшествий выводы расследования и выявленные основные причины должны быть подкреплены документальными доказательствами. [10]

Переход к корректирующим действиям

[ редактировать ]

Целью RCA является выявление основной причины проблемы с намерением предотвратить ее повторение или ухудшение. Следующим шагом является инициирование долгосрочных корректирующих действий для устранения основной причины, выявленной в ходе RCA, и обеспечения того, чтобы проблема не возникла снова. Однако исправление проблемы формально не является частью RCA; это разные этапы процесса решения проблем, известного как управление отказами в ИТ и телекоммуникациях, ремонт в технике, восстановление в авиации, восстановление окружающей среды в экологии , терапия в медицине и т. д.

Домены приложений

[ редактировать ]

Анализ первопричин используется во многих областях приложений. RCA специально упоминается во многих разделах Кодекса федеральных правил США. Например:

  1. РАЗДЕЛ 10 – ЭНЕРГЕТИКА >>> 10CFR, Часть 50, Приложение B, Критерий XVI, «Корректирующие действия» (также принят NQA-1)
    • «Должны быть установлены меры, гарантирующие, что условия, неблагоприятные для качества, такие как отказы, неисправности, недостатки, дефектные материалы и оборудование, а также несоответствия, быстро выявляются и исправляются.
    • В случае возникновения существенных условий, неблагоприятных для качества, меры должны гарантировать, что причина состояния установлена, и предприняты корректирующие действия для предотвращения повторения».
  2. РАЗДЕЛ 14 – АЭРОНАВТИКА И КОСМОСА >>> 14 CFR, глава III, подраздел C, часть 437, подраздел C, §437.73 Регистрация аномалий, отчетность и выполнение корректирующих действий.
    1. Лицо, получившее разрешение, должно регистрировать каждую аномалию, которая влияет на критически важную для безопасности систему, подсистему, процесс, объект или вспомогательное оборудование.
    2. Лицо, получившее разрешение, должно выявить все коренные причины каждой аномалии и реализовать все корректирующие действия для каждой аномалии.
  3. РАЗДЕЛ 21 – ПИТАНИЕ И ЛЕКАРСТВА >>> 21 CFR, подраздел J: 21CFR820.100(a) – Корректирующие/предупреждающие действия: (A) Каждый производитель должен установить и поддерживать процедуры осуществления корректирующих и предупреждающих действий. Процедуры должны включать требования к:
    1. Исследование причин несоответствий, касающихся продукции, процессов и системы качества;
    2. Определение действий, необходимых для исправления и предотвращения повторения несоответствующей продукции и других проблем с качеством;
    3. Проверка или подтверждение корректирующих и предупреждающих действий, чтобы гарантировать, что такие действия эффективны и не оказывают негативного влияния на готовое устройство;
  4. РАЗДЕЛ 42 — ОБЩЕСТВЕННОЕ ЗДРАВООХРАНЕНИЕ >>> 42 CFR, ЧАСТЬ 488, ОБСЛЕДОВАНИЕ, СЕРТИФИКАЦИЯ И ПРОЦЕДУРЫ ИСПОЛНЕНИЯ > Подраздел E — Осмотр и сертификация учреждений длительного ухода
    1. §488.61 Особые процедуры утверждения и повторного утверждения программ трансплантации органов.
    2. ...Анализ первопричин смертности пациентов и неудач трансплантатов, включая факторы, которые программа определила как вероятные причинные или способствующие факторы смерти пациентов и неудач трансплантатов;

Управление производством и производственными процессами

[ редактировать ]

Приведенный выше пример иллюстрирует, как RCA можно использовать в производстве . RCA также обычно используется для контроля промышленных процессов , например, для контроля производства химикатов ( контроль качества ).

RCA также используется для анализа отказов при проектировании и техническом обслуживании .

ИТ и телекоммуникации

[ редактировать ]

Анализ первопричин часто используется в ИТ и телекоммуникациях для выявления коренных причин серьезных проблем. Например, в структуре управления услугами ITIL целью управления инцидентами является как можно скорее возобновить работу неисправной ИТ-службы (реактивное управление), тогда как управление проблемами направлено на окончательное решение повторяющихся проблем путем устранения их коренных причин (проактивное управление). .

Другим примером является процесс управления инцидентами компьютерной безопасности , где анализ первопричин часто используется для расследования нарушений безопасности. [11]

RCA также используется в сочетании с мониторингом деловой активности и комплексной обработкой событий для анализа сбоев в бизнес-процессах .

Его использование в ИТ-индустрии не всегда можно сравнивать с его использованием в отраслях, критически важных для безопасности, поскольку обычно использование RCA в ИТ-индустрии не поддерживается ранее существовавшими деревьями отказов или другими спецификациями проектирования. Вместо этого анализ обычно поддерживается сочетанием систем отладки, обнаружения на основе событий и мониторинга (где службы моделируются индивидуально). Инструментов обучения и поддержки, таких как моделирование или различные подробные инструкции для всех ожидаемых сценариев, не существует, вместо этого они создаются постфактум на основе проблем, которые считаются «достойными».В результате анализ часто ограничивается теми вещами, которые имеют интерфейсы мониторинга/наблюдения, а не фактической запланированной/видимой функцией с упором на проверку входных и выходных данных. Следовательно, поговорка «нет первопричины» стала распространенной в ИТ-индустрии.

Здоровье и безопасность

[ редактировать ]

В сферах здоровья и безопасности RCA обычно используется в медицине (диагностика) и эпидемиологии (например, для определения источника инфекционного заболевания), где методы причинного вывода часто требуют как клинических, так и статистических знаний, чтобы понять сложности процессы. [12]

RCA используется в науках об окружающей среде (например, для анализа экологических катастроф), анализе аварий (авиационная и железнодорожная промышленность), а также в области безопасности и гигиены труда . [13] При производстве медицинских изделий, [14] фармацевтика, [15] еда, [16] и пищевые добавки, [17] Анализ первопричин является нормативным требованием.

Системный анализ

[ редактировать ]

RCA также используется в управлении изменениями , управлении рисками и системном анализе .

Проблемы

[ редактировать ]

Не вдаваясь в особенности конкретных проблем, несколько общих условий могут сделать RCA более сложным, чем может показаться на первый взгляд.

Во-первых, важная информация часто отсутствует, поскольку на практике, как правило, невозможно отслеживать все и хранить все данные мониторинга в течение длительного времени.

Во-вторых, сбор данных и доказательств и их классификация по временной шкале событий до конечной проблемы может быть нетривиальной задачей. Например, в телекоммуникациях распределенные системы мониторинга обычно обрабатывают от миллиона до миллиарда событий в день. Найти несколько важных событий в такой массе несущественных событий – это все равно, что найти пресловутую иголку в стоге сена .

В-третьих, у данной проблемы может быть более одной основной причины, и эта множественность может сильно затруднить установление причинно-следственной связи.

В-четвертых, причинные графики часто имеют много уровней, и анализ первопричин заканчивается на уровне, который является «коренным» для исследователя. Если еще раз взглянуть на приведенный выше пример управления производственными процессами, более глубокое исследование может показать, что процедуры технического обслуживания на заводе включали периодическую проверку подсистемы смазки каждые два года, в то время как продукт текущего поставщика подсистемы смазки предусматривал 6-месячный период. Смена поставщика могла произойти из-за желания руководства сэкономить деньги и неспособности проконсультироваться с инженерным персоналом о последствиях изменения процедур технического обслуживания. Таким образом, хотя показанная выше «основная причина» могла предотвратить указанное повторение, она не предотвратила бы другие – возможно, более серьезные – сбои, затрагивающие другие машины.

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ См. Wilson, Dell & Anderson 1993 , стр. 8–17.
  2. ^ См. IATA 2016 и Sofema 2017 .
  3. ^ См. Манна и Пнуэли, 1995 .
  4. ^ См. Леверенц и Линднер, 1995 .
  5. ^ См. Бабаоглу и др. 2005 .
  6. ^ См. Оно 1988 .
  7. ^ «Лекарство хуже болезни» . Нью-Йорк Таймс . 5 ноября 1927 г.
  8. ^ Эндрю К. Ревкин (7 декабря 2000 г.). «Углубление печатных плат River может стать лекарством, даже хуже, чем сама болезнь, - настаивает GE» . Нью-Йорк Таймс .
  9. ^ Филип Лонгман (9 июня 2004 г.). «Глобальный детский кризис» . Нью-Йорк Таймс .
  10. ^ См. ИАТА 2016 .
  11. ^ См. Абубакар и др. 2016 год
  12. ^ Ландситтель, Дуглас; Шривастава, Авантика; Кропф, Кристин (2020). «Повествовательный обзор методов причинного вывода и связанных с ним образовательных ресурсов» . Управление качеством в здравоохранении . 29 (4): 260–269. дои : 10.1097/QMH.0000000000000276 . ISSN   1063-8628 . ПМИД   32991545 . S2CID   222146291 .
  13. ^ См. OSHA 2019 .
  14. ^ Управление по нормативному регулированию (26 декабря 2019 г.). «Корректирующие и предупреждающие действия (CAPA)» . FDA .
  15. ^ США-FDA. «СОВРЕМЕННАЯ НАДЛЕЖАЩАЯ ПРАКТИКА ПРОИЗВОДСТВА ГОТОВЫХ ФАРМАЦЕВТИЧЕСКИХ СРЕДСТВ» . Электронный свод федеральных правил (eCFR) . Проверено 28 декабря 2020 г.
  16. ^ США-FDA. «СОВРЕМЕННАЯ НАДЛЕЖАЩАЯ ПРОИЗВОДСТВЕННАЯ ПРАКТИКА, АНАЛИЗ ОПАСНОСТЕЙ И ПРЕВЕНТИВНЫЙ КОНТРОЛЬ НА ОСНОВЕ РИСКА ДЛЯ ПИЩЕВЫХ ПИЩЕВ ЧЕЛОВЕКА» . Электронный свод федеральных правил (eCFR) . Проверено 28 декабря 2020 г.
  17. ^ США-FDA. «ТЕКУЩАЯ НАДЛЕЖАЩАЯ ПРОИЗВОДСТВЕННАЯ ПРАКТИКА ПРОИЗВОДСТВА, УПАКОВКИ, МАРКИРОВКИ ИЛИ ХРАНЕНИЯ ПИЩЕВЫХ ДОБАВОК» . Электронный свод федеральных правил (eCFR) . Проверено 28 декабря 2020 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 0ea88714629d1af8475a6e2f3b43e7cd__1721014680
URL1:https://arc.ask3.ru/arc/aa/0e/cd/0ea88714629d1af8475a6e2f3b43e7cd.html
Заголовок, (Title) документа по адресу, URL1:
Root cause analysis - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)