Причинно-следственный анализ
Причинный анализ - это область планирования эксперимента и статистики, относящаяся к установлению причины и следствия. [1] Обычно он включает в себя установление четырех элементов: корреляции , последовательности во времени (т. е. причины должны возникать до предполагаемого следствия), правдоподобного физического или теоретико-информационного механизма, позволяющего наблюдаемому эффекту следовать из возможной причины, и устранение возможности общего явления. и альтернативные («особые») причины . Такой анализ обычно включает один или несколько искусственных или естественных экспериментов. [2]
Мотивация [ править ]
Анализ данных в первую очередь касается причинно-следственных вопросов. [3] [4] [5] [6] [7] Например, способствовали ли удобрения росту урожая? [8] Или можно ли предотвратить данную болезнь? [9] Или почему мой друг в депрессии? [10] Методы потенциального результата и регрессионного анализа обрабатывают такие запросы, когда данные собираются с помощью запланированных экспериментов. Данные, собранные в ходе обсервационных исследований, требуют различных методов причинно-следственной связи (например, из-за таких проблем, как смешивание ). [11] Методы причинно-следственной связи, используемые с экспериментальными данными, требуют дополнительных предположений для получения разумных выводов на основе данных наблюдений. [12] Трудность причинного вывода в таких обстоятельствах часто резюмируется следующим образом: « корреляция не подразумевает причинно-следственную связь ».
В философии и физике [ править ]
Природа причинности систематически исследуется в ряде академических дисциплин , включая философию и физику .
В научных кругах существует значительное количество теорий причинности; Оксфордский справочник по причинно-следственной связи ( Биби, Хичкок и Мензис, 2009 ) насчитывает 770 страниц. Среди наиболее влиятельных теорий в философии – » Аристотеля « Четыре причины и Аль- Газали окказионализм . [13] Дэвид Юм утверждал, что убеждения о причинности основаны на опыте, а опыт аналогичным образом основан на предположении, что будущее моделирует прошлое, что, в свою очередь, может быть основано только на опыте, что приводит к циклической логике . В заключение он утверждал, что причинность не основана на действительных рассуждениях : действительно можно воспринимать только корреляцию. [14] Иммануил Кант , согласно Биби, Хичкоку и Мензису (2009) , считал, что «принцип причинности, согласно которому каждое событие имеет причину или следует в соответствии с причинным законом, не может быть установлен посредством индукции как чисто эмпирическое утверждение, поскольку он тогда отсутствовала бы строгая универсальность или необходимость».
Вне области философии теории причинности можно найти в классической механике , статистической механике , квантовой механике , теориях пространства-времени , биологии , социальных науках и праве . [13] Чтобы установить причинную корреляцию в физике , обычно понимают, что причина и следствие должны быть связаны посредством локального механизма (ср., например, понятие удара ) или нелокального механизма (ср. понятие поля ), в соответствии с с известными законами природы .
С точки зрения термодинамики , универсальные свойства причин по сравнению со следствиями были идентифицированы посредством Второго закона термодинамики , подтверждающего древние, средневековые и картезианские теории. [15] считают, что «причина больше, чем следствие» для частного случая термодинамической свободной энергии . Это, в свою очередь, бросает вызов [ сомнительно – обсудить ] популярными интерпретациями концепций нелинейных систем и эффекта бабочки , при котором малые события вызывают большие эффекты вследствие, соответственно, непредсказуемости и маловероятного срабатывания больших количеств потенциальной энергии .
истолкованная из контрфактических состояний , Причинность
Интуитивно кажется, что причинно-следственная связь требует не просто корреляции, но и контрфактической зависимости. Предположим, что студент плохо сдал тест и предполагает, что причина в том, что он не учится. Чтобы доказать это, можно подумать об обратном: тот же студент пишет тот же тест при тех же обстоятельствах, но учился накануне вечером. Если бы можно было перемотать историю назад и изменить лишь одну мелочь (заставить студента готовиться к экзамену), то можно было бы наблюдать причинно-следственную связь (сравнивая версию 1 с версией 2). Поскольку невозможно перемотать историю и воспроизвести события после внесения небольших контролируемых изменений, причинно-следственную связь можно только предположить, но никогда точно не узнать. Это называется фундаментальной проблемой причинного вывода: невозможно непосредственно наблюдать причинные эффекты. [16]
Основная цель научных экспериментов и статистических методов — максимально приблизить к контрфактическому состоянию мира. [17] Например, можно было бы провести эксперимент на однояйцевых близнецах , которые, как известно, постоянно получали одинаковые оценки на тестах. Одного близнеца отправляют учиться на шесть часов, а другого отправляют в парк развлечений. Если бы их результаты тестов внезапно сильно разошлись, это было бы убедительным доказательством того, что учеба (или посещение парка развлечений) оказала причинное влияние на результаты тестов. В этом случае корреляция между результатами учебы и экзаменами почти наверняка будет подразумевать причинно-следственную связь.
Хорошо спланированные экспериментальные исследования заменяют равенство индивидов, как в предыдущем примере, равенством групп. Цель состоит в том, чтобы создать две группы, похожие друг на друга, за исключением обращения, которое эти группы получают. Это достигается путем выбора субъектов из одной популяции и случайного распределения их в две или более группы. Вероятность того, что группы будут вести себя одинаково друг с другом (в среднем), возрастает с увеличением количества субъектов в каждой группе. Если группы по существу эквивалентны, за исключением лечения, которое они получают, и наблюдаются различия в результатах для групп, то это является свидетельством того, что лечение ответственно за результат, или, другими словами, лечение вызывает наблюдаемый эффект. Однако наблюдаемый эффект может быть вызван и «случайно», например, в результате случайных возмущений в популяции. Существуют статистические тесты для количественной оценки вероятности ошибочного заключения о существовании наблюдаемой разницы, хотя на самом деле ее нет (например, см. P-значение ).
причинности Оперативные определения
Клайв Грейнджер создал первое рабочее определение причинности в 1969 году. [18] Грейнджер применил определение вероятностной причинности, предложенное Норбертом Винером , на практике как сравнение дисперсий. [19]
Проверка «истиной» [ править ]
Питер Спиртес , Кларк Глимур и Ричард Шайнс выдвинули идею о том, чтобы явно не давать определения причинности. [ нужны разъяснения ] . [3] Спиртес и Глимур представили компьютерный алгоритм для обнаружения причинно-следственных связей в 1990 году. [20] Многие современные алгоритмы обнаружения причинно-следственных связей следуют подходу Спиртеса-Глимура к проверке. [21]
Исследовательский [ править ]
Исследовательский причинно-следственный анализ, также известный как «причинность данных» или «причинное открытие». [3] Это использование статистических алгоритмов для вывода ассоциаций в наблюдаемых наборах данных, которые потенциально являются причинно-следственными при строгих предположениях. ECA — это тип причинного вывода, отличный от причинного моделирования и эффектов лечения в рандомизированных контролируемых исследованиях . [4] Это исследовательское исследование, обычно предшествующее более формальному причинно-следственному исследованию , точно так же, как исследовательский анализ данных часто предшествует проверке статистических гипотез при анализе данных . [22] [23]
См. также [ править ]
Внешние ссылки [ править ]
- Инструменты и данные команды Causality Workbench
- Инструменты команды CCD Питтсбургского университета
Ссылки [ править ]
- ^ Ролфинг, Инго; Шнайдер, Карстен К. (2018). «Объединяющая структура причинного анализа в теоретико-множественных многометодных исследованиях» (PDF) . Социологические методы и исследования . 47 (1): 37–63. дои : 10.1177/0049124115626170 . S2CID 124804330 . Проверено 29 февраля 2020 г.
- ^ Брэди, Генри Э. (7 июля 2011 г.). «Причинность и объяснение в социальных науках» . Оксфордский справочник по политологии . doi : 10.1093/oxfordhb/9780199604456.013.0049 . Проверено 29 февраля 2020 г.
- ^ Jump up to: Перейти обратно: а б с Спиртес, П.; Глимур, К.; Шайнс, Р. (2012). Причинно-следственная связь, предсказание и поиск . Springer Science & Business Media. ISBN 978-1461227489 .
- ^ Jump up to: Перейти обратно: а б Розенбаум, Пол (2017). Наблюдение и эксперимент: введение в причинный вывод . Издательство Гарвардского университета. ISBN 9780674975576 .
- ^ Перл, Иудея; Маккензи, Дана (2018). Книга «Почему : Новая наука о причине и следствии» . Основные книги. ISBN 978-0465097616 .
- ^ Кляйнберг, Саманта (2015). Почему: Руководство по поиску и использованию причин . O'Reilly Media, Inc. ISBN 978-1491952191 .
- ^ Иллари, П.; Руссо, Ф. (2014). Причинность: философская теория встречается с научной практикой . ОУП Оксфорд. ISBN 978-0191639685 .
- ^ Фишер, Р. (1937). План экспериментов . Оливер и Бойд.
- ^ Хилл, Б. (1955). Принципы медицинской статистики . Ланцет Лимитед.
- ^ Халперн, Дж. (2016). Фактическая причинно-следственная связь . МТИ Пресс. ISBN 978-0262035026 .
- ^ Перл, Дж.; Глимур, М.; Джуэлл, НП (2016). Причинно-следственный вывод в статистике: учебник для начинающих . Джон Уайли и сыновья. ISBN 978-1119186847 .
- ^ Стоун, Р. (1993). «Предположения, на которых основываются причинные выводы». Журнал Королевского статистического общества. Серия Б (Методическая) . 55 (2): 455–466. дои : 10.1111/j.2517-6161.1993.tb01915.x .
- ^ Jump up to: Перейти обратно: а б Биби, Хичкок и Мензис, 2009 г.
- ^ Моррис, Уильям Эдвард (2001). «Дэвид Хьюм» . Стэнфордская энциклопедия философии .
- ^ Ллойд, AC (1976). «Принцип, согласно которому причина больше, чем ее следствие». Фронезис . 21 (2): 146–156. дои : 10.1163/156852876x00101 . JSTOR 4181986 .
- ^ Холланд, Пол В. (1986). «Статистика и причинно-следственный вывод». Журнал Американской статистической ассоциации . 81 (396): 945–960. дои : 10.1080/01621459.1986.10478354 . S2CID 14377504 .
- ^ Перл, Иудея (2000). Причинность: модели, рассуждения и выводы . Издательство Кембриджского университета. ISBN 9780521773621 .
- ^ Грейнджер, CWJ (1969). «Исследование причинно-следственных связей с помощью эконометрических моделей и кросс-спектральных методов». Эконометрика . 37 (3): 424–438. дои : 10.2307/1912791 . JSTOR 1912791 .
- ^ Грейнджер, Клайв. «Лекция о премии. NobelPrize.org. Nobel Media AB 2018» .
- ^ Спиртес, П.; Глимур, К. (1991). «Алгоритм быстрого восстановления разреженных причинных графов». Компьютерный обзор социальных наук . 9 (1): 62–72. дои : 10.1177/089443939100900106 . S2CID 38398322 .
- ^ Го, Жочэн; Ченг, Лу; Ли, Цзюньдун; Хан, П. Ричард; Лю, Хуан (2020). «Обзор изучения причинно-следственной связи с данными». Обзоры вычислительной техники ACM . 53 (4): 1–37. arXiv : 1809.09337 . дои : 10.1145/3397269 . S2CID 52822969 .
- ^ Маккракен, Джеймс (2016). Исследовательский причинный анализ с данными временных рядов (обобщающие лекции по интеллектуальному анализу данных и обнаружению знаний) . Издательство Морган и Клейпул. ISBN 978-1627059343 .
- ^ Тьюки, Джон В. (1977). Исследовательский анализ данных . Пирсон. ISBN 978-0201076165 .
Библиография [ править ]
- Биби, Хелен; Хичкок, Кристофер; Мензис, Питер (2009). Оксфордский справочник причинно-следственной связи . Издательство Оксфордского университета. ISBN 978-0-19-162946-4 .