Исследовательский причинный анализ
![]() | Эта статья может быть слишком технической для большинства читателей, чтобы понять . ( Февраль 2019 ) |
Причинный анализ - это область экспериментального дизайна и статистического анализа, относящегося к установлению причины и следствия. [ 1 ] [ 2 ] Исследовательский причинный анализ ( ECA ), также известный как причинно -следственная связь или причинно -следственная связь [ 3 ] Является ли использование статистических алгоритмов для вывода ассоциаций в наблюдаемых наборах данных, которые потенциально причины при строгих предположениях. ECA - это тип причинного вывода, отличный от причинного моделирования и эффектов лечения в рандомизированных контролируемых исследованиях . [ 4 ] Это исследовательские исследования, как правило, предшествуют более формальным причинно -следственным исследованиям таким же образом, как анализ исследовательских данных часто предшествует статистическому тестированию гипотез в анализе данных [ 5 ] [ 6 ]
Мотивация
[ редактировать ]Анализ данных в первую очередь связан с причинными вопросами. [ 3 ] [ 4 ] [ 7 ] [ 8 ] [ 9 ] Например, привели ли удобрение, вызвало выращивание культур? [ 10 ] Или можно предотвратить данную болезнь? [ 11 ] Или, почему мой друг подавлен? [ 12 ] Потенциальные результаты и методы регрессионного анализа обрабатывают такие запросы, когда данные собираются с использованием разработанных экспериментов. Данные, собранные в обсервационных исследованиях, требуют различных методов причинно -следственного вывода (потому что, например, такие вопросы, как смешание ). [ 13 ] Методы причинного вывода, используемые с экспериментальными данными, требуют дополнительных допущений для получения разумных выводов с данными наблюдения. [ 14 ] Сложность причинно -следственного вывода в таких обстоятельствах часто суммируется как « корреляция не подразумевает причинно -следственную связь ».
Обзор
[ редактировать ]ECA постулирует, что существуют процедуры анализа данных, выполняемые на конкретных подмножествах переменных в более крупном наборе, выходы которых могут указывать на причинность между этими переменными. [ 3 ] Например, если мы предполагаем, что наблюдается каждая соответствующая ковариата в данных, то причинно -следственную связь . для поиска причинного эффекта между двумя наблюдательными переменными можно использовать [ 4 ] Причинность Granger также может быть использована для поиска причинности между двумя наблюдательными переменными при разных, но одинаково строгих предположениях. [ 15 ]
Два широких подхода к разработке таких процедур используют оперативные определения причинности [ 5 ] или проверка «Истиной» (то есть явно игнорируя проблему определения причинности и показания, что данное алгоритм подразумевает причинно -следственную связь в сценариях, когда известно, что причинно -следственные связи, например, с использованием синтетических данных [ 3 ] ).
Оперативные определения причинности
[ редактировать ]Клайв Грейнджер создал первое оперативное определение причинности в 1969 году. [ 16 ] Грейнджер сделал определение вероятностной причинности, предложенной Норбертом Винером , в качестве сравнения дисперсий. [ 17 ]
Некоторые авторы предпочитают использовать методы ECA, разработанные с использованием оперативных определений причинности, потому что они считают, что это может помочь в поиске причинно -следственных механизмов. [ 5 ] [ 18 ]
Проверка "правдой"
[ редактировать ]Питер Спиртс , Кларк Глимур и Ричард Шейнс представили идею явно не предоставлять определение причинности. [ 3 ] Spirtes и Glymour представили алгоритм ПК для причинно -следственного обнаружения в 1990 году. [ 19 ] Многие недавние алгоритмы причинно-следственных связей следуют за подходом Spirtes-Glymour к проверке. [ 20 ]
Методы
[ редактировать ]Есть много опросов причинных методов обнаружения. [ 3 ] [ 5 ] [ 20 ] [ 21 ] [ 22 ] [ 23 ] В этом разделе перечислены известные методы.
Двумерный (или "пары")
[ редактировать ]- Причинность Грейнджера (есть также вход Scholaredia [1] )
- переносить энтропию
- Конвергентное перекрестное картирование
Многомерный
[ редактировать ]- причинно -следственная энтропия [ 24 ]
- Алгоритм ПК [ 3 ] [ 25 ]
- Алгоритм FCI [ 3 ] [ 26 ]
- Лингам [ 27 ] [2]
Многие из этих методов обсуждаются в учебных пособиях, предоставленных Центром причинно -следственного обнаружения (CCD) [3] .
Примеры использования
[ редактировать ]Социальная наука
[ редактировать ]Алгоритм ПК был применен к нескольким различным наборам данных социальных наук. [ 3 ]
Лекарство
[ редактировать ]Алгоритм ПК был применен к медицинским данным. [ 28 ] Причинность Грейнджер была применена к данным FMRI . [ 29 ] ПЗС проверил их инструменты с использованием биомедицинских данных [4] .
Физика
[ редактировать ]ECA используется в физике для понимания физических причинно-следственных механизмов системы, например, в геофизике с использованием алгоритма St-Stable (вариант исходного алгоритма ПК) [ 30 ] и в динамических системах с использованием парного асимметричного вывода (вариант конвергентного перекрестного отображения). [ 31 ]
Критика
[ редактировать ]Существуют дискуссии о том, фактически являются ли взаимосвязь между данными, найденными с использованием причинно -следственной связи. [ 3 ] [ 25 ] Judea Pearl подчеркнула, что причинно -следственный вывод требует причинно -следственной связи, разработанной «интеллектом», посредством итеративного процесса тестирования допущений и подходящих данных. [ 7 ]
Ответ на критику указывает на то, что предположения, используемые для разработки методов ECA, могут не содержаться для данного набора данных [ 3 ] [ 14 ] [ 32 ] [ 33 ] [ 34 ] и что любые причинно -следственные связи, обнаруженные во время ЭКА, зависят от этих предположений, которые держатся на уровне [ 25 ] [ 35 ]
Программные пакеты
[ редактировать ]Комплексные наборы инструментов
[ редактировать ]- Tetrad -это программа Java на основе графического интерфейса с открытым исходным интерфейсом, которая предоставляет коллекцию алгоритмов причинно-следственной связи. [ 36 ] Библиотека алгоритмов, используемая Tetrad, также доступна в качестве инструмента командной строки , Python API и R -оболочки. [ 37 ]
- Информация Java Dynamics Toolkit (JIDT) -это библиотека Java с открытым исходным кодом для выполнения теоретико-причинно-следственного обнаружения информации (то есть, энтропия передачи, энтропия условной передачи и т. Д.) [5] . Примеры использования библиотеки в Matlab , GNU Octave , Python , R , Julia и Clojure представлены в документации [6] .
- PCALG -это R- пакет, который предоставляет некоторые из тех же алгоритмов причинно-следственных связей, предоставленных в тетраде [7] архивировании 2017-07-20 на машине Wayback .
Конкретные методы
[ редактировать ]Грейнджер причинность
[ редактировать ]Конвергентное перекрестное картирование
[ редактировать ]- R пакет [10] Архивированный 2019-09-25 на The Wayback Machine
Лингам
[ редактировать ]- Matlab / GNU Octave Package [11]
Существует также набор инструментов и данных, которые хранятся в команде Cuessality Workbench [12] и командой CCD [13] .
Ссылки
[ редактировать ]- ^ Rohlfing, Ingo; Schneider, Carsten Q. (2018). «Объединенная структура для причинно-следственного анализа в исследовании сет-теоретикового мультиметода» (PDF) . Социологические методы и исследования . 47 (1): 37–63. doi : 10.1177/0049124115626170 . S2CID 124804330 . Архивировано из оригинала (PDF) 9 октября 2022 года . Получено 29 февраля 2020 года .
- ^ Брэди, Генри Э. (7 июля 2011 г.). «Причинность и объяснение в социальной науке» . Оксфордский справочник политологии . doi : 10.1093/oxfordhb/9780199604456.013.0049 . Получено 29 февраля 2020 года .
- ^ Jump up to: а беременный в дюймовый и фон глин час я Дж k Spipmes, p .; Гламур, C.; Кажется, Р. (2012). Крутника, прогноз и поиск . Springer Science & Business Media. ISBN 978-1461227489 .
- ^ Jump up to: а беременный в Розенбаум, Пол (2017). Наблюдение и эксперимент: введение в причинный вывод . Гарвардский университет издательство. ISBN 9780674975576 .
- ^ Jump up to: а беременный в дюймовый МакКракен, Джеймс (2016). Исследовательский причинный анализ с данными временных рядов (лекции синтеза о сборе данных и обнаружении знаний) . Morgan & Claypool Publishers. ISBN 978-1627059343 .
- ^ Тьюки, Джон У. (1977). Исследовательский анализ данных . Пирсон. ISBN 978-0201076165 .
- ^ Jump up to: а беременный Перл, Иудея (2018). Книга почему: новая наука о причине и следствии . Основные книги. ISBN 978-0465097616 .
- ^ Кляйнберг, Саманта (2015). Почему: Руководство по поиску и использованию причин . O'Reilly Media, Inc. ISBN 978-1491952191 .
- ^ Иллари, П.; Руссо Ф. (2014). Причинность: философская теория соответствует научной практике . УП Оксфорд. ISBN 978-0191639685 .
- ^ Фишер Р. (1937). Дизайн экспериментов . Оливер и Бойд.
- ^ Хилл, Б. (1955). Принципы медицинской статистики . Lancet Limited.
- ^ Halpern, J. (2016). Фактическая причинность . MIT Press. ISBN 978-0262035026 .
- ^ Перл, Дж.; Glymour, M.; Jewell, NP (2016). Причинный вывод в статистике: праймер . Джон Уайли и сыновья. ISBN 978-1119186847 .
- ^ Jump up to: а беременный Стоун, Р. (1993). «Предположения, на которых лежат причинные выводы». Журнал Королевского статистического общества. Серия B (методологический) . 55 (2): 455–466. doi : 10.1111/j.2517-6161.1993.tb01915.x .
- ^ Грейнджер, С. (1980). «Тестирование на причинность: личная точка зрения». Журнал экономической динамики и контроля . 2 : 329–352. doi : 10.1016/0165-1889 (80) 90069-X .
- ^ Грейнджер, CWJ (1969). «Исследование причинно-следственных связей с помощью эконометрических моделей и кросс-спектральных методов». Econcemetrica . 37 (3): 424–438. doi : 10.2307/1912791 . JSTOR 1912791 .
- ^ Грейнджер, Клайв. «Призовая лекция. Nobelprize.org. Nobel Media AB 2018» .
- ^ Вудворд, Джеймс (2004). Создание вещей: теория причинно -следственного объяснения (Оксфордские исследования в области философии науки) . Издательство Оксфордского университета. ISBN 978-1435619999 .
- ^ Spirtes, P.; Glymour, C. (1991). «Алгоритм быстрого восстановления редких причинно -следственных связей». Social Science Computer Review . 9 (1): 62–72. doi : 10.1177/089443939100900106 . S2CID 38398322 .
- ^ Jump up to: а беременный Го, Руохенг; Ченг, Лу; Ли, Джундонг; Хан, П. Ричард; Лю, Хуан (2020). «Обзор причинности обучения с данными». ACM вычислительные исследования . 53 (4): 1–37. Arxiv : 1809.09337 . doi : 10.1145/3397269 . S2CID 52822969 .
- ^ Малинский, Даниэль; Дэнкс, Дэвид (2018). «Алгоритмы причинного открытия: практическое руководство» . Философия компас . 13 (1): E12470. doi : 10.1111/phc3.12470 .
- ^ Spirtes, P.; Чжан, К. (2016). «Причинное открытие и вывод: концепции и недавние методологические достижения» . Appl Inform (Berl) . 3 : 3. DOI : 10.1186/S40535-016-0018-X . PMC 4841209 . PMID 27195202 .
- ^ Ю, Куй; Ли, Джиуён; Лю, Лин; Ричард Хан, П.; Лю, Хуан (2016). «Обзор алгоритмов причинного обнаружения на основе ограничений». Arxiv : 1611.03977 [ Cs.ai ].
- ^ Солнце, Цзе; Боллт, Эрик М.; Ли, Джундонг; Ричард Хан, П.; Лю, Хуан (2014). «Причина энтропии идентифицирует косвенные влияния, доминирование соседей и упреждающие муфты». Physica D: нелинейные явления . 267 : 49–57. Arxiv : 1504.03769 . Bibcode : 2014Phyd..267 ... 49 с . doi : 10.1016/j.physd.2013.07.001 . S2CID 14422483 .
- ^ Jump up to: а беременный в Фридман, Дэвид; Хамфрис, Пол (1999). «Существуют ли алгоритмы, которые обнаруживают причинную структуру?». Синтез . 121 (1–2): 29–54. doi : 10.1023/a: 1005277613752 . S2CID 6826436 .
- ^ Рагху, Вк; Рэмси, JD; Моррис, А.; Манатакис, DV; Спрайты, P.; Chrysanthis, pk; Glymour, C.; Бенос, П.В. (2018). «Сравнение стратегий для масштабируемого причинно -следственного обнаружения моделей скрытых переменных из смешанных данных» . Международный журнал по науке о данных и аналитике . 6 (33): 33–45. doi : 10.1007/s41060-018-0104-3 . PMC 6096780 . PMID 30148202 .
- ^ Shimizu, S (2014). «Лингам: негауссовые методы оценки причинно-следственных связей». Behaviormetrika . 41 (1): 65–98. doi : 10.2333/bhmk.41.65 . S2CID 49238101 .
- ^ Щека, C.; Zheng, H.; Hallstrom, Br; Хьюз, Re (2018). «Применение алгоритма причинного обнаружения к анализу данных реестра артропластики» . Биомедицинская инженерия и вычислительная биология . 9 : 117959721875689. DOI : 10.1177/1179597218756896 . PMC 5826097 . PMID 29511363 .
- ^ Вэнь, х.; Рангараджан, Г.; Дин, М. (2013). "Является ли Грейнджер причинностью жизнеспособной методикой для анализа данных FMRI?" Полем Plos один . 8 (7): E67428. BIBCODE : 2013PLOSO ... 867428W . doi : 10.1371/journal.pone.0067428 . PMC 3701552 . PMID 23861763 .
- ^ Ebert-Uphoff, Imme; Дэн, Йи (2017). «Причинное обнаружение в« Геоссауки » - использование синтетических данных, чтобы узнать, как интерпретировать результаты» . Компьютеры и геологические науки . 99 : 50–60. Bibcode : 2017cg ..... 99 ... 50e . doi : 10.1016/j.cageo.2016.10.008 .
- ^ МакКракен, JM; Weigel, Rs; Ли, Джундонг; Ричард Хан, П.; Лю, Хуан (2014). «Конвергентное перекрестное картирование и парное асимметричное вывод». Физический Преподобный 90 (6): 062903. Arxiv : 1407.5696 . BIBCODE : 2014FRVE..90F2903M . doi : 10.1103/physreve.90.062903 . PMID 25615160 . S2CID 7506718 .
- ^ Scheines, R. (1997). «Введение в причинный вывод» (PDF) . Причинность в кризисе : 185–199.
- ^ Голландия, PW (1986). «Статистика и причинный вывод». Журнал Американской статистической ассоциации . 81 (396): 945–960. doi : 10.1080/01621459.1986.10478354 . S2CID 14377504 .
- ^ Imbens, GW; Рубин, Д.Б. (2015). Причинный вывод в статистике, социальных и биомедицинских науках . Издательство Кембриджского университета. ISBN 978-0521885881 .
- ^ Морган, SL; Winship, C. (2015). Контрфактуальные и причинно -следственные дела . Издательство Кембриджского университета. ISBN 978-1107065079 .
- ^ «Причинные модели и статистические данные, проект тетрада» .
- ^ «Инструменты, Центр причинного открытия, Университет Питтсбурга» . 10 августа 2016 года.