Причинная модель
Эту статью , возможно, придется переписать, Википедии чтобы она соответствовала стандартам качества . ( март 2020 г. ) |
В метафизике ( причинная модель или структурная причинная модель ) — это концептуальная модель описывающая причинные механизмы системы , . несколько типов причинных обозначений При разработке причинной модели можно использовать . Причинно-следственные модели могут улучшить дизайн исследования, предоставляя четкие правила для принятия решения о том, какие независимые переменные необходимо включать/контролировать.
Они могут позволить ответить на некоторые вопросы на основе существующих данных наблюдений без необходимости проведения интервенционного исследования, такого как рандомизированное контролируемое исследование . Некоторые интервенционные исследования неприемлемы по этическим или практическим причинам, а это означает, что без причинно-следственной модели некоторые гипотезы невозможно проверить.
Причинно-следственные модели могут помочь в вопросе внешней достоверности (применимы ли результаты одного исследования к неизученным группам населения). Причинно-следственные модели могут позволить объединить данные нескольких исследований (при определенных обстоятельствах) для ответа на вопросы, на которые не может ответить ни один отдельный набор данных.
Причинно-следственные модели нашли применение в обработке сигналов , эпидемиологии и машинном обучении . [2]
Определение
[ редактировать ]Причинные модели — это математические модели, представляющие причинно-следственные связи внутри отдельной системы или популяции. Они облегчают выводы о причинно-следственных связях на основе статистических данных. Они могут многому нас научить в области эпистемологии причинности и взаимосвязи между причинностью и вероятностью. Они также применялись к темам, интересующим философов, таким как логика контрфактов, теория принятия решений и анализ фактической причинно-следственной связи. [3]
- Стэнфордская энциклопедия философии
Джудея Перл определяет причинную модель как упорядоченную тройку. , где U — набор экзогенных переменных , значения которых определяются факторами вне модели; V — набор эндогенных переменных, значения которых определяются факторами модели; и E представляет собой набор структурных уравнений , которые выражают значение каждой эндогенной переменной как функцию значений других переменных в U и V. [2]
История
[ редактировать ]Аристотель определил таксономию причинности, включая материальные, формальные, действенные и конечные причины. Юм отверг таксономию Аристотеля в пользу контрфактов . В какой-то момент он отрицал, что объекты обладают «силами», которые делают один причиной, а другой — следствием. Позже он принял «если бы первого объекта не было, то и второго никогда не существовало» (« причинность « но-для »). [4]
В конце 19 века начала формироваться статистика. После многолетних усилий по выявлению причинных правил для таких областей, как биологическая наследственность, Гальтон представил концепцию регрессии средних (воплощенную спадом второкурсников в спорте), которая позже привела его к непричинной концепции корреляции . [4]
Будучи позитивистом , Пирсон исключил из большей части науки понятие причинности как недоказуемого частного случая ассоциации и ввел коэффициент корреляции в качестве показателя ассоциации. Он писал: «Сила как причина движения — это то же самое, что древесный бог как причина роста», и эта причинность была всего лишь «фетишем среди непостижимых тайн современной науки». Пирсон основал «Биометрику» и лабораторию биометрии в Университетском колледже Лондона , которые стали мировым лидером в области статистики. [4]
В 1908 году Харди и Вайнберг решили проблему стабильности признаков , которая заставила Гальтона отказаться от причинно-следственной связи, возродив менделевское наследование . [4]
В 1921 году стал Райта анализ путей теоретическим предшественником причинного моделирования и причинных графов . [5] Он разработал этот подход, пытаясь разобраться в относительном влиянии наследственности , развития и окружающей среды на морских свинок рисунок шерсти . Он подкрепил свои тогдашние еретические утверждения, показав, как такие анализы могут объяснить взаимосвязь между массой морских свинок при рождении, внутриутробным периодом и размером помета. Противодействие этим идеям со стороны видных статистиков привело к тому, что их игнорировали в течение следующих 40 лет (за исключением животноводов). Вместо этого ученые полагались на корреляции, отчасти по указанию критика Райта (и ведущего статистика) Фишера . [4] Единственным исключением был Беркс , студент, который в 1926 году первым применил диаграммы путей для представления посреднического влияния ( посредника ) и утверждал, что сохранение константы посредника приводит к ошибкам. Возможно, она самостоятельно изобрела диаграммы путей. [4] : 304
В 1923 году Нейман представил концепцию потенциального результата, но его статья не переводилась с польского на английский до 1990 года. [4] : 271
В 1958 году Кокс предупредил, что контроль над переменной Z действителен только в том случае, если на нее маловероятно влияние независимых переменных. [4] : 154
В 1960-х годах Дункан , Блэлок , Голдбергер и другие заново открыли анализ путей. Читая работу Блэлока о диаграммах путей, Дункан вспомнил лекцию Огберна двадцатью годами ранее, в которой упоминалась статья Райта, в которой, в свою очередь, упоминался Бёркс. [4] : 308
Социологи первоначально называли причинные модели моделированием структурных уравнений , но как только этот метод стал механическим, он потерял свою полезность, что заставило некоторых практиков отвергнуть любую связь с причинностью. Экономисты приняли алгебраическую часть путевого анализа, назвав ее моделированием одновременных уравнений. Однако экономисты по-прежнему избегали придавать своим уравнениям причинно-следственный смысл. [4]
Через шестьдесят лет после своей первой статьи Райт опубликовал статью, в которой она резюмировалась, после критики Карлина и др., которые возражали, что она касается только линейных отношений и что надежное, свободное от моделей представление данных более показательно. [4]
В 1973 году Льюис выступал за замену корреляции причинностью без причинности (контрфактическими утверждениями). Он упомянул о способности людей представлять себе альтернативные миры, в которых причина возникает или не возникает и в которых следствие появляется только вслед за своей причиной. [4] : 266 В 1974 году Рубин ввел понятие «потенциальных результатов» как язык для постановки причинно-следственных вопросов. [4] : 269
В 1983 году Картрайт предложил обуславливать любой фактор, «каузально релевантный» эффекту, выходя за рамки простой вероятности как единственного ориентира. [4] : 48
В 1986 году Бэрон и Кенни представили принципы обнаружения и оценки посредничества в системе линейных уравнений. По состоянию на 2014 год их статья была 33-й по цитируемости за все время. [4] : 324 В том же году Гренландия и Робинс представили подход «обменимости» к устранению путаницы, рассматривая контрфактические факты. Они предложили оценить, что случилось бы с группой лечения, если бы они не получили лечение, и сравнить этот результат с результатом контрольной группы. Если они совпадали, считалось, что смешение отсутствует. [4] : 154
Лестница причинно-следственной связи
[ редактировать ]Перла Причинная метамодель включает трехуровневую абстракцию, которую он называет лестницей причинности. Самый низкий уровень, Ассоциация (видение/наблюдение), предполагает ощущение закономерностей или закономерностей во входных данных, выраженных в виде корреляций. Средний уровень, Вмешательство (действие), предсказывает последствия преднамеренных действий, выраженные в виде причинно-следственных связей. Самый высокий уровень, Контрфактуалы (воображение), включает в себя построение теории (части) мира, которая объясняет, почему определенные действия имеют определенные последствия и что происходит в отсутствие таких действий. [4]
Ассоциация
[ редактировать ]Один объект связан с другим, если наблюдение одного меняет вероятность наблюдения другого. Пример: покупатели, покупающие зубную пасту, с большей вероятностью покупают также зубную нить. Математически:
или вероятность (покупки) зубной нити при (покупке) зубной пасты. Ассоциации также можно измерить, вычислив корреляцию двух событий. Ассоциации не имеют причинно-следственной связи. Одно событие может вызвать другое, может быть наоборот, или оба события могут быть вызваны каким-то третьим событием (несчастный гигиенист пристыжает покупателя, заставляя его лучше относиться к своей полости рта). [4]
Вмешательство
[ редактировать ]Этот уровень утверждает конкретные причинно-следственные связи между событиями. Причинно-следственная связь оценивается путем экспериментального выполнения какого-либо действия, влияющего на одно из событий. Пример: какова будет новая вероятность покупки после удвоения цены на зубную пасту? Причинно-следственная связь не может быть установлена путем изучения истории (изменений цен), поскольку изменение цены могло произойти по какой-то другой причине, которая сама по себе могла повлиять на второе событие (тариф, который увеличивает цену обоих товаров). Математически:
где do — оператор, сигнализирующий об экспериментальном вмешательстве (удвоении цены). [4] Оператор указывает на выполнение минимального изменения в мире, необходимого для создания желаемого эффекта, «мини-операции» на модели с как можно меньшими отклонениями от реальности. [6]
Контрфакты
[ редактировать ]Самый высокий уровень, контрфактический, предполагает рассмотрение альтернативной версии прошлого события или того, что могло бы произойти при других обстоятельствах для одной и той же экспериментальной единицы. Например, какова вероятность того, что, если бы магазин удвоил цену на зубную нить, покупатель зубной пасты все равно купил бы ее?
Контрфакты могут указывать на наличие причинно-следственной связи. Модели, которые могут отвечать на противоречивые факты, позволяют проводить точные вмешательства, последствия которых можно предсказать. В крайнем случае, такие модели принимаются как физические законы (как в законах физики, например, инерции, которая гласит, что если к неподвижному объекту не приложена сила, он не будет двигаться). [4]
Причинность
[ редактировать ]Причинность против корреляции
[ редактировать ]Статистика вращается вокруг анализа взаимосвязей между несколькими переменными. Традиционно эти отношения описываются как корреляции , ассоциации без каких-либо подразумеваемых причинно-следственных связей. Причинно-следственные модели пытаются расширить эту структуру, добавляя понятие причинно-следственных связей, в которых изменения одной переменной вызывают изменения других. [2]
Определения причинности двадцатого века основывались исключительно на вероятностях/ассоциациях. Одно событие( Считалось, что ) вызывает другое, если оно увеличивает вероятность другого ( ). Математически это выражается так:
- .
Такие определения неадекватны, поскольку другие отношения (например, общая причина и ) может удовлетворять условию. Причинность имеет отношение ко второй ступени лестницы. Ассоциации находятся на первом этапе и служат лишь доказательством последнего. [4]
В более позднем определении была предпринята попытка устранить эту двусмысленность, обуславливая фоновые факторы. Математически:
- ,
где представляет собой набор фоновых переменных и представляет значения этих переменных в определенном контексте. Однако требуемый набор фоновых переменных не определен (несколько наборов могут увеличить вероятность), поскольку вероятность является единственным критерием. [ нужны разъяснения ] . [4]
Другие попытки определить причинность включают причинность Грейнджера , статистическую проверку гипотезы о том, что причинность (в экономике ) можно оценить путем измерения способности предсказывать будущие значения одного временного ряда, используя предыдущие значения другого временного ряда. [4]
Типы
[ редактировать ]Причина может быть необходимой, достаточной, способствующей или какой-либо их комбинацией. [7]
Необходимый
[ редактировать ]Чтобы x был необходимой причиной y , наличие y должно подразумевать предшествовавшее возникновение x . Однако наличие x не означает, что y . произойдет [8] Необходимые причины также известны как причины «если бы не», поскольку y не произошло бы, если бы не появление x . [4] : 261
Достаточные причины
[ редактировать ]Чтобы x было достаточной причиной y , наличие x должно подразумевать последующее возникновение y . Однако другая причина z может независимо вызывать y . Таким образом, наличие y не требует предварительного появления x . [8]
Сопутствующие причины
[ редактировать ]Чтобы x было причиной, способствующей y , наличие x должно увеличивать вероятность y . Если вероятность равна 100%, то x вместо этого называется достаточным. Также может потребоваться сопутствующая причина. [9]
Модель
[ редактировать ]Причинно-следственная диаграмма
[ редактировать ]Причинно-следственная диаграмма — это ориентированный граф , который отображает причинно-следственные связи между переменными в причинно-следственной модели. Причинно-следственная диаграмма включает в себя набор переменных (или узлов ). Каждый узел соединен стрелкой с одним или несколькими другими узлами, на которые он оказывает причинное влияние. Стрелка обозначает направление причинно-следственной связи, например стрелка, соединяющая переменные. и со стрелкой в указывает на то, что изменение вызывает изменение в (с соответствующей вероятностью). Путь — это обход графа между двумя узлами по причинным стрелкам. [4]
Причинные диаграммы включают диаграммы причинных петель , направленные ациклические графы и диаграммы Исикавы . [4]
Причинно-следственные диаграммы не зависят от количественных вероятностей, которые их информируют. Изменения этих вероятностей (например, из-за технологических усовершенствований) не требуют изменений в модели. [4]
Элементы модели
[ редактировать ]Причинные модели имеют формальную структуру с элементами с определенными свойствами. [4]
Схемы соединений
[ редактировать ]Три типа соединений трех узлов — это линейные цепи, ветвящиеся вилки и сливающиеся коллайдеры. [4]
Цепь
[ редактировать ]Цепочки представляют собой прямые линии со стрелками, указывающими от причины к следствию. В этой модели является посредником, поскольку он опосредует изменения, которые в противном случае пришлось бы . [4] : 113
Вилка
[ редактировать ]В форках одна причина имеет несколько последствий. Оба эффекта имеют общую причину. Существует (непричинная) ложная корреляция между и которое можно устранить путем кондиционирования (за конкретную стоимость ). [4] : 114
«Кондиционирование на «означает «данный " (т.е. при значении ).
Разработка вилки является помехой:
В таких моделях является распространенной причиной и (что также приводит к ), изготовление сбивающий с толку [ нужны разъяснения ] . [4] : 114
Коллайдер
[ редактировать ]В коллайдерах несколько причин влияют на один результат. Кондиционирование включено (за конкретную стоимость ) часто выявляет непричинную отрицательную корреляцию между и . Эту отрицательную корреляцию назвали предвзятостью коллайдера и эффектом «объяснения». объясняет корреляцию между и . [4] : 115 Корреляция может быть положительной в том случае, если вклады обеих сторон и необходимы, чтобы повлиять . [4] : 197
Типы узлов
[ редактировать ]Посредник
[ редактировать ]Узел-посредник изменяет влияние других причин на результат (в отличие от простого влияния на результат). [4] : 113 Например, в приведенном выше примере цепочки: является посредником, поскольку изменяет эффект (косвенная причина ) на (результат).
сбивающий с толку
[ редактировать ]Узел-конфаундер влияет на несколько результатов, создавая между ними положительную корреляцию. [4] : 114
Инструментальная переменная
[ редактировать ]– Инструментальная переменная это такая переменная, которая: [4] : 246
- имеет путь к результату;
- не имеет другого пути к причинным переменным;
- не имеет прямого влияния на результат.
Коэффициенты регрессии могут служить оценкой причинного влияния инструментальной переменной на результат, если этот эффект не смешивается. Таким образом, инструментальные переменные позволяют количественно оценить причинные факторы без данных о искажающих факторах. [4] : 249
Например, учитывая модель:
является инструментальной переменной, поскольку она имеет путь к результату и не смешивается, например, с .
В приведенном выше примере, если и принимают двоичные значения, то предположение, что не происходит, называется монотонностью [ нужны разъяснения ] . [4] : 253
Уточнения к технике [ нужны разъяснения ] включая создание инструмента [ нужны разъяснения ] путем обусловления другой переменной [ нужны разъяснения ] заблокировать [ нужны разъяснения ] пути [ нужны разъяснения ] между инструментом и конфаундером [ нужны разъяснения ] и объединение нескольких переменных в один инструмент [ нужны разъяснения ] . [4] : 257
Менделевская рандомизация
[ редактировать ]Определение: Менделевская рандомизация использует измеренные вариации генов с известной функцией для изучения причинного влияния модифицируемого воздействия на заболевание в обсервационных исследованиях . [10] [11]
Поскольку гены варьируются случайным образом в разных популяциях, наличие гена обычно квалифицируется как инструментальная переменная, подразумевая, что во многих случаях причинно-следственную связь можно определить количественно с помощью регрессии в наблюдательном исследовании. [4] : 255
Ассоциации
[ редактировать ]Условия независимости
[ редактировать ]Условия независимости — это правила, позволяющие решить, являются ли две переменные независимыми друг от друга. Переменные являются независимыми, если значения одной не влияют напрямую на значения другой. Множественные причинные модели могут иметь общие условия независимости. Например, модели
и
имеют одинаковые условия независимости, поскольку обусловленность листья и независимый. Однако эти две модели не имеют одинакового значения и могут быть фальсифицированы на основе данных (то есть, если данные наблюдений показывают связь между и после кондиционирования , то обе модели неверны). И наоборот, данные не могут показать, какая из этих двух моделей верна, поскольку они имеют одинаковые условия независимости.
Обусловливание переменной — это механизм проведения гипотетических экспериментов. Кондиционирование переменной включает в себя анализ значений других переменных для заданного значения условной переменной. В первом примере условие подразумевает, что наблюдения для данного значения не должно проявляться зависимости между и . Если такая зависимость существует, то модель некорректна. Некаузальные модели не могут проводить такие различия, потому что они не делают причинных утверждений. [4] : 129–130
Искажающий / опровергающий
[ редактировать ]Важным элементом дизайна корреляционного исследования является выявление потенциально мешающих влияний на изучаемую переменную, например демографию. Эти переменные контролируются для устранения этих влияний. Однако правильный список мешающих переменных не может быть определен априори . Таким образом, возможно, что исследование может контролировать нерелевантные переменные или даже (косвенно) изучаемую переменную. [4] : 139
Причинно-следственные модели предлагают надежный метод выявления соответствующих мешающих переменных. Формально Z является помехой, если «Y связан с Z путями, не проходящими через X». Их часто можно определить, используя данные, собранные в ходе других исследований. Математически, если
X и Y смешиваются (из-за некоторой мешающей переменной Z). [4] : 151
Ранее к предположительно неверным определениям конфаундера относились: [4] : 152
- «Любая переменная, которая коррелирует как с X, так и с Y».
- Y ассоциируется с Z среди необлученных.
- Неколлапсируемость: разница между «грубым относительным риском и относительным риском, возникающим после поправки на потенциальный искажающий фактор».
- Эпидемиологический: переменная, связанная с X среди населения в целом и связанная с Y среди людей, не подвергавшихся воздействию X.
Последнее имеет недостаток в том, что в модели:
Z соответствует определению, но является посредником, а не помехой, и является примером контроля за результатом.
В модели
Традиционно B считался искажающим фактором, поскольку он связан с X и Y, но не находится на причинном пути и не является потомком чего-либо на причинном пути. Контроль за B приводит к тому, что он становится помехой. Это известно как М-смещение. [4] : 161
Регулировка задней двери
[ редактировать ]Для анализа причинного влияния X на Y в причинной модели необходимо учитывать все мешающие переменные (деконфаундинг). Чтобы идентифицировать набор мешающих факторов, (1) каждый некаузальный путь между X и Y должен быть заблокирован этим набором; (2) без нарушения каких-либо причинно-следственных связей; и (3) без создания каких-либо ложных путей. [4] : 158
Определение : черный путь от переменной X к Y — это любой путь от X к Y, который начинается со стрелки, указывающей на X. [4] : 158
Определение : Учитывая упорядоченную пару переменных (X,Y) в модели, набор мешающих переменных Z удовлетворяет критерию бэкдора, если (1) ни одна искажающая переменная Z не является потомком X и (2) все бэкдорные пути между X и Y заблокированы набором искажающих факторов.
Если критерий бэкдора удовлетворен для (X,Y), X и Y устраняются с помощью набора переменных-конфаундеров. Нет необходимости контролировать какие-либо переменные, кроме искажающих факторов. [4] : 158 Критерий «черного входа» — это достаточное, но не необходимое условие для нахождения набора переменных Z, чтобы исключить анализ причинного воздействия X на y.
Когда причинно-следственная модель является правдоподобным представлением реальности и бэкдор-критерий удовлетворен, тогда коэффициенты частичной регрессии можно использовать в качестве (причинно-следственных) коэффициентов пути (для линейных отношений). [4] : 223 [12]
Регулировка входной двери
[ редактировать ]Если все элементы пути блокировки ненаблюдаемы, путь бэкдора не поддается вычислению, но если все прямые пути от есть элементы где нет открытых путей, соединяющих , затем , набор всего s, можно измерить . Фактически существуют условия, когда может выступать в качестве прокси для .
Определение : входной путь – это прямой причинно-следственный путь, данные по которому доступны для всех. , [4] : 226 перехватывает все направленные пути к , нет незаблокированных путей из к и все бэкдор-пути из к заблокированы . [13]
Следующее преобразует выражение do в выражение без выполнения действий путем обусловления переменных на пути к входной двери. [4] : 226
Предполагая, что данные об этих наблюдаемых вероятностях доступны, окончательную вероятность можно вычислить без эксперимента, независимо от существования других мешающих путей и без скрытых корректировок. [4] : 226
Вмешательства
[ редактировать ]Запросы
[ редактировать ]Запросы — это вопросы, задаваемые на основе конкретной модели. На них обычно отвечают путем проведения экспериментов (вмешательств). Вмешательства принимают форму фиксации значения одной переменной в модели и наблюдения за результатом. Математически такие запросы имеют вид (из примера): [4] : 8
где оператор do указывает, что эксперимент явно изменил цену зубной пасты. Графически это блокирует любые причинные факторы, которые в противном случае могли бы повлиять на эту переменную. Схематически это стирает все причинные стрелки, указывающие на экспериментальную переменную. [4] : 40
Возможны более сложные запросы, в которых оператор do применяется (значение фиксировано) к нескольким переменным.
Интервенционное распространение
[ редактировать ]Эта статья требует внимания эксперта по математике . Конкретная проблема: необходимо понять do-Operator, см. https://www.pymc.io/projects/examples/en/latest/causal_inference/interventional_distribution.html . ( май 2024 г. ) |
Сделать расчет
[ редактировать ]Исчисление do — это набор манипуляций, доступных для преобразования одного выражения в другое, с общей целью преобразования выражений, содержащих оператор do, в выражения, которые его не содержат. Выражения, не включающие оператор do, можно оценить только на основе данных наблюдений, без необходимости экспериментального вмешательства, которое может быть дорогостоящим, длительным или даже неэтичным (например, предлагать испытуемым бросить курить). [4] : 231 Набор правил полон (его можно использовать для вывода каждого истинного утверждения в этой системе). [4] : 237 Алгоритм может определить, вычислимо ли решение для данной модели за полиномиальное время . [4] : 238
Правила
[ редактировать ]Исчисление включает три правила преобразования выражений условной вероятности с использованием оператора do.
Правило 1
[ редактировать ]Правило 1 разрешает добавление или удаление наблюдений: [4] : 235
в случае, если набор переменных Z блокирует все пути из W в Y и все стрелки, ведущие в X, удалены. [4] : 234
Правило 2
[ редактировать ]Правило 2 разрешает замену вмешательства наблюдением или наоборот: [4] : 235
в случае, когда Z удовлетворяет критерию «черной двери» . [4] : 234
Правило 3
[ редактировать ]Правило 3 разрешает удаление или добавление вмешательств: [4]
в случае, когда никакие причинные пути не соединяют X и Y. [4] : 234 : 235
Расширения
[ редактировать ]Правила не подразумевают, что из любого запроса можно удалить операторы do. В таких случаях можно заменить переменную, которой можно манипулировать (например, диета), на переменную, которая не подвергается манипуляциям (например, уровень холестерина в крови), которую затем можно преобразовать, чтобы удалить эту переменную. Пример:
Контрфакты
[ редактировать ]Контрфакты рассматривают возможности, которые не обнаруживаются в данных, например, развился ли бы рак у некурящего, если бы он вместо этого был заядлым курильщиком. Это высшая ступень причинно-следственной лестницы Перла.
Потенциальный результат
[ редактировать ]Определение: Потенциальный результат для переменной Y — это «значение, которое Y принял бы для индивидуального [ нужны разъяснения ] u , если бы X было присвоено значение x». Математически: [4] : 270
- или .
Потенциальный результат определяется на уровне индивида u. [4] : 270
Традиционный подход к потенциальным результатам основан на данных, а не на моделях, что ограничивает его способность распутывать причинно-следственные связи. Он рассматривает причинно-следственные вопросы как проблемы отсутствия данных и дает неправильные ответы даже на стандартные сценарии. [4] : 275
Причинно-следственный вывод
[ редактировать ]В контексте причинно-следственных моделей потенциальные результаты интерпретируются причинно, а не статистически.
Первый закон причинного вывода гласит, что потенциальный результат
можно вычислить, изменив причинную модель M (путем удаления стрелок из X) и вычислив результат для некоторого x . Формально: [4] : 280
Проведение контрфактического
[ редактировать ]Исследование контрфактического явления с использованием причинно-следственной модели включает в себя три этапа. [14] Подход справедлив независимо от формы модельных связей, линейной или иной. Когда взаимосвязи модели полностью определены, можно вычислить значения точек. В других случаях (например, когда доступны только вероятности) можно вычислить утверждение об интервале вероятности, например, что некурящий x будет иметь 10-20% вероятность заболевания раком. [4] : 279
Учитывая модель:
можно применять уравнения для расчета значений A и C, полученные на основе регрессионного анализа или другого метода, заменяя известные значения из наблюдений и фиксируя значения других переменных (противфактические). [4] : 278
Похитить
[ редактировать ]Примените абдуктивное рассуждение ( логический вывод , который использует наблюдение для поиска самого простого/наиболее вероятного объяснения), чтобы оценить u , прокси для ненаблюдаемых переменных в конкретном наблюдении, которое подтверждает контрфактическое объяснение. [4] : 278 Вычислите вероятность u с учетом пропозициональных доказательств.
Действовать
[ редактировать ]Для конкретного наблюдения используйте оператор do, чтобы установить обратное (например, m =0), соответствующим образом изменив уравнения. [4] : 278
Предсказывать
[ редактировать ]Вычислите значения выхода ( y ) с помощью модифицированных уравнений. [4] : 278
Посредничество
[ редактировать ]Различить прямые и косвенные (опосредованные) причины можно только путем проведения контрфактических действий. [4] : 301 Понимание посредничества требует, чтобы посредник оставался постоянным, одновременно вмешиваясь в непосредственную причину. В модели
M опосредует влияние X на Y, в то время как X также оказывает непосредственное влияние на Y. Таким образом, M остается постоянным, а do(X) вычисляется.
Вместо этого ошибка посредничества включает в себя обусловленность посредника, если посредник и результат путаются, как это происходит в приведенной выше модели.
Для линейных моделей косвенный эффект можно вычислить, взяв произведение всех коэффициентов пути вдоль опосредованного пути. Общий косвенный эффект рассчитывается как сумма отдельных косвенных эффектов. Для линейных моделей посредничество указывается, когда коэффициенты уравнения, подобранного без включения посредника, значительно отличаются от уравнения, которое его включает. [4] : 324
Прямой эффект
[ редактировать ]В экспериментах по такой модели управляемый прямой эффект (CDE) вычисляется путем принудительного установления значения посредника M (do(M = 0)) и случайного назначения некоторым испытуемым каждого из значений X (do(X=0) ), do(X=1), ...) и наблюдая за результирующими значениями Y. [4] : 317
Каждому значению посредника соответствует соответствующий CDE.
Однако лучший эксперимент — вычислить естественный прямой эффект. (NDE) Это эффект, определяемый тем, что отношения между X и M остаются нетронутыми, при этом вмешиваясь в отношения между X и Y. [4] : 318
Например, рассмотрим прямой эффект увеличения числа посещений стоматолога-гигиениста (X) каждые два года из года в год, что поощряет использование зубной нити (M). Десны (Y) становятся здоровее либо благодаря гигиенисту (прямо), либо благодаря использованию зубной нити (медиатор/косвенно). Эксперимент состоит в том, чтобы продолжать пользоваться зубной нитью, пропуская визит к гигиенисту.
Косвенный эффект
[ редактировать ]Косвенное влияние X на Y - это «увеличение, которое мы увидели бы в Y, сохраняя X постоянным и увеличивая M до любого значения, которое M могло бы достичь при увеличении X на единицу». [4] : 328
Косвенные эффекты нельзя «контролировать», поскольку прямой путь нельзя отключить, удерживая константу другой переменной. Естественный косвенный эффект (NIE) – это влияние на здоровье десен (Y) от использования зубной нити (M). NIE рассчитывается как сумма (в случаях использования зубной нити и отсутствия зубной нити) разницы между вероятностью использования зубной нити с учетом гигиениста и без него, или: [4] : 321
Приведенный выше расчет NDE включает в себя контрфактические индексы ( ). Для нелинейных моделей очевидная, казалось бы, эквивалентность [4] : 322
не применяется из-за аномалий, таких как пороговые эффекты и двоичные значения. Однако,
работает для всех отношений модели (линейных и нелинейных). Это позволяет затем рассчитывать NDE непосредственно на основе данных наблюдений, без вмешательства или использования контрфактических индексов. [4] : 326
Транспортабельность
[ редактировать ]Причинно-следственные модели предоставляют средство интеграции данных из разных наборов данных, известное как транспорт, даже несмотря на то, что причинно-следственные модели (и связанные с ними данные) различаются. Например, данные опроса можно объединить с данными рандомизированных контролируемых исследований. [4] : 352 Транспорт предлагает решение вопроса внешней валидности : может ли исследование быть применено в другом контексте.
Если две модели совпадают по всем важным переменным и известно, что данные одной модели несмещены, данные одной совокупности можно использовать для того, чтобы сделать выводы о другой. В других случаях, когда известно, что данные необъективны, повторное взвешивание может позволить перенести набор данных. В третьем случае выводы можно сделать на основе неполного набора данных. В некоторых случаях данные исследований нескольких популяций можно объединить (посредством транспортировки), чтобы сделать выводы о неизмеренной популяции. В некоторых случаях объединение оценок (например, P(W|X)) из нескольких исследований может повысить точность вывода. [4] : 355
Do-исчисление обеспечивает общий критерий переноса: целевая переменная может быть преобразована в другое выражение с помощью серии do-операций, которые не включают в себя какие-либо переменные, «производящие различия» (те, которые различают две совокупности). [4] : 355 Аналогичное правило применяется к исследованиям, в которых участвуют существенно разные участники. [4] : 356
Байесовская сеть
[ редактировать ]Любая причинно-следственная модель может быть реализована как байесовская сеть. Байесовские сети можно использовать для определения обратной вероятности события (с учетом результата, каковы вероятности конкретной причины). Для этого требуется подготовить таблицу условной вероятности, показывающую все возможные входные данные и результаты с соответствующими вероятностями. [4] : 119
Например, для модели с двумя переменными «Болезнь» и «Тест» (для заболевания) таблица условной вероятности принимает форму: [4] : 117
Тест | ||
---|---|---|
Болезнь | Позитивный | Отрицательный |
Отрицательный | 12 | 88 |
Позитивный | 73 | 27 |
Согласно этой таблице, при отсутствии у пациента заболевания вероятность положительного результата теста составляет 12%.
Хотя это приемлемо для небольших задач, по мере увеличения количества переменных и связанных с ними состояний таблица вероятностей (и связанное с ней время вычислений) увеличивается экспоненциально. [4] : 121
Байесовские сети используются в коммерческих целях в таких приложениях, как исправление ошибок беспроводных данных и анализ ДНК. [4] : 122
Инварианты/контекст
[ редактировать ]Другая концептуализация причинности включает понятие инвариантных отношений. В случае идентификации рукописных цифр форма цифры контролирует значение, поэтому форма и значение являются инвариантами. Изменение формы меняет смысл. Другие свойства этого не делают (например, цвет). Эта инвариантность должна распространяться на наборы данных, созданные в разных контекстах (неинвариантные свойства формируют контекст). Вместо обучения (оценки причинно-следственной связи) с использованием объединенных наборов данных изучение одного и тестирование другого может помочь отличить варианты от инвариантных свойств. [15]
См. также
[ редактировать ]- Причинная система
- Причинная сеть - байесовская сеть с явным требованием, чтобы отношения были причинными.
- Моделирование структурными уравнениями - статистический метод проверки и оценки причинно-следственных связей.
- Анализ пути (статистика)
- Байесовская сеть
- Причинно-следственная карта
- Динамическое причинно-следственное моделирование
- Причинная модель Рубина
Ссылки
[ редактировать ]- ^ Карл Фристон (февраль 2009 г.). «Причинное моделирование и связь мозга в функциональной магнитно-резонансной томографии» . ПЛОС Биология . 7 (2): e1000033. дои : 10.1371/journal.pbio.1000033 . ПМЦ 2642881 . ПМИД 19226186 .
- ^ Jump up to: а б с Жемчужина 2009 года .
- ^ Хичкок, Кристофер (2018), «Причинные модели» , в Залте, Эдвард Н. (ред.), Стэнфордская энциклопедия философии (изд. осени 2018 г.), Лаборатория метафизических исследований, Стэнфордский университет , получено 8 сентября 2018 г.
- ^ Jump up to: а б с д и ж г час я дж к л м н тот п д р с т в v В х и С аа аб и объявление но из в ах есть также и аль являюсь а к ап ак с как в В из хорошо топор является тот нет бб до нашей эры др. быть парень бг чб с минет БК с бм млрд быть б.п. БК бр бс БТ этот бв б бх к бз что CB копия компакт-диск Этот см. cg ч Там СиДжей ск кл Перл, Иудея ; Маккензи, Дана (15 мая 2018 г.). Книга «Почему: новая наука о причине и следствии» . Основные книги. ISBN 9780465097616 .
- ^ Окаша, Самир (12 января 2012 г.). «Причинность в биологии» . В Биби, Хелен; Хичкок, Кристофер; Мензис, Питер (ред.). Оксфордский справочник причинно-следственной связи . Том. 1. ОУП Оксфорд. doi : 10.1093/oxfordhb/9780199279739.001.0001 . ISBN 9780191629464 .
- ^ Перл, Иудея (2021 г.). «Каузальный и контрфактический вывод» . В Кнауфе, Маркус; Спон, Вольфганг (ред.). Справочник по рациональности . МТИ Пресс . дои : 10.7551/mitpress/11252.003.0044 . ISBN 9780262366175 .
- ^ Эпп, Сюзанна С. (2004). Дискретная математика с приложениями . Томсон-Брукс/Коул. стр. 25–26. ISBN 9780534359454 .
- ^ Jump up to: а б «Причинно-следственная связь» . www.istarassessment.org . Проверено 2 марта 2016 г.
- ^ Ригельман, Р. (1979). «Сопутствующая причина: ненужная и недостаточная». Последипломное образование по медицине . 66 (2): 177–179. дои : 10.1080/00325481.1979.11715231 . ПМИД 450828 .
- ^ Катан М.Б. (март 1986 г.). «Изоформы аполипопротеина Е, сывороточный холестерин и рак». Ланцет . 1 (8479): 507–8. дои : 10.1016/s0140-6736(86)92972-7 . ПМИД 2869248 . S2CID 38327985 .
- ^ Смит, Джордж Дэйви; Эбрагим, Шах (2008). Менделевская рандомизация: генетические варианты как инструменты усиления причинно-следственных выводов в наблюдательных исследованиях . Издательство национальных академий (США).
- ^ Pearl 2009 , глава 3-3. Контроль искажающей предвзятости .
- ^ Перл, Иудея; Глимур, Мэделин; Джуэлл, Николас П. (7 марта 2016 г.). Причинно-следственный вывод в статистике: учебник для начинающих . Джон Уайли и сыновья. ISBN 978-1-119-18684-7 .
- ^ Перл 2009 , с. 207.
- ^ Хао, Карен (8 мая 2019 г.). «Глубокое обучение может раскрыть, почему мир устроен именно так» . Обзор технологий Массачусетского технологического института . Проверено 10 февраля 2020 г.
Источники
[ редактировать ]- Перл, Иудея (14 сентября 2009 г.). Причинность . Издательство Кембриджского университета. ISBN 9781139643986 .
Внешние ссылки
[ редактировать ]- Перл, Иудея (26 февраля 2010 г.). «Введение в причинный вывод» . Международный журнал биостатистики . 6 (2): Статья 7. doi : 10.2202/1557-4679.1203 . ISSN 1557-4679 . ПМК 2836213 . ПМИД 20305706 .
- Причинно-следственное моделирование в PhilPapers
- Фальк, Дэн (17 марта 2019 г.). «Алгоритмы ИИ теперь поразительно хороши в науке» . Проводной . ISSN 1059-1028 . Проверено 20 марта 2019 г.
- Модлин, Тим (30 августа 2019 г.). «Почему мир» . Бостонский обзор . Проверено 9 сентября 2019 г.
- Хартнетт, Кевин (15 мая 2018 г.). «Чтобы создать по-настоящему умные машины, научите их причине и следствию» . Журнал Кванта . Проверено 19 сентября 2019 г.
- [1]
- ^ Изучение представлений с использованием причинной инвариантности , ICLR, февраль 2020 г. , получено 10 февраля 2020 г.