Игнорирование
В статистике , игнорирование — это особенность плана эксперимента при которой метод сбора данных (и характер недостающих данных) не зависит от недостающих данных. Механизм недостающих данных, такой как назначение лечения или стратегия выборки для обследования, «игнорируется», если матрица недостающих данных, которая указывает, какие переменные наблюдаются или отсутствуют, не зависит от недостающих данных при условии соблюдения наблюдаемых данных.
Эта идея является частью модели причинного вывода Рубина , разработанной Дональдом Рубином в сотрудничестве с Полом Розенбаумом в начале 1970-х годов. Точное определение различается в их статьях того периода. В одной из статей Рубина 1978 года Рубин обсуждает игнорируемые механизмы присвоения : [1] это можно понимать так, что способ распределения людей по группам лечения не имеет значения для анализа данных, учитывая все, что записано об этом человеке. Позже, в 1983 г. [2] Рубин и Розенбаум скорее определяют строго игнорируемое назначение лечения , которое является более сильным условием, математически сформулированным как , где является потенциальным результатом лечения , это некоторые ковариаты и это настоящее лечение.
Жемчуг [3] разработал простой графический критерий, называемый «черный ход» , который влечет за собой игнорирование и идентифицирует наборы ковариат, которые удовлетворяют этому условию.
Игнорирование означает, что мы можем игнорировать то, как человек оказался в одной, а не в другой группе («лечение» или «контроль» ), когда дело доходит до потенциального результата (скажем, ). Его также называют несмешанностью, отбором наблюдаемых или смещением отсутствия пропущенных переменных. [4]
Формально это записывается как , или словами потенциал результат человека лечились они или нет, не зависит от того, действительно ли они (наблюдаемые) лечились или нет. Другими словами, мы можем игнорировать то, как люди оказались в одном или другом состоянии, и рассматривать их потенциальные результаты как взаимозаменяемые. Хотя это кажется запутанным, это становится понятным, если мы добавим нижние индексы для «реализованных» и верхние индексы для «идеальных» (потенциальных) миров (обозначение, предложенное Дэвидом Фридманом) .Итак: Д 1 1 /*Д 0 1 являются потенциальными исходами Y, если бы человек лечился (верхний индекс 1 ), тогда как в действительности они действительно были (Y 1 1 , индекс 1 ) или нет (*Y 0 1 : сигнализирует, что эта величина никогда не может быть осознана или наблюдаема или полностью противоречит фактам или контрфактична, CF).
Сходным образом, являются потенциальными исходы, если бы человек не лечился (надстрочный индекс ), хотя на самом деле они были , индекс или не совсем( .
Только один из каждого потенциального результата (РО) может быть реализован, а другой — нет, для одного и того же состояния, поэтому, когда мы пытаемся оценить эффекты лечения, нам нужно что-то, что могло бы заменить полностью противоречащие фактам результаты наблюдаемыми (или оцените их). Когда сохраняется игнорируемость/экзогенность, например, когда люди рандомизированы для лечения или нет, мы можем «заменить» * Y 0 1 со своим наблюдаемым аналогом Y 1 1 и *Y 1 0 со своим наблюдаемым аналогом Y 0 0 , не на индивидуальном уровне Y i , а когда речь идет о средних значениях, таких как E[ Y i 1 - Да 0 ], что и есть причинно-следственный эффект лечения (TE), который человек пытается восстановить.
В соответствии с «правилом непротиворечивости» потенциальные результаты — это фактически реализованные ценности, поэтому мы можем написать Y i 0 = Y i0 0 и Й я 1 = Y i1 1 («Правило последовательности гласит, что потенциальный результат человека в гипотетических условиях, которые случайно материализовались, является именно тем результатом, который испытал этот человек», [5] с. 872). Следовательно, TE = E[Y i. 1 - Да 0 ] = E[Y i1 1 – Y i0 0 ].Теперь, просто добавляя и вычитая одну и ту же полностью противоречащую величине величину *Y 1 0 мы получаем:E[Y i1 1 – Y i0 0 ] = E[Y i1 1 –*Д 1 0 +*Д 1 0 - Да я0 0 ] = E[Y i1 1 –*Д 1 0 ] + Е[*Y 1 0 - Да я0 0 ] = ATT + {Смещение выбора},где ATT = средний эффект лечения на обработанных [6] а второй термин — это предвзятость, возникающая, когда у людей есть выбор принадлежать либо к «обработанной», либо к «контрольной» группе.Игнорирование, простое или условное по отношению к некоторым другим переменным, подразумевает, что такое смещение отбора можно игнорировать, поэтому можно восстановить (или оценить) причинный эффект.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Рубин, Дональд (1978). «Байесовский вывод для причинных эффектов: роль рандомизации» . Анналы статистики . 6 (1): 34–58. дои : 10.1214/aos/1176344064 .
- ^ Рубин, Дональд Б.; Розенбаум, Пол Р. (1983). «Центральная роль показателя склонности в наблюдательных исследованиях причинных эффектов» . Биометрика . 70 (1): 41–55. дои : 10.2307/2335942 . JSTOR 2335942 .
- ^ Перл, Иудея (2000). Причинность: модели, рассуждения и выводы . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 978-0-521-89560-6 .
- ^ Ямамото, Теппей (2012). «Понимание прошлого: статистический анализ причинно-следственной связи». Журнал политологии . 56 (1): 237–256. дои : 10.1111/j.1540-5907.2011.00539.x . hdl : 1721.1/85887 . S2CID 15961756 .
- ^ Перл, Иудея (2010). «О правиле непротиворечивости причинного вывода: аксиома, определение, предположение или теорема?» . Эпидемиология . 21 (6): 872–875. дои : 10.1097/EDE.0b013e3181f5d3fd . ПМИД 20864888 . S2CID 4648801 .
- ^ Имаи, Косуке (2006). «Недоразумения между экспериментаторами и наблюдателями по поводу причинно-следственных выводов» . Журнал Королевского статистического общества, серия A (Статистика в обществе) . 171 (2): 481–502. дои : 10.1111/j.1467-985X.2007.00527.x . S2CID 17852724 .
Дальнейшее чтение
[ редактировать ]- Гельман, Эндрю ; Карлин, Джон Б.; Стерн, Хэл С.; Рубин, Дональд Б. (2004). Байесовский анализ данных . Нью-Йорк: Чепмен и Холл/CRC.
- Йегер, Манфред (2011). «Игнорируемость в статистических и вероятностных выводах». Журнал исследований искусственного интеллекта . 24 : 889–917. arXiv : 1109.2143 . Бибкод : 2011arXiv1109.2143J . дои : 10.1613/jair.1657 . S2CID 12806880 .