Соответствие (статистика)
Сопоставление – это статистический метод, который оценивает эффект лечения путем сравнения обработанных и необработанных единиц в обсервационном исследовании или квазиэксперименте (т.е. когда лечение не назначается случайным образом). Цель сопоставления состоит в том, чтобы уменьшить систематическую ошибку оценки эффекта лечения в исследовании данных наблюдения путем нахождения для каждой обработанной единицы одной (или более) необработанной единицы(й) со схожими наблюдаемыми характеристиками, относительно которых ковариаты сбалансированы. out (аналогично алгоритму K-ближайших соседей ). Путем сопоставления пролеченных единиц с аналогичными необработанными единицами сопоставление позволяет сравнить результаты среди пролеченных и нелеченых единиц, чтобы оценить эффект снижения систематической ошибки лечения из-за смешивания . [ 1 ] [ 2 ] [ 3 ] Сопоставление показателей склонности , ранний метод сопоставления, был разработан как часть причинной модели Рубина . [ 4 ] но было показано, что он увеличивает зависимость модели, предвзятость, неэффективность и мощность и больше не рекомендуется по сравнению с другими методами сопоставления. [ 5 ] Простой, понятный и статистически мощный метод сопоставления, известный как «грубое точное сопоставление» или CEM. [ 6 ]
Соответствие было продвинуто Дональдом Рубином . [ 4 ] он подвергся резкой критике В экономике со стороны Роберта Лалонда (1986): [ 7 ] которые сравнили оценки эффектов лечения, полученные в ходе эксперимента , с сопоставимыми оценками, полученными с помощью методов сопоставления, и показали, что методы сопоставления являются предвзятыми . Раджив Дехеджиа и Садек Вахба (1999) пересмотрели критику ЛаЛонда и показали, что сопоставление является хорошим решением. [ 8 ] Аналогичная критика высказывалась и в политической науке. [ 9 ] и социология [ 10 ] журналы.
Анализ
[ редактировать ]Когда интересующий результат является двоичным, наиболее общим инструментом для анализа сопоставленных данных является условная логистическая регрессия , поскольку она обрабатывает слои произвольного размера и непрерывные или бинарные обработки (предикторы) и может контролировать ковариаты. В отдельных случаях более простые тесты, такие как тест парных разностей , тест Макнемара и тест Кокрана-Мантела-Хэнзеля доступны .
Когда интересующий результат непрерывен, оценка среднего эффекта лечения проводится .
Сопоставление также можно использовать для «предварительной обработки» образца перед анализом с помощью другого метода, например регрессионного анализа . [ 11 ]
Превосходство
[ редактировать ]Чрезмерное совпадение или систематическая ошибка после лечения – это сопоставление очевидного медиатора, который на самом деле является результатом воздействия. [ 12 ] Если сам медиатор стратифицирован, весьма вероятно, что будет индуцирована неясная связь с воздействием заболевания. [ 13 ] Таким образом, чрезмерное соответствие приводит к статистической погрешности . [ 13 ]
Например, сопоставление контрольной группы по продолжительности беременности и/или количеству многоплодных родов при оценке перинатальной смертности и массы тела при рождении после экстракорпорального оплодотворения (ЭКО) является чрезмерным, поскольку ЭКО само по себе увеличивает риск преждевременных родов и многоплодия. [ 14 ]
Это можно рассматривать как ошибку выборки , снижающую внешнюю достоверность исследования, поскольку контрольная группа становится более похожей на случаи воздействия, чем на общую популяцию.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Рубин, Дональд Б. (1973). «Сопоставление для устранения систематической ошибки в наблюдательных исследованиях». Биометрия . 29 (1): 159–183. дои : 10.2307/2529684 . JSTOR 2529684 .
- ^ Андерсон, Даллас В.; Киш, Лесли; Корнелл, Ричард Г. (1980). «О стратификации, группировке и сопоставлении». Скандинавский статистический журнал . 7 (2): 61–66. JSTOR 4615774 .
- ^ Куппер, Лоуренс Л.; Карон, Джон М.; Кляйнбаум, Дэвид Г.; Моргенштерн, Хэл; Льюис, Дональд К. (1981). «Сопоставление эпидемиологических исследований: соображения обоснованности и эффективности». Биометрия . 37 (2): 271–291. CiteSeerX 10.1.1.154.1197 . дои : 10.2307/2530417 . JSTOR 2530417 . ПМИД 7272415 .
- ^ Перейти обратно: а б Розенбаум, Пол Р.; Рубин, Дональд Б. (1983). «Центральная роль показателя склонности в наблюдательных исследованиях причинных эффектов» . Биометрика . 70 (1): 41–55. дои : 10.1093/biomet/70.1.41 .
- ^ Кинг, Гэри; Нильсен, Ричард (октябрь 2019 г.). «Почему показатели склонности не следует использовать для сопоставления» . Политический анализ . 27 (4): 435–454. дои : 10.1017/pan.2019.11 . hdl : 1721.1/128459 . ISSN 1047-1987 .
- ^ Якус, Стефано М.; Кинг, Гэри; Порро, Джузеппе (2011). «Многомерные методы сопоставления, ограничивающие монотонный дисбаланс» . Журнал Американской статистической ассоциации . 106 (493): 345–361. дои : 10.1198/jasa.2011.tm09599 . hdl : 2434/151476 . ISSN 0162-1459 . S2CID 14790456 .
- ^ ЛаЛонд, Роберт Дж. (1986). «Оценка эконометрических оценок программ обучения с использованием экспериментальных данных». Американский экономический обзор . 76 (4): 604–620. JSTOR 1806062 .
- ^ Дехеджиа, Р.Х.; Вахба, С. (1999). «Причинные эффекты в неэкспериментальных исследованиях: переоценка программ обучения» (PDF) . Журнал Американской статистической ассоциации . 94 (448): 1053–1062. дои : 10.1080/01621459.1999.10473858 .
- ^ Арсено, Кевин; Гербер, Алан С.; Грин, Дональд П. (2006). «Сравнение экспериментальных и сопоставленных методов с использованием крупномасштабного полевого эксперимента по мобилизации избирателей». Политический анализ . 14 (1): 37–62. дои : 10.1093/pan/mpj001 .
- ^ Арсено, Кевин; Гербер, Алан С.; Грин, Дональд П. (2010). «Предупреждение об использовании сопоставления для оценки причинных эффектов: эмпирический пример сравнения оценок сопоставления с экспериментальным эталоном». Социологические методы и исследования . 39 (2): 256–282. дои : 10.1177/0049124110378098 . S2CID 37012563 .
- ^ Хо, Дэниел Э.; Имаи, Косукэ; Кинг, Гэри; Стюарт, Элизабет А. (2007). «Сопоставление как непараметрическая предварительная обработка для уменьшения зависимости модели при параметрическом причинном выводе» . Политический анализ . 15 (3): 199–236. дои : 10.1093/pan/mpl013 .
- ^ Кинг, Гэри; Цзэн, Ланче (2007). «Обнаружение зависимости модели при статистическом выводе: ответ» . Ежеквартальный журнал международных исследований . 51 (1): 231–241. дои : 10.1111/j.1468-2478.2007.00449.x . ISSN 0020-8833 . JSTOR 4621711 . S2CID 12669035 .
- ^ Перейти обратно: а б Марш, Дж. Л.; Хаттон, Дж. Л. ; Бинкс, К. (2002). «Устранение эффектов реакции на дозу радиации: пример превышения соответствия» . Британский медицинский журнал . 325 (7359): 327–330. дои : 10.1136/bmj.325.7359.327 . ПМЦ 1123834 . ПМИД 12169512 .
- ^ Гисслер, М.; Хемминки, Э. (1996). «Опасность превышения результатов исследований перинатальной смертности и массы тела при рождении детей, рожденных после искусственного зачатия». Eur J Obstet Gynecol Reprod Biol . 69 (2): 73–75. дои : 10.1016/0301-2115(95)02517-0 . ПМИД 8902436 .
Дальнейшее чтение
[ редактировать ]- Ангрист, Джошуа Д.; Пишке, Йорн-Штеффен (2009). «Регрессия встречает соответствие». В основном безобидная эконометрика: спутник эмпирика . Издательство Принстонского университета. стр. 69–80. ISBN 978-0-691-12034-8 .