Сопоставление оценок склонности
При статистическом анализе наблюдений данных сопоставление показателей склонности ( PSM ) представляет собой метод статистического сопоставления , который пытается оценить эффект лечения, политики или другого вмешательства путем учета ковариат , которые предсказывают получение лечения. PSM пытается уменьшить систематическую ошибку из-за мешающих переменных, которые можно обнаружить при оценке эффекта лечения, полученной путем простого сравнения результатов среди единиц , получивших лечение, с теми, которые этого не сделали . Пол Р. Розенбаум и Дональд Рубин представили эту технику в 1983 году. [1]
Возможность систематической ошибки возникает потому, что разница в результатах лечения (например, средний эффект лечения ) между группами, получавшими и не получавшими лечение, может быть вызвана фактором, который предсказывает лечение, а не само лечение. В рандомизированных экспериментах рандомизация позволяет объективно оценить эффект лечения; Для каждой ковариаты рандомизация подразумевает, что группы лечения в среднем будут сбалансированы по закону больших чисел . К сожалению, в обсервационных исследованиях назначение лечения субъектам исследования обычно не является случайным. Сопоставление представляет собой попытку уменьшить систематическую ошибку назначения лечения и имитировать рандомизацию путем создания выборки единиц, получивших лечение, сопоставимой по всем наблюдаемым ковариатам с выборкой единиц, не получавших лечения.
«Склонность» описывает, насколько вероятно, что единица будет обработана, учитывая ее ковариатные значения. Чем сильнее смешиваются лечение и ковариаты и, следовательно, чем сильнее смещение при анализе эффекта наивного лечения, тем лучше ковариаты предсказывают, будет ли единица лечиться или нет. Наличие подразделений с одинаковыми показателями склонности как в группе лечения, так и в контроле позволяет уменьшить такое смешение.
Например, кому-то может быть интересно узнать о последствиях курения . Необходимо обсервационное исследование, поскольку неэтично случайным образом назначать людей на лечение «курением». Эффект лечения, оцениваемый путем простого сравнения тех, кто курил, с теми, кто не курил, будет зависеть от любых факторов, предсказывающих курение (например, пола и возраста). PSM пытается контролировать эти предубеждения, сравнивая группы, получавшие и не получавшие лечение, по контрольным переменным.
Обзор
[ редактировать ]PSM предназначен для случаев причинно-следственных выводов и искажающей систематической ошибки в неэкспериментальных условиях, когда: (i) несколько единиц в группе сравнения, не получающей лечения, сопоставимы с лечебными единицами; и (ii) выбор подмножества единиц сравнения, аналогичных единице лечения, затруднен, поскольку единицы необходимо сравнивать по многомерному набору характеристик предварительной обработки. [ нужна ссылка ]
При нормальном сопоставлении сопоставляются отдельные характеристики, отличающие экспериментальную и контрольную группы, в попытке сделать группы более похожими. Но если эти две группы не имеют существенного совпадения, то существенная ошибка может возникнуть . Например, если только худшие случаи из нелеченой «группы сравнения» сравнивать с только лучшими случаями из группы лечения , результатом может быть регрессия к среднему значению , что может заставить группу сравнения выглядеть лучше или хуже, чем на самом деле. [ нужна ссылка ]
PSM использует прогнозируемую вероятность членства в группе (например, группа лечения по сравнению с контрольной группой) на основе наблюдаемых предикторов, обычно получаемых с помощью логистической регрессии, для создания контрфактической группы . Оценки склонности могут использоваться для сопоставления или в качестве ковариат , отдельно или вместе с другими совпадающими переменными или ковариатами.
Общая процедура
[ редактировать ]1. Оцените показатели склонности, например, с помощью логистической регрессии :
- Зависимая переменная: Z = 1, если единица участвовала (т. е. является членом лечебной группы); Z = 0, если объект не участвовал (т.е. является членом контрольной группы).
- Выберите подходящие искажающие факторы (переменные, предположительно связанные как с лечением, так и с результатом)
- Получите оценку показателя склонности: прогнозируемую вероятность p или логарифм шансов, log[ p /(1 − p )].
2. Сопоставьте каждого участника с одним или несколькими неучастниками по показателю склонности, используя один из следующих методов:
- Соответствие ближайшего соседа
- Оптимальное полное соответствие: сопоставьте каждого участника с уникальным(и) неучастником(ами), чтобы минимизировать общее расстояние в показателях склонности между участниками и соответствующими им неучастниками. Этот метод можно комбинировать с другими методами сопоставления.
- Сопоставление с помощью каверномера: сравниваются единицы сравнения в пределах определенной ширины показателя склонности обработанных единиц, при этом ширина обычно составляет долю стандартного отклонения показателя склонности.
- Сопоставление радиуса: используются все совпадения в пределах определенного радиуса и повторно используются между лечебными установками.
- Сопоставление ядра : то же, что и сопоставление радиуса, за исключением того, что контрольные наблюдения взвешиваются как функция расстояния между показателем склонности наблюдения к лечению и показателем склонности к контрольному совпадению. Одним из примеров является ядро Епанечникова. Сопоставление радиусов — это особый случай, когда используется однородное ядро.
- Сопоставление метрики Махаланобиса в сочетании с PSM
- Стратификационное сопоставление
- Сопоставление различий в различиях (ядерные и локальные линейные веса)
- Точное соответствие
3. Убедитесь, что ковариаты сбалансированы в группах лечения и сравнения в слоях оценки склонности.
- Используйте стандартизированные различия или графики для изучения распределений.
- Если ковариаты не сбалансированы, вернитесь к шагам 1 или 2 и измените процедуру.
4. Оцените эффекты на основе новой выборки.
- Обычно: средневзвешенное среднее значение различий в результатах между участниками и неучастниками в пределах матча.
- Используйте анализы, подходящие для ненезависимых совпадающих образцов, если каждому участнику соответствует более одного неучастника.
Формальные определения
[ редактировать ]Основные настройки
[ редактировать ]Основной случай [1] состоит из двух процедур (с номерами 1 и 0) с N независимыми и одинаково распределенными случайными величинами . Каждый субъект, я бы отреагировал на лечение которого и для контроля с . Величина, которую необходимо оценить, представляет собой средний эффект лечения : . Переменная указывает, прошел ли субъект лечение ( ) или контроль ( ). Позволять быть вектором наблюдаемых измерений до лечения (или ковариат) для i- го субъекта. Наблюдения производятся до назначения лечения, но особенности в не могут включать все (или какие-либо) из тех, которые использовались для принятия решения о назначении лечения. нумерация единиц (т. е.: i = 1, ..., N ) не содержит никакой информации, кроме той, которая содержится в Предполагается, что . В следующих разделах индекс i будет опущен , но при этом будет обсуждаться стохастическое поведение некоторых субъектов.
Категорически игнорируемое назначение лечения
[ редактировать ]Пусть некоторый субъект имеет вектор ковариат X (т. е.: условно несмешанный) и некоторые потенциальные результаты r 0 и r 1 под контролем и лечением соответственно. Говорят, что назначение лечения строго игнорируется, потенциальные результаты не зависят от лечения ( Z ) при условии, что фоновые переменные X. если Это можно компактно записать как
где означает статистическую независимость . [1]
Балансирующий балл
[ редактировать ]Балансирующий балл b ( X ) является функцией наблюдаемых ковариат X, так что условное распределение X при условии b ( X ) одинаково для обработанных ( Z = 1) и контрольных ( Z = 0) единиц:
Самая тривиальная функция: .
Оценка склонности
[ редактировать ]Показатель склонности – это вероятность того, что единице (например, человеку, классу, школе) будет присвоено конкретное лечение с учетом набора наблюдаемых ковариат. Оценки склонности используются для уменьшения путаницы путем приравнивания групп на основе этих ковариат.
бинарного лечения что у нас есть индикатор Z , переменная ответа r и фоновые наблюдаемые ковариаты X. Предположим , Показатель склонности определяется как условная вероятность лечения с учетом фоновых переменных:
В контексте причинно-следственных выводов и методологии опроса оценки склонности оцениваются (с помощью таких методов, как логистическая регрессия , случайный лес и другие), с использованием некоторого набора ковариат. Эти оценки склонности затем используются в качестве оценок весов, которые будут использоваться с методами взвешивания обратной вероятности .
Основные теоремы
[ редактировать ]Следующие утверждения были впервые представлены и доказаны Розенбаумом и Рубином в 1983 году: [1]
- Оценка склонности является балансирующим показателем.
- Любой показатель, который «более точный», чем показатель склонности, является балансирующим показателем (т.е.: для некоторой функции f ). Оценка склонности является самой грубой балансирующей функцией оценки, поскольку она берет (возможно) многомерный объект ( X i ) и преобразует его в одно измерение (хотя другие, очевидно, тоже существуют), в то время как является лучшим.
- Если назначение лечения категорически игнорируется при наличии X , то:
- Это также категорически нельзя игнорировать, учитывая любую балансирующую функцию. В частности, учитывая оценку склонности:
- Для любого значения балансирующего показателя разница между средствами обработки и контроля имеющихся образцов (т. е.: ), основанный на субъектах, имеющих одинаковое значение балансирующего балла, может служить несмещенной оценкой среднего эффекта лечения : .
- Использование выборочных оценок балансовых показателей может дать выборочный баланс по X.
Отношение к достаточности
[ редактировать ]Если мы думаем о значении Z как о параметре совокупности, влияющем на распределение , тогда показатель балансировки служит достаточной статистикой для Z. X Более того, приведенные выше теоремы показывают, что показатель склонности является минимальной достаточной статистикой, если рассматривать Z как параметр X . Наконец, если назначение лечения Z категорически игнорируется при условии X , то показатель склонности является минимальной достаточной статистикой для совместного распределения .
Графический тест на обнаружение присутствия мешающих переменных
[ редактировать ]Джудея Перл показала, что существует простой графический тест, называемый критерием «черной двери», который обнаруживает наличие мешающих переменных. Чтобы оценить эффект лечения, фоновые переменные X должны блокировать все лазейки в графе. Эту блокировку можно выполнить либо путем добавления искажающей переменной в качестве элемента управления регрессией, либо путем сопоставления искажающей переменной. [2]
Недостатки
[ редактировать ]Было показано, что PSM увеличивает «дисбаланс, неэффективность, зависимость модели и предвзятость», чего нельзя сказать о большинстве других методов сопоставления. [3] Идеи, лежащие в основе использования сопоставления, все еще актуальны, но их следует применять с другими методами сопоставления; Показатели склонности также имеют другое продуктивное применение при взвешивании и вдвойне надежной оценке.
Как и другие процедуры сопоставления, PSM оценивает средний эффект лечения на основе данных наблюдений. Ключевые преимущества PSM на момент его внедрения заключались в том, что, используя линейную комбинацию ковариат для одного балла, он уравновешивает группу лечения и контрольную группу по большому количеству ковариат, не теряя при этом большого количества наблюдений. Если бы единицы лечения и контроля были сбалансированы по большому числу ковариат по одной за раз, потребовалось бы большое количество наблюдений для преодоления « проблемы размерности », в результате чего введение новой балансирующей ковариаты увеличивает минимально необходимое количество наблюдений в группе лечения и контроля. образец геометрически .
Одним из недостатков PSM является то, что он учитывает только наблюдаемые (и наблюдаемые) ковариаты, а не скрытые характеристики. Факторы, которые влияют на назначение лечения и результат, но которые невозможно наблюдать, не могут быть учтены в процедуре сопоставления. [4] Поскольку процедура контролирует только наблюдаемые переменные, любая скрытая погрешность, вызванная скрытыми переменными, может остаться после сопоставления. [5] Другая проблема заключается в том, что PSM требует больших выборок со значительным перекрытием между экспериментальной и контрольной группами.
Общие опасения по поводу сопоставления также были подняты Джудеей Перлом , который утверждал, что скрытая предвзятость может на самом деле усилиться, поскольку сопоставление наблюдаемых переменных может вызвать предвзятость из-за дремлющих ненаблюдаемых искажающих факторов. Точно так же Перл утверждал, что снижение предвзятости можно гарантировать только (асимптотически) путем моделирования качественных причинно-следственных связей между лечением, результатом, наблюдаемыми и ненаблюдаемыми ковариатами. [6] Смешение происходит, когда экспериментатор не может контролировать альтернативные, непричинные объяснения наблюдаемой взаимосвязи между независимыми и зависимыми переменными. Такой контроль должен удовлетворять « критерию бэкдора » Перла. [2]
Реализации в пакетах статистики
[ редактировать ]- R : сопоставление показателей склонности доступно как часть
MatchIt
, [7] [8]optmatch
, [9] или другие пакеты. - SAS : процедура PSMatch и макрос.
OneToManyMTCH
сопоставлять наблюдения на основе оценки склонности. [10] - Stata : несколько команд реализуют сопоставление оценок склонности, [11] включая написанные пользователем
psmatch2
. [12] Stata версии 13 и более поздних также предлагает встроенную командуteffects psmatch
. [13] - SPSS : диалоговое окно для сопоставления показателей склонности доступно в меню IBM SPSS Статистика (Сопоставление показателей данных/склонности) и позволяет пользователю устанавливать допуск на совпадение, рандомизировать порядок регистров при составлении выборок, устанавливать приоритет точных совпадений, выбирать образцы с или без них. замену, установите случайное начальное число и максимизируйте производительность за счет увеличения скорости обработки и минимизации использования памяти.
- Питон :
PsmPy
, библиотека для сопоставления показателей склонности в Python
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б с д Розенбаум, Пол Р.; Рубин, Дональд Б. (1983). «Центральная роль показателя склонности в наблюдательных исследованиях причинных эффектов» . Биометрика . 70 (1): 41–55. дои : 10.1093/biomet/70.1.41 .
- ^ Перейти обратно: а б Перл, Дж. (2000). Причинность: модели, рассуждения и выводы . Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-77362-1 .
- ^ Кинг, Гэри; Нильсен, Ричард (07 мая 2019 г.). «Почему показатели склонности не следует использовать для сопоставления» . Политический анализ . 27 (4): 435–454. дои : 10.1017/pan.2019.11 . hdl : 1721.1/128459 . ISSN 1047-1987 . | ссылка на полную статью (с домашней страницы автора)
- ^ Гарридо М.М. и др. (2014). «Методы построения и оценки показателей склонности» . Исследования служб здравоохранения . 49 (5): 1701–20. дои : 10.1111/1475-6773.12182 . ПМК 4213057 . ПМИД 24779867 .
- ^ Шадиш, WR; Кук, Т.Д.; Кэмпбелл, DT (2002). Экспериментальные и квазиэкспериментальные планы обобщенного причинного вывода . Бостон: Хоутон Миффлин. ISBN 978-0-395-61556-0 .
- ^ Перл, Дж. (2009). «Понимание оценок склонности». Причинность: модели, рассуждения и выводы (второе изд.). Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-89560-6 .
- ^ Хо, Дэниел; Имаи, Косукэ; Кинг, Гэри ; Стюарт, Элизабет (2007). «Сопоставление как непараметрическая предварительная обработка для уменьшения зависимости модели при параметрическом причинном выводе» . Политический анализ . 15 (3): 199–236. дои : 10.1093/pan/mpl013 .
- ^ «MatchIt: непараметрическая предварительная обработка для параметрического причинного вывода» . Р-проект . 16 ноября 2022 г.
- ^ Хансен, Бен Б; Клопфер, Стефани Олсен (2006). «Оптимальное полное соответствие и связанные конструкции с помощью сетевых потоков». Журнал вычислительной и графической статистики . 15 (3). Информа UK Limited: 609–627. дои : 10.1198/106186006x137047 . ISSN 1061-8600 . S2CID 10138048 .
- ^ Парсонс, Лори. «Выполнение сопоставления случай-контроль 1:N по показателю склонности» (PDF) . СУГИ 29: Институт САС . Проверено 10 июня 2016 г.
{{cite web}}
: CS1 maint: местоположение ( ссылка ) - ^ Реализация оценщиков сопоставления показателей склонности с помощью STATA . Конспекты лекций 2001 г.
- ^ Левен, Э.; Сианези, Б. (2003). «PSMATCH2: Модуль статистики для выполнения полного сопоставления показателей Махаланобиса и склонности, построения общих графиков поддержки и тестирования ковариатного дисбаланса» . Компоненты статистического программного обеспечения .
- ^ «teffects psmatch — Сопоставление показателей склонности» (PDF) . Руководство по Стате .
Библиография
[ редактировать ]- Абади, Альберто ; Имбенс, Гвидо В. (2006). «Большие выборочные свойства совпадающих оценок среднего эффекта лечения». Эконометрика . 74 (1): 235–267. CiteSeerX 10.1.1.559.6313 . дои : 10.1111/j.1468-0262.2006.00655.x .
- Лейте, Уолтер Л. (2017). Методы оценки практической склонности с использованием R. Вашингтон, округ Колумбия: Публикации Sage. ISBN 978-1-4522-8888-8 .
- Остин, Питер К. (31 мая 2011 г.). «Введение в методы оценки склонности для уменьшения влияния искажающих факторов в наблюдательных исследованиях» . Многомерное поведенческое исследование . 46 (3): 399–424. дои : 10.1080/00273171.2011.568786 . ПМК 3144483 . ПМИД 21818162 .