Jump to content

Сопоставление оценок склонности

(Перенаправлено из показателя склонности )

При статистическом анализе наблюдений данных сопоставление показателей склонности ( PSM ) представляет собой метод статистического сопоставления , который пытается оценить эффект лечения, политики или другого вмешательства путем учета ковариат , которые предсказывают получение лечения. PSM пытается уменьшить систематическую ошибку из-за мешающих переменных, которые можно обнаружить при оценке эффекта лечения, полученной путем простого сравнения результатов среди единиц , получивших лечение, с теми, которые этого не сделали . Пол Р. Розенбаум и Дональд Рубин представили эту технику в 1983 году. [1]

Возможность систематической ошибки возникает потому, что разница в результатах лечения (например, средний эффект лечения ) между группами, получавшими и не получавшими лечение, может быть вызвана фактором, который предсказывает лечение, а не само лечение. В рандомизированных экспериментах рандомизация позволяет объективно оценить эффект лечения; Для каждой ковариаты рандомизация подразумевает, что группы лечения в среднем будут сбалансированы по закону больших чисел . К сожалению, в обсервационных исследованиях назначение лечения субъектам исследования обычно не является случайным. Сопоставление представляет собой попытку уменьшить систематическую ошибку назначения лечения и имитировать рандомизацию путем создания выборки единиц, получивших лечение, сопоставимой по всем наблюдаемым ковариатам с выборкой единиц, не получавших лечения.

«Склонность» описывает, насколько вероятно, что единица будет обработана, учитывая ее ковариатные значения. Чем сильнее смешиваются лечение и ковариаты и, следовательно, чем сильнее смещение при анализе эффекта наивного лечения, тем лучше ковариаты предсказывают, будет ли единица лечиться или нет. Наличие подразделений с одинаковыми показателями склонности как в группе лечения, так и в контроле позволяет уменьшить такое смешение.

Например, кому-то может быть интересно узнать о последствиях курения . Необходимо обсервационное исследование, поскольку неэтично случайным образом назначать людей на лечение «курением». Эффект лечения, оцениваемый путем простого сравнения тех, кто курил, с теми, кто не курил, будет зависеть от любых факторов, предсказывающих курение (например, пола и возраста). PSM пытается контролировать эти предубеждения, сравнивая группы, получавшие и не получавшие лечение, по контрольным переменным.

PSM предназначен для случаев причинно-следственных выводов и искажающей систематической ошибки в неэкспериментальных условиях, когда: (i) несколько единиц в группе сравнения, не получающей лечения, сопоставимы с лечебными единицами; и (ii) выбор подмножества единиц сравнения, аналогичных единице лечения, затруднен, поскольку единицы необходимо сравнивать по многомерному набору характеристик предварительной обработки. [ нужна ссылка ]

При нормальном сопоставлении сопоставляются отдельные характеристики, отличающие экспериментальную и контрольную группы, в попытке сделать группы более похожими. Но если эти две группы не имеют существенного совпадения, то существенная ошибка может возникнуть . Например, если только худшие случаи из нелеченой «группы сравнения» сравнивать с только лучшими случаями из группы лечения , результатом может быть регрессия к среднему значению , что может заставить группу сравнения выглядеть лучше или хуже, чем на самом деле. [ нужна ссылка ]

PSM использует прогнозируемую вероятность членства в группе (например, группа лечения по сравнению с контрольной группой) на основе наблюдаемых предикторов, обычно получаемых с помощью логистической регрессии, для создания контрфактической группы . Оценки склонности могут использоваться для сопоставления или в качестве ковариат , отдельно или вместе с другими совпадающими переменными или ковариатами.

Общая процедура

[ редактировать ]

1. Оцените показатели склонности, например, с помощью логистической регрессии :

  • Зависимая переменная: Z = 1, если единица участвовала (т. е. является членом лечебной группы); Z = 0, если объект не участвовал (т.е. является членом контрольной группы).
  • Выберите подходящие искажающие факторы (переменные, предположительно связанные как с лечением, так и с результатом)
  • Получите оценку показателя склонности: прогнозируемую вероятность p или логарифм шансов, log[ p /(1 − p )].

2. Сопоставьте каждого участника с одним или несколькими неучастниками по показателю склонности, используя один из следующих методов:

  • Соответствие ближайшего соседа
  • Оптимальное полное соответствие: сопоставьте каждого участника с уникальным(и) неучастником(ами), чтобы минимизировать общее расстояние в показателях склонности между участниками и соответствующими им неучастниками. Этот метод можно комбинировать с другими методами сопоставления.
  • Сопоставление с помощью каверномера: сравниваются единицы сравнения в пределах определенной ширины показателя склонности обработанных единиц, при этом ширина обычно составляет долю стандартного отклонения показателя склонности.
  • Сопоставление радиуса: используются все совпадения в пределах определенного радиуса и повторно используются между лечебными установками.
  • Сопоставление ядра : то же, что и сопоставление радиуса, за исключением того, что контрольные наблюдения взвешиваются как функция расстояния между показателем склонности наблюдения к лечению и показателем склонности к контрольному совпадению. Одним из примеров является ядро ​​Епанечникова. Сопоставление радиусов — это особый случай, когда используется однородное ядро.

3. Убедитесь, что ковариаты сбалансированы в группах лечения и сравнения в слоях оценки склонности.

  • Используйте стандартизированные различия или графики для изучения распределений.
  • Если ковариаты не сбалансированы, вернитесь к шагам 1 или 2 и измените процедуру.

4. Оцените эффекты на основе новой выборки.

  • Обычно: средневзвешенное среднее значение различий в результатах между участниками и неучастниками в пределах матча.
  • Используйте анализы, подходящие для ненезависимых совпадающих образцов, если каждому участнику соответствует более одного неучастника.

Формальные определения

[ редактировать ]

Основные настройки

[ редактировать ]

Основной случай [1] состоит из двух процедур (с номерами 1 и 0) с N независимыми и одинаково распределенными случайными величинами . Каждый субъект, я бы отреагировал на лечение которого и для контроля с . Величина, которую необходимо оценить, представляет собой средний эффект лечения : . Переменная указывает, прошел ли субъект лечение ( ) или контроль ( ). Позволять быть вектором наблюдаемых измерений до лечения (или ковариат) для i- го субъекта. Наблюдения производятся до назначения лечения, но особенности в не могут включать все (или какие-либо) из тех, которые использовались для принятия решения о назначении лечения. нумерация единиц (т. е.: i = 1, ..., N ) не содержит никакой информации, кроме той, которая содержится в Предполагается, что . В следующих разделах индекс i будет опущен , но при этом будет обсуждаться стохастическое поведение некоторых субъектов.

Категорически игнорируемое назначение лечения

[ редактировать ]

Пусть некоторый субъект имеет вектор ковариат X (т. е.: условно несмешанный) и некоторые потенциальные результаты r 0 и r 1 под контролем и лечением соответственно. Говорят, что назначение лечения строго игнорируется, потенциальные результаты не зависят от лечения ( Z ) при условии, что фоновые переменные X. если Это можно компактно записать как

где означает статистическую независимость . [1]

Балансирующий балл

[ редактировать ]

Балансирующий балл b ( X ) является функцией наблюдаемых ковариат X, так что условное распределение X при условии b ( X ) одинаково для обработанных ( Z = 1) и контрольных ( Z = 0) единиц:

Самая тривиальная функция: .

Оценка склонности

[ редактировать ]

Показатель склонности – это вероятность того, что единице (например, человеку, классу, школе) будет присвоено конкретное лечение с учетом набора наблюдаемых ковариат. Оценки склонности используются для уменьшения путаницы путем приравнивания групп на основе этих ковариат.

бинарного лечения что у нас есть индикатор Z , переменная ответа r и фоновые наблюдаемые ковариаты X. Предположим , Показатель склонности определяется как условная вероятность лечения с учетом фоновых переменных:

В контексте причинно-следственных выводов и методологии опроса оценки склонности оцениваются (с помощью таких методов, как логистическая регрессия , случайный лес и другие), с использованием некоторого набора ковариат. Эти оценки склонности затем используются в качестве оценок весов, которые будут использоваться с методами взвешивания обратной вероятности .

Основные теоремы

[ редактировать ]

Следующие утверждения были впервые представлены и доказаны Розенбаумом и Рубином в 1983 году: [1]

  • Оценка склонности является балансирующим показателем.
  • Любой показатель, который «более точный», чем показатель склонности, является балансирующим показателем (т.е.: для некоторой функции f ). Оценка склонности является самой грубой балансирующей функцией оценки, поскольку она берет (возможно) многомерный объект ( X i ) и преобразует его в одно измерение (хотя другие, очевидно, тоже существуют), в то время как является лучшим.
  • Если назначение лечения категорически игнорируется при наличии X , то:
  • Это также категорически нельзя игнорировать, учитывая любую балансирующую функцию. В частности, учитывая оценку склонности:
  • Для любого значения балансирующего показателя разница между средствами обработки и контроля имеющихся образцов (т. е.: ), основанный на субъектах, имеющих одинаковое значение балансирующего балла, может служить несмещенной оценкой среднего эффекта лечения : .
  • Использование выборочных оценок балансовых показателей может дать выборочный баланс по X.

Отношение к достаточности

[ редактировать ]

Если мы думаем о значении Z как о параметре совокупности, влияющем на распределение , тогда показатель балансировки служит достаточной статистикой для Z. X Более того, приведенные выше теоремы показывают, что показатель склонности является минимальной достаточной статистикой, если рассматривать Z как параметр X . Наконец, если назначение лечения Z категорически игнорируется при условии X , то показатель склонности является минимальной достаточной статистикой для совместного распределения .

Графический тест на обнаружение присутствия мешающих переменных

[ редактировать ]

Джудея Перл показала, что существует простой графический тест, называемый критерием «черной двери», который обнаруживает наличие мешающих переменных. Чтобы оценить эффект лечения, фоновые переменные X должны блокировать все лазейки в графе. Эту блокировку можно выполнить либо путем добавления искажающей переменной в качестве элемента управления регрессией, либо путем сопоставления искажающей переменной. [2]

Недостатки

[ редактировать ]

Было показано, что PSM увеличивает «дисбаланс, неэффективность, зависимость модели и предвзятость», чего нельзя сказать о большинстве других методов сопоставления. [3] Идеи, лежащие в основе использования сопоставления, все еще актуальны, но их следует применять с другими методами сопоставления; Показатели склонности также имеют другое продуктивное применение при взвешивании и вдвойне надежной оценке.

Как и другие процедуры сопоставления, PSM оценивает средний эффект лечения на основе данных наблюдений. Ключевые преимущества PSM на момент его внедрения заключались в том, что, используя линейную комбинацию ковариат для одного балла, он уравновешивает группу лечения и контрольную группу по большому количеству ковариат, не теряя при этом большого количества наблюдений. Если бы единицы лечения и контроля были сбалансированы по большому числу ковариат по одной за раз, потребовалось бы большое количество наблюдений для преодоления « проблемы размерности », в результате чего введение новой балансирующей ковариаты увеличивает минимально необходимое количество наблюдений в группе лечения и контроля. образец геометрически .

Одним из недостатков PSM является то, что он учитывает только наблюдаемые (и наблюдаемые) ковариаты, а не скрытые характеристики. Факторы, которые влияют на назначение лечения и результат, но которые невозможно наблюдать, не могут быть учтены в процедуре сопоставления. [4] Поскольку процедура контролирует только наблюдаемые переменные, любая скрытая погрешность, вызванная скрытыми переменными, может остаться после сопоставления. [5] Другая проблема заключается в том, что PSM требует больших выборок со значительным перекрытием между экспериментальной и контрольной группами.

Общие опасения по поводу сопоставления также были подняты Джудеей Перлом , который утверждал, что скрытая предвзятость может на самом деле усилиться, поскольку сопоставление наблюдаемых переменных может вызвать предвзятость из-за дремлющих ненаблюдаемых искажающих факторов. Точно так же Перл утверждал, что снижение предвзятости можно гарантировать только (асимптотически) путем моделирования качественных причинно-следственных связей между лечением, результатом, наблюдаемыми и ненаблюдаемыми ковариатами. [6] Смешение происходит, когда экспериментатор не может контролировать альтернативные, непричинные объяснения наблюдаемой взаимосвязи между независимыми и зависимыми переменными. Такой контроль должен удовлетворять « критерию бэкдора » Перла. [2]

Реализации в пакетах статистики

[ редактировать ]
  • R : сопоставление показателей склонности доступно как часть MatchIt, [7] [8] optmatch, [9] или другие пакеты.
  • SAS : процедура PSMatch и макрос. OneToManyMTCH сопоставлять наблюдения на основе оценки склонности. [10]
  • Stata : несколько команд реализуют сопоставление оценок склонности, [11] включая написанные пользователем psmatch2. [12] Stata версии 13 и более поздних также предлагает встроенную команду teffects psmatch. [13]
  • SPSS : диалоговое окно для сопоставления показателей склонности доступно в меню IBM SPSS Статистика (Сопоставление показателей данных/склонности) и позволяет пользователю устанавливать допуск на совпадение, рандомизировать порядок регистров при составлении выборок, устанавливать приоритет точных совпадений, выбирать образцы с или без них. замену, установите случайное начальное число и максимизируйте производительность за счет увеличения скорости обработки и минимизации использования памяти.
  • Питон : PsmPy, библиотека для сопоставления показателей склонности в Python

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б с д Розенбаум, Пол Р.; Рубин, Дональд Б. (1983). «Центральная роль показателя склонности в наблюдательных исследованиях причинных эффектов» . Биометрика . 70 (1): 41–55. дои : 10.1093/biomet/70.1.41 .
  2. ^ Перейти обратно: а б Перл, Дж. (2000). Причинность: модели, рассуждения и выводы . Нью-Йорк: Издательство Кембриджского университета. ISBN  978-0-521-77362-1 .
  3. ^ Кинг, Гэри; Нильсен, Ричард (07 мая 2019 г.). «Почему показатели склонности не следует использовать для сопоставления» . Политический анализ . 27 (4): 435–454. дои : 10.1017/pan.2019.11 . hdl : 1721.1/128459 . ISSN   1047-1987 . | ссылка на полную статью (с домашней страницы автора)
  4. ^ Гарридо М.М. и др. (2014). «Методы построения и оценки показателей склонности» . Исследования служб здравоохранения . 49 (5): 1701–20. дои : 10.1111/1475-6773.12182 . ПМК   4213057 . ПМИД   24779867 .
  5. ^ Шадиш, WR; Кук, Т.Д.; Кэмпбелл, DT (2002). Экспериментальные и квазиэкспериментальные планы обобщенного причинного вывода . Бостон: Хоутон Миффлин. ISBN  978-0-395-61556-0 .
  6. ^ Перл, Дж. (2009). «Понимание оценок склонности». Причинность: модели, рассуждения и выводы (второе изд.). Нью-Йорк: Издательство Кембриджского университета. ISBN  978-0-521-89560-6 .
  7. ^ Хо, Дэниел; Имаи, Косукэ; Кинг, Гэри ; Стюарт, Элизабет (2007). «Сопоставление как непараметрическая предварительная обработка для уменьшения зависимости модели при параметрическом причинном выводе» . Политический анализ . 15 (3): 199–236. дои : 10.1093/pan/mpl013 .
  8. ^ «MatchIt: непараметрическая предварительная обработка для параметрического причинного вывода» . Р-проект . 16 ноября 2022 г.
  9. ^ Хансен, Бен Б; Клопфер, Стефани Олсен (2006). «Оптимальное полное соответствие и связанные конструкции с помощью сетевых потоков». Журнал вычислительной и графической статистики . 15 (3). Информа UK Limited: 609–627. дои : 10.1198/106186006x137047 . ISSN   1061-8600 . S2CID   10138048 .
  10. ^ Парсонс, Лори. «Выполнение сопоставления случай-контроль 1:N по показателю склонности» (PDF) . СУГИ 29: Институт САС . Проверено 10 июня 2016 г. {{cite web}}: CS1 maint: местоположение ( ссылка )
  11. ^ Реализация оценщиков сопоставления показателей склонности с помощью STATA . Конспекты лекций 2001 г.
  12. ^ Левен, Э.; Сианези, Б. (2003). «PSMATCH2: Модуль статистики для выполнения полного сопоставления показателей Махаланобиса и склонности, построения общих графиков поддержки и тестирования ковариатного дисбаланса» . Компоненты статистического программного обеспечения .
  13. ^ «teffects psmatch — Сопоставление показателей склонности» (PDF) . Руководство по Стате .

Библиография

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 17a6b267349dd1aaa7daf53cccc8eff9__1704332520
URL1:https://arc.ask3.ru/arc/aa/17/f9/17a6b267349dd1aaa7daf53cccc8eff9.html
Заголовок, (Title) документа по адресу, URL1:
Propensity score matching - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)