Взвешивание обратной вероятности
Взвешивание обратной вероятности — это статистический метод оценки величин, относящихся к совокупности, отличной от той, из которой были собраны данные. Часто применяются дизайны исследований с несопоставимой совокупностью выборки и совокупностью целевого вывода (целевой совокупностью). [1] Могут существовать факторы, препятствующие исследователям напрямую брать образцы из целевой популяции, такие как стоимость, время или этические соображения. [2] Решением этой проблемы является использование альтернативной стратегии проектирования, например, стратифицированной выборки . Правильное применение взвешивания потенциально может повысить эффективность и уменьшить погрешность невзвешенных оценок.
Одной из самых первых взвешенных оценок является Хорвица – Томпсона . оценка среднего значения [3] Когда известна вероятность выборки , на основе которой формируется выборочная совокупность из целевой совокупности, то для взвешивания наблюдений используется обратная величина этой вероятности. Этот подход был распространен на многие аспекты статистики в различных рамках. В частности, существуют взвешенные вероятности , взвешенные оценочные уравнения и взвешенные плотности вероятности, на основе которых выводится большая часть статистики. Эти приложения систематизировали теорию других статистических данных и оценок, таких как предельные структурные модели , стандартизированный коэффициент смертности и алгоритм EM для огрубленных или агрегированных данных.
Взвешивание обратной вероятности также используется для учета недостающих данных, когда субъекты с недостающими данными не могут быть включены в первичный анализ. [4] При оценке вероятности выборки или вероятности того, что фактор будет измерен в другом измерении, взвешивание обратной вероятности может использоваться для завышения веса субъектов, которые недостаточно представлены из-за значительной степени отсутствия данных .
Взвешенная оценка обратной вероятности (IPWE)
[ редактировать ]Оценщик взвешивания обратной вероятности может использоваться для демонстрации причинно-следственной связи, когда исследователь не может провести контролируемый эксперимент, но имеет данные для моделирования. Поскольку предполагается, что лечение назначается не случайно, цель состоит в том, чтобы оценить контрфактический или потенциальный результат, если всем субъектам в популяции будет назначен тот или иной вид лечения.
Предположим, что наблюдаемые данные взятый iid (независимый и одинаково распределенный) из неизвестного распределения P, где
- ковариаты
- два возможных метода лечения.
- ответ
- Мы не предполагаем, что лечение назначается случайным образом.
Цель состоит в том, чтобы оценить потенциальный результат, , что наблюдалось бы, если бы субъекту было назначено лечение . Затем сравните средний результат, если всем пациентам в популяции было назначено любое лечение: . Мы хотим оценить используя данные наблюдений .
Формула оценки
[ редактировать ]Создание IPWE
[ редактировать ]- где
- построить или использование любой модели склонности (часто модели логистической регрессии)
После расчета среднего значения каждой группы лечения можно использовать статистический t-критерий или тест ANOVA для оценки разницы между средними значениями групп и определения статистической значимости эффекта лечения.
Предположения
[ редактировать ]Напомним совместную вероятностную модель для ковариаты , действие и ответ . Если и известны как и , соответственно, то ответ имеет распределение
Мы делаем следующие предположения.
- ( А1 ) Консистенция:
- ( A2 ) Никаких неизмеренных помех: . Более формально, для каждой ограниченной и измеримой функции и , Это означает, что назначение лечения основано исключительно на ковариатных данных и не зависит от потенциальных результатов.
- ( A3 ) Позитивность: для всех и .
Формальный вывод
[ редактировать ]В предположениях ( A1 )-( A3 ) выведем следующие тождества
Первое равенство следует из определения и ( A1 ). Для второго равенства сначала используйте итерированное ожидание, чтобы записать
По ( А3 ), почти наверняка. Затем, используя ( A2 ), обратите внимание, что
Следовательно, интегрируя последнее выражение относительно и отмечая, что почти наверняка второе равенство в следует.
Уменьшение дисперсии
[ редактировать ]Известно, что взвешенная оценка обратной вероятности (IPWE) нестабильна, если некоторые оцененные склонности слишком близки к 0 или 1. В таких случаях в IPWE доминирует небольшое количество субъектов с большими весами. Однако недавно разработанные сглаженные оценки IPW с использованием Rao-Blackwellization уменьшают дисперсию IPWE до 7 раз, а также могут защитить расширенную оценку, взвешенную по обратной вероятности, от неправильной спецификации модели. [5]
Дополненная обратная вероятностно-взвешенная оценка (AIPWE)
[ редактировать ]Альтернативным оценщиком является расширенная обратная оценка, взвешенная по вероятности (AIPWE), которая сочетает в себе свойства оценщика на основе регрессии и оценки, взвешенной по обратной вероятности. Таким образом, это «вдвойне надежный» метод, поскольку он требует правильного указания только модели склонности или результата, но не того и другого. Этот метод дополняет IPWE, уменьшая изменчивость и повышая эффективность оценок. Эта модель содержит те же предположения, что и взвешенная оценка обратной вероятности (IPWE). [6]
Формула оценки
[ редактировать ]Со следующими обозначениями:
- является индикаторной функцией , если субъект i входит в лечебную группу a (или нет).
- Постройте оценщик регрессии предсказать результат на основе ковариат и лечение , по какому-то предмету i. Например, используя обычную регрессию наименьших квадратов .
- Постройте оценку склонности (вероятности) . Например, с помощью логистической регрессии .
- Объедините в AIPWE, чтобы получить
Интерпретация и «двойная надежность»
[ редактировать ]Последующая перестановка формулы помогает раскрыть основную идею: наша оценка основана на среднем прогнозируемом результате с использованием модели (т.е.: ). Однако, если модель смещена, то остатки модели не будут (в полной группе лечения а) около 0. Мы можем исправить это потенциальное смещение, добавив дополнительный член средних остатков модели (Q) из истинная ценность результата (Y) (т.е.: ). Поскольку у нас есть недостающие значения Y, мы даем веса, чтобы увеличить относительную важность каждого остатка (эти веса основаны на обратной склонности, или вероятности, наблюдения каждого субъекта) (см. стр. 10 в [7] ).
Преимущество «двойной устойчивости» такой оценки заключается в том, что достаточно правильно определить одну из двух моделей, чтобы оценка была несмещенной (либо или или и то, и другое). Это связано с тем, что если модель результата четко определена, ее остатки будут около 0 (независимо от весов, которые получит каждый остаток). А если модель смещена, но модель взвешивания четко определена, то смещение будет хорошо оценено (и скорректировано) с помощью средневзвешенных остатков. [7] [8] [9]
Смещение дважды робастных оценок называется смещением второго порядка и зависит от произведения разности и разница . Это свойство позволяет нам, имея «достаточно большой» размер выборки, снизить общую погрешность оценщиков с двойной надежностью за счет использования оценщиков машинного обучения (вместо параметрических моделей). [10]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Робинс, Дж. М.; Ротницкий, А ; Чжао, LP (1994). «Оценка коэффициентов регрессии при не всегда соблюдении некоторых регрессоров». Журнал Американской статистической ассоциации . 89 (427): 846–866. дои : 10.1080/01621459.1994.10476818 .
- ^ Бреслоу, Невада ; Ламли, Т; и др. (2009). «Использование всей когорты при анализе данных о когорте случаев» . Am J Epidemiol . 169 (11): 1398–1405. дои : 10.1093/aje/kwp055 . ПМЦ 2768499 . ПМИД 19357328 .
- ^ Хорвиц, Д.Г.; Томпсон, ди-джей (1952). «Обобщение выборки без замены из конечной вселенной». Журнал Американской статистической ассоциации . 47 (260): 663–685. дои : 10.1080/01621459.1952.10483446 .
- ^ Эрнан, Массачусетс; Робинс, Дж. М. (2006). «Оценка причинных последствий на основе эпидемиологических данных» . J Эпидемиологическое здоровье общества . 60 (7): 578–596. CiteSeerX 10.1.1.157.9366 . дои : 10.1136/jech.2004.029496 . ПМЦ 2652882 . ПМИД 16790829 .
- ^ Ляо, JG; Роде, К. (2022). «Уменьшение дисперсии в оценках, взвешенных по обратной вероятности, для среднего эффекта лечения с использованием показателя склонности». Биометрия . 78 (2): 660–667. дои : 10.1111/biom.13454 . ПМИД 33715153 . S2CID 232232367 .
- ^ Цао, Вэйхуа; Циатис, Анастасиос А.; Давидиан, Мари (2009). «Повышение эффективности и надежности вдвойне надежной оценки для среднего значения совокупности с неполными данными» . Биометрика . 96 (3): 723–734. дои : 10.1093/biomet/asp033 . ISSN 0006-3444 . ПМЦ 2798744 . ПМИД 20161511 .
- ^ Jump up to: а б Канг, Джозеф Д.И. и Джозеф Л. Шафер. «Демистификация двойной устойчивости: сравнение альтернативных стратегий оценки среднего значения населения на основе неполных данных». Статистическая наука 22.4 (2007): 523-539. ссылка на статью
- ^ Ким, Джэ Кван и Дэвид Хазиза. «Вдвойне надежный вывод с отсутствующими данными в выборке опроса». Статистика Синица 24.1 (2014): 375-394. ссылка на статью
- ^ Симэн, Шон Р. и Стейн Ванстиландт. «Введение в двойные надежные методы для неполных данных». Статистическая наука: обзорный журнал Института математической статистики 33.2 (2018): 184. ссылка на статью.
- ^ Эрнан, Мигель А. и Джеймс М. Робинс. «Причинно-следственный вывод». (2010): 2. ссылка на книгу - стр. 170.