Многоуровневая регрессия с постстратификацией
Часть серии на |
Регрессионный анализ |
---|
Модели |
Оценка |
Фон |
Многоуровневая регрессия с постстратификацией ( MRP ) представляет собой статистический метод, используемый для исправления модельных оценок для известных различий между популяцией выборки (популяция данных, которые есть из них), и целевой популяцией (популяция, которую нужно оценить).
Постократрификация . относится к процессу корректировки оценок, по сути, средневзвешенным оценкам из всех возможных комбинаций атрибутов (например, возраста и пола) Каждая комбинация иногда называется «ячейкой». Многоуровневая регрессия - это использование многоуровневой модели для сглаживания шумных оценок в ячейках с слишком небольшим количеством данных с использованием общих или близлежащих средних значений.
Одним из приложений является оценка предпочтений в субрегионах (например, штаты, отдельные избирательные округа) на основе данных обследования индивидуального уровня, собранных на других уровнях агрегации (например, национальные опросы). [ 1 ]
Математическая формулировка
[ редактировать ]Следуя описанию MRP модели [ 2 ] , предполагать представляет собой измерение единого результата и среднее значение населения , , является целевым параметром интереса. В основном населении, каждый человек, , принадлежит одному из Постератификационные клетки, характеризующиеся уникальным набором ковариат. Многоуровневая регрессия с моделью постстратификации включает в себя следующую пару шагов:
MRP Шаг 1 (многоуровневая регрессия) : многоуровневая регрессионная модель определяет линейный предиктор для среднего или преобразование логита среднего значения в случае бинарного исхода, в ячейке постстратификации ,
где для измерение результата респондента в клетке , является фиксированным перехватом , уникальный ковариатный вектор для ячейки , вектор коэффициентов регрессии ( фиксированные эффекты ), различный коэффициент ( случайный эффект ), Карты Индекс ячейки к соответствующему индексу категории переменной Полем Все различные коэффициенты являются обменными партиями с независимыми нормальными предыдущими распределениями .
MRP Шаг 2: Постератификация : оценка постстратификации (PS) для интересующего параметра населения - где Является ли оцененный результат интереса для ячейки постстретификации и размер -Та Посстратификационная ячейка в популяции. Оценки на любом уровне субпопуляции аналогично получены где является подмножества всех постстратификационных клеток, которые включают .
Техника и ее преимущества
[ редактировать ]Техника по существу включает использование данных, например, от переписей, касающихся различных типов людей, соответствующих различным характеристикам (например, возраст, раса), на первом этапе оценки взаимосвязи между этими типами и индивидуальными предпочтениями ( т.е. регрессия набора данных). Затем эта связь используется во втором этапе для оценки субрегионального предпочтения, основанного на количестве людей, имеющих каждый тип/характеристика в этом субрегионе (процесс, известный как «постофификация»). [ 3 ] Таким образом, необходимость провести опросы на субрегиональном уровне, которые могут быть дорогими и нецелесообразными в области (например, страна) со многими субрегионами (например, округа, Ridings или состояния). Это также избегает проблем с последовательности обследования при сравнении различных опросов, проведенных в разных областях. [ 4 ] [ 1 ] Кроме того, это позволяет оценить предпочтения в определенной местности, основанном на опросе, проведенном в более широкой области, которая включает в себя относительно немногие люди из рассматриваемого места, или где выборка может быть очень непреднамеренной. [ 5 ]
История
[ редактировать ]Техника была первоначально разработана Гелманом и Т. Литтлом в 1997 году, [ 6 ] Опираясь на идеи Фэй и Херриота [ 7 ] и Р. Литтл. [ 8 ] Впоследствии он был расширен Парком, Гелманом и Бафуми в 2004 и 2006 годах. Он был предложен для использования при оценке предпочтений избирателей на уровне США и Филипса в 2009 году. Варшоу и Родден впоследствии предложили его для использования в оценке округа и округа. Уровень общественное мнение в 2012 году. [ 1 ] Позже Wang et al. [ 9 ] Использовали данные опроса пользователей Xbox для прогнозирования результатов президентских выборов в США в 2012 году . Геймеры Xbox были в возрасте от 18 до 29 лет и 93% мужчин, в то время как электорат в целом составлял 19% от 18 до 29 лет и 47% мужчин. Несмотря на то, что первоначальные данные были сильно смещенными, после многоуровневой регрессии с постстратификацией авторы смогли получить оценки, которые согласились с теми, которые поступают из опросов, использующих большие объемы случайных и репрезентативных данных. С тех пор он также был предложен для использования в области эпидемиологии . [ 5 ]
YouGov использовал эту технику для успешного прогнозирования общего результата всеобщих выборов в Великобритании 2017 года , [ 10 ] Правильно прогнозировать результат в 93% избирательных округов. [ 11 ] На выборах в 2019 и 2024 годах другие избиратели использовали ППМ, включая выживание [ 12 ] и ipsos. [ 13 ]
Ограничения и расширения
[ редактировать ]ППМ может быть расширен на оценку изменения мнения с течением времени [ 4 ] И когда они используются для прогнозирования выборов лучше всего, когда они используются относительно близко к дате опроса, после закрытия номинаций. [ 14 ]
Как «многоуровневая регрессия», так и «постстратификационные» идеи MRP могут быть обобщены. Многоуровневая регрессия может быть заменена непараметрической регрессией [ 15 ] или регуляризованное прогноз , и постстратификация может быть обобщено для обеспечения негенсусных переменных, то есть итоги постстратификации, которые оцениваются, а не известны. [ 16 ]
Ссылки
[ редактировать ]- ^ Jump up to: а беременный в Buttice, Matthew K.; Хайтон, Бенджамин (осень 2013). «Как многоуровневая регрессия и постстратификация работают с обычными национальными исследованиями?» (PDF) . Политический анализ . 21 (4): 449–451. doi : 10.1093/pan/mpt017 . JSTOR 24572674 .
- ^ Даунс, Марни Даунс; в Al. (Август 2018). «Многоуровневая регрессия и постстратификация: подход к моделированию к оценке величин популяции из высоко отобранных образцов обследования» . Американский журнал эпидемиологии . 187 (8): 1780–1790. doi : 10.1093/aje/kwy070 .
- ^ "Что такое MRP?" Полем Выживание.com . Выживание. 5 ноября 2018 года . Получено 31 октября 2019 года .
- ^ Jump up to: а беременный Гелман, Эндрю; Лакс, Джеффри; Филлипс, Джастин; Габри, Иона; Трангуччи, Роберт (28 августа 2018 г.). «Использование многоуровневой регрессии и постстратификации для оценки динамического общественного мнения» (PDF) : 1–3 . Получено 31 октября 2019 года .
{{cite journal}}
: CITE Journal требует|journal=
( помощь ) - ^ Jump up to: а беременный Даунс, Марни; Гуррин, Лайл С.; Английский, Даллас Р.; Пиркис, Джейн; Керриер, Дайан; Спитал, Мэтью Дж.; Карлин, Джон Б. (9 апреля 2018 г.). «Многоуровневая регрессия и постстратификация: подход к моделированию к оценке величин популяции из высоко отобранных образцов обследования» . Американский журнал эпидемиологии . 179 (8): 187 . Получено 31 октября 2019 года .
- ^ Гелман, Эндрю; Литтл, Томас (1997). «Посрядка во многих категориях с использованием иерархической логистической регрессии» . Методология опроса . 23 : 127–135.
- ^ Фэй, Роберт; Херриот, Роджер (1979). «Оценки дохода для небольших мест: применение процедур Джеймса-Стейна к данным переписи». Журнал Американской статистической ассоциации . 74 (423): 1001–1012. doi : 10.1080/01621459.1979.10482505 . JSTOR 2286322 .
- ^ Литтл, Родерик (1993). «Пост-стратификация: перспектива моделей». Журнал Американской статистической ассоциации . 88 (423): 1001–1012. doi : 10.1080/01621459.1993.10476368 . JSTOR 2290792 .
- ^ Ван, Вэй; Ротшильд, Дэвид; Гоэль, Шарад; Гелман, Эндрю (2015). «Прогнозирование выборов с нерепрезентативными опросами» (PDF) . Международный журнал прогнозирования . 31 (3): 980–991. doi : 10.1016/j.ijforecast.2014.06.001 .
- ^ Ревер, Тимоти (9 июня 2017 г.). «Как экспериментальный опрос YouGov правильно назвал британские выборы» . Новый ученый . Получено 31 октября 2019 года .
- ^ Коэн, Даниэль (27 сентября 2019 г.). « Я никогда не знал, что избиратели будут такими беспорядочными»: избиратели, работающие над предсказанием следующих выборов в Великобритании » . Хранитель . Получено 31 октября 2019 года .
- ^ Выживание 2019 https://www.survation.com/2019 General-election-mrp-predictions-survation-and-r-chris-hanretty/
- ^ Ipsos 2024 https://www.ipsos.com/en-uk/uk-opinion-polls/ipsos-election-mrp
- ^ Джеймс, Уильям; МакЛеллан, Кайли (15 октября 2019 г.). «Вопрос о доверии: британские опросчики сражаются за то, чтобы назвать надвигающиеся выборы» . Рейтер . Получено 31 октября 2019 года .
- ^ Бисби, Джеймс (2019). «BARP: улучшение мистера P Использование байесовских аддитивных деревьев регрессии». Американское политологическое обзор . 113 (4): 1060–1065. doi : 10.1017/s0003055419000480 . S2CID 201385400 .
- ^ Гелман, Эндрю (28 октября 2018 г.). «MRP (или RPP) с не-точеной переменными» . Статистическое моделирование, причинно -следственный вывод и социальная наука .