Многоуровневая регрессия с постстратификацией
Часть серии о |
Регрессионный анализ |
---|
Модели |
Оценка |
Фон |
Многоуровневая регрессия с постстратификацией ( MRP ) — это статистический метод, используемый для корректировки оценок модели для известных различий между выборочной совокупностью (популяцией имеющихся данных) и целевой совокупностью (популяцией, для которой необходимо провести оценку).
Постстратификация относится к процессу корректировки оценок, по сути, представляет собой средневзвешенное значение оценок всех возможных комбинаций атрибутов (например, возраста и пола). Каждую комбинацию иногда называют «ячейкой». Многоуровневая регрессия — это использование многоуровневой модели для сглаживания зашумленных оценок в ячейках со слишком небольшим количеством данных с использованием общих или близких средних значений.
Одним из приложений является оценка предпочтений в субрегионах (например, штатах, отдельных округах) на основе данных опросов индивидуального уровня, собранных на других уровнях агрегирования (например, национальных опросов). [ 1 ]
Математическая формулировка
[ редактировать ]Следуя описанию модели MRP [ 2 ] , предполагать представляет собой измерение одного результата, а среднее популяционное значение , , представляет собой целевой параметр, представляющий интерес. В базовой популяции каждый человек, , принадлежит одному из постстратификационные клетки характеризуются уникальным набором ковариат. Многоуровневая регрессия с постстратификационной моделью включает в себя следующую пару шагов:
Шаг 1 MRP (многоуровневая регрессия) . Модель многоуровневой регрессии определяет линейный предиктор для среднего значения. , или логит- преобразование среднего значения в случае двоичного результата в ячейке постстратификации ,
где является показателем результата для респондента в камере , фиксированный перехват , это уникальный ковариатный вектор для ячейки , — вектор коэффициентов регрессии ( фиксированных эффектов ), — изменяющийся коэффициент ( случайный эффект ), отображает индекс ячейки к соответствующему индексу категории переменной . Все изменяющиеся коэффициенты представляют собой сменные партии с независимыми нормальными априорными распределениями. .
Шаг 2 MRP: постстратификация : постстратификационная оценка (PS) для интересующего параметра совокупности равна где предполагаемый результат, представляющий интерес для постстратификационной ячейки и это размер -я постстратификационная ячейка в популяции. Оценки на любом уровне субпопуляции получены аналогичным образом где представляет собой подмножество всех постстратификационных клеток, которые включают .
Техника и ее преимущества
[ редактировать ]Этот метод по существу предполагает использование данных, например, переписей населения, касающихся различных типов людей, соответствующих различным характеристикам (например, возрасту, расе), на первом этапе оценки взаимосвязи между этими типами и индивидуальными предпочтениями (т. е. многоуровневое исследование). регрессия набора данных). Затем это соотношение используется на втором этапе для оценки субрегиональных предпочтений на основе количества людей, имеющих каждый тип/характеристику в этом субрегионе (процесс, известный как «постстратификация»). [ 3 ] Таким образом, можно избежать необходимости проводить исследования на субрегиональном уровне, что может оказаться дорогостоящим и непрактичным в регионе (например, в стране) с множеством субрегионов (например, округов, округов или штатов). Это также позволяет избежать проблем с согласованностью опросов при сравнении различных опросов, проведенных в разных областях. [ 4 ] [ 1 ] Кроме того, он позволяет оценить предпочтения в пределах конкретной местности на основе опроса, проведенного на более широкой территории, включающей относительно небольшое количество людей из рассматриваемой местности, или там, где выборка может быть крайне нерепрезентативной. [ 5 ]
История
[ редактировать ]Первоначально методика была разработана Гельманом и Т. Литтлом в 1997 году. [ 6 ] опираясь на идеи Фэй и Эррио [ 7 ] и Р. Литтл. [ 8 ] Впоследствии он был расширен Паком, Гельманом и Бафуми в 2004 и 2006 годах. В 2009 году Лакс и Филипс предложили его использовать для оценки предпочтений избирателей на уровне штата США. Уоршоу и Родден впоследствии предложили его для использования при оценке избирательных округов. уровень общественного мнения в 2012 году. [ 1 ] Позже Ван и др. [ 9 ] использовала данные опроса пользователей Xbox для прогнозирования исхода президентских выборов в США в 2012 году . Геймерами Xbox были 65% людей в возрасте от 18 до 29 лет и 93% мужчины, тогда как электорат в целом составлял 19% людей в возрасте от 18 до 29 лет и 47% мужчин. Несмотря на то, что исходные данные были сильно смещены, после многоуровневой регрессии с постстратификацией авторы смогли получить оценки, совпадающие с оценками, полученными в ходе опросов с использованием большого количества случайных и репрезентативных данных. С тех пор его также предложили использовать в области эпидемиологии . [ 5 ]
YouGov использовал эту технику, чтобы успешно предсказать общий результат всеобщих выборов в Великобритании в 2017 году . [ 10 ] правильно предсказав результат в 93% округов. [ 11 ] На выборах 2019 и 2024 годов другие социологи использовали MRP, включая Survation. [ 12 ] и Ипсос. [ 13 ]
Ограничения и расширения
[ редактировать ]MRP можно расширить для оценки изменения мнения с течением времени. [ 4 ] и при использовании для прогнозирования выборов лучше всего работает, когда используется относительно близко к дате голосования, после того, как выдвижение кандидатов закрыто. [ 14 ]
Идею MRP «многоуровневой регрессии» и «постстратификации» можно обобщить. Многоуровневую регрессию можно заменить непараметрической регрессией. [ 15 ] или регуляризованный прогноз , а постстратификация может быть обобщена, чтобы учесть переменные, не относящиеся к переписи, т. е. итоговые суммы после стратификации, которые оцениваются, а не известны. [ 16 ]
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с Баттис, Мэтью К.; Хайтон, Бенджамин (осень 2013 г.). «Как многоуровневая регрессия и постстратификация работают с традиционными национальными опросами?» (PDF) . Политический анализ . 21 (4): 449–451. дои : 10.1093/pan/mpt017 . JSTOR 24572674 .
- ^ Даунс, Марни Даунс; вообще (август 2018 г.). «Многоуровневая регрессия и постстратификация: подход к моделированию к оценке численности населения на основе тщательно отобранных выборок опроса» . Американский журнал эпидемиологии . 187 (8): 1780–1790. дои : 10.1093/aje/kwy070 .
- ^ «Что такое ППМ?» . Survation.com . Выживание. 5 ноября 2018 года . Проверено 31 октября 2019 г.
- ^ Перейти обратно: а б Гельман, Эндрю; Лакс, Джеффри; Филлипс, Джастин; Габри, Иона; Трангуччи, Роберт (28 августа 2018 г.). «Использование многоуровневой регрессии и постстратификации для оценки динамического общественного мнения» (PDF) : 1–3 . Проверено 31 октября 2019 г.
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Перейти обратно: а б Даунс, Марни; Гуррин, Лайл С.; Английский, Даллас Р.; Пиркис, Джейн; Карриер, Дайан; Спитал, Мэтью Дж.; Карлин, Джон Б. (9 апреля 2018 г.). «Многоуровневая регрессия и постстратификация: подход к моделированию к оценке численности населения на основе тщательно отобранных выборок опроса» . Американский журнал эпидемиологии . 179 (8): 187 . Проверено 31 октября 2019 г.
- ^ Гельман, Эндрю; Литтл, Томас (1997). «Постстратификация на многие категории с использованием иерархической логистической регрессии» . Методика опроса . 23 : 127–135.
- ^ Фэй, Роберт; Херриот, Роджер (1979). «Оценка доходов небольших населенных пунктов: применение процедур Джеймса-Стейна к данным переписи». Журнал Американской статистической ассоциации . 74 (423): 1001–1012. дои : 10.1080/01621459.1979.10482505 . JSTOR 2286322 .
- ^ Литтл, Родерик (1993). «Постстратификация: взгляд моделиста». Журнал Американской статистической ассоциации . 88 (423): 1001–1012. дои : 10.1080/01621459.1993.10476368 . JSTOR 2290792 .
- ^ Ван, Вэй; Ротшильд, Дэвид; Гоэль, Шарад; Гельман, Эндрю (2015). «Прогнозирование выборов с помощью нерепрезентативных опросов» (PDF) . Международный журнал прогнозирования . 31 (3): 980–991. doi : 10.1016/j.ijforecast.2014.06.001 .
- ^ Ревелл, Тимоти (9 июня 2017 г.). «Как экспериментальный опрос YouGov правильно назвал выборы в Великобритании» . Новый учёный . Проверено 31 октября 2019 г.
- ^ Коэн, Дэниел (27 сентября 2019 г.). « Я никогда не видел, чтобы избиратели были настолько распущены»: социологи работают над прогнозированием следующих выборов в Великобритании» . Хранитель . Проверено 31 октября 2019 г.
- ^ Survation 2019 https://www.survation.com/2019-general-election-mrp-predictions-survation-and-dr-chris-hanretty/
- ^ Ipsos 2024 https://www.ipsos.com/en-uk/uk-opinion-polls/ipsos-election-mrp
- ^ Джеймс, Уильям; Маклеллан, Кайли (15 октября 2019 г.). «Вопрос доверия: британские социологи борются за то, чтобы объявить приближающиеся выборы» . Рейтер . Проверено 31 октября 2019 г.
- ^ Бисби, Джеймс (2019). «BARP: улучшение мистера П с использованием деревьев байесовской аддитивной регрессии». Американский обзор политической науки . 113 (4): 1060–1065. дои : 10.1017/S0003055419000480 . S2CID 201385400 .
- ^ Гельман, Андрей (28 октября 2018 г.). «MRP (или RPP) с переменными, не относящимися к переписи» . Статистическое моделирование, причинный вывод и социальные науки .