Jump to content

Многоуровневая регрессия с постстратификацией

Многоуровневая регрессия с постстратификацией ( MRP ) — это статистический метод, используемый для корректировки оценок модели для известных различий между выборочной совокупностью (популяцией имеющихся данных) и целевой совокупностью (популяцией, для которой необходимо провести оценку).

Постстратификация относится к процессу корректировки оценок, по сути, представляет собой средневзвешенное значение оценок всех возможных комбинаций атрибутов (например, возраста и пола). Каждую комбинацию иногда называют «ячейкой». Многоуровневая регрессия — это использование многоуровневой модели для сглаживания зашумленных оценок в ячейках со слишком небольшим количеством данных с использованием общих или близких средних значений.

Одним из приложений является оценка предпочтений в субрегионах (например, штатах, отдельных округах) на основе данных опросов индивидуального уровня, собранных на других уровнях агрегирования (например, национальных опросов). [ 1 ]

Математическая формулировка

[ редактировать ]

Следуя описанию модели MRP [ 2 ] , предполагать представляет собой измерение одного результата, а среднее популяционное значение , , представляет собой целевой параметр, представляющий интерес. В базовой популяции каждый человек, , принадлежит одному из постстратификационные клетки характеризуются уникальным набором ковариат. Многоуровневая регрессия с постстратификационной моделью включает в себя следующую пару шагов:

Шаг 1 MRP (многоуровневая регрессия) . Модель многоуровневой регрессии определяет линейный предиктор для среднего значения. , или логит- преобразование среднего значения в случае двоичного результата в ячейке постстратификации ,

где является показателем результата для респондента в камере , фиксированный перехват , это уникальный ковариатный вектор для ячейки , — вектор коэффициентов регрессии ( фиксированных эффектов ), — изменяющийся коэффициент ( случайный эффект ), отображает индекс ячейки к соответствующему индексу категории переменной . Все изменяющиеся коэффициенты представляют собой сменные партии с независимыми нормальными априорными распределениями. .

Шаг 2 MRP: постстратификация : постстратификационная оценка (PS) для интересующего параметра совокупности равна где предполагаемый результат, представляющий интерес для постстратификационной ячейки и это размер -я постстратификационная ячейка в популяции. Оценки на любом уровне субпопуляции получены аналогичным образом где представляет собой подмножество всех постстратификационных клеток, которые включают .

Техника и ее преимущества

[ редактировать ]

Этот метод по существу предполагает использование данных, например, переписей населения, касающихся различных типов людей, соответствующих различным характеристикам (например, возрасту, расе), на первом этапе оценки взаимосвязи между этими типами и индивидуальными предпочтениями (т. е. многоуровневое исследование). регрессия набора данных). Затем это соотношение используется на втором этапе для оценки субрегиональных предпочтений на основе количества людей, имеющих каждый тип/характеристику в этом субрегионе (процесс, известный как «постстратификация»). [ 3 ] Таким образом, можно избежать необходимости проводить исследования на субрегиональном уровне, что может оказаться дорогостоящим и непрактичным в регионе (например, в стране) с множеством субрегионов (например, округов, округов или штатов). Это также позволяет избежать проблем с согласованностью опросов при сравнении различных опросов, проведенных в разных областях. [ 4 ] [ 1 ] Кроме того, он позволяет оценить предпочтения в пределах конкретной местности на основе опроса, проведенного на более широкой территории, включающей относительно небольшое количество людей из рассматриваемой местности, или там, где выборка может быть крайне нерепрезентативной. [ 5 ]

Первоначально методика была разработана Гельманом и Т. Литтлом в 1997 году. [ 6 ] опираясь на идеи Фэй и Эррио [ 7 ] и Р. Литтл. [ 8 ] Впоследствии он был расширен Паком, Гельманом и Бафуми в 2004 и 2006 годах. В 2009 году Лакс и Филипс предложили его использовать для оценки предпочтений избирателей на уровне штата США. Уоршоу и Родден впоследствии предложили его для использования при оценке избирательных округов. уровень общественного мнения в 2012 году. [ 1 ] Позже Ван и др. [ 9 ] использовала данные опроса пользователей Xbox для прогнозирования исхода президентских выборов в США в 2012 году . Геймерами Xbox были 65% людей в возрасте от 18 до 29 лет и 93% мужчины, тогда как электорат в целом составлял 19% людей в возрасте от 18 до 29 лет и 47% мужчин. Несмотря на то, что исходные данные были сильно смещены, после многоуровневой регрессии с постстратификацией авторы смогли получить оценки, совпадающие с оценками, полученными в ходе опросов с использованием большого количества случайных и репрезентативных данных. С тех пор его также предложили использовать в области эпидемиологии . [ 5 ]

YouGov использовал эту технику, чтобы успешно предсказать общий результат всеобщих выборов в Великобритании в 2017 году . [ 10 ] правильно предсказав результат в 93% округов. [ 11 ] На выборах 2019 и 2024 годов другие социологи использовали MRP, включая Survation. [ 12 ] и Ипсос. [ 13 ]

Ограничения и расширения

[ редактировать ]

MRP можно расширить для оценки изменения мнения с течением времени. [ 4 ] и при использовании для прогнозирования выборов лучше всего работает, когда используется относительно близко к дате голосования, после того, как выдвижение кандидатов закрыто. [ 14 ]

Идею MRP «многоуровневой регрессии» и «постстратификации» можно обобщить. Многоуровневую регрессию можно заменить непараметрической регрессией. [ 15 ] или регуляризованный прогноз , а постстратификация может быть обобщена, чтобы учесть переменные, не относящиеся к переписи, т. е. итоговые суммы после стратификации, которые оцениваются, а не известны. [ 16 ]

  1. ^ Перейти обратно: а б с Баттис, Мэтью К.; Хайтон, Бенджамин (осень 2013 г.). «Как многоуровневая регрессия и постстратификация работают с традиционными национальными опросами?» (PDF) . Политический анализ . 21 (4): 449–451. дои : 10.1093/pan/mpt017 . JSTOR   24572674 .
  2. ^ Даунс, Марни Даунс; вообще (август 2018 г.). «Многоуровневая регрессия и постстратификация: подход к моделированию к оценке численности населения на основе тщательно отобранных выборок опроса» . Американский журнал эпидемиологии . 187 (8): 1780–1790. дои : 10.1093/aje/kwy070 .
  3. ^ «Что такое ППМ?» . Survation.com . Выживание. 5 ноября 2018 года . Проверено 31 октября 2019 г.
  4. ^ Перейти обратно: а б Гельман, Эндрю; Лакс, Джеффри; Филлипс, Джастин; Габри, Иона; Трангуччи, Роберт (28 августа 2018 г.). «Использование многоуровневой регрессии и постстратификации для оценки динамического общественного мнения» (PDF) : 1–3 . Проверено 31 октября 2019 г. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  5. ^ Перейти обратно: а б Даунс, Марни; Гуррин, Лайл С.; Английский, Даллас Р.; Пиркис, Джейн; Карриер, Дайан; Спитал, Мэтью Дж.; Карлин, Джон Б. (9 апреля 2018 г.). «Многоуровневая регрессия и постстратификация: подход к моделированию к оценке численности населения на основе тщательно отобранных выборок опроса» . Американский журнал эпидемиологии . 179 (8): 187 . Проверено 31 октября 2019 г.
  6. ^ Гельман, Эндрю; Литтл, Томас (1997). «Постстратификация на многие категории с использованием иерархической логистической регрессии» . Методика опроса . 23 : 127–135.
  7. ^ Фэй, Роберт; Херриот, Роджер (1979). «Оценка доходов небольших населенных пунктов: применение процедур Джеймса-Стейна к данным переписи». Журнал Американской статистической ассоциации . 74 (423): 1001–1012. дои : 10.1080/01621459.1979.10482505 . JSTOR   2286322 .
  8. ^ Литтл, Родерик (1993). «Постстратификация: взгляд моделиста». Журнал Американской статистической ассоциации . 88 (423): 1001–1012. дои : 10.1080/01621459.1993.10476368 . JSTOR   2290792 .
  9. ^ Ван, Вэй; Ротшильд, Дэвид; Гоэль, Шарад; Гельман, Эндрю (2015). «Прогнозирование выборов с помощью нерепрезентативных опросов» (PDF) . Международный журнал прогнозирования . 31 (3): 980–991. doi : 10.1016/j.ijforecast.2014.06.001 .
  10. ^ Ревелл, Тимоти (9 июня 2017 г.). «Как экспериментальный опрос YouGov правильно назвал выборы в Великобритании» . Новый учёный . Проверено 31 октября 2019 г.
  11. ^ Коэн, Дэниел (27 сентября 2019 г.). « Я никогда не видел, чтобы избиратели были настолько распущены»: социологи работают над прогнозированием следующих выборов в Великобритании» . Хранитель . Проверено 31 октября 2019 г.
  12. ^ Survation 2019 https://www.survation.com/2019-general-election-mrp-predictions-survation-and-dr-chris-hanretty/
  13. ^ Ipsos 2024 https://www.ipsos.com/en-uk/uk-opinion-polls/ipsos-election-mrp
  14. ^ Джеймс, Уильям; Маклеллан, Кайли (15 октября 2019 г.). «Вопрос доверия: британские социологи борются за то, чтобы объявить приближающиеся выборы» . Рейтер . Проверено 31 октября 2019 г.
  15. ^ Бисби, Джеймс (2019). «BARP: улучшение мистера П с использованием деревьев байесовской аддитивной регрессии». Американский обзор политической науки . 113 (4): 1060–1065. дои : 10.1017/S0003055419000480 . S2CID   201385400 .
  16. ^ Гельман, Андрей (28 октября 2018 г.). «MRP (или RPP) с переменными, не относящимися к переписи» . Статистическое моделирование, причинный вывод и социальные науки .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5c585900eba8accdeed31dc4702bb0f3__1722532140
URL1:https://arc.ask3.ru/arc/aa/5c/f3/5c585900eba8accdeed31dc4702bb0f3.html
Заголовок, (Title) документа по адресу, URL1:
Multilevel regression with poststratification - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)