Jump to content

Многоуровневая регрессия с постстратификацией

Многоуровневая регрессия с постстратификацией ( MRP ) представляет собой статистический метод, используемый для исправления модельных оценок для известных различий между популяцией выборки (популяция данных, которые есть из них), и целевой популяцией (популяция, которую нужно оценить).

Постократрификация . относится к процессу корректировки оценок, по сути, средневзвешенным оценкам из всех возможных комбинаций атрибутов (например, возраста и пола) Каждая комбинация иногда называется «ячейкой». Многоуровневая регрессия - это использование многоуровневой модели для сглаживания шумных оценок в ячейках с слишком небольшим количеством данных с использованием общих или близлежащих средних значений.

Одним из приложений является оценка предпочтений в субрегионах (например, штаты, отдельные избирательные округа) на основе данных обследования индивидуального уровня, собранных на других уровнях агрегации (например, национальные опросы). [ 1 ]

Математическая формулировка

[ редактировать ]

Следуя описанию MRP модели [ 2 ] , предполагать представляет собой измерение единого результата и среднее значение населения , , является целевым параметром интереса. В основном населении, каждый человек, , принадлежит одному из Постератификационные клетки, характеризующиеся уникальным набором ковариат. Многоуровневая регрессия с моделью постстратификации включает в себя следующую пару шагов:

MRP Шаг 1 (многоуровневая регрессия) : многоуровневая регрессионная модель определяет линейный предиктор для среднего или преобразование логита среднего значения в случае бинарного исхода, в ячейке постстратификации ,

где для измерение результата респондента в клетке , является фиксированным перехватом , уникальный ковариатный вектор для ячейки , вектор коэффициентов регрессии ( фиксированные эффекты ), различный коэффициент ( случайный эффект ), Карты Индекс ячейки к соответствующему индексу категории переменной Полем Все различные коэффициенты являются обменными партиями с независимыми нормальными предыдущими распределениями .

MRP Шаг 2: Постератификация : оценка постстратификации (PS) для интересующего параметра населения - где Является ли оцененный результат интереса для ячейки постстретификации и размер -Та Посстратификационная ячейка в популяции. Оценки на любом уровне субпопуляции аналогично получены где является подмножества всех постстратификационных клеток, которые включают .

Техника и ее преимущества

[ редактировать ]

Техника по существу включает использование данных, например, от переписей, касающихся различных типов людей, соответствующих различным характеристикам (например, возраст, раса), на первом этапе оценки взаимосвязи между этими типами и индивидуальными предпочтениями ( т.е. регрессия набора данных). Затем эта связь используется во втором этапе для оценки субрегионального предпочтения, основанного на количестве людей, имеющих каждый тип/характеристика в этом субрегионе (процесс, известный как «постофификация»). [ 3 ] Таким образом, необходимость провести опросы на субрегиональном уровне, которые могут быть дорогими и нецелесообразными в области (например, страна) со многими субрегионами (например, округа, Ridings или состояния). Это также избегает проблем с последовательности обследования при сравнении различных опросов, проведенных в разных областях. [ 4 ] [ 1 ] Кроме того, это позволяет оценить предпочтения в определенной местности, основанном на опросе, проведенном в более широкой области, которая включает в себя относительно немногие люди из рассматриваемого места, или где выборка может быть очень непреднамеренной. [ 5 ]

Техника была первоначально разработана Гелманом и Т. Литтлом в 1997 году, [ 6 ] Опираясь на идеи Фэй и Херриота [ 7 ] и Р. Литтл. [ 8 ] Впоследствии он был расширен Парком, Гелманом и Бафуми в 2004 и 2006 годах. Он был предложен для использования при оценке предпочтений избирателей на уровне США и Филипса в 2009 году. Варшоу и Родден впоследствии предложили его для использования в оценке округа и округа. Уровень общественное мнение в 2012 году. [ 1 ] Позже Wang et al. [ 9 ] Использовали данные опроса пользователей Xbox для прогнозирования результатов президентских выборов в США в 2012 году . Геймеры Xbox были в возрасте от 18 до 29 лет и 93% мужчин, в то время как электорат в целом составлял 19% от 18 до 29 лет и 47% мужчин. Несмотря на то, что первоначальные данные были сильно смещенными, после многоуровневой регрессии с постстратификацией авторы смогли получить оценки, которые согласились с теми, которые поступают из опросов, использующих большие объемы случайных и репрезентативных данных. С тех пор он также был предложен для использования в области эпидемиологии . [ 5 ]

YouGov использовал эту технику для успешного прогнозирования общего результата всеобщих выборов в Великобритании 2017 года , [ 10 ] Правильно прогнозировать результат в 93% избирательных округов. [ 11 ] На выборах в 2019 и 2024 годах другие избиратели использовали ППМ, включая выживание [ 12 ] и ipsos. [ 13 ]

Ограничения и расширения

[ редактировать ]

ППМ может быть расширен на оценку изменения мнения с течением времени [ 4 ] И когда они используются для прогнозирования выборов лучше всего, когда они используются относительно близко к дате опроса, после закрытия номинаций. [ 14 ]

Как «многоуровневая регрессия», так и «постстратификационные» идеи MRP могут быть обобщены. Многоуровневая регрессия может быть заменена непараметрической регрессией [ 15 ] или регуляризованное прогноз , и постстратификация может быть обобщено для обеспечения негенсусных переменных, то есть итоги постстратификации, которые оцениваются, а не известны. [ 16 ]

  1. ^ Jump up to: а беременный в Buttice, Matthew K.; Хайтон, Бенджамин (осень 2013). «Как многоуровневая регрессия и постстратификация работают с обычными национальными исследованиями?» (PDF) . Политический анализ . 21 (4): 449–451. doi : 10.1093/pan/mpt017 . JSTOR   24572674 .
  2. ^ Даунс, Марни Даунс; в Al. (Август 2018). «Многоуровневая регрессия и постстратификация: подход к моделированию к оценке величин популяции из высоко отобранных образцов обследования» . Американский журнал эпидемиологии . 187 (8): 1780–1790. doi : 10.1093/aje/kwy070 .
  3. ^ "Что такое MRP?" Полем Выживание.com . Выживание. 5 ноября 2018 года . Получено 31 октября 2019 года .
  4. ^ Jump up to: а беременный Гелман, Эндрю; Лакс, Джеффри; Филлипс, Джастин; Габри, Иона; Трангуччи, Роберт (28 августа 2018 г.). «Использование многоуровневой регрессии и постстратификации для оценки динамического общественного мнения» (PDF) : 1–3 . Получено 31 октября 2019 года . {{cite journal}}: CITE Journal требует |journal= ( помощь )
  5. ^ Jump up to: а беременный Даунс, Марни; Гуррин, Лайл С.; Английский, Даллас Р.; Пиркис, Джейн; Керриер, Дайан; Спитал, Мэтью Дж.; Карлин, Джон Б. (9 апреля 2018 г.). «Многоуровневая регрессия и постстратификация: подход к моделированию к оценке величин популяции из высоко отобранных образцов обследования» . Американский журнал эпидемиологии . 179 (8): 187 . Получено 31 октября 2019 года .
  6. ^ Гелман, Эндрю; Литтл, Томас (1997). «Посрядка во многих категориях с использованием иерархической логистической регрессии» . Методология опроса . 23 : 127–135.
  7. ^ Фэй, Роберт; Херриот, Роджер (1979). «Оценки дохода для небольших мест: применение процедур Джеймса-Стейна к данным переписи». Журнал Американской статистической ассоциации . 74 (423): 1001–1012. doi : 10.1080/01621459.1979.10482505 . JSTOR   2286322 .
  8. ^ Литтл, Родерик (1993). «Пост-стратификация: перспектива моделей». Журнал Американской статистической ассоциации . 88 (423): 1001–1012. doi : 10.1080/01621459.1993.10476368 . JSTOR   2290792 .
  9. ^ Ван, Вэй; Ротшильд, Дэвид; Гоэль, Шарад; Гелман, Эндрю (2015). «Прогнозирование выборов с нерепрезентативными опросами» (PDF) . Международный журнал прогнозирования . 31 (3): 980–991. doi : 10.1016/j.ijforecast.2014.06.001 .
  10. ^ Ревер, Тимоти (9 июня 2017 г.). «Как экспериментальный опрос YouGov правильно назвал британские выборы» . Новый ученый . Получено 31 октября 2019 года .
  11. ^ Коэн, Даниэль (27 сентября 2019 г.). « Я никогда не знал, что избиратели будут такими беспорядочными»: избиратели, работающие над предсказанием следующих выборов в Великобритании » . Хранитель . Получено 31 октября 2019 года .
  12. ^ Выживание 2019 https://www.survation.com/2019 General-election-mrp-predictions-survation-and-r-chris-hanretty/
  13. ^ Ipsos 2024 https://www.ipsos.com/en-uk/uk-opinion-polls/ipsos-election-mrp
  14. ^ Джеймс, Уильям; МакЛеллан, Кайли (15 октября 2019 г.). «Вопрос о доверии: британские опросчики сражаются за то, чтобы назвать надвигающиеся выборы» . Рейтер . Получено 31 октября 2019 года .
  15. ^ Бисби, Джеймс (2019). «BARP: улучшение мистера P Использование байесовских аддитивных деревьев регрессии». Американское политологическое обзор . 113 (4): 1060–1065. doi : 10.1017/s0003055419000480 . S2CID   201385400 .
  16. ^ Гелман, Эндрю (28 октября 2018 г.). «MRP (или RPP) с не-точеной переменными» . Статистическое моделирование, причинно -следственный вывод и социальная наука .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: cc600fe31e41be6b2a117c5c5a4e5bd9__1722532140
URL1:https://arc.ask3.ru/arc/aa/cc/d9/cc600fe31e41be6b2a117c5c5a4e5bd9.html
Заголовок, (Title) документа по адресу, URL1:
Multilevel regression with poststratification - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)