Jump to content

Ошибка покрытия

Все цветные кружки включены в целевую совокупность. В основу выборки включены круги зеленого и оранжевого цвета. Кружочки зеленого цвета представляют собой случайно сгенерированную выборку из совокупности выборки. В выборку включен избыточный охват, поскольку Джон и Джек — одно и то же лицо, но он включен в выборку более одного раза. В основу выборки включен недостаточный охват, поскольку не вся целевая совокупность включена в основу выборки.

Ошибка покрытия – это тип ошибки, не связанной с выборкой. [1] это происходит, когда нет однозначного соответствия между целевой совокупностью и основой выборки, из которой формируется выборка. [2] Это может привести к искажению оценок, рассчитанных с использованием данных опросов. [3] Например, исследователь может пожелать изучить мнение зарегистрированных избирателей (целевая группа населения), позвонив по местам проживания, указанным в телефонном справочнике (основе выборки). Неполное освещение может произойти, если не все избиратели указаны в телефонном справочнике. Чрезмерное покрытие может произойти, если у некоторых избирателей указано более одного телефонного номера. Предвзятость также может возникнуть, если некоторые телефонные номера, указанные в справочнике, не принадлежат зарегистрированным избирателям. [4] В этом примере недостаточный охват, избыточный охват и предвзятость из-за включения незарегистрированных избирателей в основу выборки являются примерами ошибки охвата.

Обсуждение

[ редактировать ]

Ошибка охвата – это один из типов общей ошибки обследования , которая может возникнуть при выборке обследования . При опросной выборке основа выборки представляет собой список единиц выборки, из которых формируются выборки целевой совокупности. [3] Ошибка охвата возникает, когда существуют различия между целевой совокупностью и основой выборки. [5]

Например, предположим, что исследователь использует Twitter, чтобы узнать мнение избирателей США о недавних действиях президента США. Хотя целевой аудиторией исследователя являются избиратели США, в качестве основы выборки она использует список пользователей Twitter. Поскольку не все избиратели являются пользователями Твиттера, а также поскольку не все пользователи Твиттера являются избирателями, между целевой группой населения и основой выборки возникнет несоответствие, что может привести к предвзятым результатам опроса, поскольку демографические данные и мнения избирателей, использующих Твиттер, могут быть не репрезентативными. целевой группы избирателей. [4]

Недостаточный охват имеет место, когда основа выборки не включает всех членов целевой совокупности. В предыдущем примере избиратели скрыты, поскольку не все избиратели являются пользователями Twitter. С другой стороны, избыточный охват возникает, когда некоторые члены целевой совокупности чрезмерно представлены в основе выборки. В предыдущем примере возможно, что некоторые пользователи имеют более одной учетной записи Twitter и с большей вероятностью будут включены в опрос, чем пользователи Twitter, имеющие только одну учетную запись. [4]

Лонгитюдные исследования особенно подвержены недостаточному охвату, поскольку группа населения, изучаемая в рамках лонгитюдного обследования, может меняться с течением времени. [6] Например, исследователь может захотеть изучить взаимосвязь между буквенными оценками, полученными третьеклассниками в определенном школьном округе, и заработной платой, которую эти же дети зарабатывают, когда становятся взрослыми. В данном случае исследователя интересуют все третьеклассники района, вырастающие взрослыми (целевая совокупность). Ее основой выборки может быть список третьеклассников школьного округа (основы выборки). Со временем вполне вероятно, что исследователь потеряет информацию о некоторых детях, использованных в исходном исследовании, и ее выборка взрослых больше не будет соответствовать выборке детей, использованной в исследовании.

Способы количественной оценки ошибки покрытия

[ редактировать ]

Для количественной оценки и исправления ошибок покрытия использовалось множество различных методов. Часто используемые методы уникальны для конкретных агентств и организаций. Например, Бюро переписи населения США разработало модели с использованием файла последовательности доставки Почтовой службы США, адресных данных IRS 1040, коммерчески доступных подсчетов потерь права выкупа и других данных для разработки моделей, способных прогнозировать занижение учета по переписному блоку. Бюро переписи населения сообщило об определенных успехах в адаптации таких моделей к распределению Пуассона с нулевым завышенным отрицательным биномиальным распределением (ZIP). [7]

Другой метод количественной оценки ошибки охвата использует методологию маркировки и повторного сбора данных . [8] В методологии маркировки и повторной поимки образец берется непосредственно из популяции, маркируется и повторно вводится в популяцию. Позднее из популяции берется еще одна выборка (повторный отлов), и доля ранее отмеченных выборок используется для оценки фактической численности популяции. Этот метод можно распространить на определение достоверности основы выборки, взяв выборку непосредственно из целевой совокупности, а затем взяв еще одну выборку из совокупности данных, чтобы оценить недостаточный охват. [9] Например, предположим, была проведена перепись населения. После завершения переписи можно было взять случайные выборки из совокупности для повторного подсчета. [8]

Способы уменьшения ошибки покрытия

[ редактировать ]

Один из способов уменьшить ошибку охвата — полагаться на несколько источников либо для построения основы выборки, либо для сбора информации. Это называется смешанным подходом. Например, студенты Университета штата Вашингтон провели опросы об опыте студентов, создав выборку, используя как уличные адреса, так и адреса электронной почты. [5]

Еще одним примером смешанного подхода является перепись населения США 2010 года, которая в основном опиралась на ответы по почте от жилых домов, а затем привлекала интервьюеров на местах для опроса тех, кто не ответил. Таким образом, Выездные интервьюеры могли определить, существует ли конкретный адрес или он все еще занят. Этот подход имел дополнительное преимущество в виде снижения затрат, поскольку большинство людей отвечали по почте и не требовали выезда на место. [8] [5]

Пример: перепись 2010 года.

[ редактировать ]

Бюро переписи населения США готовит и ведет главный файл адресов, содержащий около 144,9 миллиона адресов, который он использует в качестве основы выборки для десятилетней переписи населения США и других обследований. Несмотря на усилия примерно 111 105 представителей на местах и ​​затраты почти в полмиллиарда долларов, бюро переписи все же обнаружило значительное количество адресов, которые не попали в главный файл адресов. [7]

Контроль охвата (CFU) и полевая проверка (FV) были операциями Бюро переписи населения, проводившимися для улучшения переписи 2010 года с использованием данных переписи 2000 года в качестве основы. Эти операции были предназначены для устранения следующих типов ошибок покрытия: неучет тех, кого следовало учитывать; подсчет того, кого не следовало считать; и подсчет кого-то, кого должны были пересчитать, но чье местонахождение было установлено ошибочно. Ошибки охвата в переписи населения США потенциально могут привести к тому, что группы населения будут недопредставлены правительством. Особую озабоченность вызывают «дифференциальные занижения», которые представляют собой недооценку целевых демографических групп. Хотя усилия CFU и FV повысили точность переписи 2010 года, было рекомендовано провести дополнительные исследования для решения вопроса дифференциального занижения учета. [10]

См. также

[ редактировать ]
  1. ^ Салант, Присцилла и Дон А. Диллман. «Как провести собственный опрос: Ведущие специалисты предоставят вам проверенные методы получения надежных результатов». (1995)
  2. ^ Рыболовство, НОАА (21 февраля 2019 г.). «Обзор статистики обследования | Рыболовство NOAA» . www.fisheries.noaa.gov . Проверено 24 февраля 2019 г.
  3. ^ Jump up to: а б Шеффер, Ричард Л. 1996. Раздел 5 выборки опроса преподавателей, Рональд С. Фексо, Уильям Д. Калсбек, Шэрон Л. Лор , Ричард Л. Шеффер, Фриц Дж. Шойрен, Элизабет А. Стасни. Американский статистик 50:4 (ноябрь 1996 г.), стр. 335–337. (на jstor )
  4. ^ Jump up to: а б с Шеффер, Ричард Л. (2012). Элементарная выборка обследования (7-я, студенческая изд.). Бостон, Массачусетс: Брукс/Коул. ISBN  978-0840053619 . OCLC   732960076 .
  5. ^ Jump up to: а б с Диллман, Дон А.; Смит, Джолин Д.; Кристиан, Лия Мелани (6 августа 2014 г.). Интернет, телефон, почта и смешанные опросы: метод индивидуального проектирования (Четвертое изд.). Хобокен. ISBN  9781118921302 . ОСЛК   878301194 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  6. ^ Линн, Питер (2009). Методология лонгитудинальных исследований . Чичестер, Великобритания: John Wiley & Sons. ISBN  9780470743911 . OCLC   317116422 .
  7. ^ Jump up to: а б Бюро переписи населения США. «Выбор предикторов для моделирования ошибок покрытия» . www.census.gov . Проверено 24 февраля 2019 г.
  8. ^ Jump up to: а б с Бимер, Пол П.; де Леу, Эдит Дезире; Экман, Стефани; Эдвардс, Брэд; Кройтер, Фрауке; Либерг, Ларс, ред. (6 февраля 2017 г.). Общая ошибка опроса на практике . Хобокен, Нью-Джерси. ISBN  9781119041689 . OCLC   971891428 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  9. ^ Бюро переписи населения США. «Модели ошибок охвата для данных переписи и обследований» . www.census.gov . Проверено 24 февраля 2019 г.
  10. ^ Перепись 2010 года: последующие действия должны уменьшить ошибки охвата, но необходимо определить влияние на демографические группы: сообщить об этом представителям Конгресса . Правительство США. Счетная палата. 2010. OCLC   721261877 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 80c99d1136d25910973c8acaad1a4b18__1633774020
URL1:https://arc.ask3.ru/arc/aa/80/18/80c99d1136d25910973c8acaad1a4b18.html
Заголовок, (Title) документа по адресу, URL1:
Coverage error - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)