Jump to content

Эффект дизайна

Эта статья была опубликована в рецензируемом журнале WikiJournal of Science (2024). Нажмите, чтобы просмотреть опубликованную версию.

В опросных исследованиях эффект дизайна — это число, которое показывает, насколько хорошо выборка людей может представлять большую группу людей для определенного показателя интереса (например, среднего значения). Это важно, когда выборка формируется методом выборки , который отличается от простого отбора людей с использованием простой случайной выборки .

Эффект дизайна — это положительное действительное число , представленное символом . Если , то выборка была отобрана так же хорошо, как если бы люди были выбраны случайным образом. Когда , то выводы на основе собранных данных не будут такими точными, как если бы люди выбирались случайным образом.

Когда исследователи используют сложные методы для отбора выборки, они используют эффект дизайна для проверки и корректировки своих результатов. Его также можно использовать при планировании исследования для определения размера выборки .

Введение

[ редактировать ]

В методологии опроса эффект схемы (обычно обозначаемый как , , или это мера ожидаемого воздействия плана выборки на дисперсию оценщика ) — некоторого параметра совокупности. Он рассчитывается как отношение дисперсии оценщика, основанного на выборке из (часто) сложной схемы выборки , к дисперсии альтернативной оценки, основанной на простой случайной выборке (SRS) из того же числа элементов. [1] : 258  (будь то оцененный или известный заранее ) может использоваться для оценки дисперсии оценщика в тех случаях, когда выборка не формируется с использованием простой случайной выборки. Это также может быть полезно при расчете размера выборки. [2] и для количественной оценки репрезентативности проб, собранных с использованием различных планов выборки.

Эффект дизайна — это положительное действительное число , которое указывает на инфляцию ( ), или дефляция ( ) в дисперсии оценки некоторого параметра, что связано с исследованием без использования SRS (с , когда дисперсии одинаковы). [3] : 53, 54  Интуитивно мы можем получить когда у нас есть некоторые априорные знания, которые мы можем использовать в процессе выборки (что бывает довольно редко). И, напротив, мы часто получаем когда нам нужно компенсировать некоторые ограничения в нашей способности собирать данные (что встречается чаще). Некоторые схемы выборки, которые могли бы представить обычно больше 1, включают: кластерную выборку (например, когда существует корреляция между наблюдениями), стратифицированную выборку (с непропорциональным распределением по размерам страт), кластерное рандомизированное контролируемое исследование , непропорциональную (неравную вероятность) выборку (например, выборку Пуассона ), статистические корректировки данных по непокрытию или неполучению ответов и многие другие. Стратифицированная выборка может дать это значение меньше 1 при использовании пропорционального распределения по размерам страт (когда они известны априорно и коррелируют с интересующим результатом) или оптимального распределения (когда дисперсия различается между стратами и известна априори). [ нужна ссылка ]

В литературе было предложено множество расчетов (и оценок) того, как известный план выборки влияет на дисперсию интересующих оценок, увеличивая или уменьшая ее. Как правило, эффект схемы варьируется в зависимости от различных статистических данных, таких как среднее значение общего числа или отношения . Также имеет значение, коррелирует ли структура выборки с интересующим результатом. Например, возможная схема выборки может быть такой, что каждый элемент выборки может иметь разную вероятность быть выбранным. В таких случаях уровень корреляции между вероятностью выбора элемента и его измеренным результатом может иметь прямое влияние на последующий эффект проектирования. Наконец, на эффект дизайна может влиять распределение самого результата. Все эти факторы следует учитывать при оценке и использовании эффекта дизайна на практике. [4] : 13 

Термин «эффект дизайна» был придуман Лесли Кишем в его книге «Выборка выборки» 1965 года. [1] : 88, 258  В ней Киш предложил общее определение эффекта дизайна: [а] а также формулы расчетного эффекта кластерной выборки (с внутриклассовой корреляцией); [1] : 162  и знаменитая формула эффекта дизайна для выборки с неравной вероятностью . [1] : 427  Их часто называют «эффектом дизайна Киша», а позже они были объединены в единую формулу.

В статье 1995 года [5] : 73  Киш упоминает, что аналогичная концепция, названная «лексисным соотношением», была описана в конце XIX века. Тесно связанная внутриклассовая корреляция была описана Фишером в 1950 году, тогда как расчеты отношений дисперсий уже были опубликованы Кишем и другими с конца 1940-х по 1950-е годы. Одним из предшественников определения Киша была работа Корнфилда в 1951 году. [6] [4]

В своей статье 1995 года Киш предположил, что учет эффекта схемы необходим при усреднении одной и той же измеренной величины по результатам нескольких исследований, проведенных за определенный период времени. [5] : 57–62  Он также предложил учитывать эффект дизайна при экстраполяции ошибок простых статистических данных (например, среднего значения) к более сложным (например, коэффициентам регрессии). Однако при анализе данных (например, использовании данных опросов для соответствия моделям) значения в настоящее время менее полезны из-за наличия специализированного программного обеспечения для анализа данных опросов. До разработки программного обеспечения, которое вычисляет стандартные ошибки для многих типов проектов и оценок, аналитики корректировали стандартные ошибки, создаваемые программным обеспечением, которое предполагало, что все записи в наборе данных идентифицированы, путем умножения их на (см. определение Deft ниже). [ нужна ссылка ]

Определения

[ редактировать ]

Обозначения

[ редактировать ]
Таблица 1: Сводка обозначений
Символ Описание
Отклонение оценки при заданном плане выборки
Отклонение оценки при простой случайной выборке без замещения (SRSWOR)
Отклонение оценки при простой случайной выборке с заменой (SRSWR)
, Эффект дизайна, мера влияния плана выборки на дисперсию оценщика по сравнению с простой случайной выборкой без замены (SRSWOR),
, Коэффициент эффекта плана, квадратный корень из отношения дисперсий при данном плане выборки и SRS с заменой (SRSWR),
Размер выборки
Численность населения
Эффективный размер выборки, размер выборки в соответствии с SRS, необходимый для достижения той же дисперсии, что и заданный план выборки,
Вес для -я единица
Размер выборки для страты
Численность населения по страте
Вес для слоя
Общее количество слоев
, Средний размер кластера
Общее количество кластеров
Размер выборки для кластера
Коэффициент внутриклассовой корреляции (ICC) для кластерной выборки
, , Меры вариации весов с использованием квадрата коэффициента вариации (CV) (релвариантность)
Предполагаемая корреляция между переменной результата и вероятности выбора
Расчетная точка пересечения в линейной регрессии выходной переменной о вероятностях выбора
Предполагаемое стандартное отклонение итоговой переменной
, Коэффициент вариации для весов и вероятности выбора , соответственно
Доля выборки,
Популяционная дисперсия конечной переменной
, Вероятность выбора для -я единица
Вероятность включения -я единица

Эффект дизайна , обычно обозначаемый (или , иногда с дополнительными индексами), — отношение двух теоретических дисперсий оценок некоторого параметра ( ): [1] [7]

  • Числитель представляет фактическую дисперсию оценки параметра ( ) при заданном плане выборки ;
  • Знаменатель представляет собой дисперсию при условии одинакового размера выборки, но если выборка была получена с использованием оценщика для простой случайной выборки без замены ( ).

Так что:

Другими словами, измеряет степень увеличения дисперсии (или, в некоторых случаях, уменьшения) в результате того, что выборка была составлена ​​и скорректирована в соответствии с конкретным планом выборки (например, с использованием весов или других показателей) по сравнению с тем, если бы выборка была составлена ​​из простой случайной выборки. (без замены). Обратите внимание, как определение основан на параметрах популяции, которые часто неизвестны и которые трудно оценить напрямую. В частности, это определение включает в себя дисперсию оценок при двух разных планах выборки, хотя на практике используется только один план выборки. [ нужна ссылка ]

Например, при оценке среднего значения численности населения (для некоторых планов выборки p) составляет: [4] : 4  [3] : 54  [б]

Где размер выборки, - доля выборки от генеральной совокупности, - (квадратная) конечная популяционная поправка (FPC), несмещенная выборочная дисперсия , и является некоторой оценкой дисперсии среднего значения при схеме выборки. Проблема с приведенной выше формулой заключается в том, что крайне редко удается напрямую оценить дисперсию расчетного среднего значения при двух разных схемах выборки, поскольку большинство исследований полагаются только на одну схему выборки.

Существует множество способов расчета , в зависимости от интересующего параметра (например, общая численность населения, среднее значение генеральной совокупности, квантили, соотношение количеств и т. д.), используемого оценщика и схемы выборки (например, кластерная выборка, стратифицированная выборка, пост-стратификация, многоэтапная выборка и т. д.). .). [8] : 98  Процесс оценки для конкретных конструкций будут описаны в следующем разделе .

Соответствующее количество , предложенный Кишем в 1995 году, представляет собой расчетный эффект-фактор , сокращенно (или также ). [5] : 56  [4] Он определяется как квадратный корень из коэффициентов дисперсии, при этом в знаменателе используется простая случайная выборка с заменой (SRSWR), а не без замены (SRSWOR):

В этом более позднем определении (предложенном в 1995 г. по сравнению с 1965 г.) Киш выступал за использование над по нескольким причинам. Утверждалось, что SRS «без замещения» (с его положительным влиянием на дисперсию) следует отражать в знаменателе определения эффекта схемы, поскольку он является частью плана выборки. Кроме того, поскольку часто использование коэффициента находится в доверительных интервалах ), утверждалось, что использование будет проще, чем писать . Говорят также, что во многих случаях, когда популяция очень велика, (почти) квадратный корень из ( ), следовательно, его проще использовать, чем точно рассчитывать поправку на конечную численность (FPC). [ нужна ссылка ] [с]

Несмотря на это, в различных случаях исследователь может приблизительно путем расчета дисперсии в числителе, предполагая SRS с заменой (SRSWR) вместо SRS без замены (SRSWOR), даже если это неточно. Например, рассмотрим многоступенчатый план, в котором первичные единицы выборки (ПЕВ) отбираются систематически с вероятностью, пропорциональной некоторой мере размера, из списка, отсортированного определенным образом (скажем, по количеству домохозяйств в каждой ПЕВ). Кроме того, пусть он будет объединен с оценщиком, который использует сгребание для сопоставления итогов по нескольким демографическим переменным. В такой схеме вероятности совместного выбора для ПЕВ, которые необходимы для оценки дисперсии без замены, равны 0 для некоторых пар ПЕВ, что означает, что точной оценки дисперсии на основе плана (т. е. с повторной выборкой) не существует. Другой пример — когда для анализа используется файл общего пользования, выданный каким-либо государственным органом. В этом случае информация о вероятностях совместного выбора блоков первой ступени практически никогда не публикуется. В результате аналитик не может оценить а с заменой дисперсии числителя, даже если это необходимо. Стандартным обходным решением является вычисление оценки дисперсии, как если бы ПЕВ были выбраны с заменой. Это выбор по умолчанию в таких пакетах программного обеспечения, как Stata, пакет опросов R и процедуры опросов SAS. [ нужна ссылка ]

Эффективный размер выборки

[ редактировать ]

Эффективный размер выборки , определенный Кишем в 1965 году, рассчитывается путем деления исходного размера выборки на эффект схемы. [1] : 162, 259  [9] : 190, 192  А именно:

Эта величина отражает, каким был бы размер выборки, необходимый для достижения текущей дисперсии оценщика (для некоторого параметра) при существующем плане, если бы план выборки (и соответствующий оценщик параметров) был основан на простой случайной выборке . [10]

Связанная с этим величина — это эффективного размера выборки коэффициент , который можно рассчитать, просто взяв обратную величину. (т.е. ).

Например, пусть эффект схемы для оценки среднего значения совокупности на основе некоторого плана выборки равен 2. Если размер выборки равен 1000, то эффективный размер выборки будет равен 500. Это означает, что дисперсия средневзвешенного значения, основанного на 1000, равна 2 . выборки будут такими же, как и простое среднее значение , основанное на 500 выборках, полученных с использованием простой случайной выборки.

Эффект плана для известных планов выборки

[ редактировать ]

Эффект схемы зависит от схемы выборки и статистических корректировок.

[ редактировать ]

Различные схемы выборки и статистические корректировки могут существенно по-разному влиять на систематическую ошибку и дисперсию оценок (например, среднего значения). [ нужна ссылка ]

Примером схемы, которая может привести к повышению эффективности оценки по сравнению с простой случайной выборкой, является стратифицированная выборка . Эта эффективность достигается за счет использования информации о составе населения. Например, если известно, что пол коррелирует с интересующим результатом, а также что соотношение мужчин и женщин для некоторой популяции составляет (скажем) 50%-50%, то выборка ровно половины выборки каждого пола уменьшит дисперсия оценки результата. Аналогичным образом, если какая-то конкретная подгруппа населения представляет особый интерес, намеренное увеличение выборки из этой подгруппы населения уменьшит дисперсию оценок, сделанных по ней. [ нужна ссылка ]

Повышение эффективности дисперсии иногда может быть принесено в жертву ради удобства или стоимости. Например, в случае кластерной выборки единицы могут иметь равные или неравные вероятности выбора, независимо от их внутриклассовой корреляции (и их отрицательного эффекта увеличения дисперсии оценок). Мы могли бы решить (по практическим соображениям) собирать ответы только от двух человек из каждого домохозяйства (т. е. от выборочного кластера), что могло бы привести к более сложной корректировке после выборки, чтобы справиться с неравными вероятностями отбора. Кроме того, такие решения могут привести к менее эффективным оценкам, чем просто взятие фиксированной доли ответов из кластера. [ нужна ссылка ]

Если план выборки не установлен заранее и его необходимо определить на основе имеющихся у нас данных, это может привести к увеличению как дисперсии, так и систематической ошибки взвешенной оценки. Это может произойти при внесении корректировок по таким вопросам, как непокрытие, отсутствие ответов или неожиданное разделение слоев населения, которое не было доступно на начальном этапе выборки. В этих случаях мы могли бы использовать статистические процедуры, такие как постстратификация, ранжирование или обратное взвешивание оценки склонности (где оценки склонности оцениваются), среди других методов. Использование этих методов требует предположений относительно исходной проектной модели. Например, когда мы используем пост-стратификацию по возрасту и полу, предполагается, что эти переменные могут объяснить значительную часть систематической ошибки в выборке. Качество этих оценок тесно связано с качеством дополнительной информации и отсутствием случайных предположений, используемых при их составлении. В любом случае, даже когда оценщики (например, модели оценки склонности) хорошо справляются с задачей, охватывая большую часть плана выборки, использование весов может иметь небольшую или большую разницу, в зависимости от конкретного набора данных. [ нужна ссылка ]

Из-за большого разнообразия планов выборки (с влиянием или без влияния на неравные вероятности отбора) были разработаны различные формулы для учета потенциального эффекта схемы, а также для оценки дисперсии оценок при учете планов выборки. [11] Иногда эти различные эффекты дизайна могут быть объединены вместе (как в случае с неравной вероятностью выбора и кластерной выборкой, подробнее об этом читайте в следующих разделах). Использовать ли эти формулы или просто предположить SRS, зависит от ожидаемой величины снижения систематической ошибки по сравнению с увеличением дисперсии оценки (и накладных расходов, связанных с методологической и технической сложностью). [1] : 426 

Таблица 2. Сводная информация о формулах эффекта дизайна
Название формулы Уравнение Описание
Эффект конструкции Киша для неравных весов Измеряет потерю точности из-за неравных весов, где это вес для -ая единица.
Эффект дизайна Киша для кластерной выборки Измеряет потерю точности из-за кластерной выборки, где средний размер кластера и – внутриклассовая корреляция.
Комбинированный дизайнерский эффект Киша Измеряет совокупный эффект неравных весов и кластерной выборки, где и размер и вес выборки для -й слой соответственно.
Эффект расчета Спенсера для расчетной суммы Измеряет эффект схемы для оценки итоговой суммы, когда существует корреляция между результатом и вероятностями выбора, где - предполагаемая корреляция, - реляционность весов, - предполагаемый перехват, и — предполагаемое стандартное отклонение результата.
Эффект дизайна Парка и Ли для расчетного среднего отношения Измеряет эффект схемы для оценки среднего отношения, когда существует корреляция между результатом и вероятностями выбора, где и – коэффициенты вариации весов и вероятностей выбора соответственно.
Эффект конструкции Генри для калибровочного взвешивания Расширяет эффект конструкции Киша, включив в него калибровочное взвешивание в одноэтапных образцах. Предлагает показатель эффекта дизайна с помощью модели для одноэтапной выборки с калибровочным взвешиванием, учитывая корреляцию между результатом и калибровочными переменными.
Эффект дизайна Лора для наклона регрессии Предоставляет формулы эффекта дизайна для оценок наклона регрессии OLS и GLS при кластерной выборке. Представлены формулы эффекта дизайна для оценок наклона регрессии обычных наименьших квадратов (OLS) и обобщенных наименьших квадратов (GLS) в контексте кластерной выборки с использованием модели случайных коэффициентов.

Неравные вероятности выбора

[ редактировать ]

Источники неравных вероятностей отбора

[ редактировать ]
Таблица 3: Сводная информация об источниках неравных вероятностей выбора
Источник Описание Примеры Влияние на вероятность выборки
Непропорциональная выборка Намеренно завышенная/заниженная выборка определенных подгрупп или групп - Оптимальное распределение при стратифицированной выборке
- Передискретизация небольших групп для сравнения
- Кластерная выборка с неравными размерами кластеров.
Приводит к неравным вероятностям выбора по замыслу
Непокрытие Неспособность включить все элементы целевой совокупности в основу выборки - Выборка на основе неполных списков (например, телефонных книг)
- Реклама для набора участников опроса
Влияет на вероятность выборки, но это влияние трудно измерить и скорректировать.
Отсутствие ответа Неспособность получить измерения от отобранных единиц, которые предназначались для измерения - Отсутствие ответа подразделения (например, отказ, отсутствие дома)
- Отсутствие ответа на вопрос (например, деликатные вопросы)
- Неспособность ответить (например, языковой барьер, болезнь)
Приводит к неравной вероятности отбора, поскольку уровень неполучения ответов может различаться в зависимости от подгруппы.
Статистические корректировки Последующие корректировки весов выборки для учета известных характеристик совокупности или для смягчения систематических ошибок в связи с непокрытием и отсутствием ответов. - Постстратификация
- Грабли
- Взвешивание оценки склонности
- Калибровочное взвешивание
Вводит неравные веса для улучшения репрезентативности, но может увеличить дисперсию.

Существуют различные способы выборки единиц, чтобы каждая единица имела одинаковую вероятность выбора. Такие методы называются методами равновероятной выборки (EPSEM). Некоторые из наиболее простых методов включают простую случайную выборку (SRS, с заменой или без нее) и систематическую выборку для получения выборки фиксированного размера. Существует также выборка Бернулли со случайным размером выборки. Более продвинутые методы, такие как стратифицированная выборка и кластерная выборка, также могут быть разработаны для EPSEM. Например, при кластерной выборке мы можем использовать двухэтапную выборку, при которой мы отбираем каждый кластер (который может иметь разные размеры) с равной вероятностью, а затем отбираем из каждого кластера на втором этапе, используя SRS с фиксированной пропорцией (например, выборка половина кластера, весь кластер и т. д.). Этот метод даст EPSEM, но конкретное количество элементов, которые мы получим, является стохастическим (т. е. недетерминированным). [д] [12] : 3–8  Другая стратегия кластерной выборки, которая приводит к EPSEM, заключается в выборке кластеров способом, пропорциональным их размерам, а затем выборке фиксированного количества элементов внутри каждого кластера. [и]

В своих работах Киш и другие выделяют несколько известных причин, приводящих к неравным вероятностям отбора: [1] : 425  [9] : 185  [5] : 69  [13] : 50, 395  [14] : 306 

  1. Непропорциональная выборка из-за структуры или процедуры отбора. Это происходит, когда исследователь намеренно увеличивает или занижает выборку определенных подгрупп или кластеров. Например:
    • При стратифицированной выборке , когда известно, что единицы из некоторых слоев имеют большую дисперсию, чем другие слои. В таких случаях намерение исследователя может состоять в том, чтобы использовать эти предварительные знания о дисперсии между слоями, чтобы уменьшить общую дисперсию оценки некоторого интересующего параметра уровня популяции (например, среднего значения). Этого можно достичь с помощью стратегии, известной как оптимальное распределение , при которой страта избыточная выборка пропорциональна более высокому стандартному отклонению и более низкой стоимости выборки (т. е. , где стандартное отклонение результата в , и относится к стоимости набора одного элемента из ). Примером оптимального распределения является оптимальное распределение Неймана , которое, когда стоимость набора людей из каждой страты фиксирована, размер выборки составляет: . Если суммирование производится по всем слоям: n — общий размер выборки; — размер выборки для слоя h ; – относительный размер слоя h по сравнению со всей совокупностью N ; и — стандартная ошибка в слое h . [15] Родственной концепции оптимального планирования является оптимальный план эксперимента .
    • Если существует интерес к сравнению двух слоев (например, людей из двух конкретных социально-демографических групп или из двух регионов и т. д.), в этом случае меньшая группа может быть подвергнута избыточной выборке. Таким образом, дисперсия средства оценки, сравнивающего две группы, уменьшается.
    • При кластерной выборке могут быть кластеры разного размера, но процедура осуществляет выборку из всех кластеров с помощью SRS , и измеряются все элементы в кластере (например, если размеры кластера не известны заранее на этапе выборки).
    • В некоторых случаях двухэтапная кластерная выборка основана на размерах кластеров. Например, когда на первом этапе кластеры отбираются пропорционально оценке их размера (так называемая вероятность PPS , пропорциональная размеру), а на втором этапе выбирается фиксированная пропорция элементов (например, половина или все элементы в кластер) — тогда вероятности выбора различны для элементов из разных кластеров. Похожий случай: первый этап пытается выполнить выборку кластеров с использованием PPS, второй этап использует фиксированное количество элементов в каждом кластере, но размеры кластеров, использованные для выборки на первом этапе, были неточными (так что некоторые меньшие кластеры могут иметь шанс быть выбранным выше, чем должен, и наоборот для более крупных кластеров со слишком малым шансом попасть в выборку). В таких случаях, чем больше ошибки в вероятностях выборки, использованных на первом этапе, тем больше будут неравные вероятности отбора для каждого элемента. [8] : 109  [ф]
    • Когда основа, используемая для выборки, включает дублирование некоторых элементов, что приводит к тому, что некоторые элементы имеют большую вероятность попасть в выборку, чем другие (например, если основа выборки была создана путем объединения нескольких списков. Или если набор пользователей из нескольких рекламных каналов в котором некоторые пользователи доступны для набора по нескольким каналам, в то время как другие доступны для набора только по одному из каналов), так что разные единицы будут иметь разные вероятности выборки, что делает эту процедуру выборки не EPSEM. [12] : 3–8  [9] : 186 
    • Когда необходимо объединить несколько разных образцов/кадров. Например, если проводить разные рекламные кампании по набору респондентов. Или при объединении результатов нескольких исследований, проведенных разными исследователями и/или в разное время (т. е. метаанализ ). [9] : 188 
    Когда происходит непропорциональная выборка из-за решений по планированию выборки, исследователь может (иногда) иметь возможность отследить решение и точно рассчитать точную вероятность включения. Когда эти вероятности выбора трудно проследить, их можно оценить с использованием некоторой модели оценки склонности в сочетании с информацией из вспомогательных переменных (например, возраста, пола и т. д.).
  2. Непокрытие . [1] : 527, 528  Это происходит, например, если выборка людей осуществляется на основе некоторого заранее определенного списка, который не включает всех людей в совокупности (например, телефонная книга или использование рекламы для набора людей для участия в опросе). Эти недостающие единицы отсутствуют из-за того, что не удалось создать основу выборки , а не из-за преднамеренного исключения некоторых людей (например, несовершеннолетних, людей, которые не могут голосовать и т. д.). Считается, что влияние неохвата на вероятность выборки трудно измерить (и скорректировать) в различных ситуациях обследования, если не сделаны серьезные предположения. Корректировки на непокрытие могут привести к неадекватным весам, если для корректировки не используются соответствующие ковариаты. Если существуют ковариаты, которые можно использовать для корректировки непокрытия, ожидается, что они приведут к неравным весам опросов.
  3. Отсутствие ответа . Это относится к невозможности получить измерения единиц выборки, которые предназначены для измерения. Причины отсутствия ответа различны и зависят от контекста. Человек может быть временно недоступен, например, если он не может ответить на звонок во время телефонного опроса. Человек также может отказаться отвечать на опрос по разным причинам, например, из-за разных тенденций людей из разных этнических/демографических/социально-экономических групп отвечать в целом; недостаточный стимул тратить время или делиться данными; название учреждения, проводящего обследование; неспособность ответить (например, из-за болезни, неграмотности или языкового барьера); ответчик не найден (например, переехал); ответ был потерян/уничтожен во время кодирования или передачи (т.е. ошибка измерения). В контексте опросов эти причины могут быть связаны с ответами на весь опрос или только на конкретные вопросы. [1] : 532  [9] : 186 
  4. Статистические корректировки . Они могут включать в себя такие методы, как модели пост-стратификации , рейтинга или оценки склонности (оценки) , используемые для корректировки выборки до некоторых известных (или предполагаемых) размеров слоев. Эти корректировки могут дополнять расчетные веса , целью которых является учет дисбалансов, возникающих из-за какой-либо известной схемы выборки. Такие процедуры используются для устранения проблем при составлении выборки, начиная от ошибок выборки , недостаточного охвата основы выборки и заканчивая неполучением ответов. [16] : 45  [17] Например, эти методы можно использовать для того, чтобы сделать выборку более похожей на некоторые целевые «контроли» (т. е. представляющую интерес совокупность), процесс, также называемый «стандартизацией». [9] : 187  В таких случаях эти корректировки помогают получить несмещенные оценки (часто за счет увеличения дисперсии, как показано в следующих разделах). Если исходная выборка является невероятностной выборкой , то корректировки после стратификации аналогичны квотной выборке . [9] : 188, 189  Обратите внимание, что если используется простая случайная выборка, постстратификация (с использованием некоторой вспомогательной информации) не дает оценки, которая будет равномерно лучше, чем просто невзвешенная оценка. Однако его можно рассматривать как более «надежную» оценку. [18] Альтернативно, когда план выборки полностью известен (что приводит к некоторому вероятность выбора некоторого элемента из страты h ), а отсутствие ответа измеримо (т.е. мы знаем, что только наблюдения, на которые даны ответы в слое h ), то точно известный вес обратной вероятности можно вычислить для каждого элемента i из слоя h, используя: . [9] : 186  [г] Иногда для оценки вероятности выбора используется статистическая корректировка, такая как пост-стратификация или рейкинг. Например, при сравнении имеющейся у нас выборки с той же целевой группой населения это также называется сопоставлением с контролем. Процесс оценки может быть сосредоточен только на приведении существующей популяции к альтернативной популяции (например, при попытке экстраполяции панели, составленной из нескольких регионов, на всю страну). В таком случае корректировка может быть сосредоточена на некотором калибровочном коэффициенте. и веса вычисляются как . [9] : 187  Однако в других случаях как недостаточный охват, так и неполучение ответов моделируются как часть статистической корректировки, что приводит к оценке общей вероятности выборки (скажем, ). В таком случае веса просто: . Обратите внимание, что при использовании статистических корректировок часто оценивается на основе какой-либо модели. Формулировки в следующих разделах предполагают это. известно, что неверно для статистических поправок (поскольку мы имеем только ). Однако если предположить, что ошибка оценки очень мал, то следующие разделы можно использовать, как если бы он был известен. Верность этого предположения зависит от размера выборки, используемой для моделирования, и об этом стоит помнить во время анализа. Когда вероятности выбора могут быть разными, размер выборки случайен, а вероятности попарного выбора независимы, мы называем это выборкой Пуассона . [19]

«На основе дизайна» и «на основе модели» для описания свойств оценщиков

[ редактировать ]

Поправка на выбор с неравной вероятностью с помощью «индивидуальных весов случаев» (например, взвешивание обратной вероятности) дает различные типы оценок интересующих величин. Оценщики, такие как оценщик Хорвица – Томпсона, дают несмещенные оценки (если вероятности выбора действительно известны или приблизительно известны) для общей суммы и среднего значения генеральной совокупности. Девилль и Серндал (1992) ввели термин « калибровочная оценка » для оценок, использующих веса, удовлетворяющие некоторым условиям, например, когда сумма весов равна размеру популяции. И вообще, что взвешенная сумма весов равна некоторому количеству вспомогательной переменной: (например, что сумма взвешенных возрастов респондентов равна численности населения в каждой возрастной группе). [20] [17] : 132  [21] : 1 

Два основных способа спорить о свойствах калибровочных оценок: [17] : 133–134  [22]

  1. на основе рандомизации (или на основе схемы выборки) — в данном случае веса ( ) и значения интересующего результата все измеренные в образце значения считаются известными. В этой схеме существует изменчивость (известных) значений результата ( Y ). Однако единственная случайность связана с тем, какой из элементов совокупности был выбран в выборку (часто обозначаемый как , получая 1, если элемент находится в выборке и 0, если это не так). Для простой случайной выборки каждый будет IID- распределением Бернулли с некоторым параметром . Для общего EPSEM (выборка равной вероятности) все равно будет Бернулли с каким-то параметром , но они больше не могут быть независимыми случайными величинами. То есть знание того, что выборка является EPSEM, означает, что она поддерживает маргинально равную вероятность отбора, но не сообщает нам об общей вероятности отбора. Для чего-то вроде пост-стратификации количество элементов в каждой страте можно смоделировать как полиномиальное распределение с разными вероятности включения для каждого элемента, принадлежащего некоторому страту . В этих случаях сам размер выборки может быть случайной величиной.
  2. на основе модели — в этом случае выборка фиксирована, веса фиксированы, но интересующий результат рассматривается как случайная величина. Например, в случае постстратификации результат можно смоделировать как некоторую функцию линейной регрессии , где независимыми переменными являются переменные-индикаторы, сопоставляющие каждое наблюдение с соответствующим слоем, а изменчивость сопровождается ошибкой.

Как мы увидим позже, некоторые доказательства в литературе опираются на структуру, основанную на рандомизации, в то время как другие сосредоточены на модели, основанной на перспективе. При переходе от среднего к взвешенному среднему добавляется больше сложности. Например, в контексте методологии опроса часто сама численность населения считается неизвестной величиной, которая оценивается. Таким образом, расчет средневзвешенного значения фактически основан на оценке отношения с оценкой общей суммы в числителе и оценкой численности населения в знаменателе (что делает расчет дисперсии более сложным). [23] [3] : 182 

Распространенные типы гирь

[ редактировать ]
Таблица 4. Сводка распространенных типов весов, используемых при расчете эффекта дизайна
Тип веса Описание Интерпретация
Частотные веса Каждый вес представляет собой целое число, указывающее абсолютную частоту появления элемента в выборке. Конкретная ценность имеет абсолютное значение; веса представляют количество информации в наборе данных
Веса обратной дисперсии Каждому элементу присваивается вес, обратный его известной дисперсии. Когда все элементы имеют одинаковое математическое ожидание, использование таких весов для взвешенных средних имеет наименьшую дисперсию.
Нормализованные (выпуклые) веса Веса образуют выпуклую комбинацию (сумма равна 1); может быть нормализовано до суммы размера выборки (n) Веса, сумма которых равна n, имеют относительную интерпретацию: элементы с весами > 1 более «редки», чем в среднем, и оказывают большее влияние (скажем) на среднее значение, в то время как веса < 1 являются более «распространенными» и менее влиятельными.
Веса обратной вероятности Каждому элементу присваивается вес, пропорциональный обратной вероятности его выбора. Веса показывают, сколько элементов каждый элемент «представляет» в целевой совокупности; сумма весов равна размеру целевой совокупности

Существует множество типов (и подтипов) весов с разными способами их использования и интерпретации. Для некоторых весов их абсолютное значение имеет важное значение, тогда как для других весов важной частью являются относительные значения весов друг к другу. В этом разделе представлены некоторые из наиболее распространенных типов весов, чтобы на них можно было ссылаться в последующих разделах.

  • Частотные веса [24] являются базовым типом взвешивания, представленным на вводных курсах по статистике. При этом каждый вес представляет собой целое число, которое указывает абсолютную частоту элемента в выборке. Их также иногда называют весами повторения (или вхождения). Конкретное значение имеет абсолютное значение, которое теряется при преобразовании весов, например при масштабировании . Например: если у нас есть числа 10 и 20 со значениями частотных весов 2 и 3, то при «размазывании» наших данных это будут: 10,10, 20, 20, 20 (с весами 1 каждому из этих элементов). ). Веса частоты включают в себя объем информации, содержащейся в наборе данных, и, таким образом, позволяют создавать взвешенной дисперсии несмещенную оценку с использованием поправки Бесселя . Обратите внимание, что такие веса часто являются случайными переменными , поскольку конкретное количество элементов, которые мы увидим для каждого значения в наборе данных, является случайным.
  • взвешивание обратной дисперсии , также известное как аналитические веса , [24] это когда каждому элементу присваивается вес, обратный его (известной) дисперсии. [25] [9] : 187  Когда все элементы имеют одинаковое математическое ожидание, использование таких весов для расчета средневзвешенных значений имеет наименьшую дисперсию среди всех средневзвешенных значений. В общей формулировке эти веса известны и не случайны.
  • Нормализованные (выпуклые) веса — это набор весов, образующих выпуклую комбинацию , т. е. каждый вес представляет собой число от 0 до 1, а сумма всех весов равна 1. Любой набор (неотрицательных) весов можно превратить на нормализованные веса путем деления каждого веса на сумму всех весов, в результате чего эти веса нормализуются до суммы, равной 1.
Родственная форма — это веса, нормализованные по сумме с размером выборки (n) . Сумма этих (неотрицательных) весов равна размеру выборки (n), а их среднее значение равно 1. Любой набор весов можно нормализовать по размеру выборки, разделив каждый вес на среднее значение всех весов. Эти веса имеют хорошую относительную интерпретацию: элементы с весами больше 1 более «влиятельны» (с точки зрения их относительного влияния, скажем, на средневзвешенное значение), чем среднее наблюдение, тогда как веса меньше 1 менее «влиятельны», чем среднее наблюдение.
  • Взвешивание обратной вероятности , или просто веса вероятности , [24] это когда каждому элементу присваивается вес, который (пропорционален) обратной вероятности выбора этого элемента. Например, с помощью . [9] : 185  С помощью весов обратной вероятности мы узнаем, сколько элементов каждый элемент «представляет» в целевой совокупности. Следовательно, сумма таких весов возвращает размер интересующей целевой совокупности. Веса обратной вероятности можно нормализовать до суммы 1 или нормализовать до суммы размера выборки (n), и многие расчеты из следующих разделов дадут одни и те же результаты.
Когда выборка представляет собой EPSEM , все вероятности равны, и обратная вероятность выбора дает веса, которые все равны друг другу (все они равны , где размер выборки и это численность населения). Такая выборка называется самовзвешивающейся выборкой . [9] : 193 

Существуют также косвенные способы применения «взвешенных» корректировок. Например, существующие случаи могут быть продублированы для условных отсутствующих наблюдений (например, из-за отсутствия ответов), при этом дисперсия оценивается с использованием таких методов, как множественное вменение . Альтернативный подход — удалить (присвоить вес 0) некоторым случаям. Например, при желании уменьшить влияние групп с избыточной выборкой, которые менее важны для некоторого анализа. Оба случая по своей природе аналогичны взвешиванию обратной вероятности, но на практике приложение дает больше/меньше строк данных (что потенциально упрощает использование входных данных в некоторых программных реализациях) вместо применения дополнительного столбца весов. Тем не менее, последствия таких реализаций аналогичны простому использованию весов. Таким образом, хотя в случае удаления наблюдений данные могут быть легко обработаны обычными программными реализациями, случай добавления строк требует специальных корректировок оценок неопределенности. Невыполнение этого требования может привести к ошибочным выводам (т.е. никакого бесплатного обеда при использовании альтернативного представления основных проблем). [9] : 189, 190 

Термин «случайные веса», придуманный Кишем, используется для обозначения весов, которые соответствуют неравным вероятностям выбора , но не связаны с ожиданием или дисперсией выбранных элементов. [9] : 190, 191 

Случайные веса с расчетным средним отношением ( ) - Эффект дизайна Киша

[ редактировать ]

При взятии неограниченной выборки элементы, мы можем затем случайным образом разделить эти элементы на непересекающиеся слои, каждый из которых содержит некоторый размер элементы так, чтобы . Все элементы в каждом слое им присвоен некоторый (известный) неотрицательный вес ( ). Вес может быть получен путем обратной некоторой неравной вероятности выбора для элементов в каждом слое (т.е. взвешивание обратной вероятности с помощью такой процедуры, как постстратификация). В этой ситуации эффект плана Киша для увеличения дисперсии выборочного средневзвешенного значения из-за этого плана (отраженного в весах) по сравнению с SRS некоторой выходной переменной y (когда нет корреляции между весами и результатом, т.е. случайные веса): [1] : 427  [9] : 191(4.2) 

Рассматривая каждый элемент как принадлежащий отдельному слою Киш (в 1992 г.) упростил приведенную выше формулу до (известной) следующей версии: [9] : 191(4.3)  [26] : 318  [4] : 8 

Эта версия формулы действительна, когда из одной страты взято несколько наблюдений (т. е. каждое имеет одинаковый вес) или когда стратов много, и из каждой из них взято одно наблюдение, но несколько из них имеют одинаковый вес. вероятность выбора. Хотя интерпретация немного различается, расчет обоих сценариев оказывается одинаковым.

При использовании эффекта схемы Киша для неравных весов вы можете использовать следующую упрощенную формулу для « . Эффективного размера выборки Киша» [27] [1] : 162, 259 

[Доказательство]
Предположения и доказательства
[ редактировать ]

Приведенная выше формула Киша дает увеличение дисперсии средневзвешенного значения на основе «случайных» весов . Это также можно записать в виде следующей формулы, где y — наблюдения, выбранные с использованием неравных вероятностей отбора (без внутрикластерной корреляции и без связи с ожиданием или дисперсией измерения результата), [9] : 190, 191  и y' — это наблюдения, которые мы получили бы, если бы получили их из простой случайной выборки :

Можно показать, что формулу отношения дисперсий можно свести к формуле Киша, используя перспективу, основанную на модели . [28] В нем формула Киша будет справедлива, когда все n наблюдений ( ) (по крайней мере приблизительно) некоррелированы ( ), с той же дисперсией ( ) в интересующей переменной ответа (y). Также необходимо будет предположить, что сами веса являются не случайной величиной , а скорее некоторыми известными константами (например, обратной вероятностью отбора для некоторого заранее определенного и известного плана выборки ). [ нужна ссылка ]

[Доказательство]

Условия для y тривиально выполняются, если наблюдения y являются IID с одинаковыми математическим ожиданием и дисперсией . В таких случаях , и мы можем оценить используя . [9] [29] Если не все значения y имеют одинаковые ожидания, мы не можем использовать предполагаемую дисперсию для расчета, поскольку эта оценка предполагает, что все у нас одинаковые ожидания. В частности, если существует корреляция между весами и выходной переменной y, то это означает, что ожидание y не одинаково для всех наблюдений (а, скорее, зависит от конкретного значения веса для каждого наблюдения). В таком случае, хотя формула эффекта дизайна может быть верной (если соблюдаются другие условия), для нее потребуется другая оценка дисперсии средневзвешенного значения. Например, возможно, лучше использовать оценщик взвешенной дисперсии . [ нужна ссылка ]

Если другое Значения s имеют разные дисперсии, тогда, хотя взвешенная дисперсия может отражать правильную дисперсию на уровне совокупности, формула Киша для эффекта дизайна может больше не быть верной. [ нужна ссылка ]

Аналогичная проблема возникает, если в выборках присутствует некоторая корреляционная структура (например, при использовании кластерной выборки ). [ нужна ссылка ]

Отношение к коэффициенту вариации
[ редактировать ]

Обратите внимание, что определение эффекта дизайна, данное Кишем, тесно связано с коэффициентом вариации (Киш также называет его ревариантностью или relvar) . для краткости [час] ) весов (при использовании нескорректированного (на уровне генеральной совокупности) стандартного отклонения выборки для оценки ). В литературе это имеет несколько обозначений: [9] : 191  [13] : 396 

.

Где это популяционная дисперсия , и это среднее значение. Когда веса нормализованы к размеру выборки (так что их сумма равна n, а среднее значение равно 1), тогда и формула сводится к . Хотя мы действительно предполагаем, что веса фиксированы, мы можем думать об их дисперсии как о дисперсии эмпирического распределения, определяемого путем выборки (с равной вероятностью) одного веса из нашего набора весов (аналогично тому, как мы думаем о корреляции x и y в простой линейной регрессии ). [ нужна ссылка ]

[Доказательство]
Отношение к непропорциональной стратифицированной выборке
[ редактировать ]

Первоначальное определение Киша сравнивало дисперсию при определенной схеме выборки с дисперсией, полученной с помощью простой случайной выборки . В некоторой литературе дается следующее альтернативное определение эффекта схемы Киша: «отношение дисперсии взвешенного среднего значения обследования при непропорциональной стратифицированной выборке к дисперсии при пропорциональной стратифицированной выборке, когда все дисперсии единиц страты равны». [26] : 318  [13] : 396  Размышляя об этом, Парк и Ли (2006) заявили, что «обоснование вывода [...] [Киша] заключается в том, что потеря точности [среднего взвешенного значения] из-за случайного неравного взвешивания может быть аппроксимирована соотношением дисперсия при непропорциональной стратифицированной выборке по сравнению с дисперсией при пропорциональной стратифицированной выборке». [4] : 8 

Обратите внимание, что это альтернативное определение является лишь приблизительным, поскольку если знаменатель основан на «пропорциональной стратифицированной выборке» (достигаемой с помощью стратифицированной выборки ), то такой выбор приведет к уменьшению дисперсии по сравнению с простой случайной выборкой . Это связано с тем, что стратифицированная выборка устраняет некоторую изменчивость конкретного количества элементов на страту, как это происходит при SRS. [ нужна ссылка ]

Кроме того, Кочран (1977) предлагает формулу пропорционального увеличения дисперсии из-за отклонения от оптимального распределения (то, что в формулах Киша будет называться L ). [3] : 116 

Альтернативные соглашения об именах
[ редактировать ]

В ранних работах использовался термин . [9] : 192  По мере появления новых определений эффекта дизайна, эффект дизайна Киша для неравных вероятностей выбора был обозначен как (или ) или просто короче. [4] : 8  [13] : 396  [26] : 318  Эффект дизайна Киша также известен как «Эффект неравного взвешивания» (или просто UWE), названный Лю и др. в 2002 году. [30] : 2124 

Когда результат коррелирует с вероятностями выбора

[ редактировать ]
Спенсера Deff для расчетной суммы ( )
[ редактировать ]

Оценщиком итога является оценщик «p-расширенный с заменой» (он же: pwr-оценщик или оценщик Хансена и Гурвица ). Он основан на простой случайной выборке (с заменой, обозначаемой SIR ) из n элементов ( ) из популяции размером N. [я] Каждый элемент имеет вероятность (k от 1 до N), которые должны быть разыграны за один розыгрыш ( , т. е. это полиномиальное распределение ). Вероятность того, что конкретный появится в образце . Значение «p-расширенное с заменой» равно со следующим ожиданием: . Следовательно , pwr-оценщик, является несмещенным оценщиком суммы y. [3] : 51 

В 2000 году Брюс Д. Спенсер предложил формулу для оценки эффекта плана для дисперсии оценки общего ( а не среднего) некоторого количества ( ), когда существует корреляция между вероятностями выбора элементов и интересующей переменной результата. [31]

В этой схеме выборка размера n формируется (с заменой) из совокупности N. размера Каждый предмет нарисован с вероятностью (где , т.е. полиномиальное распределение ). Вероятности выбора используются для определения нормализованных (выпуклых) весов : . Обратите внимание, что для некоторого случайного набора из n элементов сумма весов будет равна 1 только по математическому ожиданию ( ) с некоторой изменчивостью суммы вокруг него (т. е. суммы элементов биномиального распределения Пуассона ). Отношения между и определяется следующей (популяционной) простой линейной регрессией :

Где — это результат элемента i , который линейно зависит от с перехватом и наклон . Остаток от подобранной линии равен . Мы также можем определить генеральную дисперсию результата и остатков как и . Корреляция между и является . [ нужна ссылка ]

Эффект плана Спенсера (приблизительный) для оценки общего значения y составляет: [31] : 138  [32] : 4  [13] : 401 

Где:

  • оценки
  • оценивает наклон
  • оценивает дисперсию генеральной совокупности , и
  • L — относительность весов, определенная в формуле Киша : .

Это предполагает, что модель регрессии хорошо подходит, так что вероятность выбора и остатки независимы , поскольку это приводит к тому, что остатки и квадратичные остатки не коррелируют с весами, т. е. что а также . [31] : 138 

Когда размер популяции (N) очень велик, формулу можно записать как: [26] : 319 

, где )

сохраняется линейная связь Это приближение предполагает, что между P и y . А также, что корреляция весов с ошибками и квадраты ошибок равны нулю. Т.е., и . [32] : 4 

Мы замечаем, что если , затем (т.е. среднее значение y ). В таком случае формула сводится к

Только если дисперсия y намного больше его среднего значения, тогда самый правый член близок к 0 (т. е. ), что уменьшает эффект схемы Спенсера (для расчетной суммы) до уровня эффекта схемы Киша (для отношения означает): [32] : 5  . В противном случае две формулы дадут разные результаты, что демонстрирует разницу между эффектом расчета итогового значения и эффектом расчета среднего значения.

Пак и Ли для расчетного отношения-среднего ( )
[ редактировать ]

В 2001 году Парк и Ли распространили формулу Спенсера на случай среднего отношения (т. е. оценки среднего путем деления оценки общего числа на оценку размера популяции). Это: [32] : 4 

Где:

  • (расчетный) квадрат коэффициента вариации вероятностей выбора.

Формула Пака и Ли в точности равна формуле Киша, когда . Обе формулы относятся к эффекту расчета среднего значения y , тогда как формула Спенсера относится к оценке общей численности населения.

В целом, на общую сумму ( ) имеет тенденцию быть менее эффективным, чем для отношения среднее ( ) когда мал. И вообще, влияет на эффективность обоих эффектов дизайна. [4] : 8 

Кластерная выборка

[ редактировать ]

Для данных, собранных с использованием кластерной выборки, мы предполагаем следующую структуру:

  • наблюдений в каждом кластере и K кластерах, а всего наблюдения.
  • Наблюдения имеют блочную диагональную корреляционную матрицу, в которой каждая пара наблюдений из одного и того же кластера коррелирует с внутриклассовой корреляцией , в то время как каждая пара из разностных кластеров некоррелирована. [33] Т.е. для каждой пары наблюдений и , если они принадлежат одному кластеру , мы получаем . И два элемента из двух разных кластеров не коррелируют, т.е.: .
  • Предполагается, что элемент из любого кластера имеет одинаковую дисперсию: .

Когда все кластеры имеют одинаковый размер , эффект дизайна D eff , предложенный Кишем в 1965 году (и позже повторно рассмотренный другими), определяется формулой: [1] : 162  [13] : 399  [4] : 9  [34] [35] [14] : 241 

Иногда его еще называют . [30] : 2124 

В различных работах, когда размеры кластеров не равны, приведенная выше формула используется также с как средний размер кластера (который также иногда обозначается как ). [36] [28] : 105  В таких случаях формула Киша (использующая средний вес кластера) служит консервативной (верхней границей) точного эффекта дизайна. [28] : 106 

Существуют альтернативные формулы для кластеров неравных размеров. [1] : 193  В последующей работе обсуждалась чувствительность использования среднего размера кластера с различными предположениями. [37]

Эффект дизайна для сложных конструкций

[ редактировать ]

Неравные вероятности выбора Кластерная выборка

[ редактировать ]

В статье 1987 года Киш предложил комбинированный эффект схемы, который включает в себя как эффекты взвешивания, учитывающего неравные вероятности выбора, так и кластерную выборку: [36] : 16  [28] : 105  [38] : 4  [32] : 2 

Выше используются обозначения, аналогичные тем, которые используются в этой статье (в исходной публикации 1987 года использовались другие обозначения). [Дж] Обоснование этой формулы на основе модели было предоставлено Gabler et al. [28]

Стратифицированная выборка неравные вероятности выбора Кластерная выборка

[ редактировать ]

В 2000 году Лю и Арагон предложили разложение эффекта дизайна неравных вероятностей выбора для разных слоев в стратифицированной выборке. [39] В 2002 году Лю и др. расширил эту работу, чтобы учесть стратифицированные выборки, где внутри каждой страты есть набор неравных весов вероятности выбора. Кластерная выборка является либо глобальной, либо послойной. [30] Аналогичную работу провели Park et al. в 2003 году. [40]

Чен-Руст : Эффекты расчета для двух- и трехэтапных планов со стратификацией.

[ редактировать ]

Чен-Руст расширяет основанное на модели обоснование формулы Киша 1987 года для эффектов дизайна, предложенной Габлером, эл. ал., [28] применяя его к двухэтапным планам со стратификацией на первом этапе и к трехэтапным планам без стратификации. [41] Модифицированные формулы определяют общий эффект схемы с использованием весов опроса и внутрикластерных корреляций населения. Эти формулы позволяют провести содержательную интерпретацию эффектов схемы из различных источников и оценить внутрикластерные корреляции в завершенных опросах или спрогнозировать эффекты схемы в будущих исследованиях. [ нужна ссылка ]

Генри : мера расчетного эффекта для калибровочного взвешивания одноэтапных проб.

[ редактировать ]

Генри [26] предлагает расширенную меру расчетного эффекта взвешивания с помощью модели для одноэтапной выборки и корректировки калибровочного веса для случая, когда , где представляет собой вектор ковариат, ошибки модели независимы, а оценщиком общей численности населения является оценщик общей регрессии (GREG) Сярндаля, Свенсона и Ретмана (1992). [3] Новая мера учитывает совокупное влияние дизайна выборки без использования epsem, неравных весов от корректировок калибровки и корреляции между анализируемой переменной и вспомогательными веществами, используемыми при калибровке.

Лора : эффект дизайна для наклона регрессии в кластерной выборке.

[ редактировать ]

Лора [42] предназначен для оценок обычных наименьших квадратов (OLS) и обобщенных наименьших квадратов (GLS) в контексте кластерной выборки с использованием модели регрессии случайных коэффициентов. Лор представляет условия, при которых GLS-оценка наклона регрессии имеет расчетный эффект менее 1, что указывает на более высокую эффективность. Однако эффект конструкции средства оценки GLS очень чувствителен к спецификации модели. Если лежащая в основе модель случайных коэффициентов неправильно указана как модель случайного пересечения, эффект проектирования может быть серьезно занижен. Напротив, OLS-оценщик наклона регрессии и эффект проектирования, рассчитанный с точки зрения проектирования, устойчивы к неправильной спецификации структуры отклонений, что делает их более надежными в ситуациях, когда спецификация модели может быть неточной. [ нужна ссылка ]

Использование

[ редактировать ]

может использоваться при планировании будущего сбора данных, а также в качестве диагностического инструмента: [14] : 85 

  • При планировании будущего сбора данных - может быть использован для оценки эффективности выборки. Например, если существует потенциально «слишком большое» увеличение дисперсии из-за какого-либо решения по планированию выборки или если какой-то альтернативный (экономически осуществимый) план окажется более эффективным. Это также влияет на размер выборки (в целом, по страте, по кластеру и т. д.). При планировании размера выборки можно провести работу по корректировке эффекта схемы, чтобы отделить эффект интервьюера (ошибку измерения) от влияния схемы выборки на дисперсию выборки. [43]
  • В качестве диагностического инструмента - может помочь в оценке потенциальных проблем с помощью апостериорного анализа взвешивания (например, с учетом корректировок на неполучение ответов). [8] Например, если значение особенно велико, то это может указывать на проблему со схемой выборки или взвешивания. Это также может помочь при выполнении некоторых манипуляций с весами (например, обрезке весов); эффект схемы можно использовать для оценки влияния манипуляций на эффективный размер выборки. [44] А также в выявлении явных проблем с данными или их анализом (например, от ошибок до наличия выбросов ). [9] : 191  Хотя в некоторой литературе предполагается, что вероятно, потребует некоторого внимания, [13] : 396  не существует универсального эмпирического правила, согласно которому значение эффекта дизайна является «слишком высоким». Практические соображения значения часто зависят от контекста.

Учет эффекта дизайна не является необходимым, когда [5] : 57–62  исходная совокупность близка к IID или когда структура выборки данных была составлена ​​как простая случайная выборка . Это также менее полезно, когда размер выборки относительно мал (по крайней мере частично, по практическим соображениям).

Хотя изначально Киш надеялся, что эффект схемы будет как можно более независимым от основного распределения данных, вероятностей выборки, их корреляций и интересующей статистики, последующие исследования показали, что это действительно влияет на эффект схемы. Следовательно, эти свойства следует тщательно учитывать при принятии решения о том, какой именно расчет, который нужно использовать, и как его использовать. [4] : 13  [32] : 6 

Эффект дизайна редко применяется при построении доверительных интервалов. В идеале для средства оценки конкретного параметра можно было бы определить как дисперсию в рамках простой случайной выборки (SRS) с замещением, так и эффект схемы (который учитывает все элементы схемы выборки, которые изменяют дисперсию). В таких сценариях базовое отклонение и эффект плана можно было бы умножить, чтобы вычислить отклонение оценщика для конкретного плана. [1] : 259  Это вычисленное значение затем можно использовать для формирования доверительных интервалов. Однако в реальных приложениях оба значения одновременно оцениваются редко. В результате предпочтение отдается другим методам. Например, линеаризация Тейлора используется для построения доверительных интервалов на основе дисперсии взвешенного среднего . В более широком смысле метод начальной загрузки, также известный как веса репликации , применяется для ряда взвешенных статистических данных. [ нужна ссылка ]

Реализации программного обеспечения

[ редактировать ]

Эффект дизайна Киша реализован в различных пакетах статистического программного обеспечения:

  • Судан. [51]
  • WESVAR: вычисляет эффект конструкции Киша с заменой (SRSWR), т.е. . [52]

Примечания

[ редактировать ]
  1. ^ Т.е. эффект дизайна — это соотношение дисперсий двух оценок: одной из выборки с некоторым дизайном, а другой — из простой случайной выборки.
  2. ^ Общая формула (теоретического) эффекта проектирования при оценке общей суммы (а не среднего значения) для некоторого дизайна приведена в Cochran 1977. [3] : 54 
  3. ^ Первоначальное намерение Киша заключалось в том, чтобы он «выражал эффекты плана выборки, выходящие за рамки элементной изменчивости». , удаляя как единицу измерения, так и размер выборки как мешающие параметры». Была надежда на то, что эффект дизайна будет обобщаемым (актуальным для) многих статистических данных и переменных в рамках одного и того же опроса (и даже между опросами). [5] : 55  Однако последующие работы показали, что эффект схемы зависит от конкретной схемы выборки, результата и представляющей интерес статистики (например, общая численность населения по сравнению со средним значением). Особенно, зависит от связи между некоторыми конкретными результатами и конкретным дизайном (например, корреляция между и вероятность выбора ). [4] : 5  Следовательно, современная литература не поддерживает обобщаемость по многим статистическим данным и показателям результатов.
  4. ^ В качестве простой иллюстрации представьте, что у нас есть кластеры разных размеров, и мы выбираем только один кластер (используя SRS) и измеряем все элементы в нем. Это приведет к EPSEM, но количество наблюдений, которые мы получим, будет зависеть от размера кластера.
  5. ^ Точнее: предположим, что это мера размера кластера . Одним из распространенных методов выборки PPS (вероятность, пропорциональная размеру) является выборка каждого кластера с вероятностью выбора, которая пропорциональна его размеру, следующим образом: где — это количество кластеров, которые мы хотим выбрать и — это основа, используемая для выборки кластеров. Если мы взяли подвыборку равного числа, , элементов в каждом кластере выборки с использованием некоторого метода равной вероятности, и правильное количество элементов в кластере , то вероятность выбора элемента (в каком-то кластере ) будет одинаковым для каждого элемента во всех кластерах (т. е. EPSEM): .Если оказывается неправильного размера, выборка осуществляется со скоростью все равно даст EPSEM (метод равновероятного выбора). Обратите внимание: если мы перечислим (проведем измерение) все единицы в выборке кластера (вместо некоторого фиксированного числа или фиксированная пропорция ), то каждая единица в кластере имеет вероятность выбора кластера, что приведет к неравной вероятности выбора между элементами разных кластеров (т.е. ).
  6. ^ Например, предположим, что мы предполагаем для каждого кластера что его размер , мы можем попробовать кластеры со следующей вероятностью отбора: . Затем мы берем фиксированное количество элементы из каждого кластера. В таком случае, если мы скажем, что реальный размер кластера равен, скажем, , то вероятность выбора для каждого элемента взято из кластера , будет: . Обратите внимание, что это можно смягчить на этапе выборки, если мы будем выбирать из каждого кластера, используя частоту , то вероятность выбора будет EPSEM (даже если реальный размер кластера был и не ).
  7. ^ была выбрана выборка с равной вероятностью Эта формула будет применяться только в том случае, если в слое h и каждый элемент имеет одинаковую вероятность ответа.
  8. ^ Обратите внимание, что есть еще один термин, называемый относительной дисперсией , который отличается от него. Это отношение дисперсии к среднему значению, а рельвариантность Киша — это отношение дисперсии к квадрату среднего значения.
  9. ^ В литературе размеры выборки и популяции иногда обозначаются как и N , а иногда m и M. n В этой статье мы n и N. использовали
  10. ^ Формула эффекта дизайна Киша в исходных обозначениях: [36] : 16 

Эта статья была отправлена ​​в WikiJournal of Science на внешнюю академическую рецензию в 2023 году ( отчеты рецензента ). Обновленный контент был реинтегрирован на страницу Википедии по лицензии CC-BY-SA-3.0 ( 2024 г. ). Проверенная версия записи: В Галилее; и др. (5 мая 2024 г.). «Эффект дизайна» . Викижурнал науки . 7 (1): 4. doi : 10.15347/WJS/2024.004 . ISSN   2470-6345 . Викиданные   Q116768211 .

  1. ^ Jump up to: а б с д и ж г час я дж к л м н тот Киш, Лесли (1965). Выборка опроса . John Wiley & Sons, Inc. Нью-Йорк: ISBN  0-471-10949-5 .
  2. ^ Хо, Мунсон; Ким, Ёнман; Сюэ, Сяонань; Ким, Мими Ю. (2010). «Требования к размеру выборки для выявления эффекта вмешательства в конце наблюдения в продольном кластерном рандомизированном исследовании» . Статистика в медицине . 29 (3): 382–390. дои : 10.1002/сим.3806 . ISSN   1097-0258 . ПМИД   20014353 . S2CID   30001378 . Архивировано из оригинала 5 января 2013 года.
  3. ^ Jump up to: а б с д и ж г Сарндал, Карл-Эрик; Свенссон, Бенгт; Ретман, Ян (1992). Выборка опроса с помощью модели . Бег. doi : 10.1007/978-1-4612-4378-6 (неактивен 7 мая 2024 г.). ISBN  9780387975283 . {{cite book}}: CS1 maint: DOI неактивен по состоянию на май 2024 г. ( ссылка )
  4. ^ Jump up to: а б с д и ж г час я дж к Пак, Инхо; Ли, Хёншик (2004). «Эффекты дизайна для средневзвешенных и общих оценок при комплексной выборке обследования» (PDF) . Методика опроса . 30 (2): 183–193. ISSN   1492-0921 .
  5. ^ Jump up to: а б с д и ж Киш, Лесли (1995). «Методы дизайнерских эффектов» (PDF) . Журнал официальной статистики . 11 (1): 55. ISSN   0282-423X .
  6. ^ Кокран, Уильям Г. (июнь 1951 г.). «Общие принципы отбора образца» . Американский журнал общественного здравоохранения и здоровья нации . 41 (6): 647–653. дои : 10.2105/AJPH.41.6.647 . ISSN   0090-0036 . ПМЦ   1525569 . ПМИД   14838186 .
  7. ^ Эверитт, бакалавр наук (2002). Кембриджский статистический словарь (2-е изд.). Издательство Кембриджского университета. ISBN  0-521-81099-Х .
  8. ^ Jump up to: а б с Калтон, Грэм; Брик, Дж. Майкл; Лц, Тхань (2005). Оценка компонентов эффектов плана для использования при планировании выборки (PDF) . Выборочные обследования домохозяйств в развивающихся странах и странах с переходной экономикой (Отчет). Нью-Йорк: Департамент по экономическим и социальным вопросам, Статистический отдел Организации Объединенных Наций. стр. 95–121. ISBN  92-1-161481-3 . ST/ESA/STAT/SER.F/96.
  9. ^ Jump up to: а б с д и ж г час я дж к л м н тот п д р с т в Киш, Лесли (1992). «Взвешивание неравных Pi » . (PDF ) Журнал официальной статистики . 8 (2): 183–200. ISSN   0282-423X .
  10. ^ Ленстер, Том (18 декабря 2014 г.). «Эффективный размер выборки» . Кафе «Н-Категория» .
  11. ^ Уолтер, Кирк М. (2007). Введение в оценку дисперсии . Статистика для социальных и поведенческих наук (2-е изд.). Спрингер. дои : 10.1007/978-0-387-35099-8 . ISBN  978-0387329178 .
  12. ^ Jump up to: а б Фрерихс, Р.Р. (2004). «Равная вероятность отбора». Экспресс-опросы (PDF) . неопубликовано.
  13. ^ Jump up to: а б с д и ж г Вэллиант, Ричард; Девер, Джилл А.; Кройтер, Фрауке (2013). Практические инструменты для составления и взвешивания выборок обследования . Нью-Йорк: Спрингер. дои : 10.1007/978-1-4614-6449-5 . ISBN  978-1-4899-9381-6 .
  14. ^ Jump up to: а б с Кокран, WG (1977). Методы отбора проб (3-е изд.). Нэшвилл, Теннесси: Джон Уайли и сыновья. ISBN  978-0-471-16240-7 .
  15. ^ Нейман, Ежи (1934). «О двух различных аспектах репрезентативного метода: метод стратифицированной выборки и метод целенаправленного отбора». Журнал Королевского статистического общества . 97 (4): 558–625. дои : 10.2307/2342192 . ISSN   0952-8385 . JSTOR   2342192 .
  16. ^ Девер, Джилл А.; Валиант, Ричард (2010). «Сравнение оценок дисперсии для пост-стратификации с расчетными контрольными суммами» (PDF) . Методика опроса . 36 (1): 45–56. ISSN   1492-0921 .
  17. ^ Jump up to: а б с Котт, Филип С. (2006). «Использование калибровочного взвешивания для корректировки ошибок отсутствия ответа и покрытия» (PDF) . Методика опроса . 32 (2): 133. ISSN   1492-0921 .
  18. ^ Холт, Д.; Смит, ТМФ (1979). «Пост-стратификация». Журнал Королевского статистического общества. Серия А (Общая) . 142 (1): 33–46. дои : 10.2307/2344652 . ISSN   0035-9238 . JSTOR   2344652 .
  19. ^ Гош, Дирен; Фогт, Эндрю (2002). «Методы выборки, связанные с выборкой Бернулли и Пуассона» (PDF) . Труды секции обзорных методов исследования . 2002 : 3569–3570. ISSN   0733-5830 .
  20. ^ Девиль, Жан-Клод; Сярндал, Карл-Эрик (1992). «Калибровочные оценщики при выборке опросов». Журнал Американской статистической ассоциации . 87 (418): 376–382. дои : 10.1080/01621459.1992.10475217 . ISSN   0162-1459 .
  21. ^ Брик, Дж. Майкл; Монтакила, Джилл; Рот, Шелли (2003). «Выявление проблем с оценщиками граблей» (PDF) . Труды секции обзорных методов исследования . 2003 : 710–717. ISSN   0733-5830 .
  22. ^ Кейдинг, Нильс; Клейтон, Дэвид (2014). «Стандартизация и контроль помех в наблюдательных исследованиях: историческая перспектива». Статистическая наука . 29 (4): 529–558. arXiv : 1503.02853 . дои : 10.1214/13-STS453 . ISSN   0883-4237 .
  23. ^ Ламли, Томас (25 мая 2021 г.). «Как оценить (приблизительную) дисперсию средневзвешенного значения?» . Обмен стеками .
  24. ^ Jump up to: а б с «Какие типы весов поддерживают SAS, Stata и SPSS?» . Группа статистического консалтинга Калифорнийского университета в Лос-Анджелесе. 2021. Архивировано из оригинала 2 сентября 2023 года . Проверено 2 сентября 2023 г.
  25. ^ Калтон, Грэм (1968). «Стандартизация: метод контроля посторонних переменных». Журнал Королевского статистического общества. Серия C (Прикладная статистика) . 17 (2): 118–136. дои : 10.2307/2985676 . ISSN   0035-9254 . JSTOR   2985676 .
  26. ^ Jump up to: а б с д и Генри, Кимберли А.; Валиант, Ричард (2015). «Мера расчетного эффекта для калибровочного взвешивания одноэтапных проб» (PDF) . Методика опроса . 41 (2): 315–331. ISSN   1492-0921 .
  27. ^ Бок, Тим (24 марта 2017 г.). «Эффекты дизайна и эффективный размер выборки» . Дисплей .
  28. ^ Jump up to: а б с д и ж г Габлер, Зигфрид; Хадер, Сабина; Лахири, Парта (1999). «Модельное обоснование формулы Киша для расчетных эффектов для взвешивания и кластеризации» (PDF) . Методика опроса . 25 : 105–106. ISSN   1492-0921 .
  29. ^ Литтл, Родерик Дж.; Вартивариан, Соня (2005). «Увеличивает ли взвешивание неполученных ответов дисперсию средних значений опроса?» (PDF) . Методика опроса . 31 (2): 161. ISSN   1492-0921 .
  30. ^ Jump up to: а б с Лю, Цзюнь; Янаккьоне, Винс; Байрон, Марджи (2002). «Разложение эффектов дизайна для стратифицированной выборки» (PDF) . Труды секции обзорных методов исследования . 2002 : 2124–2126. ISSN   0733-5830 .
  31. ^ Jump up to: а б с Спенсер, Брюс Д. (2000). «Приблизительный расчетный эффект для неравного взвешивания, когда измерения могут коррелировать с вероятностями выбора» (PDF) . Методика опроса . 26 : 137–138. ISSN   1492-0921 .
  32. ^ Jump up to: а б с д и ж Пак, Инхо; Ли, Хёншик (2001). «Эффект дизайна: все ли мы о нем знаем» (PDF) . Труды секции обзорных методов исследования . 2001 . ISSN   0733-5830 .
  33. ^ Роу, Александр К.; Лама, Марсель; Оникпо, Фаустин; Деминг, Майкл С. (2002). «Эффекты дизайна и коэффициенты внутриклассовой корреляции по результатам кластерного обследования медицинских учреждений в Бенине». Международный журнал качества здравоохранения . 14 (6): 521–523. дои : 10.1093/intqhc/14.6.521 . ISSN   1353-4505 . ПМИД   12515339 .
  34. ^ Блэнд, Майкл (2005). «Кластерные рандомизированные исследования в медицинской литературе» . Университет Йорка.
  35. ^ Ахмед, Сайфуддин (2009). «Методы выборочных обследований» (PDF) . Школа общественного здравоохранения Блумберга Университета Джонса Хопкинса. стр. 5–6. Архивировано из оригинала (PDF) 28 сентября 2013 г.
  36. ^ Jump up to: а б с Киш, Лесли (1987). «Вопросы/Ответы» (PDF) . Статистик опроса . Том. 17. С. 13–17. ISSN   0214-3240 .
  37. ^ Линн, Питер; Габлер, Зигфрид (2005). «Приближения к b * при прогнозировании эффектов дизайна из-за кластеризации» (PDF) . Методика опроса . 31 (1): 101–104. ISSN   1492-0921 .
  38. ^ Габлер, Зигфрид; Хадер, Сабина; Линн, Питер (2005). «Эффекты дизайна для нескольких образцов дизайна» (PDF) . Методика опроса . 32 (1): 115–120. ISSN   1492-0921 .
  39. ^ Лю, Цзюнь; Арагон, Эльвесса (2000). «Стратегии подвыборки в продольных исследованиях» (PDF) . Труды секции обзорных методов исследования . 2000 : 307–312. ISSN   0733-5830 .
  40. ^ Пак, Инхо; Уингли, Марианна; Кларк, Джей; Раст, Кейт; Седлак, Андреа; Морганштейн, Дэвид (2003). «Эффекты проектирования и планирование изысканий» (PDF) . Труды секции обзорных методов исследования . 2003 : 3179–3186. ISSN   0733-5830 .
  41. ^ Чен, Сиксия; Раст, Кейт (2017). «Распространение формулы Киша для расчетных эффектов на двух- и трехэтапные планы со стратификацией» . Журнал статистики и методологии опросов . 5 (2): 111–130. дои : 10.1093/jssam/smw036 . ISSN   2325-0984 . ПМЦ   10426793 . ПМИД   37583392 .
  42. ^ Лор, Шэрон Л. (2014). «Эффекты проектирования для наклона регрессии в кластерной выборке». Журнал статистики и методологии опросов . 2 (2): 97–125. дои : 10.1093/jssam/smu003 . ISSN   2325-0984 .
  43. ^ Зинс, Стефан; Бургард, Ян Пабло (2020). «Учет интервьюера и эффектов дизайна при планировании размеров выборки» . Методика опроса . 46 (1): 93–119. ISSN   1492-0921 .
  44. ^ Поттер, Фрэнк; Чжэн, Юхун (2015). «Методы и проблемы сокращения экстремальных весов в выборочных обследованиях» (PDF) . Труды секции обзорных методов исследования . 2015 : 2707–2719. ISSN   0733-5830 .
  45. ^ Ламли, Томас (2004). «Анализ сложных выборок опроса». Журнал статистического программного обеспечения . 9 (1): 1–19. дои : 10.18637/jss.v009.i08 . ISSN   1548-7660 . Пакет R версии 2.2
  46. ^ Исследовательский центр Пью. «пьюметодс» . Гитхаб . Проверено 28 ноября 2023 г.
  47. ^ Гутьеррес Рохас, Уго Андрес (17 января 2020 г.). "samplesize4surveys" . Комплексная сеть архивов R (CRAN) . Проверено 28 ноября 2023 г.
  48. ^ Сариг, Таль; Галили, Таль; Эйлат, Рои (2023). «баланс — пакет Python для балансировки выборок смещенных данных». arXiv : 2307.06024 [ stat.CO ].
  49. ^ Бускирк, Трент Д. (2011). Оценка эффектов проектирования для средних, пропорций и итогов на основе данных комплексного выборочного обследования с использованием SAS® Proc Surveymeans (PDF) . Конференция группы пользователей SAS Среднего Запада, 2011 г. Сент-Луис, Миссури: Школа общественного здравоохранения Университета Сент-Луиса. стр. 1–13. Архивировано из оригинала (PDF) 11 мая 2015 года . Проверено 28 ноября 2023 г.
  50. ^ «Анализ данных опроса в Stata 17» . Группа статистического консалтинга Калифорнийского университета в Лос-Анджелесе. 2021. Архивировано из оригинала 7 июня 2023 года . Проверено 28 ноября 2023 г.
  51. ^ «ОПИСАНИЕ Примера 1» (PDF) . РТИ Интернешнл . Проверено 28 ноября 2023 г.
  52. ^ Чоудри, Г. Хусейн; Валиант, Ричард (2002). WesVar: Программное обеспечение для комплексного анализа данных обследований (PDF) . Симпозиум Статистического управления Канады. Оттава: Статистическое управление Канады . Проверено 28 ноября 2023 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c5ef40d3ee1e3a9082949e7c8c847457__1719732960
URL1:https://arc.ask3.ru/arc/aa/c5/57/c5ef40d3ee1e3a9082949e7c8c847457.html
Заголовок, (Title) документа по адресу, URL1:
Design effect - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)