Jump to content

Сбалансированная повторная репликация

Сбалансированная повторная репликация — это статистический метод оценки изменчивости выборки статистики, полученной с помощью стратифицированной выборки .

Краткое описание техники

[ редактировать ]
  1. Выберите сбалансированные полувыборки из полной выборки.
  2. Рассчитайте интересующую статистику для каждой полувыборки.
  3. Оцените дисперсию статистики на основе различий между значениями полной выборки и полувыборки.

Отбор полувыборок

[ редактировать ]

Упрощенная версия

[ редактировать ]

Рассмотрим сначала идеализированную ситуацию, когда каждая страта нашей выборки содержит только две единицы. Тогда каждая полувыборка будет содержать ровно один из них, так что полувыборки разделяют стратификацию полной выборки. Если есть s страт, в идеале мы бы взяли все 2 с способы выбора полустрата; но если s велико, это может быть неосуществимо.

Если необходимо взять меньше полувыборок, они отбираются так, чтобы быть «сбалансированными» (отсюда и название метода). Пусть H матрица Адамара размера s и выберите одну строку на полувыборку. (Неважно, какие строки; важен тот факт, что все строки H ортогональны.) Теперь для каждой полувыборки выберите, какую единицу взять из каждого слоя в соответствии со знаком соответствующей записи в H : то есть для полувыборки h мы выбираем первую единицу из страты k, если H hk = −1, и вторую единицу, если H hk = +1. Ортогональность строк H гарантирует, что наш выбор не коррелирует между полувыборками.

Реалистичная версия

[ редактировать ]

К сожалению, матрицы Адамара размера s может не существовать . В этом случае мы выбираем размер немного больше s . Теперь подматрица H , определяющая наш выбор, больше не обязательно должна иметь строго ортогональные строки, но если размер H лишь немного больше s, строки будут примерно ортогональными.

Количество единиц на страту не обязательно должно быть ровно 2 и обычно не будет. В этом случае единицы в каждой страте делятся на две «ПЕВ дисперсии» (ПЕВ = первичная единица выборки) равного или почти равного размера. Это можно делать случайным образом или таким образом, чтобы ПЕВ были как можно более похожими. (Так, например, если стратификация была выполнена на основе некоторого числового параметра, единицы в каждой страте могут быть отсортированы в порядке этого параметра и выбраны альтернативные единицы для двух ПЕВ.)

Если количество слоев очень велико, перед применением BRR можно объединить несколько слоев. Полученные группы известны как «страты дисперсии».

Формула БРР

[ редактировать ]

Пусть a — значение нашей статистики, рассчитанное на основе полной выборки; пусть a i ( i = 1,..., n ) — соответствующая статистика, рассчитанная для полувыборок. ( n — количество полувыборок.)

Тогда наша оценка выборочной дисперсии статистики равна среднему значению ( a i a ) 2 . Это (по крайней мере, в идеальном случае) несмещенная оценка выборочной дисперсии.

метод Фэй

[ редактировать ]

Метод Фэя является обобщением BRR. Вместо того, чтобы просто брать выборки половинного размера, мы каждый раз используем полную выборку, но с неравным весом: k для единиц вне полувыборки и 2 - k для единиц внутри нее. (BRR — это случай k = 0.) Тогда оценка дисперсии равна V /(1 − k ) 2 , где V — оценка, полученная по приведенной выше формуле BRR.

См. также

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 4750fd5ecf5420f89f216ce8f9f01c34__1709457900
URL1:https://arc.ask3.ru/arc/aa/47/34/4750fd5ecf5420f89f216ce8f9f01c34.html
Заголовок, (Title) документа по адресу, URL1:
Balanced repeated replication - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)