Выборочное распределение
В статистике выборочное распределение или распределение конечной выборки — это распределение вероятностей данной случайной выборке основанной на статистики, . Если для вычисления одного значения статистики (например, выборочного среднего или выборочной дисперсии ) для каждой выборки отдельно использовалось произвольно большое количество выборок, каждая из которых включала несколько наблюдений (точек данных), то выборка Распределение — это распределение вероятностей значений, которые принимает статистика. Во многих случаях наблюдается только одна выборка, но распределение выборки можно найти теоретически.
Выборочные распределения важны в статистике, поскольку они существенно упрощают путь к статистическим выводам . Более конкретно, они позволяют аналитическим соображениям основываться на распределении вероятностей статистики, а не на совместном распределении вероятностей всех значений отдельной выборки.
Введение [ править ]
Выборочное распределение статистики — это распределение этой статистики, рассматриваемой как случайная величина , полученная из случайной выборки размером . Его можно рассматривать как распределение статистики для всех возможных выборок из одной и той же совокупности заданного размера выборки. Распределение выборки зависит от основного распределения населения, рассматриваемой статистики, используемой процедуры выборки и используемого размера выборки. Часто возникает значительный интерес к тому, можно ли аппроксимировать выборочное распределение асимптотическим распределением , которое соответствует предельному случаю, либо когда число случайных выборок конечного размера, взятых из бесконечной совокупности и используемых для получения распределения, стремится к бесконечности. или когда из одной и той же популяции берется только одна «выборка» равно бесконечного размера.
Например, рассмотрим нормальную популяцию со средним и дисперсия . Предположим, мы неоднократно берем выборки заданного размера из этой совокупности и вычисляем среднее арифметическое. для каждой выборки – эта статистика называется выборочным средним . Распределение этих средних или средних значений называется «выборочным распределением выборочного среднего». Это распределение является нормальным ( n — размер выборки), поскольку основная совокупность является нормальной, хотя распределения выборки также часто могут быть близкими к нормальным, даже если распределение совокупности не является таковым (см. центральную предельную теорему ). Альтернативой выборочному среднему является выборочная медиана . При расчете на основе одной и той же совокупности оно имеет распределение выборки, отличное от распределения среднего значения, и, как правило, не является нормальным (но может быть близким для больших размеров выборки).
Среднее значение выборки из совокупности, имеющей нормальное распределение, является примером простой статистики, взятой из одной из простейших статистических совокупностей . Для других статистических данных и других групп населения формулы более сложны, и зачастую они не существуют в закрытом виде . В таких случаях выборочные распределения могут быть аппроксимированы с помощью моделирования Монте-Карло . [1] бутстреп- методы или асимптотическая теория распределения.
Стандартная ошибка [ править ]
Стандартное отклонение выборочного распределения статистики называется стандартная ошибка этой величины. В случае, когда статистикой является выборочное среднее, а выборки некоррелированы, стандартная ошибка равна:
Важным следствием этой формулы является то, что размер выборки необходимо увеличить в четыре раза (умножить на 4), чтобы получить половину (1/2) ошибки измерения. При разработке статистических исследований, где стоимость является фактором, это может сыграть роль в понимании компромисса между затратами и выгодами.
В случае, когда статистикой является общая выборка, а выборки некоррелированы, стандартная ошибка равна:
Примеры [ править ]

Население | Статистика | Выборочное распределение |
---|---|---|
Нормальный : | Выборочное среднее из выборок размера n | . Если стандартное отклонение неизвестно, можно считать , которое соответствует t-распределению Стьюдента с степени свободы. Здесь - выборочная дисперсия, и является основной величиной , распределение которой не зависит от . |
Бернулли : | Выборочная доля «успешных испытаний» | |
Две независимые нормальные популяции: и | Разница между выборочными средними, | |
Любое абсолютно непрерывное распределение F с плотностью f | медиана из выборки размером n = 2 k − 1, где выборка заказана к | |
Любое распределение с функцией распределения F | Максимум из случайной выборки размером n |
Ссылки [ править ]
- ^ Муни, Кристофер З. (1999). Моделирование Монте-Карло . Таузенд-Оукс, Калифорния: Сейдж. п. 2. ISBN 9780803959439 .
- Мерберг А. и С. Дж. Миллер (2008). «Выборочное распределение медианы» . Конспекты курса математики 162: Математическая статистика , стр. 1–9.