Jump to content

Выборка Бернулли

В теории выборки конечной совокупности выборка Бернулли представляет собой процесс выборки, при котором каждый элемент совокупности подвергается независимому испытанию Бернулли , которое определяет, станет ли этот элемент частью выборки. Важным свойством выборки Бернулли является то, что все элементы совокупности имеют равную вероятность попасть в выборку. [1]

Таким образом, выборка Бернулли представляет собой особый случай выборки Пуассона . При выборке Пуассона каждый элемент генеральной совокупности может иметь разную вероятность быть включенным в выборку. В выборке Бернулли вероятность одинакова для всех элементов.

Поскольку каждый элемент генеральной совокупности рассматривается в выборке отдельно, размер выборки не является фиксированным, а скорее подчиняется биномиальному распределению .

Самый простой метод Бернулли генерирует n случайных переменных для извлечения выборки из совокупности из n элементов. Предположим, вы хотите извлечь определенный процент населения . Алгоритм можно описать следующим образом: [2]

for each item in the set
    generate a random non-negative integer R
    if (R mod 100) < pct then
        select item
Масштабированное f(k, n, 0,2) для четырех значений n.

Скажем, процент в 20% обычно выражается как вероятность p =0,2. В этом случае случайные величины генерируются в единичном интервале. После запуска алгоритма выборка размера k будет выбрана . Можно было бы ожидать иметь , что становится все более вероятным по мере роста n . Фактически, можно вычислить вероятность получения размера выборки k с помощью биномиального распределения :

Слева эта функция показана для четырех значений и . Чтобы сравнить значения для разных значений , по оси абсцисс масштабируются от к единичному интервалу, в то время как значение функции по ординате умножается на обратное, так что площадь под графиком сохраняет то же значение — эта площадь связана с соответствующей кумулятивной функцией распределения. Значения показаны в логарифмическом масштабе.

Значения n такие, что размер выборки Бернулли находится в пределах ошибки в 95% случаев.

Справа минимальные значения которые удовлетворяют заданным границам погрешности с вероятностью 95%. В случае ошибки набор внутри границ можно описать следующим образом:

Вероятность оказаться внутри снова определяется биномиальным распределением как:

На рисунке показаны самые низкие значения так, чтобы сумма была не менее 0,95. Для и алгоритм дает точные результаты для всех х. Промежуточные получаются путем деления пополам . Обратите внимание, что если представляет собой целый процент, , гарантирует, что . Ценности столь же высокие, как может потребоваться для такого точного совпадения.

См. также

[ редактировать ]
  1. ^ Карл-Эрик Сарндал; Бенгт Свенсон; Ян Ретман (1992). Выборка опроса с помощью модели . ISBN  978-0-387-97528-3 .
  2. ^ Воратас Качитвичянукул; Брюс В. Шмайсе (1 февраля 1988 г.). «Генерация биномиальной случайной величины» . Коммуникации АКМ . 31 (2): 216–222. дои : 10.1145/42372.42381 . S2CID   18698828 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a27052535aa57a9fc1cfa9fdf8495c76__1685196180
URL1:https://arc.ask3.ru/arc/aa/a2/76/a27052535aa57a9fc1cfa9fdf8495c76.html
Заголовок, (Title) документа по адресу, URL1:
Bernoulli sampling - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)