Биномиальное распределение Пуассона
Параметры | — вероятности успеха для каждого из n испытаний | ||
---|---|---|---|
Поддерживать | k ∈ { 0, …, n } | ||
ПМФ | |||
CDF | |||
Иметь в виду | |||
Дисперсия | |||
асимметрия | |||
Избыточный эксцесс | |||
МГФ | |||
CF | |||
ПГФ |
В теории вероятностей и статистике биномиальное распределение Пуассона — это дискретное распределение вероятностей суммы независимых испытаний Бернулли , которые не обязательно распределены одинаково. Концепция названа в честь Симеона Дени Пуассона .
Другими словами, это вероятностей распределение количество успехов в наборе из n независимых экспериментов типа «да/нет» с вероятностью успеха . Обычное биномиальное распределение является частным случаем биномиального распределения Пуассона, когда все вероятности успеха одинаковы, т.е. .
Определения
[ редактировать ]Функция массы вероятности
[ редактировать ]Вероятность проведения k успешных испытаний из n можно записать как сумму [1]
где - это набор всех подмножеств k целых чисел, которые можно выбрать из . Например, если n = 3, то . является дополнением , то есть .
будет содержать элементы, сумму по которым на практике невозможно вычислить, если число испытаний n не мало (например, если n = 30, содержит более 10 20 элементы). Однако есть и другие, более эффективные способы расчета. .
Пока ни одна из вероятностей успеха не равна единице, можно вычислить вероятность k успехов, используя рекурсивную формулу [2] [3]
где
Рекурсивная формула не является численно стабильной , и ее следует избегать, если больше примерно 20.
Альтернативой является использование алгоритма «разделяй и властвуй» : если мы предположим, что представляет собой степень двойки, обозначающую бином Пуассона и оператор свертки , мы имеем .
В более общем смысле, массовая функция вероятности бинома Пуассона может быть выражена как свертка векторов где . Это наблюдение приводит к алгоритму прямой свертки (DC) для вычисления через :
// PMF and nextPMF begin at index 0 function DC() is declare new PMF array of size 1 PMF[0] = [1] for i = 1 to do declare new nextPMF array of size i + 1 nextPMF[0] = (1 - ) * PMF[0] nextPMF[i] = * PMF[i - 1] for k = 1 to i - 1 do nextPMF[k] = * PMF[k - 1] + (1 - ) * PMF[k] repeat PMF = nextPMF repeat return PMF end function
будет найден в PMF[k]. DC численно стабилен, точен и, при реализации в виде программной процедуры, исключительно быстр для . Это также может быть довольно быстро для больших в зависимости от распределения . [4]
Другая возможность — использование дискретного преобразования Фурье . [5]
где и .
Другие методы описаны в книге Чена и Лю «Статистические применения биномиального распределения Пуассона и условного распределения Бернулли». [6] и в «Простом и быстром методе вычисления биномиальной функции распределения Пуассона» Бискарри и др. [4]
Кумулятивная функция распределения
[ редактировать ]Кумулятивную функцию распределения (CDF) можно выразить как:
,
где представляет собой набор всех подмножеств размера который можно выбрать из .
Его можно вычислить, вызвав приведенную выше функцию DC, а затем добавив элементы через возвращенного массива PMF.
Характеристики
[ редактировать ]Среднее и дисперсия
[ редактировать ]Поскольку биномиально распределенная переменная Пуассона представляет собой сумму n независимых распределенных переменных Бернулли, ее среднее значение и дисперсия будут просто суммами среднего значения и дисперсии n распределений Бернулли:
Энтропия
[ редактировать ]Не существует простой формулы для энтропии биномиального распределения Пуассона, но энтропия ограничена сверху энтропией биномиального распределения с тем же числовым параметром и тем же средним значением. Следовательно, энтропия также ограничена сверху энтропией распределения Пуассона с тем же средним значением. [7]
Гипотеза Шеппа-Олкина о вогнутости, выдвинутая Лоуренсом Шеппом и Ингрэмом Олкином в 1981 году, утверждает, что энтропия биномиального распределения Пуассона является вогнутой функцией вероятностей успеха. . [8] Эту гипотезу доказали Эрван Хиллион и Оливер Джонсон в 2015 году. [9] Гипотеза монотонности Шеппа – Олкина, также из той же статьи 1981 года, заключается в том, что энтропия монотонно возрастает с увеличением , если все . Эту гипотезу также доказали Хиллион и Джонсон в 2019 году. [10]
Чернов связан
[ редактировать ]Вероятность того, что биномиальное распределение Пуассона станет большим, может быть ограничена с помощью его производящей функции момента следующим образом (действительно, когда и для любого ):
где мы взяли . Это похоже на хвостовые границы биномиального распределения .
Приближение биномиальным распределением
[ редактировать ]Биномиальное распределение Пуассона может быть аппроксимировано биномиальным распределением где , среднее значение , – вероятность успеха . Отклонения и связаны формулой
Как видно, чем ближе должны , то есть, чем больше стремятся к однородности, тем больше дисперсия. Когда все равны , становится , , а дисперсия максимальна. [1]
Эм определил границы общего изменения расстояния и , фактически ограничивая ошибку, возникающую при аппроксимации с . Позволять и быть полным вариационным расстоянием и . Затем
где .
стремится к 0 тогда и только тогда, когда стремится к 1. [11]
Аппроксимация распределением Пуассона.
[ редактировать ]Биномиальное распределение Пуассона также может быть аппроксимировано распределением Пуассона со средним . Барбур и Холл показали, что
где - общее расстояние вариации и . [12] Видно, что чем меньше , тем лучше приближает .
Как и , ; поэтому дисперсия биномиального распределения Пуассона ограничена сверху распределением Пуассона с , и чем меньше , чем ближе будет .
Вычислительные методы
[ редактировать ]Ссылка [13] обсуждаются методы оценки функции вероятности биномиального распределения Пуассона. На его основе основаны следующие программные реализации:
- пакет R poibin . Вместе с бумагой был предоставлен [13] который доступен для вычисления cdf, pmf, функции квантиля и генерации случайных чисел биномиального распределения Пуассона. Для расчета PMF можно указать алгоритм DFT или рекурсивный алгоритм для расчета точного PMF, а также можно указать методы аппроксимации с использованием нормального распределения и распределения Пуассона.
- poibin — реализация Python — может вычислять PMF и CDF, для этого использует метод DFT, описанный в статье.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б Ван, Ю.Х. (1993). «О количестве успехов в независимых испытаниях» (PDF) . Статистика Синица . 3 (2): 295–312.
- ^ Шах, БК (1994). «О распределении суммы независимых целочисленных случайных величин». Американский статистик . 27 (3): 123–124. JSTOR 2683639 .
- ^ Чен, XH; АП Демпстер; Дж. С. Лю (1994). «Взвешенная конечная выборка населения для максимизации энтропии» (PDF) . Биометрика . 81 (3): 457. doi : 10.1093/biomet/81.3.457 .
- ^ Перейти обратно: а б Бискарри, Уильям; Чжао, Сихай Дэйв; Бруннер, Роберт Дж. (01 июня 2018 г.). «Простой и быстрый метод вычисления биномиальной функции распределения Пуассона» . Вычислительная статистика и анализ данных . 122 : 92–100. дои : 10.1016/j.csda.2018.01.007 . ISSN 0167-9473 .
- ^ Фернандес, М.; С. Уильямс (2010). «Выражение в замкнутой форме для биномиальной функции плотности вероятности Пуассона». Транзакции IEEE по аэрокосмическим и электронным системам . 46 (2): 803–817. Бибкод : 2010ITAES..46..803F . дои : 10.1109/TAES.2010.5461658 . S2CID 1456258 .
- ^ Чен, SX; Дж. С. Лю (1997). «Статистические приложения биномиального распределения Пуассона и условного распределения Бернулли» . Статистика Синица . 7 : 875–892.
- ^ Харремоэс, П. (2001). «Биномиальное распределение и распределение Пуассона как распределение максимальной энтропии» (PDF) . Транзакции IEEE по теории информации . 47 (5): 2039–2041. дои : 10.1109/18.930936 .
- ^ Шепп, Лоуренс; Олкин, Ингрэм (1981). «Энтропия суммы независимых случайных величин Бернулли и полиномиального распределения» . В Гани, Дж.; Рохатги, В.К. (ред.). Вклад в вероятность: Сборник статей, посвященный Юджину Лукачу . Нью-Йорк: Академическая пресса. стр. 201–206. ISBN 0-12-274460-8 . МР 0618689 .
- ^ Хиллион, Эрван; Джонсон, Оливер (05 марта 2015 г.). «Доказательство гипотезы Шеппа – Олкина о вогнутости энтропии». Бернулли . 23 (4Б): 3638–3649. arXiv : 1503.01570 . дои : 10.3150/16-BEJ860 . S2CID 8358662 .
- ^ Хиллион, Эрван; Джонсон, Оливер (9 ноября 2019 г.). «Доказательство гипотезы монотонности энтропии Шеппа – Олкина» . Электронный журнал вероятностей . 24 (126): 1–14. arXiv : 1810.09791 . дои : 10.1214/19-EJP380 .
- ^ Эм, Вернер (1 января 1991 г.). «Биномиальная аппроксимация биномиального распределения Пуассона» . Статистика и вероятностные буквы . 11 (1): 7–16. дои : 10.1016/0167-7152(91)90170-В . ISSN 0167-7152 .
- ^ Барбур, AD; Холл, Питер (1984). «О скорости пуассоновской сходимости» (PDF) . Открытый репозиторий и архив Цюриха . Математические труды Кембриджского философского общества, 95 (3). стр. 473–480.
- ^ Перейти обратно: а б Хун, Или (март 2013 г.). «О вычислении функции распределения биномиального распределения Пуассона». Вычислительная статистика и анализ данных . 59 : 41–51. дои : 10.1016/j.csda.2012.10.006 .