Jump to content

Биномиальное распределение Пуассона

Бином Пуассона
Параметры — вероятности успеха для каждого из n испытаний
Поддерживать k ∈ { 0, …, n }
ПМФ
CDF
Иметь в виду
Дисперсия
асимметрия
Избыточный эксцесс
МГФ
CF
ПГФ

В теории вероятностей и статистике биномиальное распределение Пуассона — это дискретное распределение вероятностей суммы независимых испытаний Бернулли , которые не обязательно распределены одинаково. Концепция названа в честь Симеона Дени Пуассона .

Другими словами, это вероятностей распределение количество успехов в наборе из n независимых экспериментов типа «да/нет» с вероятностью успеха . Обычное биномиальное распределение является частным случаем биномиального распределения Пуассона, когда все вероятности успеха одинаковы, т.е. .

Определения

[ редактировать ]

Функция массы вероятности

[ редактировать ]

Вероятность проведения k успешных испытаний из n можно записать как сумму [1]

где - это набор всех подмножеств k целых чисел, которые можно выбрать из . Например, если n = 3, то . является дополнением , то есть .

будет содержать элементы, сумму по которым на практике невозможно вычислить, если число испытаний n не мало (например, если n = 30, содержит более 10 20 элементы). Однако есть и другие, более эффективные способы расчета. .

Пока ни одна из вероятностей успеха не равна единице, можно вычислить вероятность k успехов, используя рекурсивную формулу [2] [3]

где

Рекурсивная формула не является численно стабильной , и ее следует избегать, если больше примерно 20.

Альтернативой является использование алгоритма «разделяй и властвуй» : если мы предположим, что представляет собой степень двойки, обозначающую бином Пуассона и оператор свертки , мы имеем .

В более общем смысле, массовая функция вероятности бинома Пуассона может быть выражена как свертка векторов где . Это наблюдение приводит к алгоритму прямой свертки (DC) для вычисления через :

// PMF and nextPMF begin at index 0
function DC() is 
     declare new PMF array of size 1
     PMF[0] = [1]
     for i = 1 to  do 
          declare new nextPMF array of size i + 1
          nextPMF[0] = (1 - ) * PMF[0]
          nextPMF[i] =  * PMF[i - 1]
          for k = 1 to i - 1 do
               nextPMF[k] =  * PMF[k - 1] + (1 - ) * PMF[k]
          repeat
          PMF = nextPMF
     repeat
     return PMF
end function

будет найден в PMF[k]. DC численно стабилен, точен и, при реализации в виде программной процедуры, исключительно быстр для . Это также может быть довольно быстро для больших в зависимости от распределения . [4]

Другая возможность — использование дискретного преобразования Фурье . [5]

где и .

Другие методы описаны в книге Чена и Лю «Статистические применения биномиального распределения Пуассона и условного распределения Бернулли». [6] и в «Простом и быстром методе вычисления биномиальной функции распределения Пуассона» Бискарри и др. [4]

Кумулятивная функция распределения

[ редактировать ]

Кумулятивную функцию распределения (CDF) можно выразить как:

,

где представляет собой набор всех подмножеств размера который можно выбрать из .

Его можно вычислить, вызвав приведенную выше функцию DC, а затем добавив элементы через возвращенного массива PMF.

Характеристики

[ редактировать ]

Среднее и дисперсия

[ редактировать ]

Поскольку биномиально распределенная переменная Пуассона представляет собой сумму n независимых распределенных переменных Бернулли, ее среднее значение и дисперсия будут просто суммами среднего значения и дисперсии n распределений Бернулли:

Энтропия

[ редактировать ]

Не существует простой формулы для энтропии биномиального распределения Пуассона, но энтропия ограничена сверху энтропией биномиального распределения с тем же числовым параметром и тем же средним значением. Следовательно, энтропия также ограничена сверху энтропией распределения Пуассона с тем же средним значением. [7]

Гипотеза Шеппа-Олкина о вогнутости, выдвинутая Лоуренсом Шеппом и Ингрэмом Олкином в 1981 году, утверждает, что энтропия биномиального распределения Пуассона является вогнутой функцией вероятностей успеха. . [8] Эту гипотезу доказали Эрван Хиллион и Оливер Джонсон в 2015 году. [9] Гипотеза монотонности Шеппа – Олкина, также из той же статьи 1981 года, заключается в том, что энтропия монотонно возрастает с увеличением , если все . Эту гипотезу также доказали Хиллион и Джонсон в 2019 году. [10]

Чернов связан

[ редактировать ]

Вероятность того, что биномиальное распределение Пуассона станет большим, может быть ограничена с помощью его производящей функции момента следующим образом (действительно, когда и для любого ):

где мы взяли . Это похоже на хвостовые границы биномиального распределения .

Приближение биномиальным распределением

[ редактировать ]

Биномиальное распределение Пуассона может быть аппроксимировано биномиальным распределением где , среднее значение , – вероятность успеха . Отклонения и связаны формулой

Как видно, чем ближе должны , то есть, чем больше стремятся к однородности, тем больше дисперсия. Когда все равны , становится , , а дисперсия максимальна. [1]

Эм определил границы общего изменения расстояния и , фактически ограничивая ошибку, возникающую при аппроксимации с . Позволять и быть полным вариационным расстоянием и . Затем

где .

стремится к 0 тогда и только тогда, когда стремится к 1. [11]

Аппроксимация распределением Пуассона.

[ редактировать ]

Биномиальное распределение Пуассона также может быть аппроксимировано распределением Пуассона со средним . Барбур и Холл показали, что

где - общее расстояние вариации и . [12] Видно, что чем меньше , тем лучше приближает .

Как и , ; поэтому дисперсия биномиального распределения Пуассона ограничена сверху распределением Пуассона с , и чем меньше , чем ближе будет .

Вычислительные методы

[ редактировать ]

Ссылка [13] обсуждаются методы оценки функции вероятности биномиального распределения Пуассона. На его основе основаны следующие программные реализации:

  • пакет R poibin . Вместе с бумагой был предоставлен [13] который доступен для вычисления cdf, pmf, функции квантиля и генерации случайных чисел биномиального распределения Пуассона. Для расчета PMF можно указать алгоритм DFT или рекурсивный алгоритм для расчета точного PMF, а также можно указать методы аппроксимации с использованием нормального распределения и распределения Пуассона.
  • poibin — реализация Python — может вычислять PMF и CDF, для этого использует метод DFT, описанный в статье.

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б Ван, Ю.Х. (1993). «О количестве успехов в независимых испытаниях» (PDF) . Статистика Синица . 3 (2): 295–312.
  2. ^ Шах, БК (1994). «О распределении суммы независимых целочисленных случайных величин». Американский статистик . 27 (3): 123–124. JSTOR   2683639 .
  3. ^ Чен, XH; АП Демпстер; Дж. С. Лю (1994). «Взвешенная конечная выборка населения для максимизации энтропии» (PDF) . Биометрика . 81 (3): 457. doi : 10.1093/biomet/81.3.457 .
  4. ^ Перейти обратно: а б Бискарри, Уильям; Чжао, Сихай Дэйв; Бруннер, Роберт Дж. (01 июня 2018 г.). «Простой и быстрый метод вычисления биномиальной функции распределения Пуассона» . Вычислительная статистика и анализ данных . 122 : 92–100. дои : 10.1016/j.csda.2018.01.007 . ISSN   0167-9473 .
  5. ^ Фернандес, М.; С. Уильямс (2010). «Выражение в замкнутой форме для биномиальной функции плотности вероятности Пуассона». Транзакции IEEE по аэрокосмическим и электронным системам . 46 (2): 803–817. Бибкод : 2010ITAES..46..803F . дои : 10.1109/TAES.2010.5461658 . S2CID   1456258 .
  6. ^ Чен, SX; Дж. С. Лю (1997). «Статистические приложения биномиального распределения Пуассона и условного распределения Бернулли» . Статистика Синица . 7 : 875–892.
  7. ^ Харремоэс, П. (2001). «Биномиальное распределение и распределение Пуассона как распределение максимальной энтропии» (PDF) . Транзакции IEEE по теории информации . 47 (5): 2039–2041. дои : 10.1109/18.930936 .
  8. ^ Шепп, Лоуренс; Олкин, Ингрэм (1981). «Энтропия суммы независимых случайных величин Бернулли и полиномиального распределения» . В Гани, Дж.; Рохатги, В.К. (ред.). Вклад в вероятность: Сборник статей, посвященный Юджину Лукачу . Нью-Йорк: Академическая пресса. стр. 201–206. ISBN  0-12-274460-8 . МР   0618689 .
  9. ^ Хиллион, Эрван; Джонсон, Оливер (05 марта 2015 г.). «Доказательство гипотезы Шеппа – Олкина о вогнутости энтропии». Бернулли . 23 (4Б): 3638–3649. arXiv : 1503.01570 . дои : 10.3150/16-BEJ860 . S2CID   8358662 .
  10. ^ Хиллион, Эрван; Джонсон, Оливер (9 ноября 2019 г.). «Доказательство гипотезы монотонности энтропии Шеппа – Олкина» . Электронный журнал вероятностей . 24 (126): 1–14. arXiv : 1810.09791 . дои : 10.1214/19-EJP380 .
  11. ^ Эм, Вернер (1 января 1991 г.). «Биномиальная аппроксимация биномиального распределения Пуассона» . Статистика и вероятностные буквы . 11 (1): 7–16. дои : 10.1016/0167-7152(91)90170-В . ISSN   0167-7152 .
  12. ^ Барбур, AD; Холл, Питер (1984). «О скорости пуассоновской сходимости» (PDF) . Открытый репозиторий и архив Цюриха . Математические труды Кембриджского философского общества, 95 (3). стр. 473–480.
  13. ^ Перейти обратно: а б Хун, Или (март 2013 г.). «О вычислении функции распределения биномиального распределения Пуассона». Вычислительная статистика и анализ данных . 59 : 41–51. дои : 10.1016/j.csda.2012.10.006 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: fae843b7ba607794077cdd2c60fef09c__1720107660
URL1:https://arc.ask3.ru/arc/aa/fa/9c/fae843b7ba607794077cdd2c60fef09c.html
Заголовок, (Title) документа по адресу, URL1:
Poisson binomial distribution - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)