Бета-биномиальное распределение
Функция массы вероятности | |||
Кумулятивная функция распределения | |||
Обозначения | |||
---|---|---|---|
Параметры | n ∈ N 0 — количество испытаний ( настоящий ) ( настоящий ) | ||
Поддерживать | х € { 0, …, п } | ||
ПМФ | где это бета-функция | ||
CDF | где 3 F 2 ( a ; b ;x) — обобщенная гипергеометрическая функция | ||
Иметь в виду | |||
Дисперсия | |||
асимметрия | |||
Избыточный эксцесс | Посмотреть текст | ||
МГФ | где это гипергеометрическая функция | ||
CF | |||
ПГФ |
В теории вероятностей и статистике бета -биномиальное распределение представляет собой семейство дискретных распределений вероятностей на конечном носителе неотрицательных целых чисел, возникающее, когда вероятность успеха в каждом из фиксированного или известного числа испытаний Бернулли либо неизвестна, либо случайна. Бета-биномиальное распределение — это биномиальное распределение , в котором вероятность успеха в каждом из n испытаний не фиксирована, а случайным образом извлекается из бета-распределения . Он часто используется в байесовской статистике , эмпирических методах Байеса и классической статистике для выявления чрезмерной дисперсии в распределенных данных биномиального типа.
Бета-биномиальное распределение является одномерной версией мультиномиального распределения Дирихле , поскольку биномиальное и бета-распределения являются одномерными версиями полиномиального распределения и распределения Дирихле соответственно. Особый случай, когда α и β являются целыми числами, также известен как отрицательное гипергеометрическое распределение .
Мотивация и вывод
[ редактировать ]Как сложное распределение
[ редактировать ]Бета -распределение является сопряженным распределением биномиального распределения . Этот факт приводит к аналитически определяемому распределению соединений , при котором можно думать о параметр биномиального распределения как случайно выбранный из бета-распределения. Предположим, нас интересует предсказание количества голов, в будущие испытания. Это дано
Используя свойства бета-функции , это можно альтернативно записать
В качестве модели урны
[ редактировать ]Бета-биномиальное распределение также можно мотивировать с помощью модели урны для положительных целочисленных значений α и β , известной как модель урны Пойа . В частности, представьте себе урну, содержащую α- красные шары и β- черные шары, из которой производятся случайные выборки. Если наблюдается красный шар, то в урну возвращаются два красных шара. Аналогично, если вытащили черный шар, то в урну возвращаются два черных шара. Если это повторяется n раз, то вероятность наблюдения x красных шаров подчиняется бета-биномиальному распределению с параметрами n , α и β .
Напротив, если случайные розыгрыши производятся с простой заменой (в урну не добавляются шары сверх наблюдаемого шара), то распределение следует биномиальному распределению, а если случайные розыгрыши производятся без замены, распределение следует гипергеометрическому распределению. .
Моменты и свойства
[ редактировать ]Первые три момента грубых
и эксцесс
Сдача в аренду отметим, что среднее значение можно записать как
и дисперсия как
где . Параметр известна как «внутриклассовая» или «внутрикластерная» корреляция. Именно эта положительная корреляция приводит к сверхдисперсии. Обратите внимание, что когда , нет информации, позволяющей отличить бета-вариацию от биномиальной, и обе модели имеют равные дисперсии.
Факториальные моменты
[ редактировать ]r факториальный -й момент бета-биномиальной случайной величины X равен
- .
Точечные оценки
[ редактировать ]Метод моментов
[ редактировать ]Метод оценок моментов можно получить, отметив первый и второй моменты бета-бинома и установив их равными выборочным моментам. и . Мы находим
Эти оценки могут быть бессмысленно отрицательными, что свидетельствует о том, что данные либо недисперсны, либо недостаточно дисперсны относительно биномиального распределения. В этом случае альтернативными кандидатами являются биномиальное распределение и гипергеометрическое распределение соответственно.
Оценка максимального правдоподобия
[ редактировать ]в закрытой форме Хотя оценки максимального правдоподобия непрактичны, учитывая, что PDF-файл состоит из общих функций (гамма-функция и/или бета-функции), их можно легко найти с помощью прямой численной оптимизации. Оценки максимального правдоподобия на основе эмпирических данных можно вычислить с использованием общих методов подбора полиномиальных распределений Полиа, методы которых описаны в (Minka 2003). Пакет R VGAM посредством функции vglm посредством максимального правдоподобия облегчает подбор моделей типа glm с ответами, распределенными в соответствии с бета-биномиальным распределением. Нет требования, чтобы n было фиксированным на протяжении всего наблюдения.
Пример: неоднородность соотношения полов
[ редактировать ]Следующие данные показывают количество детей мужского пола среди первых 12 детей в семье размером 13 человек в 6115 семьях, взятых из больничных записей в Саксонии XIX века (Сокал и Рольф, стр. 59 из Линдси). 13-й ребенок игнорируется, чтобы сгладить эффект того, что семьи неслучайно останавливаются при достижении желаемого пола.
Мужчины | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
Семьи | 3 | 24 | 104 | 286 | 670 | 1033 | 1343 | 1112 | 829 | 478 | 181 | 45 | 7 |
Первые два выборочных момента:
и поэтому метод оценок моментов
Оценки максимального правдоподобия можно найти численно.
и максимальное логарифмическое правдоподобие равно
откуда мы находим AIC
AIC для конкурирующей биномиальной модели составляет AIC = 25070,34, и, таким образом, мы видим, что бета-биномиальная модель обеспечивает превосходное соответствие данным, т.е. имеются доказательства чрезмерной дисперсии. Триверс и Уиллард постулируют теоретическое обоснование гетерогенности гендерной склонности потомков млекопитающих .
Превосходная посадка очевидна, особенно среди хвостов.
Мужчины | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
Наблюдаемые семьи | 3 | 24 | 104 | 286 | 670 | 1033 | 1343 | 1112 | 829 | 478 | 181 | 45 | 7 |
Соответствующее ожидаемое (бета-биномиальное) | 2.3 | 22.6 | 104.8 | 310.9 | 655.7 | 1036.2 | 1257.9 | 1182.1 | 853.6 | 461.9 | 177.9 | 43.8 | 5.2 |
Соответствующее ожидаемое (биномиальное p = 0,519215) | 0.9 | 12.1 | 71.8 | 258.5 | 628.1 | 1085.2 | 1367.3 | 1265.6 | 854.2 | 410.0 | 132.8 | 26.1 | 2.3 |
Роль в байесовской статистике
[ редактировать ]Бета-биномиальное распределение играет важную роль в байесовской оценке вероятности успеха Бернулли. который мы хотим оценить на основе данных. Позволять быть выборкой независимых и одинаково распределенных случайных величин Бернулли. . Предположим, наши знания о - по Байесу - является неопределенным и моделируется априорным распределением . Если затем путем наложения процентов априорное прогнозируемое распределение
- .
После наблюдения отметим, что апостериорное распределение для
где является нормирующей константой. Мы признаем апостериорное распределение как .
Таким образом, снова используя компаундирование, мы обнаруживаем, что апостериорное прогнозируемое распределение суммы будущей выборки размером из случайные величины это
- .
Генерация случайных переменных
[ редактировать ]Чтобы нарисовать бета-биномиальную случайную величину просто нарисуй а затем нарисуй .
Связанные дистрибутивы
[ редактировать ]- где .
- где — дискретное равномерное распределение .
- где и и это биномиальное распределение .
- где – отрицательное биномиальное распределение .
См. также
[ редактировать ]Ссылки
[ редактировать ]- Минка, Томас П. (2003). Оценка распределения Дирихле . Технический отчет Microsoft.
Внешние ссылки
[ редактировать ]- Использование бета-биномиального распределения для оценки производительности устройства биометрической идентификации.
- Fastfit содержит код Matlab для подгонки к данным бета-биномиальных распределений (в форме двумерных распределений Полиа).
- Интерактивная графика: одномерные отношения распределения
- Бета-биномиальные функции в пакете VGAM R
- Бета-биномиальное распределение в Java-библиотеке Cognitive Foundry Sandia National Labs