Геометрическое распределение
![]() | Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( Август 2022 г. ) |
Функция массы вероятности ![]() | |||
Кумулятивная функция распределения ![]() | |||
Параметры | вероятность успеха ( реальная ) | вероятность успеха ( реальная ) | |
---|---|---|---|
Поддерживать | k испытаний, где | k отказов, где | |
ПМФ | |||
CDF | для , для | для , для | |
Иметь в виду | |||
медиана | | | |
Режим | |||
Дисперсия | |||
асимметрия | |||
Избыточный эксцесс | |||
Энтропия | |||
МГФ | для | для | |
CF | |||
ПГФ |
В теории вероятностей и статистике геометрическое распределение представляет собой одно из двух дискретных распределений вероятностей :
- Распределение вероятностей числа из испытаний Бернулли, необходимых для достижения одного успеха, поддержанного на съемочной площадке ;
- Распределение вероятностей числа неудач до первого успеха, поддержанного на съемочной площадке .
Какое из них называется геометрическим распределением, это вопрос условности и удобства.
Эти два разных геометрических распределения не следует путать друг с другом. название смещенного геометрического распределения (распределение Часто за первое принимают ); однако, чтобы избежать двусмысленности, считается разумным указать, что именно предполагается, путем явного упоминания поддержки.
Геометрическое распределение дает вероятность того, что для первого успеха потребуется независимые испытания, каждое с вероятностью успеха . Если вероятность успеха в каждом испытании равна , то вероятность того, что -е испытание – это первый успех
для
Вышеуказанная форма геометрического распределения используется для моделирования количества испытаний вплоть до первого успеха. Напротив, для моделирования количества неудач до первого успеха используется следующая форма геометрического распределения:
для
В любом случае последовательность вероятностей является геометрической последовательностью .
Геометрическое распределение обозначается Geo( p ), где . [1]
Определение [ править ]
Геометрическое распределение — это дискретное распределение вероятностей , которое описывает, когда происходит первый успех в бесконечной последовательности независимых и одинаково распределенных испытаний Бернулли . Его функция массы вероятности равна
Альтернативно, в некоторых текстах определяется распределение, при котором изменяя функцию массы вероятности на: [2]
Свойства [ править ]
Моменты и кумулянты [ править ]
Ожидаемое значение количества независимых испытаний, приведших к первому успеху, и дисперсия геометрически распределенной случайной величины X составляют:
Аналогично, ожидаемое значение и дисперсия геометрически распределенной случайной величины Y = X - 1 (см. определение распределения ) является:
Доказательство [ править ]
Ожидаемое значение X [ править ]
Рассмотрим ожидаемое значение X , как указано выше, т.е. среднее количество попыток до успеха. В первом испытании мы либо добьемся успеха с вероятностью , или мы потерпим неудачу с вероятностью . Если мы потерпим неудачу, оставшееся среднее число попыток до тех пор, пока успех не будет идентичен исходному среднему значению.Это следует из того, что все испытания независимы.Отсюда получаем формулу:
что, если решить для дает:
Ожидаемое значение Y [ править ]
То, что ожидаемое значение Y , как указано выше, равно (1 - p )/ p, можно тривиально увидеть из что следует из линейности ожидания или может быть показано следующим образом:
Чередование суммирования и дифференцирования оправдано тем, что сходящиеся степенные ряды сходятся равномерно на компактных подмножествах множества точек, где они сходятся.
Пусть µ = (1 - p )/ p будет ожидаемым значением Y . Тогда кумулянты распределения вероятностей Y удовлетворяют рекурсии
Примеры ожидаемого значения [ править ]
Д3) Пациент ожидает подходящего донора почки для трансплантации. Если вероятность того, что случайно выбранный донор подойдет, равна p = 0,1, каково ожидаемое число доноров, которые пройдут тестирование, прежде чем будет найден подходящий донор?
При p = 0,1 среднее количество неудач до первого успеха равно E( Y ) = (1 − p )/ p = (1 − 0,1)/0,1 = 9.
Для альтернативной формулировки, где X — количество попыток до первого успеха включительно, ожидаемое значение равно E( X ) = 1/ p = 1/0,1 = 10.
Например, в примере 1 выше, при p = 0,6, среднее количество неудач до первого успеха равно E( Y ) = (1 - p )/ p = (1 - 0,6)/0,6 = 0,67.
Моменты высшего порядка [ править ]
Моменты числа неудач до первого успеха определяются выражением
где — функция полилогарифма .
Общие свойства [ править ]
- Функции генерирующие вероятность X Y и , , соответственно:
- Как и его непрерывный аналог ( экспоненциальное распределение ), геометрическое распределение не имеет памяти . справедливо следующее То есть для любых m и n .
- Геометрическое распределение, поддерживаемое {0, 1, 2, 3, ... }, является единственным дискретным распределением без памяти. Обратите внимание, что геометрическое распределение, поддерживаемое {1, 2,... }, не является безпамятным.
- Среди всех дискретных распределений вероятностей, поддерживаемых на {1, 2, 3, ... } с заданным ожидаемым значением µ , геометрическое распределение X с параметром p = 1/ µ является распределением с наибольшей энтропией . [3]
- Геометрическое распределение числа Y неудач до первого успеха бесконечно делится , т. е. для любого натурального числа n существуют независимые одинаково распределенные случайные величины Y 1 , ..., Y n, сумма которых имеет то же распределение, что Y. и . Они не будут геометрически распределены, если n = 1; они следуют отрицательному биномиальному распределению .
- Десятичные цифры геометрически распределенной случайной величины Y представляют собой последовательность независимых (и не одинаково распределенных) случайных величин. [ нужна ссылка ] Например, цифра сотен D имеет такое распределение вероятностей:
- где q = 1 - p , и аналогично для других цифр и, в более общем плане, аналогично для систем счисления с основанием, отличным от 10. Когда основание равно 2, это показывает, что геометрически распределенная случайная величина может быть записана как сумма независимые случайные величины, распределения вероятностей которых неразложимы .
- Кодирование Голомба является оптимальным префиксным кодом. [ нужны разъяснения ] для геометрического дискретного распределения. [4]
- Сумма двух независимых случайных величин, распределенных Geo (p), не является геометрическим распределением. [1]
Связанные дистрибутивы [ править ]
- Геометрическое распределение Y является частным случаем отрицательного биномиального распределения с r = 1. В более общем смысле, если Y 1 , ..., Y r — независимые геометрически распределенные переменные с параметром p , то сумма
- следует отрицательному биномиальному распределению с параметрами r и p . [5]
- Геометрическое распределение является частным случаем дискретного составного распределения Пуассона .
- Если Y 1 , ..., Y r – независимые геометрически распределенные переменные (возможно с разными параметрами успешности pm ) , то их минимум
- также геометрически распределено с параметром [6]
- Предположим, 0 < r < 1, и для k = 1, 2, 3,... случайная величина X k имеет распределение Пуассона с ожидаемым значением r. к / к . Затем
- имеет геометрическое распределение, принимающее значения из набора {0, 1, 2, ...}, с ожидаемым значением r /(1 - r ). [ нужна ссылка ]
- Экспоненциальное распределение является непрерывным аналогом геометрического распределения. Если X — экспоненциально распределенная случайная величина с параметром λ, то
- где — функция пола (или наибольшего целого числа), геометрически распределенная случайная величина с параметром p = 1 — e − л (таким образом, λ = −ln(1 − p ) [7] ) и принимающие значения из набора {0, 1, 2, ...}. Это можно использовать для генерации геометрически распределенных псевдослучайных чисел, сначала генерируя экспоненциально распределенные псевдослучайные числа из универсального генератора псевдослучайных чисел : затем геометрически распределен с параметром , если равномерно распределен в [0,1].
- Если p = 1/ n и X геометрически распределено с параметром p , то распределение X / n приближается к экспоненциальному распределению с ожидаемым значением 1 при n → ∞, поскольку
В более общем смысле, если p = λ / n , где λ — параметр, то при n → ∞ распределение X / n приближается к экспоненциальному распределению со скоростью λ :
поэтому функция распределения X / n сходится к , что соответствует экспоненциальной случайной величине.
Статистический вывод
Оценка параметров [ править ]
Для обоих вариантов геометрического распределения параметр p можно оценить, приравняв ожидаемое значение к выборочному среднему . Это метод моментов , который в данном случае дает максимального правдоподобия оценки p . [8] [9]
В частности, для первого варианта пусть k = k 1 , ..., k n будет выборкой , где k i ≥ 1 для i = 1, ..., n . Тогда p можно оценить как
В байесовском выводе бета -распределение является сопряженным априорным распределением параметра p . Если этому параметру задано значение Beta( α , β ) априорно , то апостериорное распределение будет
Апостериорное среднее E[ p ] приближается к оценке максимального правдоподобия когда α и β приближаются к нулю.
В альтернативном случае пусть k 1 , ..., k n будет выборкой, где k i ≥ 0 для i = 1, ..., n . Тогда p можно оценить как
Апостериорное распределение p с учетом априорного значения Beta( α , β ) равно [10]
И снова апостериорное среднее E[ p ] приближается к оценке максимального правдоподобия. когда α и β приближаются к нулю.
Для любой оценки при использовании максимального правдоподобия смещение равно
что дает оценку максимального правдоподобия с поправкой на смещение
Вычислительные методы [ править ]
В языке программирования R функция dgeom(k, prob)
вычисляет вероятность k
неудачи перед успехом с вероятностью успеха prob
за каждое испытание.
В Microsoft Excel функция NEGBINOMDIST(number_f, number_s, probability_s)
можно использовать для подсчета количества отказов, number_f
, до ряда успехов, number_s
, с вероятностью успеха, probability_s
, для каждого испытания. Параметр number_s
до 1, дает геометрическое распределение. [11]
См. также [ править ]
- Гипергеометрическое распределение
- Проблема коллекционера купонов
- Составное распределение Пуассона
- Отрицательное биномиальное распределение
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б Современное введение в вероятность и статистику: понимание почему и как . Деккинг, Мишель (1946 г.р.). Лондон: Спрингер. 2005. стр. 48–50, 61–62, 152. ISBN. 9781852338961 . OCLC 262680588 .
{{cite book}}
: CS1 maint: другие ( ссылка ) - ^ Jump up to: Перейти обратно: а б Нагель, Вернер; Штайер, Рольф (04 апреля 2017 г.). Вероятность и условное ожидание: основы эмпирических наук . Серия Уайли по вероятности и статистике (1-е изд.). Уайли. стр. 260–261. дои : 10.1002/9781119243496 . ISBN 978-1-119-24352-6 .
- ^ Пак, Сон Ю.; Бера, Анил К. (июнь 2009 г.). «Модель условной гетероскедастичности авторегрессии с максимальной энтропией». Журнал эконометрики . 150 (2): 219–230. doi : 10.1016/j.jeconom.2008.12.014 .
- ^ Галлагер, Р.; ван Вурхис, Д. (март 1975 г.). «Оптимальные исходные коды для геометрически распределенных целочисленных алфавитов (Корресп.)». Транзакции IEEE по теории информации . 21 (2): 228–230. дои : 10.1109/TIT.1975.1055357 . ISSN 0018-9448 .
- ^ Питман, Джим. Вероятность (издание 1993 г.). Издательство Спрингер. стр. 372.
- ^ Чардо, Джанфранко; Лимис, Лоуренс М.; Никол, Дэвид (1 июня 1995 г.). «О минимуме независимых геометрически распределенных случайных величин» . Статистика и вероятностные буквы . 23 (4): 313–326. дои : 10.1016/0167-7152(94)00130-Z . hdl : 2060/19940028569 . S2CID 1505801 .
- ^ «Вольфрам-Альфа: машина вычислительных знаний» . www.wolframalpha.com .
- ^ Каселла, Джордж; Бергер, Роджер Л. (2002). статистический вывод (2-е изд.). стр. 312–315. ISBN 0-534-24312-6 .
- ^ «Примеры MLE: экспоненциальные и геометрические распределения Старый Киви — Рея» . www.projectrhea.org . Проверено 17 ноября 2019 г.
- ^ «3. Сопряженные семейства распределений» (PDF) . Архивировано (PDF) из оригинала 8 апреля 2010 г.
- ^ «3.5 Геометрическое распределение вероятностей с использованием электронной таблицы Excel» . Статистика LibreTexts . 24 июля 2021 г. Проверено 20 октября 2023 г.