Модель урны для пеленания
В статистике модель урны Пойи (также известная как схема урны Пойи или просто урна Пойи ), названная в честь Джорджа Пойа , представляет собой семейство моделей урн , которые можно использовать для интерпретации многих часто используемых статистических моделей .
Модель представляет интересующие объекты (такие как атомы, люди, автомобили и т. д.) в виде цветных шаров в урне . В базовой модели урны Поля экспериментатор помещает x белых и y в урну черных шаров. На каждом этапе из урны равномерно и случайным образом вынимают один шар и наблюдают за его цветом; Затем его возвращают в урну, и в урну добавляется еще один шар того же цвета.
Если по случайной случайности в первых нескольких розыгрышах будет вытянуто больше черных шаров, чем белых, это повысит вероятность того, что позже будет вытянуто больше черных шаров. Аналогично и с белыми шарами. Таким образом, урна обладает свойством самоусиления (« богатые становятся еще богаче »). Это противоположность выборке без замены : каждый раз, когда наблюдается определенное значение, вероятность его повторного наблюдения снижается, тогда как в модели урны Пойа наблюдаемое значение с большей вероятностью будет наблюдаться снова. В модели урны Пойа последовательные акты измерения с течением времени оказывают все меньше и меньше влияния на будущие измерения, тогда как при отборе проб без замены верно обратное: после определенного количества измерений определенного значения это значение больше никогда не будет видно. .
Он также отличается от отбора проб с заменой, когда шар возвращается в урну, но без добавления новых шаров. В этом случае нет ни самоусиления, ни антисамоусиления.
Основные результаты
[ редактировать ]Интересными вопросами являются эволюция популяции урн и последовательность цветов вытаскиваемых шаров.
После вытягивает, вероятность того, что в урне окажется белые шарики и черные шары (для ) является где верхняя черта обозначает возрастающий факториал . Это можно доказать, нарисовав треугольник Паскаля всех возможных конфигураций.
В частности, начиная с одного белого и одного черного шара (т. е. ) вероятность иметь любое число белых шаров в урне после рисует то же самое, .
В более общем смысле, если урна начинается с цветные шарики , с , затем после вытягивает, вероятность того, что в урне окажется цветные шарики является где мы используем полиномиальный коэффициент .
При условии, что в урне окажется цветные шарики после рисует, есть разные траектории, которые могли привести к такому конечному состоянию. Условная вероятность каждой траектории одинакова: .
Интерпретация
[ редактировать ]Одна из причин интереса к этой конкретной, довольно сложной модели урны (т.е. с дублированием, а затем заменой каждого вытянутого шара) заключается в том, что она представляет собой пример, в котором количество (первоначально x черных и y белых) шаров в урне не скрытый, который способен аппроксимировать правильное обновление субъективных вероятностей, соответствующих другому случаю , в котором исходное содержимое урны скрыто , в то время как проводится обычный отбор проб с заменой (без дублирования шара Поля). Из-за простой схемы «отбора пробы с заменой» во втором случае содержимое урны теперь статично , но эта большая простота компенсируется предположением, что содержимое урны теперь неизвестно наблюдателю. Байесовский анализ неопределенности наблюдателя относительно первоначального содержимого урны можно провести, используя конкретный выбор (сопряженного) предварительного распределения. В частности, предположим, что наблюдатель знает, что урна содержит только одинаковые шары, каждый из которых окрашен в черный или белый цвет, но он не знает ни абсолютного числа присутствующих шаров, ни пропорции шаров каждого цвета. Предположим, что они имеют априорные убеждения об этих неизвестных: для них распределение вероятностей содержимого урны хорошо аппроксимируется некоторым априорным распределением общего числа шаров в урне и бета-априорным распределением с параметрами (x,y) для начальной доли черных, причем эта доля (для них) считается приблизительно независимой от общего числа. Тогда процесс исходов последовательности вытягиваний из урны (с заменой, но без дублирования) имеет примерно тот же закон вероятности , что и описанная выше схема Пойа, в которой от них не было скрыто действительное содержимое урны. Ошибка аппроксимации здесь связана с тем фактом, что урна, содержащая известное конечное число m шаров, конечно, не может иметь точно распределенную по бета-распределению неизвестную долю черных шаров, поскольку область возможных значений этой пропорции ограничена кратностью , вместо того, чтобы иметь полную свободу принимать любое значение в непрерывном единичном интервале, как это было бы с точно распределенной бета-пропорцией. Это несколько неформальное описание представлено в целях мотивации и может быть математически более точным.
Эта базовая модель урны Полиа была обобщена во многих отношениях.
Раздачи, связанные с урной Pólya
[ редактировать ]- бета-биномиальное распределение : Распределение количества успешных розыгрышей (испытаний), например, количества извлечений белого шара, заданного извлекает из урны Полиа.
- Бета-отрицательное биномиальное распределение : распределение количества белых шаров, наблюдаемое до тех пор, пока не будет наблюдаться фиксированное количество черных шаров.
- Мультиномиальное распределение Дирихле (также известное как многомерное распределение Полиа ): распределение по количеству шаров каждого цвета, заданное извлекает из урны Полиа, где лежат разные цвета вместо двух.
- Отрицательное полиномиальное распределение Дирихле : распределение по количеству шаров каждого цвета до тех пор, пока не будет наблюдаться фиксированное количество остановившихся цветных шаров.
- Мартингалы , бета-биномиальное распределение и бета-распределение : пусть w и b — количество белых и черных шаров, изначально находящихся в урне, и количество белых шаров, находящихся в урне после n розыгрышей. Тогда последовательность значений для представляет собой нормализованную версию бета-биномиального распределения . Это мартингал , который сходится к бета-распределению при n → ∞.
- Процесс Дирихле , Процесс китайского ресторана , Урна Хоппе : Представьте себе модифицированную схему урны Полиа следующим образом. Начнем с урны с черные шарики. При извлечении шара из урны, если мы вытягиваем черный шар, положите его обратно вместе с новым шаром нового, отличного от черного цвета, случайно сгенерированным из равномерного распределения по бесконечному набору доступных цветов, и рассмотрите вновь сгенерированный цвет будет «значением» розыгрыша. В противном случае положите шар обратно вместе с другим шаром того же цвета, как в стандартной схеме урны Полиа. Цвета бесконечной последовательности розыгрышей этой модифицированной схемы урн Pólya соответствуют процессу китайского ресторана . Если вместо генерации нового цвета мы вытягиваем случайное значение из заданного базового распределения и используем это значение для обозначения шара, метки бесконечной последовательности розыгрышей следуют процессу Дирихле . [ 1 ]
- Модель Морана : Модель урны, используемая для моделирования генетического дрейфа в теоретической популяционной генетике . Это очень похоже на модель урны Pólya, за исключением того, что помимо добавления нового шара того же цвета из урны удаляется случайно вытянутый шар. Таким образом, количество шаров в урне остается постоянным. Продолжение отбора проб затем приводит в конечном итоге к урне со всеми шарами одного цвета, причем вероятность каждого цвета равна доле этого цвета в исходной урне. Существуют варианты модели Морана, которые настаивают на том, чтобы шар, извлеченный из урны, отличался от шара, первоначально отобранного на этом этапе, и варианты, которые удаляют шар сразу после того, как новый шар помещен в урну, так что новый шар — один из шаров, доступных для удаления. Это имеет небольшую разницу во времени, необходимом для достижения состояния, в котором все шары имеют один и тот же цвет. Процесс Морана моделирует генетический дрейф в популяции с перекрывающимися поколениями.
Взаимозаменяемость
[ редактировать ]Урна Полии — типичный пример процесса обмена .
Предположим, у нас есть урна, содержащая белые шарики и черные шарики. Приступаем к случайному извлечению шаров из урны. На -й розыгрыш, мы определяем случайную величину, , к если шар черный и в противном случае. Затем мы возвращаем шар в урну вместе с дополнительным шаром того же цвета. Для данного , если у нас это есть для многих , то более вероятно, что , потому что в урну добавилось еще больше черных шаров. Следовательно, эти переменные не являются независимыми друг от друга.
Последовательность однако демонстрирует более слабое свойство обмениваемости. [ 2 ] Напомним, что последовательность (конечных или бесконечных) случайных величин называется обменной , если ее совместное распределение инвариантно относительно перестановок индексов.
Чтобы показать заменяемость последовательности , предположим, что из урны вынимают шары, а из них шарики, шары черные и белые. При первом розыгрыше количество шаров в урне равно ; во втором розыгрыше это и так далее. На -й розыгрыш, количество шаров будет . Вероятность того, что мы вытянем все сначала черные шары, а потом все белые шары даются
Теперь мы должны показать, что если поменять порядок черных и белых шаров, вероятность не изменится. Как и в приведенном выше выражении, даже после перестановки розыгрышей знаменатель всегда будет , поскольку это количество шаров в урне в этом раунде.
Если мы увидим -й черный шар в раунде , вероятность будет равен , т.е. числитель будет равен . Используя те же аргументы, мы можем вычислить вероятность для белых шаров. Следовательно, для любой последовательности в котором происходит раз и происходит раз (т.е. последовательность с черные шары и белые шары, вытянутые в некотором порядке) итоговая вероятность будет равна следующему выражению, где мы воспользовались коммутативностью умножения в числителе:
Эта вероятность не связана с порядком появления черных и белых шаров и зависит только от общего количества белых шаров и общего количества черных шаров. [ 2 ]
Согласно теореме Де Финетти , должно существовать уникальное априорное распределение, такое, что совместное распределение наблюдения последовательности представляет собой байесовскую смесь вероятностей Бернулли. Можно показать, что это априорное распределение является бета-распределением с параметрами . В теореме Де Финетти, если заменить с , то получим предыдущее уравнение: [ 2 ]
В этом уравнении .
См. также
[ редактировать ]- Процесс Питмана-Йора
- Процесс Морана
- Святочный процесс
- О теореме Финетти
- процесс в китайском ресторане
Ссылки
[ редактировать ]- ^ Хоппе, Фред (1984). «Урны в стиле Полиа и формула отбора проб Юэнсов». Журнал математической биологии . 20:91 . дои : 10.1007/BF00275863 . hdl : 2027.42/46944 . S2CID 122994288 .
- ^ Перейти обратно: а б с Хоппе, Фред М. (1984). «Поляподобные урны и формула отбора проб Юэнса» . Журнал математической биологии . 20 (1): 91–94. дои : 10.1007/bf00275863 . hdl : 2027.42/46944 . ISSN 0303-6812 . S2CID 122994288 . [ мертвая ссылка ]
Дальнейшее чтение
[ редактировать ]- Эггенбергер, Ф.; Поля, Г. (1923). «О статистике цепных операций». З. Энджью. Математика . 3 (4): 2379–289. дои : 10.1002/замм.19230030407 .
- Аладжаджи, Ф.; Фуджа, Т. (1994). «Канал связи, созданный по образцу заражения». Транзакции IEEE по теории информации . 40 : 2035–2041. дои : 10.1109/18.340476 . hdl : 1903/5422 .
- Банерджи, А.; Бурлина, П.; Аладжаджи, Ф. (1999). «Сегментация изображений и маркировка с использованием модели урны Пойя». Транзакции IEEE при обработке изображений . 8 (9): 1243–1253. дои : 10.1109/83.784436 .
Библиография
[ редактировать ]- Н.Л. Джонсон и С.Коц, (1977) «Модели урн и их применение». Джон Уайли.
- Хосам Махмуд, (2008) «Модели урн Pólya». Чепмен и Холл/CRC. ISBN 978-1420059830 .