Распределение Неймана типа А
Эта статья требует внимания эксперта по математике . Добавьте в этот шаблон причину или параметр обсуждения , чтобы объяснить проблему со статьей. ( январь 2024 г. ) |
Функция массы вероятности Горизонтальная ось — это индекс x , количество вхождений. По вертикальной оси мы имеем вероятность того, что va примет значение x | |||
Кумулятивная функция распределения Горизонтальная ось — это индекс x , количество вхождений. По вертикальной оси мы имеем накопленную сумму вероятностей от к | |||
Обозначения | |||
---|---|---|---|
Параметры | |||
Поддерживать | х € { 0, 1, 2, ... } | ||
ПМФ | |||
CDF | |||
Иметь в виду | |||
Дисперсия | |||
асимметрия | |||
Избыточный эксцесс | |||
МГФ | |||
CF | |||
ПГФ |
В статистике и вероятности распределение Неймана типа А представляет собой дискретное распределение вероятностей из семейства составных распределений Пуассона . Прежде всего, чтобы легко понять это распределение, мы продемонстрируем его на следующем примере, объясненном в разделе «Одномерные дискретные распределения»; [ 1 ] мы имеем статистическую модель распределения личинок на единицу площади поля (в единицу среды обитания), предполагая, что изменение количества скоплений яиц на единицу площади (на единицу среды обитания) может быть представлено коэффициентом Пуассона распределение с параметром , тогда как предполагается, что число личинок, развивающихся в кластере яиц, имеет независимое распределение Пуассона с одним и тем же параметром . Если мы хотим узнать, сколько личинок существует, мы определяем случайную величину Y как сумму количества личинок, вылупившихся в каждой группе (с учетом j групп). Следовательно, Y = X 1 + X 2 + ... X j , где X 1 ,..., X j – независимые переменные Пуассона с параметром и .
История
[ редактировать ]Ежи Нейман родился в России 16 апреля 1894 года. Он был польским статистиком, первую часть своей карьеры проведшим в Европе. В 1939 году он разработал распределение Неймана типа А. [ 1 ] описать распространение личинок на опытных полевых участках. Прежде всего, он используется для описания популяций, основанных на заражении, например, в энтомологии (Beall [1940], [ 2 ] Эванс [1953] [ 3 ] ), несчастные случаи (Кресвелл и Фроггатт [1963]), [ 4 ] и бактериология .
Первоначальный вывод этого распределения был основан на биологической модели, и, по-видимому, ожидалось, что хорошее соответствие данным оправдает гипотезу модели. Однако теперь известно, что это распределение можно получить на основе различных моделей ( Уильям Феллер [1943]), [ 5 ] и ввиду этого распределение Неймана получается как сложное распределение Пуассона . Такая интерпретация делает их пригодными для моделирования гетерогенных популяций и делает их примерами очевидного заражения.
Несмотря на это, трудности при работе с типом А Неймана возникают из-за того, что его выражения для вероятностей очень сложны. Даже оценки параметров с помощью эффективных методов, таких как метод максимального правдоподобия , утомительны и непросты для понимания уравнений.
Определение
[ редактировать ]Функция, генерирующая вероятность
[ редактировать ]Генерирующая функция вероятности (pgf) G 1 ( z ), которая создает N независимых X j случайных величин, используется для ветвящегося процесса. Каждый X j производит случайное количество особей, где X 1 , X 2 ,... имеют то же распределение, что и X , то есть распределение X с pgf G 2 ( z ). Тогда общее количество особей является случайной величиной, [ 1 ]
Pgf распределения SN :
Одно из обозначений, которое особенно полезно, позволяет нам использовать символическое представление для обозначения распределения F1, которое было обобщено распределением F2:
В данном случае это записывается так:
Наконец, функция, производящая вероятность :
Из производящей функции вероятностей мы можем вычислить функцию массы вероятности, объясненную ниже.
Функция массы вероятности
[ редактировать ]Пусть X 1 , X 2 ,... X j — независимые по Пуассону переменные . Распределение вероятностей случайной величины Y = X 1 + X 2 +... X j представляет собой распределение Неймана типа А с параметрами и .
Альтернативно,
Чтобы увидеть, как развивается предыдущее выражение, мы должны иметь в виду, что функция массы вероятности вычисляется на основе производящей функции вероятности , и использовать свойство чисел Стирлинга. Давайте посмотрим на развитие
Другая форма оценки вероятностей - это повторяющиеся последовательности: [ 6 ]
- ,
Хотя его длина напрямую зависит от n , это рекуррентное соотношение используется только для численных вычислений и особенно полезно для компьютерных приложений.
где
- x = 0, 1, 2, ..., за исключением вероятностей повторяющихся последовательностей, где x = 1, 2, 3, ...
- , .
- х ! и Дж ! являются факториалами x j и соответственно .
- одно из свойств чисел Стирлинга второго рода таково: [ 7 ]
Обозначения
[ редактировать ]Характеристики
[ редактировать ]Производящие функции момента и кумулянта
[ редактировать ]случайной Производящая функция момента величины X определяется как ожидаемое значение e т , как функция реального параметра t . Для , производящая функция момента существует и равна
Кумулянтная производящая функция представляет собой логарифм и производящей функции момента равна [ 1 ]
В следующей таблице мы видим моменты порядка от 1 до 4.
Заказ | Момент | кумулятивный |
---|---|---|
1 | ||
2 | ||
3 | ||
4 |
асимметрия
[ редактировать ]Асимметрия среднего — это третий момент, сосредоточенный вокруг значения , деленного на 3/2 степени стандартного отклонения , и для распространение это,
Куртозис
[ редактировать ]Эксцесс – это четвертый момент, сосредоточенный вокруг среднего значения , разделенного на квадрат дисперсии , и для распространение это,
Избыточный эксцесс — это всего лишь поправка, делающая эксцесс нормального распределения равным нулю, и он заключается в следующем:
- Всегда , или распределение имеет высокий острый пик вокруг среднего и более толстых хвостов.
Характеристическая функция
[ редактировать ]В дискретном распределении характеристическая функция любой вещественной случайной величины определяется как ожидаемое значение , где i — мнимая единица и t ∈ R
Эта функция связана с производящей момент функцией через . Следовательно, для этого распределения характеристическая функция равна:
- Обратите внимание, что символ используется для представления характеристической функции.
Кумулятивная функция распределения
[ редактировать ]Кумулятивная функция распределения :
Другие объекты недвижимости
[ редактировать ]- Индекс дисперсии является нормированной мерой дисперсии распределения вероятностей . Он определяется как отношение дисперсии к середине , [ 8 ]
- Из выборки размером N , где каждая случайная величина Y i происходит из , где Y 1 , Y 2 , .., Y n независимы. Это дает оценку MLE как: [ 9 ]
- где это среднее значение
- Между двумя предыдущими выражениями мы можем параметризовать, используя и ,
Оценка параметров
[ редактировать ]Метод моментов
[ редактировать ]Среднее значение и дисперсия NA( ) являются и , соответственно. Итак, у нас есть эти два уравнения: [ 10 ]
- и являются бостральной дисперсией и средним значением соответственно.
Решая эти два уравнения, мы получаем оценки момента и из и .
Максимальная вероятность
[ редактировать ]Вычисление оценки максимального правдоподобия и включает умножение всех вероятностей в функции массы вероятности для получения выражения .
Когда мы применяем настройку параметризации, определенную в «Других свойствах», мы получаем . Мы можем определить оценку максимального правдоподобия на основе одного параметра, если оценим как с учетом выборки X размера N. (выборочное среднее ) Мы можем видеть это ниже.
- Для оценки вероятностей мы будем использовать PMF повторяющихся последовательностей , чтобы расчет был менее сложным.
Проверка предположения Пуассона
[ редактировать ]Когда используется для моделирования выборки данных, важно проверить, хорошо ли распределение Пуассона соответствует данным. Для этого используется следующая проверка гипотезы:
Тест отношения правдоподобия
[ редактировать ]Статистика теста отношения правдоподобия для является,
Где вероятность – это функция логарифмического правдоподобия. W не имеет асимптотики распределение, как и ожидалось при нулевой гипотезе, поскольку d = 1 находится на краю области параметров. В асимптотическом распределении W можно продемонстрировать, что константы 0 и есть смесь 50:50. Для этой смеси процентные пункты верхнего хвоста такие же, как и верхние процентные пункты для
Связанные дистрибутивы
[ редактировать ]Распределение Пуассона (на {0, 1, 2, 3, ...}) является частным случаем распределения Неймана типа A, с
Из моментов порядка 1 и 2 мы можем записать среднее значение совокупности и дисперсию на основе параметров и .
В показателе дисперсии d мы наблюдаем, что, подставляя для параметризованного уравнения порядка 1 и для порядка 2 получаем . Таким образом, наша переменная Y распределяется как Пуассон параметра когда d приближается к 1.
Тогда у нас есть это,
Приложения
[ редактировать ]История использования
[ редактировать ]Когда размножение вида Неймана типа А приводит к образованию кластеров , распределение использовалось для характеристики рассеяния растений. Обычно это происходит, когда вид развивается из потомков родительских растений или из семян, попавших близко к родительскому растению. Однако Арчибальд (1948] [ 11 ] заметил, что данных недостаточно, чтобы сделать вывод о типе воспроизводства по типу подобранного распределения. В то время как тип А Неймана дал положительные результаты для распространения растений, Эванс (1953] [ 3 ] показали, что отрицательное биномиальное распределение дает положительные результаты для распределения насекомых. Распределение Неймана типа А также изучалось в контексте экологии , и результаты показывают, что, если скопления растений не настолько компактны, чтобы не лежать на краю квадрата, используемого для выбора мест отбора проб, это распределение вряд ли будет применимо к растениям. населения. Согласно Скелламу (1958), компактность кластеров является скрытым предположением в первоначальном выводе распределения Неймана. [ 12 ] Было показано, что на результаты существенно влияет выбор размера квадрата.
В контексте несчастных случаев с водителями автобусов Крессвелл и Фроггатт (1963) [ 4 ] вывел тип А Неймана на основе следующих гипотез:
- Каждый водитель подвержен «заклинаниям», количество которых является пуассоновским для любого заданного промежутка времени, с тем же параметром для всех водителей.
- Производительность водителя во время периода плоха, и он, вероятно, испытает пуассоновское количество столкновений с тем же параметром. для всех водителей.
- Каждый водитель ведет себя независимо.
- Никакие несчастные случаи не могут произойти вне заклинания.
Эти предположения приводят к распределению Неймана типа А через и модель. В отличие от «короткого распределения» Крессвелл и Фроггатт назвали это «длинным распределением» из-за его длинного хвоста. Согласно Ирвину (1964), распределение типа А можно также получить, если предположить, что разные водители имеют разные уровни склонности, К. или с вероятностью:
- принимая значения
и что водитель со склонностью k произошло X происшествий, где:
Это модель со смешиванием значений, принимаемых K .
Распределение было также предложено в заявке на группировку палаток меньшинств для еды с 1965 по 1969 год. В этом отношении было предсказано, что необходимо аппроксимировать только показатели кластеризации или среднее количество объектов в группе, а не корректировать распределения по d очень большие базы данных.
- Ссылка на историю использования . [ 1 ]
Вычисление вероятностей Неймана типа A в R
[ редактировать ]- Код ниже имитирует 5000 экземпляров ,
rNeymanA <- function(n,lambda, phi){ r <- numeric() for (j in 1:n) { k = rpois(1,lambda) r[j] <- sum(rpois(k,phi)) } return(r) }
- Массовая функция повторяющихся вероятностей реализована в R для оценки теоретических вероятностей; мы можем увидеть это ниже,
dNeyman.rec <- function(x, lambda, phi){ p <- numeric() p[1]<- exp(-lambda + lambda*exp(-phi)) c <- lambda*phi*exp(-phi) if(x == 0){ return(p[1]) } else{ for (i in 1:x) { suma = 0 for (r in 0:(i-1)) { suma = suma + (phi^r)/(factorial(r))*p[i-r] } p[i+1] = (c/(i))*suma # +1 per l'R } res <- p[i+1] return(res) } }
Мы сравниваем результаты относительных частот, полученных с помощью моделирования, и вероятностей, вычисленных с помощью pmf. Учитывая два значения параметров и . Это показано в следующей таблице:
Х | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
---|---|---|---|---|---|---|---|---|---|
Оцененный | .271 | .207 | .187 | .141 | .082 | .052 | .028 | .016 | .008 |
Теоретический | .282 | .207 | .180 | .129 | .084 | .051 | .029 | .016 | .008 |
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с д и Джонсон, Нидерланды ; Кемп, AW; Коц, С (2005). Одномерные дискретные распределения . Канада: Wiley-Interscience. стр. 407–409. ISBN 0-471-27246-9 .
- ^ Билл, Г. (1940). «Соответствие и значение распространения заразных инфекций применительно к наблюдениям за личинками насекомых». Экология . 21 (4): 460–474. Бибкод : 1940Ecol...21..460B . дои : 10.2307/1930285 . JSTOR 1930285 .
- ^ Перейти обратно: а б Эванс, Д.А. (1953). «Экспериментальные данные о распространении заразных веществ в экологии». Биометрика . 40 (1–2): 186–211. дои : 10.1093/biomet/40.1-2.186 .
- ^ Перейти обратно: а б Кресвелл, WL; Фроггатт, П. (1963). Причины дорожно-транспортных происшествий с участием водителей автобусов . Лондон: Издательство Оксфордского университета.
- ^ Феллер, В. (1943). «Об общем классе «заразных» распределений». Анналы математической статистики . 14 (4): 389. doi : 10.1214/aoms/1177731359 .
- ^ Джонсон, Нидерланды ; Кемп, AW; Коц, С (2005). Одномерные дискретные распределения . Канада: Wiley-Interscience. п. 404.
- ^ Джонсон, Нидерланды ; Кемп, AW; Коц, С (2005). «1.1.3». Одномерные дискретные распределения . Канада: Wiley-Interscience.
- ^ «Индекс дисперсии (отношение отклонения к среднему)» . Статологи . 18 апреля 2022 г.
- ^ Шентон, ЛР; Боуман, нокаут (1977). «9.6.1». Оценка максимального правдоподобия в небольших выборках . Лондон: Гриффин.
- ^ Шентон, ЛР (1949). «Об эффективности метода моментов и распределения Неймана типа А» . Биометрика . 36 (3–4): 450–454. дои : 10.1093/biomet/36.3-4.450 . JSTOR 2332680 . ПМИД 15402077 .
- ^ Арчибальд, ЕЭЗ Популяции растений I: Новое применение заразного распространения Неймана, Анналы ботаники . Лондон: Издательство Оксфордского университета. стр. 221–235.
- ^ Скеллам, Дж. Г. (1958). «О выводе и применимости распределения Неймана типа А». Биометрика . 45 (1–2): 32–36. дои : 10.1093/biomet/45.1-2.32 .