Распространение отшельника
Функция массы вероятности ![]() Горизонтальная ось — это индекс k , количество вхождений. Функция определяется только для целочисленных значений k . Соединительные линии являются лишь ориентирами для глаз. | |||
Кумулятивная функция распределения ![]() Горизонтальная ось — это индекс k , количество вхождений. CDF является разрывным в целых числах k и плоским везде, поскольку переменная, распределенная по Эрмиту, принимает только целые значения. | |||
Обозначения | |||
---|---|---|---|
Параметры | а 1 ≥ 0, а 2 ≥ 0 | ||
Поддерживать | х € { 0, 1, 2, ... } | ||
ПМФ | |||
CDF | |||
Иметь в виду | |||
Дисперсия | |||
асимметрия | |||
Избыточный эксцесс | |||
МГФ | |||
CF | |||
ПГФ |
В теории вероятностей и статистике , распределение Эрмита названное в честь Чарльза Эрмита , представляет собой дискретное распределение вероятностей, используемое для моделирования данных подсчета с более чем одним параметром. Это распределение является гибким с точки зрения его способности допускать умеренную чрезмерную дисперсию данных.
Авторы Кемп и Кемп [1] назвали его «распределением Эрмита» из-за того, что его функция вероятности и производящая функция момента могут быть выражены через коэффициенты (модифицированных) полиномов Эрмита .
История
[ редактировать ]Распределение впервые появилось в статье «Приложения математики к медицинским проблемам» . [2] Андерсоном Греем Маккендриком в 1926 году. В этой работе автор объясняет несколько математических методов, которые можно применить в медицинских исследованиях. В одном из этих методов он рассмотрел двумерное распределение Пуассона и показал, что распределение суммы двух коррелирующих переменных Пуассона соответствует распределению, которое позже будет известно как распределение Эрмита.
В качестве практического применения Маккендрик рассматривал распределение количества бактерий в лейкоцитах . Используя метод моментов, он подогнал данные к распределению Эрмита и нашел модель более удовлетворительной, чем аппроксимация ее распределением Пуассона .
Распределение было официально представлено и опубликовано К.Д. Кемпом и Адриенн В. Кемп в 1965 году в их работе «Некоторые свойства распределения Эрмита» . Работа сосредоточена на свойствах этого распределения, например, на необходимых условиях для параметров и их оценках максимального правдоподобия (MLE), анализе производящей функции вероятности (PGF) и на том, как ее можно выразить через коэффициенты ( модифицированные) Полиномы Эрмита . Примером, который они использовали в этой публикации, является распределение количества бактерий в лейкоцитах, которое использовал Маккендрик, но Кемп и Кемп оценили модель, используя метод максимального правдоподобия .
Распределение Эрмита — это частный случай дискретного составного распределения Пуассона только с двумя параметрами. [3] [4]
Те же авторы опубликовали в 1966 году статью « Альтернативный вывод распределения Эрмита» . [5] В этой работе установлено, что распределение Эрмита можно получить формально путем объединения распределения Пуассона с нормальным распределением .
В 1971 году Ю. К. Патель [6] в своей докторской диссертации провел сравнительное исследование различных процедур оценки распределения Эрмита. Он включал в себя оценку максимального правдоподобия, оценки момента, оценки средней и нулевой частоты и метод четных точек.
В 1974 году Гупта и Джайн [7] провел исследование обобщенной формы распределения Эрмита.
Определение
[ редактировать ]Функция массы вероятности
[ редактировать ]Пусть X 1 и X 2 — две независимые переменные Пуассона с параметрами a 1 и a 2 . Распределение вероятностей Y случайной величины = X 1 + 2 X 2 представляет собой распределение Эрмита с параметрами a 1 и a 2 , а функция массы вероятности определяется выражением [8]
где
- п = 0, 1, 2, ...
- а1 ≥ , а2 . 0
- ( п - 2 j )! и Дж ! являются факториалами ( n − 2 j ) и j соответственно.
- является целой частью n /2.
вероятностной Производящая функция массы равна: [8]
Обозначения
[ редактировать ]Когда случайная величина Y = X 1 + 2 X 2 распределяется по распределению Эрмита, где X 1 и X 2 — две независимые переменные Пуассона с параметрами a 1 и a 2 , мы пишем
Характеристики
[ редактировать ]Производящие функции момента и кумулянта
[ редактировать ]случайной Производящая функция момента величины X определяется как ожидаемое значение e т , как функция реального параметра t . Для распределения Эрмита с параметрами X 1 и X 2 производящая функция момента существует и равна
Кумулянтная производящая функция представляет собой логарифм производящей функции момента и равна [4]
Если мы рассмотрим коэффициент ( it ) р р ! в разложении K ( t ) получаем r -кумулянт
Следовательно, среднее значение и последующие три момента относительно него равны
Заказ | Момент | кумулятивный |
---|---|---|
1 | ||
2 | ||
3 | ||
4 |
асимметрия
[ редактировать ]Асимметрия — это третий момент , сосредоточенный вокруг среднего значения, деленного на 3/2 степени стандартного отклонения , и для распределения Эрмита это: [4]
- Всегда , поэтому масса распределения сосредоточена слева.
Куртозис
[ редактировать ]Эксцесс — это четвертый момент , сосредоточенный вокруг среднего значения, разделенный на квадрат дисперсии , а для распределения Эрмита он равен: [4]
Избыточный эксцесс — это просто поправка, делающая эксцесс нормального распределения равным нулю, и он заключается в следующем:
- Всегда , или распределение имеет высокий острый пик вокруг среднего и более толстых хвостов.
Характеристическая функция
[ редактировать ]В дискретном распределении характеристическая функция любой действительной случайной величины определяется как ожидаемое значение , где i — мнимая единица и t ∈ R
Эта функция связана с функцией, порождающей момент, соотношением . Следовательно, для этого распределения характеристическая функция равна: [1]
Кумулятивная функция распределения
[ редактировать ]Кумулятивная функция распределения : [1]
Другие объекты недвижимости
[ редактировать ]- Это распределение может иметь любое количество режимов . В качестве примера можно привести подобранное распределение Маккендрика. [2] данные имеют расчетные параметры , . Следовательно, первые пять оцененных вероятностей равны 0,899, 0,012, 0,084, 0,001, 0,004.

- Это распределение замкнуто относительно сложения или замкнуто относительно сверток. [9] Подобно распределению Пуассона , распределение Эрмита обладает этим свойством. Учитывая две случайные величины, распределенные по Эрмиту и , то Y = X 1 + X 2 подчиняется распределению Эрмита, .
- Это распределение допускает умеренную избыточную дисперсию , поэтому его можно использовать, когда данные обладают этим свойством. [9] Случайная величина имеет сверхдисперсию или сверхдисперсию по отношению к распределению Пуассона, когда ее дисперсия превышает ее ожидаемое значение. Распределение Эрмита допускает умеренную сверхдисперсию, поскольку коэффициент дисперсии всегда находится в диапазоне от 1 до 2.
Оценка параметров
[ редактировать ]Метод моментов
[ редактировать ]и Среднее значение дисперсия распределения Эрмита равны и , соответственно. Итак, у нас есть эти два уравнения:
Решая эти два уравнения, мы получаем оценки момента и из 1 и 2 . [6]
Поскольку a 1 и a 2 положительны, оценщик и допустимы (≥ 0) только в том случае, если .
Максимальная вероятность
[ редактировать ]Учитывая выборку X 1 , ..., X m являются независимыми случайными величинами, каждая из которых имеет распределение Эрмита, мы хотим оценить значения параметров и . Мы знаем, что среднее и дисперсия распределения равны и , соответственно. Используя эти два уравнения,
Мы можем параметризовать функцию вероятности с помощью µ и d
Следовательно, функция логарифмического правдоподобия равна: [9]
где
Из логарифмической функции правдоподобия уравнения правдоподобия имеют вид: [9]
Непосредственные расчеты показывают, что [9]
- И d можно найти, решив:
где
- Можно показать, что логарифмическая функция правдоподобия строго вогнута в области параметров. Следовательно, MLE уникален.
Уравнение правдоподобия не всегда имеет решение, как показано в следующем предложении:
Предложение: [9] Пусть X 1 , ..., X m происходят из обобщенного распределения Эрмита с фиксированным n . Тогда MLE параметров равны и если только если , где указывает на эмпирический факторный момент 2-го порядка.
- Примечание 1: Условие эквивалентно где эмпирический индекс дисперсии
- Примечание 2. Если условие не выполняется, то MLE параметров равны и , то есть данные подбираются с использованием распределения Пуассона.
Нулевая частота и средние оценки
[ редактировать ]Обычно для дискретных распределений выбирают нулевую относительную частоту набора данных, которая приравнивается к нулевой вероятности при предполагаемом распределении. Наблюдая за этим и . Следуя примеру Ю. К. Пателя (1976), полученная система уравнений:
Получаем нулевую частоту и оценку a 1 среднюю и 2 из , [6]
где , – нулевая относительная частота, n > 0
Видно, что для распределений с высокой вероятностью при 0 эффективность высока.
- Для допустимых значений и , мы должны иметь
Проверка предположения Пуассона
[ редактировать ]Когда распределение Эрмита используется для моделирования выборки данных, важно проверить, достаточно ли распределения Пуассона для соответствия данным. Следуя параметризованной функции массы вероятности, используемой для расчета оценки максимального правдоподобия, важно подтвердить следующую гипотезу:
Тест отношения правдоподобия
[ редактировать ]правдоподобия теста отношения Статистика [9] для отшельнического распределения есть,
Где – это функция логарифмического правдоподобия. Поскольку d = 1 принадлежит границе области параметров, при нулевой гипотезе W не имеет асимптотики распределение как и ожидалось. Можно установить, что асимптотическое распределение W представляет собой смесь константы 0 и константы 50:50. . Процентные точки верхнего хвоста α для этой смеси такие же, как процентные точки верхнего хвоста 2α для ; например, для α = 0,01, 0,05 и 0,10 они равны 5,41189, 2,70554 и 1,64237.
«Оценка» или критерий множителя Лагранжа
[ редактировать ]Статистика очков такова: [9]
где m — количество наблюдений.
Асимптотическое распределение статистики оценочного теста при нулевой гипотезе представляет собой распределение. Возможно, будет удобно использовать подписанную версию оценочного теста, т.е. , асимптотически следующий стандартному нормальному.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с Кемп, CD; Кемп, AW (1965). «Некоторые свойства распределения «Эрмита». Биометрика . 52 (3–4): 381–394. дои : 10.1093/biomet/52.3-4.381 .
- ^ Jump up to: а б Маккендрик, АГ (1926). «Приложения математики к медицинским проблемам» . Труды Эдинбургского математического общества . 44 : 98–130. дои : 10.1017/s0013091500034428 .
- ^ Хуэймин, Чжан; Юньсяо Лю; Бо Ли (2014). «Заметки о дискретной составной модели Пуассона с приложениями к теории риска». Страхование: Математика и Экономика . 59 : 325–336. doi : 10.1016/j.insmatheco.2014.09.012 .
- ^ Jump up to: а б с д Джонсон, Н.Л., Кемп, А.В., и Коц, С. (2005) Одномерные дискретные распределения, 3-е издание, Wiley, ISBN 978-0-471-27246-5 .
- ^ Кемп, Адриенна В.; Компакт-диск Кемпа (1966). «Альтернативный вывод распределения Эрмита». Биометрика . 53 (3–4): 627–628. дои : 10.1093/biomet/53.3-4.627 .
- ^ Jump up to: а б с Патель, ЮК (1976). «Оценка четной точки и оценка момента в распределении Эрмита». Биометрия . 32 (4): 865–873. дои : 10.2307/2529270 . JSTOR 2529270 .
- ^ Гупта, Р.П.; Джайн, GC (1974). «Обобщенное распределение Эрмита и его свойства». SIAM Journal по прикладной математике . 27 (2): 359–363. дои : 10.1137/0127027 . JSTOR 2100572 .
- ^ Jump up to: а б Коц, Сэмюэл (1982–1989). Энциклопедия статистических наук . Джон Уайли. ISBN 978-0471055525 .
- ^ Jump up to: а б с д и ж г час Пуч, П. (2003). «Характеризация аддитивно замкнутых дискретных моделей свойством их оценок максимального правдоподобия с применением к обобщенным распределениям Эрмита». Журнал Американской статистической ассоциации . 98 (463): 687–692. дои : 10.1198/016214503000000594 . JSTOR 30045296 . S2CID 120484966 .