Jump to content

Полиномиальное распределение

В теории вероятностей полиномиальное распределение является обобщением биномиального распределения . Например, он моделирует вероятность выпадения очков для каждой стороны k -сторонней игральной кости, брошенной n раз. Для n независимых испытаний, каждое из которых приводит к успеху ровно одной из k категорий, причем каждая категория имеет заданную фиксированную вероятность успеха, полиномиальное распределение дает вероятность любой конкретной комбинации чисел успехов для различных категорий.

Когда k равно 2, а n равно 1, полиномиальное распределение является распределением Бернулли . Когда k равно 2, а n больше 1, это биномиальное распределение . Когда k больше 2 и n равно 1, это категориальное распределение . Термин «мультинолли» иногда используется для категориального распределения, чтобы подчеркнуть эту четырехстороннюю связь (так n определяет суффикс, а k - префикс).

Распределение Бернулли моделирует результат одного испытания Бернулли . Другими словами, он моделирует, приведет ли однократное подбрасывание монеты (возможно, необъективной ) к успеху (получение орла) или неудаче (получение решки). Биномиальное распределение обобщает это на количество решек в результате выполнения n независимых подбрасываний (испытаний Бернулли) одной и той же монеты. Полиномиальное распределение моделирует результат n экспериментов, где результат каждого испытания имеет категориальное распределение , например, бросок k -сторонней игральной кости n раз.

Пусть k — фиксированное конечное число. Математически у нас есть k возможных взаимоисключающих результатов с соответствующими вероятностями p 1 , ..., p k и n независимых испытаний. Поскольку k исходов являются взаимоисключающими и один из них должен произойти, мы имеем p i ≥ 0 для i = 1, ..., k и . Тогда, если случайные величины X i указывают, сколько раз результат номер i наблюдался в n испытаниях, вектор X = ( X 1 , ..., X k ) следует полиномиальному распределению с параметрами n и p , где p = ( п 1 , ..., п к ). Хотя испытания независимы, их результаты X i зависимы, поскольку их необходимо просуммировать до n.

Полиномиальный
Параметры

количество испытаний ( целое число )
количество взаимоисключающих событий (целое)

вероятности событий, где
Поддерживать
ПМФ
Иметь в виду
Дисперсия
Энтропия
МГФ
CF где
ПГФ

Определения [ править ]

Функция массы вероятности [ править ]

Предположим, кто-то проводит эксперимент по извлечению n шаров k из мешка разных цветов, заменяя извлеченные шары после каждого розыгрыша. Шары одного цвета эквивалентны. Обозначим переменную, которая представляет собой количество извлеченных шаров цвета i ( i = 1, ..., k ), как X i , и обозначим как p i вероятность того, что данное извлечение будет цвета i . Функция массы вероятности этого полиномиального распределения:

для неотрицательных целых чисел x 1 , ..., x k .

Массовую функцию вероятности можно выразить с помощью гамма-функции как:

Эта форма показывает свое сходство с распределением Дирихле , которое является его сопряженным априором .

Пример [ править ]

Предположим, что на трехсторонних выборах в большой стране кандидат А получил 20% голосов, кандидат Б — 30% голосов, а кандидат С — 50% голосов. Если шесть избирателей выбраны случайным образом, какова вероятность того, что в выборке окажется ровно один сторонник кандидата А, два сторонника кандидата В и три сторонника кандидата С?

Примечание. Поскольку мы предполагаем, что голосующее население велико, разумно и допустимо считать вероятности неизменными после того, как избиратель выбран для выборки. Технически говоря, это выборка без замещения, поэтому правильным распределением является многомерное гипергеометрическое распределение , но распределения сходятся по мере увеличения генеральной совокупности по сравнению с фиксированным размером выборки. [1] .

Свойства [ править ]

Нормализация [ править ]

Полиномиальное распределение нормируется согласно:

где сумма ведется по всем перестановкам такой, что .

и дисперсия Ожидаемое значение

Ожидаемое количество раз , когда результат i наблюдался в n испытаниях, равно

Ковариационная матрица выглядит следующим образом. Каждый диагональный элемент представляет собой дисперсию биномиально распределенной случайной величины и, следовательно,

Внедиагональные записи представляют собой ковариации :

для i , j различны.

Все ковариации отрицательны, поскольку при фиксированном n увеличение одного компонента полиномиального вектора требует уменьшения другого компонента.

Когда эти выражения объединяются в матрицу с i, j элементами результатом является размера k × k положительно-полуопределенная ковариационная матрица ранга k - 1. В особом случае, когда k = n и все числа p i равны, ковариационная матрица является центрирующей матрицей .

Элементы соответствующей корреляционной матрицы :

Обратите внимание, что количество испытаний n не входит в это выражение.

Каждая из k компонент в отдельности имеет биномиальное распределение с параметрами n и pi для соответствующего значения индекса i .

Носителем полиномиального распределения является множество

Число его элементов равно

Матричное обозначение [ править ]

В матричной записи

и

с п Т = вектор-строка, транспонированная вектор-столбцом p .

Визуализация [ править ]

Как срезы обобщенного треугольника Паскаля

Точно так же, как можно интерпретировать биномиальное распределение как (нормализованные) одномерные (1D) срезы треугольника Паскаля , так же можно интерпретировать полиномиальное распределение как 2D (треугольные) срезы пирамиды Паскаля или 3D/4D/+ (пирамидальные) образные) срезы многомерных аналогов треугольника Паскаля. Это открывает интерпретацию диапазона распределения : дискретизированные равносторонние «пирамиды» в произвольном измерении, то есть симплекс с сеткой. [ нужна ссылка ]

Как полиномиальные коэффициенты

Точно так же, как можно интерпретировать биномиальное распределение как полиномиальные коэффициенты в расширенном виде можно интерпретировать полиномиальное распределение как коэффициенты при расширении, отметив, что сумма только коэффициентов должна составлять 1.

Теория больших отклонений [ править ]

Асимптотика [ править ]

По формуле Стирлинга на пределе , у нас есть

где относительные частоты в данных можно интерпретировать как вероятности из эмпирического распределения , и расходимость Кульбака–Лейблера .

Эту формулу можно интерпретировать следующим образом.

Учитывать , пространство всех возможных распределений по категориям . Это симплекс . После независимые выборки из категориального распределения (именно так мы строим полиномиальное распределение), мы получаем эмпирическое распределение .

По асимптотической формуле вероятность того, что эмпирическое распределение отклоняется от фактического распределения затухает экспоненциально со скоростью . Чем больше экспериментов и тем больше разнообразия из , тем меньше вероятность увидеть такое эмпирическое распределение.

Если является закрытым подмножеством , затем разделив на куски, и рассуждая о темпах роста на каждом кусочке , получаем теорему Санова , которая утверждает, что

Концентрация в целом n [ править ]

Из-за экспоненциального затухания в целом , почти вся вероятностная масса сосредоточена в небольшой окрестности . В этой небольшой окрестности мы можем взять первый ненулевой член в разложении Тейлора , чтобы получить

Это напоминает распределение Гаусса, что предполагает следующую теорему:

Теорема. На предел, сходится по распределению к распределению хи-квадрат .

Продолжительность: 17 секунд.
Если мы выберем из полиномиального распределения и построим тепловую карту образцов внутри двумерного симплекса (здесь показанного в виде черного треугольника), мы заметим, что при , распределение сходится к гауссову около точки , с контурами, сходящимися по форме к эллипсам, с радиусами, сходящимися как . Между тем, расстояние между дискретными точками сходится как , и поэтому дискретное полиномиальное распределение сходится к непрерывному гауссовскому распределению.
[Доказательство]

Условная концентрация в больших n [ править ]

Вышеописанное явление концентрации можно легко обобщить на случай, когда мы ставим условия на линейные ограничения. Это теоретическое обоснование критерия хи-квадрат Пирсона .

Теорема. Указанные частоты наблюдается в наборе данных с баллы, мы налагаем независимые линейные ограничения

(обратите внимание, что первое ограничение — это просто требование, чтобы сумма эмпирических распределений равнялась единице), так что эмпирические удовлетворять всем этим ограничениям одновременно. Позволять обозначают -прогноз предварительного распределения на подобласти симплекса, разрешенной линейными ограничениями. На предел, количество выборок из полиномиального распределения, обусловленного линейными ограничениями, определяются формулами которое сходится по распределению к распределению хи-квадрат .

[Доказательство]

Вдали от эмпирически наблюдаемых ограничений (например, моменты или превалентности) теорему можно обобщить:

Теорема.

  • Данные функции , такие, что они непрерывно дифференцируемы в окрестности , а векторы линейно независимы;
  • заданные последовательности , такой, что асимптотически для каждого ;
  • тогда для полиномиального распределения, обусловленного ограничениями , у нас есть количество сходящиеся в распределении к в предел.

В случае, если все равны, теорема сводится к концентрации энтропии вокруг максимальной энтропии. [3] [4]

Связанные дистрибутивы [ править ]

В некоторых областях, таких как обработка естественного языка , категориальные и полиномиальные распределения являются синонимами, и обычно говорят о полиномиальном распределении, когда на самом деле имеется в виду категориальное распределение . Это связано с тем, что иногда удобно выразить результат категориального распределения как вектор «1 из k» (вектор, в котором один элемент содержит 1, а все остальные элементы содержат 0), а не как целое число. в диапазоне ; в этой форме категориальное распределение эквивалентно полиномиальному распределению по одному испытанию.

Статистический вывод

Тесты эквивалентности полиномиальных для распределений

Целью проверки эквивалентности является установление соответствия между теоретическим полиномиальным распределением и наблюдаемыми частотами счета. Теоретическое распределение может быть полностью заданным полиномиальным распределением или параметрическим семейством полиномиальных распределений.

Позволять обозначим теоретическое полиномиальное распределение и пусть быть истинным базовым распределением. Распределения и считаются эквивалентными, если на расстояние и параметр допуска . Задача проверки эквивалентности против . Истинное базовое распределение неизвестно. Вместо этого частоты счета наблюдаются, где это размер выборки. В тесте эквивалентности используется отвергать . Если можно отвергнуть, тогда эквивалентность между и отображается на заданном уровне значимости. Критерий эквивалентности евклидова расстояния можно найти в учебнике Веллека (2010). [5] Тест эквивалентности для общего вариационного расстояния разработан Островским (2017). [6] Точный тест эквивалентности для конкретного совокупного расстояния предложен Фреем (2009). [7]

Расстояние между истинным базовым распределением и семейство полиномиальных распределений определяется . Тогда задача проверки эквивалентности имеет вид и . Расстояние обычно вычисляется с использованием численной оптимизации. Тесты для этого случая недавно разработаны Островским (2018). [8]

двух пропорций интервалы для разницы Доверительные

В условиях полиномиального распределения строя доверительные интервалы для разницы между долями наблюдений двух событий, , требует учета отрицательной ковариации между выборочными оценщиками и .

Некоторая литература по этому вопросу посвящена варианту использования двоичных данных с согласованными парами, что требует пристального внимания при переводе формул в общий случай для любого полиномиального распределения. Формулы в текущем разделе будут обобщены, а формулы в следующем разделе будут посвящены варианту использования двоичных данных совпадающих пар.

Стандартную ошибку Вальда (SE) разницы пропорций можно оценить с помощью: [9] : 378  [10]

Для Приблизительный доверительный интервал , погрешность может включать соответствующий квантиль стандартного нормального распределения , как показано ниже:

[Доказательство]

Модификация, включающая коррекцию непрерывности, добавляет с погрешностью следующим образом: [11] : 102–3 

Другая альтернатива — положиться на байесовскую оценку с использованием априорной оценки Джеффриса , что приводит к использованию распределения Дирихле со всеми параметрами, равными 0,5, в качестве априорной. Апостериорным будут расчеты сверху, но после добавления 1/2 к каждому из k элементов, что приведет к общему увеличению размера выборки на . Первоначально он был разработан для полиномиального распределения с четырьмя событиями и известен как wald+2 для анализа данных совпадающих пар (более подробную информацию см. в следующем разделе). [12]

Это приводит к следующему SE:

[Доказательство]

Которую можно просто подставить в исходную формулу Вальда следующим образом:

Возникновение и применение [ править ]

интервалы для разницы в двоичных данных совпадающих пар (с использованием мультинома с = ) k 4 Доверительные

Для случая двоичных данных совпадающих пар общей задачей является построение доверительного интервала разницы долей совпавших событий. Например, у нас может быть тест на какое-то заболевание, и мы можем захотеть проверить его результаты для некоторой группы населения в два момента времени (1 и 2), чтобы проверить, произошло ли изменение доли положительных результатов для болезнь за это время.

два на два Такие сценарии можно представить с помощью таблицы непредвиденных обстоятельств с указанием количества элементов, в которых произошла каждая комбинация событий. Мы можем использовать маленькое f для частоты дискретизации: и заглавная буква F для частот населения: . Эти четыре комбинации можно смоделировать как исходящие из полиномиального распределения (с четырьмя потенциальными исходами). Размеры выборки и совокупности могут быть n и N соответственно. И в таком случае есть интерес в построении доверительного интервала для разницы пропорций от предельных значений следующей (выборочной) таблицы непредвиденных обстоятельств:

Тест 2 положительный Тест 2 отрицательный Итого по строке
Тест 1 положительный
Тест 1 отрицательный
Итого по столбцу

В этом случае проверка разницы в предельных пропорциях означает, что мы заинтересованы в использовании следующих определений: , . И разница, для которой мы хотим построить доверительные интервалы, заключается в следующем:

Следовательно, доверительные интервалы для предельных положительных долей ( ) аналогично построению доверительного интервала для отличия долей от второстепенной диагонали таблицы сопряженности два на два ( ).

Вычисление значения p для такой разницы известно как тест Макнемара . Построение доверительного интервала вокруг него можно построить с помощью методов, описанных выше для Доверительных интервалов для разницы двух долей .

К этому параметру можно применить доверительные интервалы Вальда из предыдущего раздела, и в литературе они представлены в альтернативных обозначениях. В частности, часто представляемая SE основана на частотах таблицы непредвиденных обстоятельств, а не на пропорциях выборки. Например, доверительные интервалы Вальда, приведенные выше, можно записать как: [11] : 102–3 

Дальнейшие исследования в литературе выявили ряд недостатков как в методах Вальда, так и в методах Вальда с коррекцией непрерывности, а также были предложены для практического применения другие методы. [11]

Одна из таких модификаций включает «Wald+2» Агрести и Мина (похожий на некоторые другие их работы). [13] ), в котором каждая частота ячейки имела дополнительную добавил к этому. [12] Это приводит к доверительным интервалам Вальда+2 . В байесовской интерпретации это похоже на построение оценок, принимая в качестве априора распределение Дирихле со всеми параметрами, равными 0,5 (что, по сути, является априором Джеффриса ). +2 каждому в имени wald+2 теперь может означать, что в контексте таблицы сопряженности два на два, которая представляет собой полиномиальное распределение с четырьмя возможными событиями, тогда, поскольку мы добавляем 1/2 наблюдения к из них, то это означает общее добавление двух наблюдений (из-за предыдущего).

Это приводит к следующему модифицированному SE для случая данных совпадающих пар:

Которую можно просто подставить в исходную формулу Вальда следующим образом:

Другие модификации включают скорректированный Вальд Бонетта и Прайса и показатель Ньюкомба .

Вычислительные методы [ править ]

Генерация случайной переменной [ править ]

Сначала измените порядок параметров так, что они отсортированы в порядке убывания (это сделано только для ускорения вычислений и не является строго необходимым). Теперь для каждого испытания нарисуйте вспомогательную переменную X из равномерного (0, 1) распределения. Результирующим результатом является компонент

{ X j = 1, X k = 0 для k j } — это одно наблюдение полиномиального распределения с и n = 1. Сумма независимых повторений этого эксперимента представляет собой наблюдение из полиномиального распределения с n, равным числу таких повторений.

условных биномиальных выборок повторяющихся с использованием Выборка

Учитывая параметры и общее количество для выборки такой, что , можно последовательно выбирать число в произвольном состоянии , разделив пространство состояний на и не- , при условии, что предыдущие образцы были взяты повторно.

условная биномиальная выборка Последовательная Алгоритм :

S = n
rho = 1
for i in [1,k-1]:
    if rho != 0:
        X[i] ~ Binom(S,p[i]/rho)
    else X[i] = 0
    S = S - X[i]
    rho = rho - p[i]
X[k] = S

С эвристической точки зрения каждое применение биномиальной выборки уменьшает доступное число для выборки, а условные вероятности также обновляются для обеспечения логической согласованности. [14]

Программные реализации [ править ]

  • Пакет MultinomialCI R позволяет рассчитывать одновременные доверительные интервалы для вероятностей полиномиального распределения с учетом набора наблюдений. [15]

См. также [ править ]

Дальнейшее чтение [ править ]

  • Эванс, Мортон; Гастингс, Николас; Пикок, Брайан (2000). Статистические распределения (3-е изд.). Нью-Йорк: Уайли. стр. 134–136 . ISBN  0-471-37124-6 .
  • Вайсштейн, Эрик В. «Мультиномиальное распределение» . Математический мир . Вольфрам Исследования .

Ссылки [ править ]

  1. ^ «вероятность – выборка полиномиального распределения» . Крест проверен . Проверено 28 июля 2022 г.
  2. ^ Лукас, Орестис; Чунг, Хо Рюн (2023). «Тотальный эмпиризм: обучение на данных». arXiv : 2311.08315 [ math.ST ].
  3. ^ Лукас, Орестис; Чунг, Хо Рюн (апрель 2022 г.). «Категорические распределения максимальной энтропии при предельных ограничениях». arXiv : 2204.03406 .
  4. ^ Лукас, Орестис; Чунг, Хо Рюн (июнь 2022 г.). «Энтропийная характеристика ограничений моделирования». arXiv : 2206.14105 .
  5. ^ Веллек, Стефан (2010). Проверка статистических гипотез об эквивалентности и не меньшей эффективности . Чепмен и Холл/CRC. ISBN  978-1439808184 .
  6. ^ Островский, Владимир (май 2017 г.). «Проверка эквивалентности полиномиальных распределений». Статистика и вероятностные буквы . 124 : 77–82. дои : 10.1016/j.spl.2017.01.004 . S2CID   126293429 . Официальная ссылка (требуется подписка) . Альтернативная бесплатная веб-ссылка .
  7. ^ Фрей, Джесси (март 2009 г.). «Точный полиномиальный критерий эквивалентности». Канадский статистический журнал . 37 : 47–59. дои : 10.1002/cjs.10000 . S2CID   122486567 . Официальная ссылка (требуется подписка) .
  8. ^ Островский, Владимир (март 2018 г.). «Проверка эквивалентности семейств полиномиальных распределений с применением модели независимости». Статистика и вероятностные буквы . 139 : 61–66. дои : 10.1016/j.spl.2018.03.014 . S2CID   126261081 . Официальная ссылка (требуется подписка) . Альтернативная бесплатная веб-ссылка .
  9. ^ Фляйсс, Джозеф Л.; Левин, Брюс; Пайк, Мёнхи Чо (2003). Статистические методы определения ставок и пропорций (3-е изд.). Хобокен, Нью-Джерси: Дж. Уайли. п. 760. ИСБН  9780471526292 .
  10. ^ Ньюкомб, Р.Г. (1998). «Интервальная оценка разницы между независимыми пропорциями: сравнение одиннадцати методов». Статистика в медицине . 17 (8): 873–890. doi : 10.1002/(SICI)1097-0258(19980430)17:8<873::AID-SIM779>3.0.CO;2-I . ПМИД   9595617 .
  11. ^ Jump up to: Перейти обратно: а б с «Доверительные интервалы для разницы между двумя коррелирующими пропорциями» (PDF) . НЦСС . Проверено 22 марта 2022 г.
  12. ^ Jump up to: Перейти обратно: а б Агрести, Алан; Мин, Ёнъи (2005). «Простые улучшенные доверительные интервалы для сравнения совпадающих пропорций» (PDF) . Статистика в медицине . 24 (5): 729–740. дои : 10.1002/sim.1781 . ПМИД   15696504 .
  13. ^ Агрести, А.; Каффо, Б. (2000). «Простые и эффективные доверительные интервалы для пропорций и разницы пропорций получаются в результате сложения двух успехов и двух неудач». Американский статистик . 54 (4): 280–288. дои : 10.1080/00031305.2000.10474560 .
  14. ^ «11.5: Полиномиальное распределение» . Статистика LibreTexts . 05.05.2020 . Проверено 13 сентября 2023 г.
  15. ^ «MultinomialCI — доверительные интервалы для полиномиальных пропорций» . КРАН. 11 мая 2021 г. Проверено 23 марта 2024 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 9f94173be417701ded0cf4a2c4c2890f__1718438280
URL1:https://arc.ask3.ru/arc/aa/9f/0f/9f94173be417701ded0cf4a2c4c2890f.html
Заголовок, (Title) документа по адресу, URL1:
Multinomial distribution - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)