Полиномиальное распределение
В теории вероятностей полиномиальное распределение является обобщением биномиального распределения . Например, он моделирует вероятность выпадения очков для каждой стороны k -сторонней игральной кости, брошенной n раз. Для n независимых испытаний, каждое из которых приводит к успеху ровно одной из k категорий, причем каждая категория имеет заданную фиксированную вероятность успеха, полиномиальное распределение дает вероятность любой конкретной комбинации чисел успехов для различных категорий.
Когда k равно 2, а n равно 1, полиномиальное распределение является распределением Бернулли . Когда k равно 2, а n больше 1, это биномиальное распределение . Когда k больше 2 и n равно 1, это категориальное распределение . Термин «мультинолли» иногда используется для категориального распределения, чтобы подчеркнуть эту четырехстороннюю связь (так n определяет суффикс, а k - префикс).
Распределение Бернулли моделирует результат одного испытания Бернулли . Другими словами, он моделирует, приведет ли однократное подбрасывание монеты (возможно, необъективной ) к успеху (получение орла) или неудаче (получение решки). Биномиальное распределение обобщает это на количество решек в результате выполнения n независимых подбрасываний (испытаний Бернулли) одной и той же монеты. Полиномиальное распределение моделирует результат n экспериментов, где результат каждого испытания имеет категориальное распределение , например, бросок k -сторонней игральной кости n раз.
Пусть k — фиксированное конечное число. Математически у нас есть k возможных взаимоисключающих результатов с соответствующими вероятностями p 1 , ..., p k и n независимых испытаний. Поскольку k исходов являются взаимоисключающими и один из них должен произойти, мы имеем p i ≥ 0 для i = 1, ..., k и . Тогда, если случайные величины X i указывают, сколько раз результат номер i наблюдался в n испытаниях, вектор X = ( X 1 , ..., X k ) следует полиномиальному распределению с параметрами n и p , где p = ( п 1 , ..., п к ). Хотя испытания независимы, их результаты X i зависимы, поскольку их необходимо просуммировать до n.
Параметры |
количество испытаний ( целое число ) | ||
---|---|---|---|
Поддерживать | |||
ПМФ | |||
Иметь в виду | |||
Дисперсия |
| ||
Энтропия | |||
МГФ | |||
CF | где | ||
ПГФ |
Определения [ править ]
Функция массы вероятности [ править ]
Предположим, кто-то проводит эксперимент по извлечению n шаров k из мешка разных цветов, заменяя извлеченные шары после каждого розыгрыша. Шары одного цвета эквивалентны. Обозначим переменную, которая представляет собой количество извлеченных шаров цвета i ( i = 1, ..., k ), как X i , и обозначим как p i вероятность того, что данное извлечение будет цвета i . Функция массы вероятности этого полиномиального распределения:
для неотрицательных целых чисел x 1 , ..., x k .
Массовую функцию вероятности можно выразить с помощью гамма-функции как:
Эта форма показывает свое сходство с распределением Дирихле , которое является его сопряженным априором .
Пример [ править ]
Предположим, что на трехсторонних выборах в большой стране кандидат А получил 20% голосов, кандидат Б — 30% голосов, а кандидат С — 50% голосов. Если шесть избирателей выбраны случайным образом, какова вероятность того, что в выборке окажется ровно один сторонник кандидата А, два сторонника кандидата В и три сторонника кандидата С?
Примечание. Поскольку мы предполагаем, что голосующее население велико, разумно и допустимо считать вероятности неизменными после того, как избиратель выбран для выборки. Технически говоря, это выборка без замещения, поэтому правильным распределением является многомерное гипергеометрическое распределение , но распределения сходятся по мере увеличения генеральной совокупности по сравнению с фиксированным размером выборки. [1] .
Свойства [ править ]
Нормализация [ править ]
Полиномиальное распределение нормируется согласно:
где сумма ведется по всем перестановкам такой, что .
и дисперсия Ожидаемое значение
Ожидаемое количество раз , когда результат i наблюдался в n испытаниях, равно
Ковариационная матрица выглядит следующим образом. Каждый диагональный элемент представляет собой дисперсию биномиально распределенной случайной величины и, следовательно,
Внедиагональные записи представляют собой ковариации :
для i , j различны.
Все ковариации отрицательны, поскольку при фиксированном n увеличение одного компонента полиномиального вектора требует уменьшения другого компонента.
Когда эти выражения объединяются в матрицу с i, j элементами результатом является размера k × k положительно-полуопределенная ковариационная матрица ранга k - 1. В особом случае, когда k = n и все числа p i равны, ковариационная матрица является центрирующей матрицей .
Элементы соответствующей корреляционной матрицы :
Обратите внимание, что количество испытаний n не входит в это выражение.
Каждая из k компонент в отдельности имеет биномиальное распределение с параметрами n и pi для соответствующего значения индекса i .
Носителем полиномиального распределения является множество
Число его элементов равно
Матричное обозначение [ править ]
В матричной записи
и
с п Т = вектор-строка, транспонированная вектор-столбцом p .
Визуализация [ править ]
Как срезы обобщенного треугольника Паскаля
Точно так же, как можно интерпретировать биномиальное распределение как (нормализованные) одномерные (1D) срезы треугольника Паскаля , так же можно интерпретировать полиномиальное распределение как 2D (треугольные) срезы пирамиды Паскаля или 3D/4D/+ (пирамидальные) образные) срезы многомерных аналогов треугольника Паскаля. Это открывает интерпретацию диапазона распределения : дискретизированные равносторонние «пирамиды» в произвольном измерении, то есть симплекс с сеткой. [ нужна ссылка ]
Как полиномиальные коэффициенты
Точно так же, как можно интерпретировать биномиальное распределение как полиномиальные коэффициенты в расширенном виде можно интерпретировать полиномиальное распределение как коэффициенты при расширении, отметив, что сумма только коэффициентов должна составлять 1.
Теория больших отклонений [ править ]
Асимптотика [ править ]
По формуле Стирлинга на пределе , у нас есть
Эту формулу можно интерпретировать следующим образом.
Учитывать , пространство всех возможных распределений по категориям . Это симплекс . После независимые выборки из категориального распределения (именно так мы строим полиномиальное распределение), мы получаем эмпирическое распределение .
По асимптотической формуле вероятность того, что эмпирическое распределение отклоняется от фактического распределения затухает экспоненциально со скоростью . Чем больше экспериментов и тем больше разнообразия из , тем меньше вероятность увидеть такое эмпирическое распределение.
Если является закрытым подмножеством , затем разделив на куски, и рассуждая о темпах роста на каждом кусочке , получаем теорему Санова , которая утверждает, что
Концентрация в целом n [ править ]
Из-за экспоненциального затухания в целом , почти вся вероятностная масса сосредоточена в небольшой окрестности . В этой небольшой окрестности мы можем взять первый ненулевой член в разложении Тейлора , чтобы получить
Теорема. На предел, сходится по распределению к распределению хи-квадрат .
Условная концентрация в больших n [ править ]
Вышеописанное явление концентрации можно легко обобщить на случай, когда мы ставим условия на линейные ограничения. Это теоретическое обоснование критерия хи-квадрат Пирсона .
Теорема. Указанные частоты наблюдается в наборе данных с баллы, мы налагаем независимые линейные ограничения
Вдали от эмпирически наблюдаемых ограничений (например, моменты или превалентности) теорему можно обобщить:
Теорема.
- Данные функции , такие, что они непрерывно дифференцируемы в окрестности , а векторы линейно независимы;
- заданные последовательности , такой, что асимптотически для каждого ;
- тогда для полиномиального распределения, обусловленного ограничениями , у нас есть количество сходящиеся в распределении к в предел.
В случае, если все равны, теорема сводится к концентрации энтропии вокруг максимальной энтропии. [3] [4]
Связанные дистрибутивы [ править ]
В некоторых областях, таких как обработка естественного языка , категориальные и полиномиальные распределения являются синонимами, и обычно говорят о полиномиальном распределении, когда на самом деле имеется в виду категориальное распределение . Это связано с тем, что иногда удобно выразить результат категориального распределения как вектор «1 из k» (вектор, в котором один элемент содержит 1, а все остальные элементы содержат 0), а не как целое число. в диапазоне ; в этой форме категориальное распределение эквивалентно полиномиальному распределению по одному испытанию.
- Когда k = 2, полиномиальное распределение является биномиальным распределением .
- Категориальное распределение , распределение каждого испытания; для k = 2 это распределение Бернулли .
- Распределение Дирихле является априорным выражением многочлена в байесовской статистике .
- Дирихле-мультиномиальное распределение .
- Бета-биномиальное распределение .
- Отрицательное полиномиальное распределение
- Принцип Харди – Вайнберга (триномиальное распределение с вероятностями )
Статистический вывод
Этот раздел нуждается в дополнении: Новый подраздел об одновременных доверительных интервалах (с соответствующими ссылками, например: [1] ). Вы можете помочь, добавив в него . ( март 2024 г. ) |
Тесты эквивалентности полиномиальных для распределений
Целью проверки эквивалентности является установление соответствия между теоретическим полиномиальным распределением и наблюдаемыми частотами счета. Теоретическое распределение может быть полностью заданным полиномиальным распределением или параметрическим семейством полиномиальных распределений.
Позволять обозначим теоретическое полиномиальное распределение и пусть быть истинным базовым распределением. Распределения и считаются эквивалентными, если на расстояние и параметр допуска . Задача проверки эквивалентности против . Истинное базовое распределение неизвестно. Вместо этого частоты счета наблюдаются, где это размер выборки. В тесте эквивалентности используется отвергать . Если можно отвергнуть, тогда эквивалентность между и отображается на заданном уровне значимости. Критерий эквивалентности евклидова расстояния можно найти в учебнике Веллека (2010). [5] Тест эквивалентности для общего вариационного расстояния разработан Островским (2017). [6] Точный тест эквивалентности для конкретного совокупного расстояния предложен Фреем (2009). [7]
Расстояние между истинным базовым распределением и семейство полиномиальных распределений определяется . Тогда задача проверки эквивалентности имеет вид и . Расстояние обычно вычисляется с использованием численной оптимизации. Тесты для этого случая недавно разработаны Островским (2018). [8]
двух пропорций интервалы для разницы Доверительные
В условиях полиномиального распределения строя доверительные интервалы для разницы между долями наблюдений двух событий, , требует учета отрицательной ковариации между выборочными оценщиками и .
Некоторая литература по этому вопросу посвящена варианту использования двоичных данных с согласованными парами, что требует пристального внимания при переводе формул в общий случай для любого полиномиального распределения. Формулы в текущем разделе будут обобщены, а формулы в следующем разделе будут посвящены варианту использования двоичных данных совпадающих пар.
Стандартную ошибку Вальда (SE) разницы пропорций можно оценить с помощью: [9] : 378 [10]
Для Приблизительный доверительный интервал , погрешность может включать соответствующий квантиль стандартного нормального распределения , как показано ниже:
Модификация, включающая коррекцию непрерывности, добавляет с погрешностью следующим образом: [11] : 102–3
Другая альтернатива — положиться на байесовскую оценку с использованием априорной оценки Джеффриса , что приводит к использованию распределения Дирихле со всеми параметрами, равными 0,5, в качестве априорной. Апостериорным будут расчеты сверху, но после добавления 1/2 к каждому из k элементов, что приведет к общему увеличению размера выборки на . Первоначально он был разработан для полиномиального распределения с четырьмя событиями и известен как wald+2 для анализа данных совпадающих пар (более подробную информацию см. в следующем разделе). [12]
Это приводит к следующему SE:
Которую можно просто подставить в исходную формулу Вальда следующим образом:
Возникновение и применение [ править ]
интервалы для разницы в двоичных данных совпадающих пар (с использованием мультинома с = ) k 4 Доверительные
Для случая двоичных данных совпадающих пар общей задачей является построение доверительного интервала разницы долей совпавших событий. Например, у нас может быть тест на какое-то заболевание, и мы можем захотеть проверить его результаты для некоторой группы населения в два момента времени (1 и 2), чтобы проверить, произошло ли изменение доли положительных результатов для болезнь за это время.
два на два Такие сценарии можно представить с помощью таблицы непредвиденных обстоятельств с указанием количества элементов, в которых произошла каждая комбинация событий. Мы можем использовать маленькое f для частоты дискретизации: и заглавная буква F для частот населения: . Эти четыре комбинации можно смоделировать как исходящие из полиномиального распределения (с четырьмя потенциальными исходами). Размеры выборки и совокупности могут быть n и N соответственно. И в таком случае есть интерес в построении доверительного интервала для разницы пропорций от предельных значений следующей (выборочной) таблицы непредвиденных обстоятельств:
Тест 2 положительный | Тест 2 отрицательный | Итого по строке | |
Тест 1 положительный | |||
Тест 1 отрицательный | |||
Итого по столбцу |
В этом случае проверка разницы в предельных пропорциях означает, что мы заинтересованы в использовании следующих определений: , . И разница, для которой мы хотим построить доверительные интервалы, заключается в следующем:
Следовательно, доверительные интервалы для предельных положительных долей ( ) аналогично построению доверительного интервала для отличия долей от второстепенной диагонали таблицы сопряженности два на два ( ).
Вычисление значения p для такой разницы известно как тест Макнемара . Построение доверительного интервала вокруг него можно построить с помощью методов, описанных выше для Доверительных интервалов для разницы двух долей .
К этому параметру можно применить доверительные интервалы Вальда из предыдущего раздела, и в литературе они представлены в альтернативных обозначениях. В частности, часто представляемая SE основана на частотах таблицы непредвиденных обстоятельств, а не на пропорциях выборки. Например, доверительные интервалы Вальда, приведенные выше, можно записать как: [11] : 102–3
Дальнейшие исследования в литературе выявили ряд недостатков как в методах Вальда, так и в методах Вальда с коррекцией непрерывности, а также были предложены для практического применения другие методы. [11]
Одна из таких модификаций включает «Wald+2» Агрести и Мина (похожий на некоторые другие их работы). [13] ), в котором каждая частота ячейки имела дополнительную добавил к этому. [12] Это приводит к доверительным интервалам Вальда+2 . В байесовской интерпретации это похоже на построение оценок, принимая в качестве априора распределение Дирихле со всеми параметрами, равными 0,5 (что, по сути, является априором Джеффриса ). +2 каждому в имени wald+2 теперь может означать, что в контексте таблицы сопряженности два на два, которая представляет собой полиномиальное распределение с четырьмя возможными событиями, тогда, поскольку мы добавляем 1/2 наблюдения к из них, то это означает общее добавление двух наблюдений (из-за предыдущего).
Это приводит к следующему модифицированному SE для случая данных совпадающих пар:
Которую можно просто подставить в исходную формулу Вальда следующим образом:
Другие модификации включают скорректированный Вальд Бонетта и Прайса и показатель Ньюкомба .
Вычислительные методы [ править ]
Генерация случайной переменной [ править ]
Сначала измените порядок параметров так, что они отсортированы в порядке убывания (это сделано только для ускорения вычислений и не является строго необходимым). Теперь для каждого испытания нарисуйте вспомогательную переменную X из равномерного (0, 1) распределения. Результирующим результатом является компонент
{ X j = 1, X k = 0 для k ≠ j } — это одно наблюдение полиномиального распределения с и n = 1. Сумма независимых повторений этого эксперимента представляет собой наблюдение из полиномиального распределения с n, равным числу таких повторений.
условных биномиальных выборок повторяющихся с использованием Выборка
Учитывая параметры и общее количество для выборки такой, что , можно последовательно выбирать число в произвольном состоянии , разделив пространство состояний на и не- , при условии, что предыдущие образцы были взяты повторно.
условная биномиальная выборка Последовательная Алгоритм :
S = n
rho = 1
for i in [1,k-1]:
if rho != 0:
X[i] ~ Binom(S,p[i]/rho)
else X[i] = 0
S = S - X[i]
rho = rho - p[i]
X[k] = S
С эвристической точки зрения каждое применение биномиальной выборки уменьшает доступное число для выборки, а условные вероятности также обновляются для обеспечения логической согласованности. [14]
Программные реализации [ править ]
- Пакет MultinomialCI R позволяет рассчитывать одновременные доверительные интервалы для вероятностей полиномиального распределения с учетом набора наблюдений. [15]
См. также [ править ]
Дальнейшее чтение [ править ]
- Эванс, Мортон; Гастингс, Николас; Пикок, Брайан (2000). Статистические распределения (3-е изд.). Нью-Йорк: Уайли. стр. 134–136 . ISBN 0-471-37124-6 .
- Вайсштейн, Эрик В. «Мультиномиальное распределение» . Математический мир . Вольфрам Исследования .
Ссылки [ править ]
- ^ «вероятность – выборка полиномиального распределения» . Крест проверен . Проверено 28 июля 2022 г.
- ^ Лукас, Орестис; Чунг, Хо Рюн (2023). «Тотальный эмпиризм: обучение на данных». arXiv : 2311.08315 [ math.ST ].
- ^ Лукас, Орестис; Чунг, Хо Рюн (апрель 2022 г.). «Категорические распределения максимальной энтропии при предельных ограничениях». arXiv : 2204.03406 .
- ^ Лукас, Орестис; Чунг, Хо Рюн (июнь 2022 г.). «Энтропийная характеристика ограничений моделирования». arXiv : 2206.14105 .
- ^ Веллек, Стефан (2010). Проверка статистических гипотез об эквивалентности и не меньшей эффективности . Чепмен и Холл/CRC. ISBN 978-1439808184 .
- ^ Островский, Владимир (май 2017 г.). «Проверка эквивалентности полиномиальных распределений». Статистика и вероятностные буквы . 124 : 77–82. дои : 10.1016/j.spl.2017.01.004 . S2CID 126293429 . Официальная ссылка (требуется подписка) . Альтернативная бесплатная веб-ссылка .
- ^ Фрей, Джесси (март 2009 г.). «Точный полиномиальный критерий эквивалентности». Канадский статистический журнал . 37 : 47–59. дои : 10.1002/cjs.10000 . S2CID 122486567 . Официальная ссылка (требуется подписка) .
- ^ Островский, Владимир (март 2018 г.). «Проверка эквивалентности семейств полиномиальных распределений с применением модели независимости». Статистика и вероятностные буквы . 139 : 61–66. дои : 10.1016/j.spl.2018.03.014 . S2CID 126261081 . Официальная ссылка (требуется подписка) . Альтернативная бесплатная веб-ссылка .
- ^ Фляйсс, Джозеф Л.; Левин, Брюс; Пайк, Мёнхи Чо (2003). Статистические методы определения ставок и пропорций (3-е изд.). Хобокен, Нью-Джерси: Дж. Уайли. п. 760. ИСБН 9780471526292 .
- ^ Ньюкомб, Р.Г. (1998). «Интервальная оценка разницы между независимыми пропорциями: сравнение одиннадцати методов». Статистика в медицине . 17 (8): 873–890. doi : 10.1002/(SICI)1097-0258(19980430)17:8<873::AID-SIM779>3.0.CO;2-I . ПМИД 9595617 .
- ^ Jump up to: Перейти обратно: а б с «Доверительные интервалы для разницы между двумя коррелирующими пропорциями» (PDF) . НЦСС . Проверено 22 марта 2022 г.
- ^ Jump up to: Перейти обратно: а б Агрести, Алан; Мин, Ёнъи (2005). «Простые улучшенные доверительные интервалы для сравнения совпадающих пропорций» (PDF) . Статистика в медицине . 24 (5): 729–740. дои : 10.1002/sim.1781 . ПМИД 15696504 .
- ^ Агрести, А.; Каффо, Б. (2000). «Простые и эффективные доверительные интервалы для пропорций и разницы пропорций получаются в результате сложения двух успехов и двух неудач». Американский статистик . 54 (4): 280–288. дои : 10.1080/00031305.2000.10474560 .
- ^ «11.5: Полиномиальное распределение» . Статистика LibreTexts . 05.05.2020 . Проверено 13 сентября 2023 г.
- ^ «MultinomialCI — доверительные интервалы для полиномиальных пропорций» . КРАН. 11 мая 2021 г. Проверено 23 марта 2024 г.