Совместное распределение вероятностей
Часть серии по статистике. |
Теория вероятностей |
---|
Учитывая две случайные величины , которые определены в одном и том же вероятностном пространстве , [1] совместное распределение вероятностей — это соответствующее распределение вероятностей для всех возможных пар выходных данных. Совместное распределение с тем же успехом можно рассматривать для любого заданного числа случайных величин. Совместное распределение кодирует маргинальные распределения , то есть распределения каждой из отдельных случайных величин и распределения условных вероятностей , которые имеют дело с тем, как распределяются выходные данные одной случайной величины, когда предоставляется информация о выходных данных другой случайной величины (ов). .
В формальной математической структуре теории меры совместное распределение задается мерой прямого действия , картой, полученной путем объединения в пары данных случайных величин, вероятностной меры выборочного пространства .
В случае вещественных случайных величин совместное распределение, как конкретное многомерное распределение, может быть выражено многомерной кумулятивной функцией распределения или многомерной функцией плотности вероятности вместе с многомерной функцией массы вероятности . В частном случае непрерывных случайных величин достаточно рассмотреть функции плотности вероятности, а в случае дискретных случайных величин достаточно рассмотреть функции массы вероятности.
Примеры
[ редактировать ]Рисует из урны
[ редактировать ]В каждой из двух урн содержится в два раза больше красных шаров, чем синих шаров, и никаких других, и из каждой урны случайным образом выбирается один шар, при этом два розыгрыша независимы друг от друга. Позволять и — дискретные случайные величины, связанные с результатами розыгрыша первой и второй урны соответственно. Вероятность вытащить красный шар из любой из урн равна 2/3, а вероятность вытащить синий шар – 1/3. Совместное распределение вероятностей представлено в следующей таблице:
А=красный | А=Синий | П(Б) | |
---|---|---|---|
Б=красный | (2/3)(2/3)=4/9 | (1/3)(2/3)=2/9 | 4/9+2/9=2/3 |
Б=Синий | (2/3)(1/3)=2/9 | (1/3)(1/3)=1/9 | 2/9+1/9=1/3 |
П(А) | 4/9+2/9=2/3 | 2/9+1/9=1/3 |
Каждая из четырех внутренних ячеек показывает вероятность определенной комбинации результатов двух розыгрышей; эти вероятности представляют собой совместное распределение. В любой ячейке вероятность появления определенной комбинации равна (поскольку розыгрыши независимы) произведению вероятности указанного результата для A и вероятности указанного результата для B. Сумма вероятностей в этих четырех ячейках равна 1, как и все распределения вероятностей.
Более того, последняя строка и последний столбец дают предельное распределение вероятностей для A и предельное распределение вероятностей для B соответственно. Например, для A первая из этих ячеек дает сумму вероятностей того, что A будет красным, независимо от того, какая вероятность B в столбце над ячейкой возникает, как 2/3. Таким образом, предельное распределение вероятностей для дает вероятности безоговорочно , на полях таблицы.
Подбрасывание монеты
[ редактировать ]Рассмотрим подбрасывание двух честных монет ; позволять и — дискретные случайные величины, связанные с результатами первого и второго подбрасывания монеты соответственно. Каждый подбрасывание монеты представляет собой испытание Бернулли и имеет распределение Бернулли . Если на монете изображен «орёл», то соответствующая случайная величина принимает значение 1, в противном случае — значение 0. Вероятность каждого из этих исходов равна 1/2, поэтому маргинальные (безусловные) функции плотности равны
Совместная функция массы вероятности и определяет вероятности для каждой пары исходов. Все возможные исходы
Поскольку каждый исход одинаково вероятен, совместная функция массы вероятности принимает вид
Поскольку подбрасывания монеты независимы, совместная функция массы вероятности представляет собой произведениеиз маргиналов:
Бросок кубика
[ редактировать ]Рассмотрите бросок игральной кости и позвольте если число четное (т. е. 2, 4 или 6) и в противном случае. Кроме того, пусть если число простое (т.е. 2, 3 или 5) и в противном случае.
1 | 2 | 3 | 4 | 5 | 6 | |
---|---|---|---|---|---|---|
А | 0 | 1 | 0 | 1 | 0 | 1 |
Б | 0 | 1 | 1 | 0 | 1 | 0 |
Затем совместное распределение и , выраженная как функция массы вероятности, равна
Сумма этих вероятностей обязательно равна 1, поскольку вероятность некоторой комбинации и происходит 1.
Маргинальное распределение вероятностей
[ редактировать ]Если в случайном эксперименте определено более одной случайной величины, важно различать совместное распределение вероятностей X и Y и распределение вероятностей каждой переменной в отдельности. Индивидуальное распределение вероятностей случайной величины называется ее предельным распределением вероятностей. В общем, предельное распределение вероятностей X можно определить из совместного распределения вероятностей X и других случайных величин.
Если совместная функция плотности вероятности случайной величины X и Y равна , предельная функция плотности вероятности X и Y, которая определяет предельное распределение , определяется как:
где первый интеграл рассчитан по всем точкам диапазона (X,Y), для которых X=x, а второй интеграл рассчитан по всем точкам диапазона (X,Y), для которых Y=y. [2]
Совместная кумулятивная функция распределения
[ редактировать ]Для пары случайных величин , совместная кумулятивная функция распределения (CDF) дается [3] : с. 89
( Уравнение 1 ) |
где правая часть представляет вероятность того, что случайная величина принимает значение меньше или равное и это принимает значение меньше или равное .
Для случайные величины , совместный CDF дается
( Уравнение 2 ) |
Интерпретация случайные величины как случайный вектор дает более короткое обозначение:
Функция плотности суставов или функция массы
[ редактировать ]Дискретный случай
[ редактировать ]Совместная массовая функция вероятности двух дискретных случайных величин является:
( Уравнение 3 ) |
или записано в терминах условных распределений
где это вероятность при условии .
Обобщением предыдущего случая с двумя переменными является совместное распределение вероятностей дискретные случайные величины что такое:
( Уравнение 4 ) |
или эквивалентно
- .
Это тождество известно как цепное правило вероятности .
Поскольку это вероятности, в случае двух переменных
который обобщает для дискретные случайные величины к
Непрерывный случай
[ редактировать ]Совместная функция плотности вероятности для двух непрерывных случайных величин определяется как производная совместной кумулятивной функции распределения (см. уравнение 1 ):
( Уравнение 5 ) |
Это равно:
где и являются условными распределениями данный и из данный соответственно, и и являются маргинальными распределениями для и соответственно.
Определение естественным образом распространяется на более чем две случайные величины:
( Уравнение 6 ) |
Опять же, поскольку это распределения вероятностей, имеем
соответственно
Смешанный случай
[ редактировать ]«Смешанная плотность соединений» может быть определена, когда одна или несколько случайных величин являются непрерывными, а другие случайные величины являются дискретными. С одной переменной каждого типа
Один из примеров ситуации, в которой может потребоваться найти кумулятивное распределение одной случайной величины, которая является непрерывной, и другой случайной величины, которая является дискретной, возникает, когда кто-то хочет использовать логистическую регрессию для прогнозирования вероятности бинарного результата Y при условии, что ценность непрерывно распределяемого результата . входные переменные При нахождении кумулятивного распределения этого двоичного результата необходимо использовать «смешанную» плотность суставов, поскольку изначально были определены таким образом, что нельзя было коллективно приписать им ни функцию плотности вероятности, ни функцию массы вероятности. Формально, — функция плотности вероятности относительно продукта на соответствующих опорах меры и . Любое из этих двух разложений затем можно использовать для восстановления совместной кумулятивной функции распределения:
Определение обобщается на смесь произвольных чисел дискретных и непрерывных случайных величин.
Дополнительные свойства
[ редактировать ]Совместное распределение независимых переменных
[ редактировать ]В общем две случайные величины и независимы тогда и только тогда , когда совместная кумулятивная функция распределения удовлетворяет
Две дискретные случайные величины и независимы тогда и только тогда, когда совместная функция массы вероятности удовлетворяет условию
для всех и .
По мере роста числа независимых случайных событий значение связанной с ними совместной вероятности быстро уменьшается до нуля по отрицательному экспоненциальному закону.
Аналогично, две абсолютно непрерывные случайные величины независимы тогда и только тогда, когда
для всех и . Это означает, что получение любой информации о значении одной или нескольких случайных величин приводит к условному распределению любой другой переменной, идентичному ее безусловному (предельному) распределению; таким образом, ни одна переменная не предоставляет никакой информации о любой другой переменной.
Совместное распределение условно зависимых переменных
[ редактировать ]Если подмножество переменных от условно зависит другого подмножества этих переменных, то функция массы вероятности совместного распределения равна . равно . Следовательно, его можно эффективно представить с помощью распределений вероятностей меньшей размерности. и . Такие отношения условной независимости могут быть представлены с помощью байесовской сети или функций копулы .
Когда в вероятностном пространстве определены две или более случайных величин, полезно описать, как они изменяются вместе; то есть полезно измерить взаимосвязь между переменными. Общей мерой связи между двумя случайными величинами является ковариация. Ковариация — это мера линейной связи между случайными величинами. Если взаимосвязь между случайными переменными нелинейна, ковариация может быть нечувствительна к взаимосвязи, а это означает, что она не связывает корреляцию между двумя переменными.
Ковариация между случайной величиной X и Y, обозначаемая как cov(X,Y), равна:
Существует еще одна мера связи между двумя случайными величинами, которую зачастую легче интерпретировать, чем ковариация.
Корреляция просто масштабирует ковариацию на произведение стандартного отклонения каждой переменной. Следовательно, корреляция представляет собой безразмерную величину, с помощью которой можно сравнивать линейные зависимости между парами переменных в разных единицах измерения. Если точки совместного распределения вероятностей X и Y, которые получают положительную вероятность, имеют тенденцию падать вдоль линии положительного (или отрицательного) наклона, ρ XY будет близок к +1 (или -1). Если ρ XY равно +1 или -1, можно показать, что точки совместного распределения вероятностей, получившие положительную вероятность, падают точно вдоль прямой линии. Говорят, что две случайные величины с ненулевой корреляцией коррелируют. Подобно ковариации, корреляция является мерой линейной связи между случайными величинами.
Корреляция между случайной величиной X и Y, обозначаемая как
Важные именованные дистрибутивы
[ редактировать ]Названные совместные распределения, которые часто возникают в статистике, включают многомерное нормальное распределение , многомерное стабильное распределение , полиномиальное распределение , отрицательное полиномиальное распределение , многомерное гипергеометрическое распределение и эллиптическое распределение .
См. также
[ редактировать ]- Байесовское программирование
- Дерево Чоу-Лю
- Условная вероятность
- Копула (теория вероятностей)
- Теорема о дезинтеграции
- Многомерная статистика
- Статистическая интерференция
- Попарно независимое распределение
Ссылки
[ редактировать ]- ^ Феллер, Уильям (1957). Введение в теорию вероятностей и ее приложения, том 1, 3-е издание . стр. 217–218. ISBN 978-0471257080 .
- ^ Монтгомери, Дуглас К. (19 ноября 2013 г.). Прикладная статистика и вероятность для инженеров . Рангер, Джордж К. (Шестое изд.). Хобокен, Нью-Джерси. ISBN 978-1-118-53971-2 . OCLC 861273897 .
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Пак, Кун Иль (2018). Основы теории вероятности и случайных процессов с приложениями к средствам связи . Спрингер. ISBN 978-3-319-68074-3 .
- ^ Монтгомери, Дуглас К. (19 ноября 2013 г.). Прикладная статистика и вероятность для инженеров . Рангер, Джордж К. (Шестое изд.). Хобокен, Нью-Джерси. ISBN 978-1-118-53971-2 . OCLC 861273897 .
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка )
Внешние ссылки
[ редактировать ]- «Совместное распространение» , Математическая энциклопедия , EMS Press , 2001 [1994]
- «Многомерное распределение» , Математическая энциклопедия , EMS Press , 2001 [1994]
- Современное введение в вероятность и статистику: понимание почему и как . Деккинг, Мишель (1946 г.р.). Лондон: Спрингер. 2005. ISBN 978-1-85233-896-1 . ОСЛК 262680588.
- «Совместная функция непрерывной плотности» . ПланетаМатематика .
- Mathworld: совместная функция распределения