Jump to content

Маргинальное распределение

(Перенаправлено с Маргинализации )

В теории вероятностей и статистике маргинальное распределение подмножества . набора величин случайных подмножестве — это распределение вероятностей переменных, содержащихся в Он дает вероятности различных значений переменных в подмножестве без ссылки на значения других переменных. Это контрастирует с условным распределением , которое дает вероятности, зависящие от значений других переменных.

Маргинальные переменные — это те переменные в подмножестве переменных, которые сохраняются. Эти понятия являются «маргинальными», поскольку их можно найти, суммируя значения таблицы по строкам или столбцам и записывая сумму на полях таблицы. [1] Распределение маргинальных переменных (маргинальное распределение) получается путем маргинализации (то есть сосредоточения внимания на суммах в маргиналах) над распределением отбрасываемых переменных, и говорят, что отброшенные переменные были маргинализированы .

Контекст здесь таков, что проводимые теоретические исследования или анализ данных включают более широкий набор случайных величин, но внимание ограничивается уменьшенным числом этих переменных. Во многих приложениях анализ может начинаться с заданного набора случайных величин, затем сначала расширять набор путем определения новых (например, суммы исходных случайных величин) и, наконец, уменьшать их число, обращая внимание на предельное распределение случайных величин. подмножество (например, сумма). Можно провести несколько различных анализов, каждый из которых рассматривает различное подмножество переменных как предельное распределение.

Определение

[ редактировать ]

Маргинальная функция массы вероятности

[ редактировать ]

При известном совместном распределении двух дискретных случайных величин , скажем, X и Y , предельное распределение любой переменной ( , X например ) представляет собой распределение вероятностей X , когда значения Y не принимаются во внимание. Это можно вычислить путем суммирования совместного распределения вероятностей по всем значениям Y . Естественно, верно и обратное: предельное распределение может быть получено для путем суммирования отдельных значений X. Y

, и
Х
И
х 1 х 2 х 3 х 4 п Y ( y ) ↓
у 1 4 / 32 2 / 32 1 / 32 1 / 32 8 / 32
у 2 3 / 32 6 / 32 3 / 32 3 / 32 15 / 32
yy3 9 / 32 0 0 0 9 / 32
п Икс ( Икс ) → 16 / 32 8 / 32 4 / 32 4 / 32 32 / 32
Совместное и маргинальное распределения пары дискретных случайных величин, X и Y , зависимы, таким образом, имея ненулевую взаимную информацию I ( X ; Y ) . Значения совместного распределения находятся в прямоугольнике 3×4; значения маргинальных распределений расположены вдоль правого и нижнего полей.

Предельную вероятность всегда можно записать как ожидаемое значение :

предельная вероятность X вычисляется путем изучения условной вероятности X при определенном значении Y и последующего усреднения этой условной вероятности по распределению всех значений Y. Интуитивно понятно, что

Это следует из определения ожидаемой ценности (после применения закона бессознательного статистика )

Следовательно, маргинализация обеспечивает правило преобразования распределения вероятностей случайной величины Y и другой случайной величины X = g ( Y ) :

Функция предельной плотности вероятности

[ редактировать ]

Учитывая две непрерывные случайные величины X и Y, которых совместное распределение известно, предельную функцию плотности вероятности можно получить путем интегрирования вероятностей совместного распределения f по Y, и наоборот. То есть

где , и .

Маргинальная кумулятивная функция распределения

[ редактировать ]

Найти предельную кумулятивную функцию распределения по совместной кумулятивной функции распределения легко. Напомним, что:

  • Для дискретных случайных величин
  • Для непрерывных случайных величин

Если X и Y совместно принимают значения на [ a , b ] × [ c , d ], то

и

Если d равно ∞, то это становится пределом . Аналогично для .

Маргинальное распределение против условного распределения

[ редактировать ]

Определение

[ редактировать ]

Предельная вероятность — это вероятность того, что одно событие произойдет независимо от других событий. Условная вероятность , с другой стороны, — это вероятность того, что событие произойдет при условии, что другое конкретное событие уже произошло. Это означает, что вычисление одной переменной зависит от другой переменной. [2]

Условное распределение переменной с учетом другой переменной представляет собой совместное распределение обеих переменных, разделенное на предельное распределение другой переменной. [3] То есть,

  • Для дискретных случайных величин
  • Для непрерывных случайных величин

Предположим, есть данные из класса из 200 учеников о количестве изученного времени ( X ) и проценте правильных ответов ( Y ). [4] Предполагая, что X и Y являются дискретными случайными величинами, совместное распределение X и Y можно описать, перечислив все возможные значения p ( x i , y j ), как показано в Таблице 3.

Х
И
Изученное время (минуты)
% правильный
х 1 (0-20) х 2 (21-40) х 3 (41-60) х 4 (>60) п Y ( y ) ↓
у 1 (0-20) 2 / 200 0 0 8 / 200 10 / 200
2 ) (21-40 10 / 200 2 / 200 8 / 200 0 20 / 200
y3 ) (41-59 2 / 200 4 / 200 32 / 200 32 / 200 70 / 200
y 4 (60-79) 0 20 / 200 30 / 200 10 / 200 60 / 200
у 5 (80-100) 0 4 / 200 16 / 200 20 / 200 40 / 200
п Икс ( Икс ) → 14 / 200 30 / 200 86 / 200 70 / 200 1
Двусторонняя таблица набора данных о взаимосвязи в классе из 200 учащихся между количеством изученного времени и процентом правильных ответов.

Маргинальное распределение можно использовать для определения количества студентов, набравших 20 или ниже: , что означает 10 студентов или 5%.

Условное распределение можно использовать для определения вероятности того, что учащийся, обучавшийся 60 минут или более, получит оценку 20 или ниже: Это означает, что вероятность набрать 20 баллов после изучения в течение как минимум 60 минут составляет около 11%.

Реальный пример

[ редактировать ]

Предположим, что необходимо вычислить вероятность того, что пешехода, переходящего дорогу по пешеходному переходу, не обращая внимания на сигнал светофора, собьет машина. Пусть H — дискретная случайная величина , принимающая одно значение из {Hit, Not Hit}. Пусть L (для светофора) — дискретная случайная величина, принимающая одно значение из {Красный, Желтый, Зеленый}.

На самом деле H будет зависеть от L. То есть P(H = Hit) будет принимать разные значения в зависимости от того, является ли L красным, желтым или зеленым (и аналогично для P(H = Not Hit)). Например, человек с гораздо большей вероятностью будет сбит машиной при попытке перейти дорогу, когда свет перпендикулярного движения горит зеленым, чем если бы он был красным. Другими словами, для любой данной возможной пары значений H и L необходимо рассмотреть совместное распределение вероятностей H и L, чтобы найти вероятность того, что эта пара событий произойдет вместе, если пешеход проигнорирует состояние светофора.

Однако при попытке вычислить предельную вероятность P(H = Hit) мы ищем вероятность того, что H = Hit в ситуации, в которой конкретное значение L неизвестно и в которой пешеход игнорирует состояние светофора. . В общем, пешехода можно сбить, если свет горит красным, ИЛИ если свет желтый, ИЛИ если свет зеленый. Итак, ответ на предельную вероятность можно найти путем суммирования P(H | L) для всех возможных значений L, при этом каждое значение L взвешивается по вероятности его появления.

Вот таблица, показывающая условные вероятности попадания в зависимости от состояния огней. (Обратите внимание, что сумма столбцов в этой таблице должна составлять 1, поскольку вероятность попадания или не попадания равна 1 независимо от состояния источника света.)

Условное распределение:
л
ЧАС
Красный Желтый Зеленый
Не попал 0.99 0.9 0.2
Ударять 0.01 0.1 0.8

Чтобы найти совместное распределение вероятностей, требуется больше данных. Например, предположим, что P(L = красный) = 0,2, P(L = желтый) = 0,1 и P(L = зеленый) = 0,7. Умножение каждого столбца в условном распределении на вероятность появления этого столбца приводит к совместному распределению вероятностей H и L, заданному в центральном блоке записей 2×3. (Обратите внимание, что сумма ячеек в этом блоке 2×3 равна 1).

Совместное распространение:
л
ЧАС
Красный Желтый Зеленый Предельная вероятность P( H )
Не попал 0.198 0.09 0.14 0.428
Ударять 0.002 0.01 0.56 0.572
Общий 0.2 0.1 0.7 1

Предельная вероятность P(H = Попадание) представляет собой сумму 0,572 по строке H = Попадание этой совместной таблицы распределения, поскольку это вероятность попадания, когда свет горит красным ИЛИ желтым ИЛИ зеленым. Аналогично, предельная вероятность того, что P(H = Not Hit) представляет собой сумму по строке H = Not Hit.

Многомерные распределения

[ редактировать ]
Многие выборки из двумерного нормального распределения. Предельные распределения показаны красным и синим цветом. Маргинальное распределение X также аппроксимируется путем создания гистограммы координат X без учета координат Y.

Для многомерных распределений применяются формулы, аналогичные приведенным выше, при этом символы X и/или Y интерпретируются как векторы. В частности, каждое суммирование или интегрирование будет осуществляться по всем переменным, кроме тех, которые содержатся X. в [5]

Это означает, что если X 1 , X 2 ,…, X n являются дискретными случайными величинами , то предельная функция массы вероятности должна быть равна если X 1 , X 2 ,…, X n являются непрерывными случайными величинами , то предельная функция плотности вероятности должна быть равна

См. также

[ редактировать ]
  1. ^ Трамплер, Роберт Дж. и Гарольд Ф. Уивер (1962). Статистическая астрономия . Дуврские публикации. стр. 32–33.
  2. ^ «Предельные и условные распределения вероятностей: определение и примеры» . Study.com . Проверено 16 ноября 2019 г.
  3. ^ «Экзамен P [Математика бывшего Советского Союза]» . www.math.fsu.edu . Проверено 16 ноября 2019 г.
  4. ^ Маргинальные и условные распределения , данные получены 16 ноября 2019 г.
  5. ^ Современное введение в вероятность и статистику: понимание почему и как . Деккинг, Мишель (1946 г.р.). Лондон: Спрингер. 2005. ISBN  9781852338961 . OCLC   262680588 . {{cite book}}: CS1 maint: другие ( ссылка )

Библиография

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a27f9670bc728c6b0c40792c39d1d5c1__1698688500
URL1:https://arc.ask3.ru/arc/aa/a2/c1/a27f9670bc728c6b0c40792c39d1d5c1.html
Заголовок, (Title) документа по адресу, URL1:
Marginal distribution - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)