Случайная переменная

Из Википедии, бесплатной энциклопедии

Случайная величина (также называемая случайной величиной , алеаторной переменной или стохастической переменной ) — это математическая формализация величины или объекта, которая зависит от случайных событий. [1] Термин «случайная величина» в своем математическом определении не относится ни к случайности, ни к изменчивости. [2] но вместо этого представляет собой математическую функцию , в которой

  • домен (например , — это набор возможных результатов в пространстве выборки набор каковы возможные верхние стороны перевернутой монеты или решка в результате подбрасывания монеты); и
  • диапазон набором представляет собой измеримое пространство (например, соответствующий домену, указанному выше, диапазон может быть если скажешь орел отображается в -1 и отображается в 1). Обычно диапазон случайной величины представляет собой набор действительных чисел .
Этот график показывает, как случайная величина является функцией от всех возможных результатов до реальных значений. Он также показывает, как случайная величина используется для определения функций вероятностной массы.

Неофициально случайность обычно представляет собой некий фундаментальный элемент случайности, например, при броске игральной кости ; это также может отражать неопределенность, например, ошибку измерения . [1] Однако интерпретация вероятности сложна с философской точки зрения и даже в конкретных случаях не всегда однозначна. Чисто математический анализ случайных величин не зависит от подобных трудностей интерпретации и может основываться на строгой аксиоматической установке.

На формальном математическом языке теории меры случайная величина определяется как измеримая функция из пространства вероятностной меры (называемого выборочным пространством ) в измеримое пространство . Это позволяет рассмотреть меру прямого действия , которая называется распределением случайной величины; Таким образом, распределение является вероятностной мерой на множестве всех возможных значений случайной величины. Две случайные величины могут иметь одинаковое распределение, но существенно различаться; например, они могут быть независимыми .

Обычно рассматривают частные случаи дискретных случайных величин и абсолютно непрерывных случайных величин , соответствующие тому, оценивается ли случайная величина в счетном подмножестве или в интервале действительных чисел . Есть и другие важные возможности, особенно в теории случайных процессов , где естественно рассматривать случайные последовательности или случайные функции . Иногда считается, что случайная величина автоматически оценивается в действительных числах, а более общие случайные величины вместо этого называются случайными элементами .

По словам Джорджа Макки , Пафнутий Чебышев был первым человеком, который «систематически мыслил в терминах случайных величин». [3]

Определение [ править ]

величина Случайная это измеримая функция из выборочного пространства как набор возможных результатов в измеримом пространстве . Техническое аксиоматическое определение требует пространства выборки. быть выборочным пространством тройки вероятностей (см. теоретико-мерное определение ). Случайную величину часто обозначают заглавными латинскими буквами , например: . [4]

Вероятность того, что принимает значение в измеримом множестве написано как

.

Стандартный случай [ править ]

Во многих случаях, имеет действительное значение , т.е. . В некоторых контекстах термин случайный элемент (см. расширения ) используется для обозначения случайной величины не этой формы.

Когда изображение (или диапазон) конечно или бесконечно счетна , случайная величина называется дискретной случайной величиной. [5] : 399  и его распределение является дискретным распределением вероятностей , т.е. может быть описано функцией массы вероятности , которая присваивает вероятность каждому значению в изображении . Если изображение несчетно бесконечно (обычно интервал ), то называется непрерывной случайной величиной . [6] [7] В особом случае, когда он абсолютно непрерывен , его распределение может быть описано функцией плотности вероятности , которая присваивает вероятности интервалам; в частности, каждая отдельная точка обязательно должна иметь нулевую вероятность абсолютно непрерывной случайной величины. Не все непрерывные случайные величины абсолютно непрерывны. [8]

Любую случайную величину можно описать ее кумулятивной функцией распределения , которая описывает вероятность того, что случайная величина будет меньше или равна определенному значению.

Расширения [ править ]

Термин «случайная величина» в статистике традиционно ограничивается случаем с действительным значением ( ). В этом случае структура действительных чисел позволяет определить такие величины, как ожидаемое значение и дисперсия случайной величины, ее кумулятивную функцию распределения и моменты ее распределения.

Однако приведенное выше определение справедливо для любого измеримого пространства. ценностей. Таким образом, можно рассматривать случайные элементы других множеств. , такие как случайные логические значения , категориальные значения , комплексные числа , векторы , матрицы , последовательности , деревья , множества , формы , многообразия и функции . Тогда можно конкретно обратиться к случайной величине типа или -значная случайная величина .

Эта более общая концепция случайного элемента особенно полезна в таких дисциплинах, как теория графов , машинное обучение , обработка естественного языка и других областях дискретной математики и информатики , где часто интересуются моделированием случайных изменений нечисловых данных. структуры . Тем не менее в некоторых случаях удобно представить каждый элемент , используя одно или несколько действительных чисел. В этом случае случайный элемент может быть представлен как вектор действительных случайных величин (все они определены в одном и том же базовом вероятностном пространстве). , что позволяет различным случайным величинам ковариироваться ). Например:

  • Случайное слово может быть представлено как случайное целое число, которое служит индексом словаря возможных слов. В качестве альтернативы его можно представить как случайный вектор-индикатор, длина которого равна размеру словаря, где единственными значениями положительной вероятности являются , , а позиция 1 указывает на слово.
  • Случайное предложение заданной длины можно представить в виде вектора случайные слова.
  • график Случайный на данные вершины могут быть представлены в виде матрица случайных величин, значения которой задают матрицу смежности случайного графа.
  • функция Случайная можно представить как набор случайных величин , давая значения функции в различных точках в области определения функции. являются обычными вещественными случайными величинами при условии, что функция имеет действительное значение. Например, случайный процесс — это случайная функция времени, случайный вектор — это случайная функция некоторого набора индексов, такого как , а случайное поле — это случайная функция на любом наборе (обычно времени, пространстве или дискретном наборе).

Функции распределения [ править ]

Если случайная величина определенное в вероятностном пространстве задано, мы можем задать вопросы типа: «Насколько вероятно, что значение равна 2?". Это то же самое, что и вероятность события который часто пишут как или для краткости.

Запись всех этих вероятностей выходных значений случайной величины дает распределение вероятностей . Распределение вероятностей «забывает» о конкретном вероятностном пространстве, используемом для определения и записывает только вероятности различных выходных значений . Такое распределение вероятностей, если имеет действительное значение, всегда может быть отражено с помощью его кумулятивной функции распределения

а иногда также используя функцию плотности вероятности , . В терминах теории меры мы используем случайную величину «продвинуть» меру на в меру на . Мера называется «распределением (вероятностей) или «закон ". [9] Плотность , Радона–Никодима производная относительно некоторой эталонной меры на (часто этой эталонной мерой является мера Лебега в случае непрерывных случайных величин или считающая мера в случае дискретных случайных величин). Базовое вероятностное пространство Это техническое устройство, используемое для обеспечения существования случайных величин, иногда для их построения, а также для определения таких понятий, как корреляция, зависимость или независимость , основанных на совместном распределении двух или более случайных величин в одном и том же вероятностном пространстве. На практике часто приходится распоряжаться пространством в целом и просто устанавливает меру который присваивает меру 1 всей вещественной линии, т. е. работает с распределениями вероятностей вместо случайных величин. См. статью о квантильных функциях для более полного изучения.

Примеры [ править ]

Дискретная случайная величина [ править ]

Рассмотрим эксперимент, в котором наугад выбирают человека. Примером случайной величины может быть рост человека. Математически случайная величина интерпретируется как функция, которая сопоставляет человека с его ростом. Со случайной величиной связано распределение вероятностей, которое позволяет вычислить вероятность того, что рост находится в любом подмножестве возможных значений, например вероятность того, что рост находится в диапазоне от 180 до 190 см, или вероятность того, что рост либо меньше более 150 или более 200 см.

Другой случайной величиной может быть количество детей у человека; это дискретная случайная величина с неотрицательными целочисленными значениями. Он позволяет вычислять вероятности для отдельных целочисленных значений (функцию массы вероятности (PMF)) или для наборов значений, включая бесконечные наборы. Например, интересующим событием может быть «четное количество детей». Как для конечных, так и для бесконечных наборов событий их вероятности можно найти путем сложения PMF элементов; то есть вероятность четного числа детей равна бесконечной сумме .

В таких примерах пространство выборки часто подавляется, поскольку его математически трудно описать, а возможные значения случайных величин затем рассматриваются как пространство выборки. Но когда две случайные величины измеряются в одном и том же выборочном пространстве результатов, например, рост и количество детей рассчитываются для одних и тех же случайных людей, их взаимосвязь легче проследить, если признать, что и рост, и количество детей зависят от от одного и того же случайного человека, например, чтобы можно было задать вопросы о том, коррелируют ли такие случайные величины или нет.

Если являются счетными множествами действительных чисел, и , затем — дискретная функция распределения. Здесь для , для . Взяв, к примеру, перечисление всех рациональных чисел как , получается дискретная функция, которая не обязательно является ступенчатой ​​(кусочно-постоянной).

Подбрасывание монеты [ править ]

Возможные результаты одного подбрасывания монеты можно описать пространством выборки . Мы можем ввести вещественную случайную величину который моделирует выплату в 1 доллар за успешную ставку на орла следующим образом:

Если монета честная , Y имеет функцию массы вероятности. предоставлено:

Бросок кубиков [ править ]

Если выборочное пространство представляет собой набор возможных чисел, выброшенных на две игральные кости, а интересующая случайная величина представляет собой сумму S чисел на двух игральных костях, то S представляет собой дискретную случайную величину, распределение которой описывается функцией массы вероятности построенной . как высота столбцов изображений здесь.

Случайную величину также можно использовать для описания процесса броска игральной кости и возможных результатов. Наиболее очевидным представлением для случая двух игральных костей является выборка пар чисел n 1 и n 2 из {1, 2, 3, 4, 5, 6} (представляющих числа на двух игральных костях) в качестве выборки. космос. Общее число выпавших чисел (сумма чисел в каждой паре) тогда является случайной величиной X , заданной функцией, которая отображает пару в сумму:

и (если игральные кости честные ) имеет функцию вероятностной массы f X , определяемую следующим образом:

Непрерывная случайная величина [ править ]

Формально непрерывная случайная величина — это случайная величина, функция распределения которой непрерывна кумулятивная всюду. [10] Не существует « пробелов которых ограничена », которые соответствовали бы числам, вероятность появления . Вместо этого непрерывные случайные величины почти никогда не принимают точное заданное значение c (формально ), но существует положительная вероятность того, что его значение будет лежать в определенных интервалах , которые могут быть сколь угодно малыми . Непрерывные случайные величины обычно допускают функции плотности вероятности (PDF), которые характеризуют их CDF и вероятностные меры ; такие распределения называются также абсолютно непрерывными ; но некоторые непрерывные распределения являются сингулярными или представляют собой смесь абсолютно непрерывной и сингулярной частей.

Примером непрерывной случайной величины может быть спиннер, который может выбирать горизонтальное направление. Тогда значения, принимаемые случайной величиной, являются направлениями. Мы могли бы представить эти направления как север, запад, восток, юг, юго-восток и т. д. Однако обычно удобнее сопоставить пространство выборки со случайной величиной, которая принимает значения, которые являются действительными числами. Это можно сделать, например, путем сопоставления направления с азимутом в градусах по часовой стрелке от севера. Затем случайная величина принимает значения, которые являются действительными числами из интервала [0, 360), причем все части диапазона являются «одинакововероятными». В данном случае X = угол поворота. Любое действительное число имеет нулевую вероятность быть выбранным, но положительная вероятность может быть присвоена любому диапазону значений. Например, вероятность выбора числа из [0, 180] равна 1 2 . Вместо того, чтобы говорить о функции вероятности, мы говорим, что плотность вероятности равна 1/360 X . Вероятность подмножества [0, 360) можно вычислить, умножив меру набора на 1/360. В общем, вероятность набора для данной непрерывной случайной величины можно вычислить путем интегрирования плотности по данному набору.

Более формально, если задан любой интервал , случайная величина называется « непрерывной равномерной случайной величиной» (CURV), если вероятность того, что она примет значение в подинтервале, зависит только от длины подинтервала. Это означает, что вероятность попадание в любой подинтервал пропорционален если длине подинтервала, то есть, a c d , b имеем

где последнее равенство следует из аксиомы унитарности вероятности. Функция плотности вероятности CURV задается индикаторной функцией его интервала поддержки , нормированной на длину интервала:

Особый интерес представляет равномерное распределение на единичном интервале . Образцы любого желаемого распределения вероятностей может быть получена путем вычисления функции квантильной на случайно сгенерированном числе, равномерно распределенном на единичном интервале. При этом используются свойства кумулятивных функций распределения , которые являются объединяющей основой для всех случайных величин.

Смешанный тип [ править ]

Смешанная случайная величина — это случайная величина, кумулятивная функция распределения которой не является ни дискретной , ни всюду непрерывной . [10] Его можно реализовать как смесь дискретной случайной величины и непрерывной случайной величины; в этом случае CDF будет средневзвешенным CDF составляющих переменных. [10]

Пример случайной величины смешанного типа может быть основан на эксперименте, в котором монета подбрасывается, а спиннер вращается, только если результатом подбрасывания монеты является орел. Если результат — решка, X = −1; в противном случае X = значение счетчика, как в предыдущем примере. Существует вероятность 1 2 , что эта случайная величина будет иметь значение −1. Другие диапазоны значений будут иметь вдвое меньшую вероятность, чем в последнем примере.

В общем случае каждое распределение вероятностей на действительной линии представляет собой смесь дискретной части, сингулярной части и абсолютно непрерывной части; см. теорему Лебега о разложении § Уточнение . Дискретная часть сосредоточена на счетном множестве, но это множество может быть плотным (как и множество всех рациональных чисел).

мерное определение Теоретико -

Наиболее формальное, аксиоматическое определение случайной величины основано на теории меры . Непрерывные случайные величины определяются в терминах наборов чисел, а также функций, которые отображают такие наборы в вероятности. Из-за различных трудностей (например, парадокса Банаха-Тарского ), которые возникают, если такие множества недостаточно ограничены, необходимо ввести так называемую сигма-алгебру , чтобы ограничить возможные множества, над которыми могут быть определены вероятности. Обычно используется такая сигма-алгебра, борелевская σ-алгебра , которая позволяет определять вероятности над любыми множествами, которые могут быть получены либо непосредственно из непрерывных интервалов чисел, либо с помощью конечного или счетного числа объединений и/ или пересечения таких интервалов. [11]

Теоретико-мерное определение состоит в следующем.

Позволять быть вероятностным пространством и пространство измеримое . Затем -значная случайная величина является измеримой функцией , что означает, что для каждого подмножества , прообраз его -измеримый; , где . [12] Это определение позволяет нам измерить любое подмножество в целевом пространстве, глядя на его прообраз, который по предположению измерим.

Говоря более интуитивным языком, член является возможным результатом, членом представляет собой измеримое подмножество возможных результатов, функция дает вероятность каждого такого измеримого подмножества, представляет набор значений, которые может принимать случайная величина (например, набор действительных чисел), и член является «хорошим» (измеримым) подмножеством (те, для которых можно определить вероятность). Тогда случайная переменная является функцией любого результата от величины, так что результаты, ведущие к любому полезному подмножеству величин для случайной величины, имеют четко определенную вероятность.

Когда является топологическим пространством , то наиболее распространенным выбором является σ-алгебра есть борелевская σ-алгебра , которая представляет собой σ-алгебру, порожденную совокупностью всех открытых множеств в . В таком случае -значная случайная величина называется -значная случайная величина . Более того, когда пространство это настоящая линия , то такая вещественная случайная величина называется просто случайной величиной .

Случайные величины с действительными значениями [ править ]

В этом случае пространство наблюдения представляет собой набор действительных чисел. Отзывать, это вероятностное пространство. Для реального пространства наблюдения функция является вещественной случайной величиной, если

Это определение является частным случаем предыдущего, поскольку множество порождает борелевскую σ-алгебру на множестве действительных чисел, и достаточно проверить измеримость на любом порождающем множестве. Здесь мы можем доказать измеримость на этом порождающем наборе, используя тот факт, что .

Моменты [ править ]

Распределение вероятностей случайной величины часто характеризуется небольшим количеством параметров, которые также имеют практическую интерпретацию. Например, зачастую достаточно знать, каково его «среднее значение». Это отражается в математической концепции ожидаемого значения случайной величины, обозначаемой , а также называемый первым моментом . В общем, не равен . Как только «среднее значение» станет известно, можно будет задаться вопросом, насколько далеки от этого среднего значения значения обычно это вопрос, на который отвечает дисперсия и стандартное отклонение случайной величины. можно интуитивно рассматривать как среднее значение, полученное из бесконечной совокупности, члены которой имеют определенные оценки .

Математически это известно как (обобщенная) проблема моментов : для данного класса случайных величин , найти коллекцию функций таких, что средние значения полностью охарактеризовать распределение случайной величины .

Моменты можно определять только для вещественных функций случайных величин (или комплексных и т. д.). Если случайная величина сама по себе вещественная, то можно взять моменты самой переменной, эквивалентные моментам тождественной функции. случайной величины. Однако даже для недействительных случайных величин можно взять моменты вещественных функций этих переменных. Например, для категориальной случайной величины X , которая может принимать номинальные значения «красный», «синий» или «зеленый», действительная функция можно построить; здесь используется скобка Айверсона и имеет значение 1, если имеет значение «зеленый», в противном случае — 0. Затем можно определить математическое ожидание и другие моменты этой функции.

Функции случайных величин [ править ]

Новую случайную величину Y можно определить, применив действительную измеримую по Борелю функцию. к результатам действительной случайной величины . То есть, . Кумулятивная распределения функция затем

Если функция обратима (т.е. существует, где является обратная функция ) и либо увеличивается, либо убывает , то предыдущее соотношение можно расширить и получить

При тех же гипотезах обратимости , предполагая также дифференцируемость , связь между функциями плотности вероятности может быть найдена путем дифференцирования обеих частей приведенного выше выражения по , чтобы получить [10]

Если нет обратимости но каждый допускает не более счетного числа корней (т. е. конечного или счетного числа корней). такой, что ) то предыдущее соотношение между функциями плотности вероятности можно обобщить с помощью

где , согласно теореме об обратной функции . Формулы для плотностей не требуют увеличиваться.

В теоретико-мерном аксиоматическом подходе к вероятности, если случайная величина на и измеримая по Борелю функция , затем также является случайной величиной композиция измеримых функций , поскольку измерима и . (Однако это не обязательно верно, если измерима ли по Лебегу . [ нужна цитата ] ) Та же процедура, которая позволяла выйти из вероятностного пространства к можно использовать для получения распределения .

Пример 1 [ править ]

Позволять быть действительной непрерывной случайной величиной и пусть .

Если , затем , так

Если , затем

так

Пример 2 [ править ]

Предполагать это случайная величина с кумулятивным распределением

где является фиксированным параметром. Рассмотрим случайную величину Затем,

Последнее выражение можно рассчитать с точки зрения кумулятивного распределения так

которая представляет собой кумулятивную функцию распределения (CDF) экспоненциального распределения .

Пример 3 [ править ]

Предполагать — случайная величина со стандартным нормальным распределением , плотность которой равна

Рассмотрим случайную величину Мы можем найти плотность, используя приведенную выше формулу для замены переменных:

В этом случае изменение не является монотонным , поскольку каждое значение имеет два соответствующих значения (один положительный и отрицательный). Однако из-за симметрии обе половины преобразуются одинаково, т.е.

Обратное преобразование

и его производная

Затем,

Это распределение хи-квадрат с одной степенью свободы .

Пример 4 [ править ]

Предполагать — случайная величина с нормальным распределением , плотность которой равна

Рассмотрим случайную величину Мы можем найти плотность, используя приведенную выше формулу для замены переменных:

В этом случае изменение не является монотонным , поскольку каждое значение имеет два соответствующих значения (один положительный и отрицательный). Однако, в отличие от предыдущего примера, в этом случае симметрии нет, и нам нужно вычислить два разных члена:

Обратное преобразование

и его производная

Затем,

Это нецентральное распределение хи-квадрат с одной степенью свободы .

Некоторые свойства [ править ]

Эквивалентность случайных величин [ править ]

Существует несколько разных смыслов, в которых случайные величины можно считать эквивалентными. Две случайные величины могут быть равны, почти наверняка равны или равны по распределению.

Ниже приводится точное определение этих понятий эквивалентности в порядке возрастания силы.

Равенство в распределении [ править ]

Если пространство выборки является подмножеством реальной линии, случайные величины X и Y равны по распределению (обозначаются ), если они имеют одинаковые функции распределения:

Чтобы быть равными по распределению, случайные величины не обязательно должны определяться в одном и том же вероятностном пространстве. Две случайные величины, имеющие равные производящие моменты, имеют одинаковое распределение. Это обеспечивает, например, полезный метод проверки равенства определенных функций независимых одинаково распределенных (IID) случайных величин . Однако производящая функция момента существует только для распределений, которые имеют определенное преобразование Лапласа .

наверняка равенство Почти

Две случайные величины X и Y равны почти наверняка (обозначаются ) тогда и только тогда, когда вероятность того, что они различны, равна нулю :

Для всех практических целей теории вероятностей это понятие эквивалентности так же сильно, как и фактическое равенство. Это связано со следующим расстоянием:

где «ess sup» представляет собой существенную верхнюю границу в смысле теории меры .

Равенство [ править ]

Наконец, две случайные величины X и Y равны , если они равны как функции в своем измеримом пространстве:

Это понятие, как правило, наименее полезно в теории вероятностей, поскольку на практике и в теории лежащее в основе пространство эксперимента измерения редко явно охарактеризовано или даже охарактеризовано.

Конвергенция [ править ]

Важной темой математической статистики является получение результатов сходимости для определенных последовательностей случайных величин; например, закон больших чисел и центральная предельная теорема .

Существуют различные смыслы, в которых последовательность случайных величин могут сходиться к случайной величине . Это объясняется в статье о сходимости случайных величин .

См. также [ править ]

Ссылки [ править ]

Встроенные цитаты [ править ]

  1. ^ Перейти обратно: а б Блицштейн, Джо; Хван, Джессика (2014). Введение в вероятность . ЦРК Пресс. ISBN  9781466575592 .
  2. ^ Дейзенрот, Марк Питер (2020). Математика для машинного обучения . А. Альдо Фейсал, Ченг Сун Онг. Кембридж, Соединенное Королевство: Издательство Кембриджского университета. ISBN  978-1-108-47004-9 . OCLC   1104219401 .
  3. ^ Джордж Макки (июль 1980 г.). «Гармонический анализ как использование симметрии - исторический обзор». Бюллетень Американского математического общества . Новая серия. 3 (1).
  4. ^ "Случайные переменные" . www.mathsisfun.com . Проверено 21 августа 2020 г.
  5. ^ Йейтс, Дэниел С.; Мур, Дэвид С; Старнс, Дарен С. (2003). Практика статистики (2-е изд.). Нью-Йорк: Фриман . ISBN  978-0-7167-4773-4 . Архивировано из оригинала 9 февраля 2005 г.
  6. ^ "Случайные переменные" . www.stat.yale.edu . Проверено 21 августа 2020 г.
  7. ^ Декинг, Фредерик Мишель; Краайкамп, Корнелис; Лопухаа, Хендрик Пауль; Мистер, Людольф Эрвин (2005). «Современное введение в теорию вероятности и статистику » Спрингеровские тексты в статистике . дои : 10.1007/ 1-84628-168-7 ISBN  978-1-85233-896-1 . ISSN   1431-875X .
  8. ^ Л. Кастаньеда; В. Аруначалам и С. Дхармараджа (2012). Введение в теорию вероятности и случайные процессы с приложениями . Уайли. п. 67. ИСБН  9781118344941 .
  9. ^ Биллингсли, Патрик (1995). Вероятность и мера (3-е изд.). Уайли. п. 187. ИСБН  9781466575592 .
  10. ^ Перейти обратно: а б с д Берцекас, Дмитрий П. (2002). Введение в вероятность . Цициклис, Джон Н., Цициклис, Яннис Н. Бельмонт, Массачусетс: Athena Scientific. ISBN  188652940X . OCLC   51441829 .
  11. ^ Штайгервальд, Дуглас Г. «Экономика 245A – Введение в теорию меры» (PDF) . Калифорнийский университет, Санта-Барбара . Проверено 26 апреля 2013 г.
  12. ^ Фристедт и Грей (1996 , стр. 11)

Литература [ править ]

Внешние ссылки [ править ]