Усеченное распространение
Эта статья нуждается в дополнительных цитатах для проверки . ( сентябрь 2009 г. ) |
Функция плотности вероятности | |||
Поддерживать | |||
---|---|---|---|
CDF | |||
Иметь в виду | |||
медиана |
В статистике усеченное распределение — это условное распределение , возникающее в результате ограничения области действия некоторого другого распределения вероятностей . Усеченные распределения возникают в практической статистике в тех случаях, когда возможность фиксировать события или даже знать о них ограничивается значениями, которые лежат выше или ниже заданного порога или внутри определенного диапазона. Например, если проверяются даты рождения детей в школе, они, как правило, подлежат усечению по сравнению с датами рождения всех детей в этом районе, учитывая, что в конкретную дату школа принимает только детей определенного возрастного диапазона. Не было бы никакой информации о том, сколько детей в данной местности родились до или после дат закрытия школы, если бы для получения информации использовался только прямой подход к школе.
Если выборка предназначена для сохранения знаний об элементах, выходящих за пределы требуемого диапазона, без регистрации фактических значений, это называется цензурированием , в отличие от усечения , описанного здесь. [1]
Определение
[ редактировать ]Следующее обсуждение ведется с точки зрения случайной величины, имеющей непрерывное распределение , хотя те же идеи применимы и к дискретным распределениям . Аналогично, в обсуждении предполагается, что усечение производится до полуоткрытого интервала y ∈ ( a,b ], но другие возможности можно реализовать напрямую.
Предположим, у нас есть случайная величина, который распределяется в соответствии с некоторой функцией плотности вероятности, , с кумулятивной функцией распределения оба из которых имеют бесконечную поддержку . Предположим, мы хотим узнать плотность вероятности случайной величины после ограничения поддержки между двумя константами, чтобы поддержка . То есть, предположим, мы хотим знать, как распространяется с учетом .
где для всех и везде еще. То есть, где – индикаторная функция. Обратите внимание, что знаменатель усеченного распределения постоянен по отношению к .
Обратите внимание, что на самом деле плотность:
- .
В усеченных дистрибутивах не обязательно удалять части сверху и снизу. Усеченное распределение, в котором удалена только нижняя часть распределения, выглядит следующим образом:
где для всех и везде еще и – кумулятивная функция распределения .
Усеченное распределение, в котором удалена верхняя часть распределения, выглядит следующим образом:
где для всех и везде еще и – кумулятивная функция распределения .
Ожидание усеченной случайной величины
[ редактировать ]Предположим, мы хотим найти ожидаемое значение случайной величины, распределенной в соответствии с плотностью и совокупное распределение учитывая, что случайная величина, , больше некоторого известного значения . Таким образом, математическое ожидание усеченной случайной величины равно:
где снова является для всех и везде еще.
Сдача в аренду и быть нижним и верхним пределами соответственно поддержки исходной функции плотности (который мы считаем непрерывным), свойства , где — некоторая непрерывная функция с непрерывной производной, включают:
- и
При условии, что ограничения существуют, то есть: , и где представляет либо или .
Примеры
[ редактировать ]Усеченное нормальное распределение является важным примером. [2]
Модель Тобита использует усеченные распределения.Другие примеры включают усеченный бином при x=0 и усеченный пуассон при x=0.
Случайное усечение
[ редактировать ]Предположим, у нас есть следующая настройка: значение усечения, , выбирается случайным образом из плотности, , но это значение не наблюдается. Тогда значение, , выбирается случайным образом из усеченного распределения, . Предположим, мы наблюдаем и хотим обновить наше представление о плотности учитывая наблюдение.
Во-первых, по определению:
- , и
Обратите внимание, что должно быть больше, чем , следовательно, когда мы интегрируем по , мы устанавливаем нижнюю границу . Функции и – безусловная плотность и безусловная кумулятивная функция распределения соответственно.
По правилу Байеса ,
который расширяется до
Два равномерных распределения (пример)
[ редактировать ]Предположим, мы знаем, что t равномерно распределено из [0, T ] и x | t распределено равномерно на [0, t ]. Пусть g ( t ) и f ( x | t ) — плотности, которые описывают t и x соответственно. Предположим, мы наблюдаем значение x и хотим знать распределение t при этом значении x .
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Додж, Ю. (2003) Оксфордский словарь статистических терминов . ОУП. ISBN 0-19-920613-9
- ^ Джонсон, Н.Л., Коц, С., Балакришнан, Н. (1994) Непрерывные одномерные распределения, Том 1 , Wiley. ISBN 0-471-58495-9 (раздел 10.1)