Jump to content

Усеченное нормальное распределение

Функция плотности вероятности
Функция плотности вероятности для усеченного нормального распределения для разных наборов параметров. Во всех случаях a = −10 и b = 10. Для чёрного: µ = −8, σ = 2; синий: μ = 0, σ = 2; красный: μ = 9, σ = 10; оранжевый: μ = 0, σ = 10.
Кумулятивная функция распределения
Кумулятивная функция распределения усеченного нормального распределения для разных наборов параметров. Во всех случаях a = −10 и b = 10. Для чёрного: µ = −8, σ = 2; синий: μ = 0, σ = 2; красный: μ = 9, σ = 10; оранжевый: μ = 0, σ = 10.
Обозначения
Параметры
(но см. определение)
— минимальное значение
— максимальное значение ( )
Поддерживать
PDF [1]
CDF
Иметь в виду
медиана
Режим
Дисперсия
Энтропия
МГФ

В теории вероятности и статистике усеченное нормальное распределение — это распределение вероятностей, полученное из распределения нормально распределенной случайной величины путем ограничения случайной величины снизу или сверху (или того и другого). Усеченное нормальное распределение имеет широкое применение в статистике и эконометрике .

Определения

[ редактировать ]

Предполагать имеет нормальное распределение со средним и дисперсия и лежит внутри интервала . Затем при условии имеет усеченное нормальное распределение.

Его функция плотности вероятности , , для , определяется

и по в противном случае.

Здесь, - функция плотности вероятности стандартного нормального распределения и это его кумулятивная функция распределения По определению, если , затем , и аналогично, если , затем .

Приведенные выше формулы показывают, что когда параметр масштаба усеченного нормального распределения допускается принимать отрицательные значения. Параметр в данном случае мнимая, но функция тем не менее реален, положителен и нормален. Параметр масштаба неусеченного нормального распределения должно быть положительным, поскольку в противном случае распределение не поддавалось бы нормализации. С другой стороны, дважды усеченное нормальное распределение в принципе может иметь отрицательный масштабный параметр (который отличается от дисперсии, см. сводные формулы), поскольку в ограниченной области такие проблемы интегрируемости не возникают. В этом случае распределение нельзя интерпретировать как неусеченный нормальный кондиционал на , конечно, но все же может быть интерпретировано как распределение максимальной энтропии с первым и вторым моментами в качестве ограничений и имеет дополнительную особенность: оно представляет два локальных максимума вместо одного, расположенного в точке и .

Характеристики

[ редактировать ]

Усеченное нормальное — это одно из двух возможных распределений вероятностей максимальной энтропии ограниченной интервалом [a,b], второе — усеченное U. для фиксированного среднего и дисперсии , [2] Усеченные нормали с фиксированной поддержкой образуют экспоненциальное семейство.Нильсен [3] сообщил о формуле закрытой формы для расчета расхождения Кульбака-Лейблера и расстояния Бхаттачарьи между двумя усеченными нормальными распределениями с поддержкой первого распределения, вложенной в поддержку второго распределения.

Если случайная величина была усечена только снизу, некоторая вероятностная масса была сдвинута к более высоким значениям, что дало стохастически доминирующее распределение первого порядка и, следовательно, увеличило среднее значение до значения, превышающего среднее значение. исходного нормального распределения. Аналогично, если случайная величина была усечена только сверху, усеченное распределение имеет среднее значение меньше, чем

Независимо от того, ограничена ли случайная величина сверху, снизу или и то, и другое, усечение представляет собой сокращение, сохраняющее среднее значение, в сочетании с жестким сдвигом, изменяющим среднее значение, и, следовательно, дисперсия усеченного распределения меньше, чем дисперсия исходного нормального распределения.

Двустороннее усечение [4]

[ редактировать ]

Позволять и . Затем: и

Необходимо соблюдать осторожность при числовом вычислении этих формул, поскольку это может привести к катастрофическому сокращению при превышении интервала не включает . Есть более эффективные способы их переписать, чтобы избежать этой проблемы. [5]

Одностороннее усечение (нижнего хвоста) [6]

[ редактировать ]

В этом случае затем

и

где

Одностороннее усечение (верхнего хвоста)

[ редактировать ]

В этом случае затем

Барр и Шеррилл (1999) дают более простое выражение для дисперсии односторонних сокращений. Их формула выражается в виде CDF хи-квадрат, который реализован в стандартных библиотеках программного обеспечения. Бебу и Мэтью (2009) предоставляют формулы для (обобщенных) доверительных интервалов вокруг усеченных моментов.

Рекурсивная формула
[ редактировать ]

Что касается неусеченного случая, то для усеченных моментов существует рекуррентная формула. [7]

Многомерный
[ редактировать ]

Вычислить моменты многомерной усеченной нормали сложнее.

Генерация значений из усеченного нормального распределения

[ редактировать ]

Случайная переменная определяется как с кумулятивная функция распределения и его инверсия, однородное случайное число на , соответствует распределению, усеченному до диапазона . Это просто метод обратного преобразования для моделирования случайных величин. Хотя этот метод является одним из самых простых, он может либо дать сбой при выборке в хвосте нормального распределения, либо при выборке в хвосте нормального распределения. [8] или быть слишком медленным. [9] Таким образом, на практике приходится искать альтернативные методы моделирования.

Один из таких усеченных нормальных генераторов (реализованный в Matlab ив R (язык программирования) как trandn.R ) основан на идее отказа от принятия из-за Марсальи. [10] Несмотря на несколько неоптимальную скорость принятия Марсальи (1964) по сравнению с Робертом (1995) , метод Марсальи обычно быстрее, [9] потому что это не требует дорогостоящего численного вычисления экспоненциальной функции.

Подробнее о моделировании усеченного нормального распределения см. Robert (1995) , Lynch (2007 , раздел 8.1.3 (страницы 200–206)), Devroye (1986) . В пакете MSM в R есть функция rtnorm , которая вычисляет отрисовку на основе усеченной нормали. Пакет truncnorm в R также имеет функции для рисования усеченной нормали.

Шопен (2011) предложил ( arXiv ) алгоритм, вдохновленный алгоритмом Зиккурата Марсальи и Цанга (1984, 2000), который обычно считается самым быстрым гауссовским сэмплером, а также очень близок к алгоритму Аренса (1995). Реализации можно найти на C , C++ , Matlab и Python .

Отбор выборки из многомерного усеченного нормального распределения значительно сложнее. [11] Точное или идеальное моделирование возможно только в случае усечения нормального распределения до многогранной области. [11] [12] В более общих случаях Дэмиен и Уокер (2001) представляют общую методологию выборки усеченных плотностей в рамках системы выборки Гиббса . Их алгоритм вводит одну скрытую переменную и в рамках системы выборки Гиббса более эффективен в вычислительном отношении, чем алгоритм Роберта (1995) .

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ «Лекция 4: Выбор» (PDF) . web.ist.utl.pt. Высший технический институт . 11 ноября 2002 г. с. 1 . Проверено 14 июля 2015 г.
  2. ^ Доусон, Д.; Рэгг, А. (сентябрь 1973 г.). «Распределения максимальной энтропии с заданными первым и вторым моментами (Корресп.)» . Транзакции IEEE по теории информации . 19 (5): 689–693. дои : 10.1109/TIT.1973.1055060 . ISSN   1557-9654 .
  3. ^ Фрэнк Нильсен (2022). «Статистические расхождения между плотностями усеченных экспоненциальных семейств с вложенными носителями: расхождения дуэта Брегмана и дуэта Дженсена» . Энтропия . 24 (3). MDPI: 421. Бибкод : 2022Entrp..24..421N . дои : 10.3390/e24030421 . ПМЦ   8947456 . ПМИД   35327931 .
  4. ^ Джонсон, Норман Ллойд; Коц, Сэмюэл; Балакришнан, Н. (1994). Непрерывные одномерные распределения . Том. 1 (2-е изд.). Нью-Йорк: Уайли. Раздел 10.1. ISBN  0-471-58495-9 . ОСЛК   29428092 .
  5. ^ Фернандес-де-Коссио-Диас, Хорхе (06 декабря 2017 г.), TruncatedNormal.jl: Вычисление среднего значения и дисперсии одномерного усеченного нормального распределения (работает далеко от пика) , получено 6 декабря 2017 г.
  6. ^ Грин, Уильям Х. (2003). Эконометрический анализ (5-е изд.). Прентис Холл. ISBN  978-0-13-066189-0 .
  7. ^ Документ Эрика Орджебина, " https://people.smp.uq.edu.au/YoniNazarathy/teaching_projects/studentWork/EricOrjebin_TruncatedNormalMoments.pdf "
  8. ^ Крозе, ДП ; Таймре, Т.; Ботев, З.И. (2011). Справочник по методам Монте-Карло . Джон Уайли и сыновья.
  9. ^ Jump up to: а б Ботев З.И.; Л'Экуйер, П. (2017). «Моделирование нормального распределения, усеченного до интервала в хвосте». 10-я Международная конференция EAI по методологиям и инструментам оценки эффективности . 25–28 октября 2016 г. Таормина, Италия: ACM. стр. 23–29. дои : 10.4108/eai.25-10-2016.2266879 . ISBN  978-1-63190-141-6 . {{cite conference}}: CS1 maint: местоположение ( ссылка )
  10. ^ Марсалья, Джордж (1964). «Генерация переменной из хвоста нормального распределения». Технометрика . 6 (1): 101–102. дои : 10.2307/1266749 . JSTOR   1266749 .
  11. ^ Jump up to: а б Ботев, З.И. (2016). «Нормальный закон при линейных ограничениях: моделирование и оценка с помощью минимаксного наклона». Журнал Королевского статистического общества, серия B. 79 : 125–148. arXiv : 1603.04166 . дои : 10.1111/rssb.12162 . S2CID   88515228 .
  12. ^ Ботев, Здравко и Л'Экуйер, Пьер (2018). «Глава 8: Моделирование хвоста одномерного и многомерного нормального распределения». В Пулиафито, Антонио (ред.). Системное моделирование: методологии и инструменты. EAI/Springer Инновации в области связи и вычислений . Спрингер, Чам. стр. 115–132. дои : 10.1007/978-3-319-92378-9_8 . ISBN  978-3-319-92377-2 . S2CID   125554530 .
  13. ^ Сунь, Цзинчао; Конг, Майинг; Пал, Субхадип (22 июня 2021 г.). «Модифицированное полунормальное распределение: свойства и эффективная схема выборки» . Коммуникации в статистике - теория и методы . 52 (5): 1591–1613. дои : 10.1080/03610926.2021.1934700 . ISSN   0361-0926 . S2CID   237919587 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 22e21a2e0fa04cae2cd5f6763c5e57d9__1712367480
URL1:https://arc.ask3.ru/arc/aa/22/d9/22e21a2e0fa04cae2cd5f6763c5e57d9.html
Заголовок, (Title) документа по адресу, URL1:
Truncated normal distribution - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)