Достоверный интервал

Из Википедии, бесплатной энциклопедии
90%-ный доверительный интервал апостериорного распределения вероятностей с самой высокой плотностью.

В байесовской статистике достоверный интервал это интервал, используемый для характеристики распределения вероятностей . Он определяется таким образом, что ненаблюдаемое значение параметра имеет определенную вероятность попасть в его пределы. Например, в эксперименте, определяющем распределение возможных значений параметра , если вероятность того, что лежит между 35 и 45, это 0,95, тогда представляет собой 95%-ный доверительный интервал.

Достоверные интервалы обычно используются для характеристики апостериорных распределений вероятностей или прогнозируемых распределений вероятностей. [1] Обобщение многомерных задач является заслуживающей доверия областью .

Достоверные интервалы являются байесовским аналогом доверительных интервалов в частотной статистике . [2] Эти две концепции возникают из разных философий: [3] Байесовские интервалы рассматривают свои границы как фиксированные, а оцениваемый параметр - как случайную величину, тогда как частотные доверительные интервалы рассматривают свои границы как случайные величины, а параметр - как фиксированное значение. для конкретной ситуации Кроме того, байесовские доверительные интервалы используют (и действительно требуют) знания априорного распределения , в то время как частотные доверительные интервалы этого не делают.

Выбор достоверного интервала [ править ]

Достоверные интервалы не уникальны; любое данное апостериорное распределение вероятностей имеет бесконечное количество 95% доверительных интервалов. Поэтому существует несколько методов определения подходящего доверительного интервала:

  • Выбор самого узкого интервала. Для унимодального распределения в этот интервал будет входить мода ( максимум апостериорный ). Иногда его называют интервалом наивысшей задней плотности (HPDI).
  • Выбор интервала, при котором вероятность оказаться ниже интервала так же велика, как и вероятность оказаться выше него. Этот интервал будет включать медиану . Иногда его называют интервалом с равными хвостами .
  • Предполагая, что среднее значение существует, выбираем интервал, для которого среднее значение является центральной точкой.

Для многомерных задач область самой высокой апостериорной плотности ограничена контурной линией плотности вероятности . [4]

Достоверные интервалы также можно оценить с помощью методов моделирования, таких как цепь Маркова Монте-Карло . [5]

с интервалом Контраст доверительным

Частотный 95% доверительный интервал означает, что при большом количестве повторных выборок 95% таких рассчитанных доверительных интервалов будут включать истинное значение параметра. С точки зрения частотности, параметр фиксирован (нельзя считать, что он имеет распределение возможных значений), а доверительный интервал является случайным (поскольку он зависит от случайной выборки).

Байесовские доверительные интервалы отличаются от частотных доверительных интервалов двумя основными аспектами:

  • Достоверные интервалы — это интервалы, значения которых имеют (апостериорную) плотность вероятности, представляющую вероятность того, что параметр имеет эти значения, тогда как доверительные интервалы рассматривают параметр совокупности как фиксированный и, следовательно, не являющийся объектом вероятности. Внутри доверительных интервалов доверие относится к случайности самого доверительного интервала при повторных испытаниях, тогда как доверительные интервалы анализируют неопределенность целевого параметра с учетом имеющихся данных.
  • доверительные интервалы и доверительные интервалы рассматривают мешающие параметры совершенно по-разному.

Для случая одного параметра и данных, которые можно суммировать в одной достаточной статистике , можно показать, что доверительный интервал и доверительный интервал совпадают, если неизвестный параметр является параметром местоположения (т. е. прямая функция вероятности имеет вид ), где априорное распределение является равномерным и плоским; [6] а также, если неизвестный параметр является параметром масштаба (т.е. прямая функция вероятности имеет вид ), с приором Джеффриса   [6] — последнее следует потому, что логарифмирование такого масштабного параметра превращает его в параметр местоположения с равномерным распределением. Но это совершенно особые (хотя и важные) случаи; в общем, такая эквивалентность невозможна.

Ссылки [ править ]

  1. ^ Эдвардс, Уорд; Линдман, Гарольд; Сэвидж, Леонард Дж. (1963). «Байесовский статистический вывод в психологических исследованиях». Психологический обзор . 70 (3): 193–242. дои : 10.1037/h0044139 .
  2. ^ Ли, премьер-министр (1997) Байесовская статистика: введение , Арнольд. ISBN   0-340-67785-6
  3. ^ ВандерПлас, Джейк. «Частотность и байесианство III: уверенность, достоверность и почему частотизм и наука не сочетаются | Pythonic Perambulations» . jakevdp.github.io .
  4. ^ О'Хаган, А. (1994) Расширенная теория статистики Кендалла, Том 2B, Байесовский вывод , Раздел 2.51. Арнольд, ISBN   0-340-52922-9
  5. ^ Чен, Мин-Хуэй; Шао, Ци-Мань (1 марта 1999 г.). «Оценка методом Монте-Карло байесовских достоверных интервалов и интервалов HPD». Журнал вычислительной и графической статистики . 8 (1): 69–92. дои : 10.1080/10618600.1999.10474802 .
  6. ^ Перейти обратно: а б Джейнс, ET (1976). « Доверительные интервалы против байесовских интервалов », в книге «Основы теории вероятностей, статистических выводов и статистических теорий науки» (У.Л. Харпер и К.А. Хукер, ред.), Дордрехт: Д. Рейдель, стр. 175 и последующие.

Дальнейшее чтение [ править ]