Вероятность покрытия
В теории статистической оценки или вероятность охвата , охват сокращенно, — это вероятность того, что доверительный интервал или доверительная область будет включать в себя истинное значение (параметр), представляющее интерес. Его можно определить как долю случаев , когда интервал окружает истинное значение, оцененное по долгосрочной частоте . [1]
В статистическом прогнозировании вероятность покрытия — это вероятность того, что интервал прогнозирования будет включать в себя значение случайной величины, выходящее за пределы выборки .Вероятность покрытия можно определить как долю случаев , когда интервал окружает значение, выходящее за пределы выборки, оцененное по долгосрочной частоте . [2]
Концепция
[ редактировать ]Фиксированная степень уверенности, заранее заданная аналитиком, называемая уровнем достоверности или коэффициентом достоверности построенного интервала, фактически представляет собой номинальную вероятность покрытия процедуры построения доверительных интервалов. Следовательно, упоминание «номинального уровня достоверности» или «номинального коэффициента достоверности» (например, как синонима номинальной вероятности покрытия ) обычно следует считать тавтологичным и вводящим в заблуждение, поскольку само понятие уровня достоверности по своей сути уже подразумевает номинальность . [а] Номинальная вероятность покрытия часто устанавливается на уровне 0,95. Напротив, (истинная) вероятность покрытия — это фактическая вероятность того, что интервал содержит параметр.
Если все предположения, использованные при определении доверительного интервала, выполняются, номинальная вероятность покрытия будет равна вероятности покрытия (для акцента называемой «истинной» или «фактической» вероятностью покрытия). Если какие-либо допущения не выполняются, фактическая вероятность покрытия может быть меньше или больше номинальной вероятности покрытия. Когда фактическая вероятность покрытия превышает номинальную вероятность покрытия, этот интервал называется консервативным (доверительным) интервалом ; если она меньше номинальной вероятности покрытия, интервал называется антиконсервативным или разрешительным . Например, предположим, что нас интересует среднее количество месяцев, в течение которых люди с определенным типом рака остаются в состоянии ремиссии после успешного лечения химиотерапией . Доверительный интервал призван содержать неизвестную среднюю продолжительность ремиссии с заданной вероятностью. В этом примере вероятность охвата будет реальной вероятностью того, что интервал действительно содержит истинную среднюю продолжительность ремиссии.
Несоответствие между вероятностью покрытия и номинальной вероятностью покрытия часто возникает при аппроксимации распределения непрерывным дискретного . Построение биномиальных доверительных интервалов является классическим примером, когда вероятности покрытия редко достигают номинального уровня. [3] [4] [5] Для биномиального случая создано несколько методик построения интервалов. Интервал баллов Вильсона — одна из хорошо известных конструкций, основанных на нормальном распределении . Другие конструкции включают интервалы Вальда, точные, Агрести-Кулла и интервалы правдоподобия. Хотя интервал баллов Вильсона, возможно, не является самой консервативной оценкой, он дает средние вероятности охвата, равные номинальным уровням, но при этом дает сравнительно узкий доверительный интервал.
«Вероятность» в вероятности покрытия интерпретируется как совокупность гипотетических повторений всей процедуры сбора и анализа данных. В этих гипотетических повторениях рассматриваются независимые наборы данных, соответствующие тому же распределению вероятностей , что и фактические данные, и на основе каждого из этих наборов данных вычисляется доверительный интервал; см. строительство Неймана . Вероятность покрытия — это доля этих вычисленных доверительных интервалов, которая включает желаемое, но ненаблюдаемое значение параметра.
Вероятностное сопоставление
[ редактировать ]При оценке, когда вероятность покрытия равна номинальной вероятности покрытия, это называется сопоставлением вероятностей. [6]
В прогнозировании, когда вероятность покрытия равна номинальной вероятности покрытия, это называется сопоставлением прогнозируемой вероятности. [2]
Формула
[ редактировать ]Построение доверительного интервала гарантирует, что вероятность нахождения истинного параметра в выборочно -зависимом интервале есть (по крайней мере) :
См. также
[ редактировать ]- Биномиальная пропорция, доверительный интервал
- Распределение уверенности
- Ложный уровень покрытия
- Интервальная оценка
Примечания
[ редактировать ]- ^ Однако в некоторых учебниках используются термины номинальный уровень достоверности или номинальный коэффициент достоверности , а также фактический уровень достоверности или фактический коэффициент достоверности в смысле «номинальный» и «фактическая вероятность покрытия»; ср., например, Вакерли, Деннис; Менденхолл, Уильям; Шеффер, Ричард Л. (2008), Математическая статистика с приложениями (7-е изд.), Cengage Learning, стр. 437, ISBN 978-1-111-79878-9 .
Ссылки
[ редактировать ]- ^ Додж, Ю. (2003). Оксфордский словарь статистических терминов. ОУП, ISBN 0-19-920613-9 , с. 93.
- ↑ Перейти обратно: Перейти обратно: а б Северини, Т; Мукерджи, Р; Гош, М. (2002). «О свойстве точного вероятностного совпадения правоинвариантных априорных значений». Биометрика . 89 (4): 952–957. JSTOR 4140551 .
- ^ Агрести, Алан; Коулл, Брент (1998). «Приблизительное лучше, чем «точное» для интервальной оценки биномиальных пропорций». Американский статистик . 52 (2): 119–126. дои : 10.2307/2685469 . JSTOR 2685469 .
- ^ Браун, Лоуренс; Кай, Т. Тони; ДасГупта, Анирбан (2001). «Интервальная оценка биномиальной пропорции» (PDF) . Статистическая наука . 16 (2): 101–117. дои : 10.1214/ss/1009213286 . Архивировано (PDF) из оригинала 23 июня 2010 года . Проверено 17 июля 2009 г.
- ^ Ньюкомб, Роберт (1998). «Двусторонние доверительные интервалы для одной пропорции: сравнение семи методов» . Статистика в медицине . 17 (2, выпуск 8): 857–872. doi : 10.1002/(SICI)1097-0258(19980430)17:8<857::AID-SIM777>3.0.CO;2-E . ПМИД 9595616 . Архивировано из оригинала 5 января 2013 года.
- ^ Гош, М; Мукерджи, Р. (1998). Последние разработки в области вероятностного сопоставления . Нью-Йоркское научное издательство. стр. 227–252.