Полосы уверенности и прогнозирования
Доверительный диапазон используется в статистическом анализе для представления неопределенности оценки кривой или функции на основе ограниченных или зашумленных данных. Аналогичным образом, полоса прогнозирования используется для представления неопределенности относительно значения новой точки данных на кривой, но подверженной шуму. Доверительные и прогнозные диапазоны часто используются как часть графического представления результатов регрессионного анализа .
Доверительные интервалы тесно связаны с доверительными интервалами , которые представляют собой неопределенность в оценке одного числового значения. «Поскольку доверительные интервалы по своей конструкции относятся только к одной точке, они уже (на данный момент), чем доверительный интервал, который должен соблюдаться одновременно во многих точках». [1]
Поточечные и одновременные доверительные интервалы
[ редактировать ]Предположим, наша цель — оценить функцию f ( x ). Например, f ( x ) может быть долей людей определенного возраста x , которые поддерживают данного кандидата на выборах. Если x измеряется с точностью до одного года, мы можем построить отдельный 95% доверительный интервал для каждого возраста. Каждый из этих доверительных интервалов охватывает соответствующее истинное значение f ( x ) с достоверностью 0,95. В совокупности эти доверительные интервалы составляют 95%-ный точечный доверительный интервал для f ( x ).
С математической точки зрения, поточечный доверительный интервал с вероятностью покрытия 1 − α удовлетворяет следующему условию отдельно для каждого значения x :
где — точечная оценка f ( x ).
Вероятность одновременного покрытия набора доверительных интервалов — это вероятность того, что все они одновременно охватывают соответствующие истинные значения. В приведенном выше примере вероятность одновременного охвата — это вероятность того, что интервалы для x = 18,19,... все покрывают свои истинные значения (при условии, что 18 лет — это самый молодой возраст, в котором человек может голосовать). Если каждый интервал в отдельности имеет вероятность покрытия 0,95, вероятность одновременного покрытия обычно меньше 0,95. — 95%-ный доверительный интервал для одновременного охвата это набор доверительных интервалов для всех значений x в области f ( x ), который построен так, чтобы иметь вероятность одновременного покрытия 0,95.
С математической точки зрения, одновременный доверительный интервал с вероятностью охвата 1 − α удовлетворяет следующему условию:
Почти во всех случаях одновременный доверительный интервал будет шире, чем точечный доверительный интервал с той же вероятностью покрытия. При определении точечного доверительного интервала этот квантор универсальности выходит за пределы функции вероятности.
Доверительные диапазоны в регрессионном анализе
[ редактировать ]Доверительные диапазоны обычно возникают при регрессионном анализе . [2] В случае простой регрессии, включающей одну независимую переменную, результаты могут быть представлены в виде графика, показывающего предполагаемую линию регрессии вместе с точечными или одновременными доверительными интервалами. Обычно используемыми методами построения одновременных доверительных интервалов в регрессии являются методы Бонферрони и Шеффе ; Дополнительные сведения см. в разделе «Процедуры контроля частоты ошибок на уровне семейства» .
Доверительные интервалы для распределений вероятностей
[ редактировать ]Доверительные интервалы могут быть построены вокруг оценок эмпирической функции распределения . Простая теория позволяет строить точечные доверительные интервалы, но также возможно построить одновременную доверительную полосу для кумулятивной функции распределения в целом, инвертируя критерий Колмогорова-Смирнова или используя непараметрические методы правдоподобия. [3]
Другие применения доверительных интервалов
[ редактировать ]Доверительные интервалы возникают всякий раз, когда статистический анализ фокусируется на оценке функции.
Доверительные интервалы также были разработаны для оценок функций плотности , спектральной плотности , функций [4] функции квантилей , сглаживания диаграмм рассеяния , функции выживания и характеристические функции . [ нужна ссылка ]
Диапазоны прогнозирования
[ редактировать ]Полосы прогнозирования связаны с интервалами прогнозирования так же, как доверительные интервалы связаны с доверительными интервалами. Полосы прогнозирования обычно возникают при регрессионном анализе. Цель полосы прогнозирования — покрыть с заданной вероятностью значения одного или нескольких будущих наблюдений из той же совокупности, из которой был выбран данный набор данных. Точно так же, как интервалы прогнозирования шире доверительных интервалов, диапазоны прогнозирования будут шире, чем доверительные интервалы.
Этот раздел может сбивать с толку или быть неясным для читателей . ( Март 2021 г. ) |
С математической точки зрения, полоса прогнозирования с вероятностью покрытия 1 − α удовлетворяет следующему условию для каждого значения x :
где ты * это наблюдение, полученное в процессе генерации данных в данной точке x, которое не зависит от данных, используемых для построения точечной оценки и уверенность [ нечеткий ] интервал ш ( х ). Это интервал точечного прогнозирования. [ нечеткий ] Можно было бы построить одновременный интервал [ нечеткий ] для конечного числа независимых наблюдений, используя, например, метод Бонферрони для расширения интервала [ нечеткий ] на соответствующую сумму.
Ссылки
[ редактировать ]- ^ стр.65 в В. Хердле, М. Мюллере, С. Сперлихе, А. Верватце (2004), Непараметрические и полупараметрические модели, Springer, ISBN 3540207228 «3.5 Доверительные интервалы и доверительные интервалы» . Архивировано из оригинала 12 апреля 2013 г. Проверено 6 февраля 2013 г. , [1]
- ^ Лю, В; Лин С.; Пигорш В.В. (2008). «Построение точных одновременных доверительных интервалов для простой модели линейной регрессии» . Международный статистический обзор . 76 (1): 39–57. дои : 10.1111/j.1751-5823.2007.00027.x .
- ^ Оуэн, AB (1995). «Непараметрические доверительные интервалы правдоподобия для функции распределения». Журнал Американской статистической ассоциации . 90 (430). Американская статистическая ассоциация: 516–521. дои : 10.2307/2291062 . JSTOR 2291062 .
- ^ Нойманн, штат Миннесота; Папародитис, Э. (2008). «Одновременные доверительные интервалы при оценке спектральной плотности». Биометрика . 95 (2): 381. CiteSeerX 10.1.1.569.3978 . дои : 10.1093/biomet/asn005 .