Jump to content

Распределение уверенности

В статистическом выводе концепцию доверительного распределения ( CD ) часто называют функцией распределения в пространстве параметров, которая может представлять доверительные интервалы всех уровней для интересующего параметра. Исторически сложилось так, что он обычно строился путем инвертирования верхних пределов нижних доверительных интервалов всех уровней, а также обычно ассоциировался с реперным показателем. [ 1 ] интерпретация ( фидуциальное распределение ), хотя это чисто частотная концепция. [ 2 ] Доверительное распределение НЕ является функцией распределения вероятностей интересующего параметра, но все же может быть функцией, полезной для получения выводов. [ 3 ]

В последние годы наблюдается всплеск возобновления интереса к доверительным распределениям. [ 3 ] В более поздних разработках концепция доверительного распределения стала чисто частотной концепцией без какой-либо достоверной интерпретации или обоснования. Концептуально доверительное распределение ничем не отличается от точечной или интервальной оценки ( доверительный интервал ), но оно использует функцию распределения, зависящую от выборки, в пространстве параметров (вместо точки или интервала) для оценки интересующего параметра.

Простым примером доверительного распределения, широко используемого в статистической практике, является бутстрап- распределение. [ 4 ] Разработка и интерпретация бутстрап-распределения не требует каких-либо фидуциальных рассуждений; то же самое верно и для концепции доверительного распределения. Но понятие доверительного распределения гораздо шире, чем понятие бутстрап-распределения. В частности, недавние исследования показывают, что оно охватывает и объединяет широкий спектр примеров: от обычных параметрических случаев (включая большинство примеров классической разработки фидуциального распределения Фишера) до бутстреп-распределений, p-значения и т. д. функций [ 5 ] нормализованные функции правдоподобия и, в некоторых случаях, байесовские априорные и байесовские апостериорные функции . [ 6 ]

Точно так же, как байесовское апостериорное распределение содержит множество информации для любого типа байесовского вывода , доверительное распределение содержит множество информации для построения почти всех типов частотных выводов, включая точечные оценки , доверительные интервалы , критические значения, статистическую мощность и p- ценности, [ 7 ] среди других. Некоторые недавние события подчеркнули многообещающий потенциал концепции компакт-дисков как эффективного инструмента вывода. [ 3 ]

Нейман (1937) [ 8 ] представил идею «доверительности» в своей основополагающей статье о доверительных интервалах, которая прояснила свойство частого повторения. По словам Фрейзера, [ 9 ] зародыш (идея) доверительного распределения можно проследить даже до Байеса (1763). [ 10 ] и Фишер (1930). [ 1 ] Хотя эта фраза, кажется, впервые была использована у Кокса (1958). [ 11 ] Некоторые исследователи рассматривают доверительное распределение как «неймановскую интерпретацию доверительных распределений Фишера». [ 12 ] что «яростно оспаривалось Фишером». [ 13 ] Считается также, что эти «непродуктивные споры» и «упрямая настойчивость» Фишера [ 13 ] может быть причиной того, что концепция доверительного распределения долгое время неверно истолковывалась как фидуциальная концепция и не была полностью разработана в рамках частотной модели. [ 6 ] [ 14 ] Действительно, доверительное распределение представляет собой чисто частотную концепцию с чисто частотной интерпретацией, хотя оно также связано с концепциями байесовского и фидуциального вывода.

Определение

[ редактировать ]

Классическое определение

[ редактировать ]

Классически доверительное распределение определяется путем инвертирования верхних пределов ряда нижних доверительных интервалов. [ 15 ] [ 16 ] [ нужна страница ] В частности,

Для каждого α в (0, 1) пусть (−∞, ξ n ( α )] будет 100α% доверительным интервалом нижней стороны для θ , где ξ n ( α ) = ξ n ( X n ,α) является непрерывным и увеличиваясь по α для каждой выборки X n . Тогда H n (•) = ξ n. −1 (•) — доверительное распределение для θ .

Эфрон заявил, что это распределение «присваивает вероятность 0,05 θ , находящемуся между верхними конечными точками доверительного интервала 0,90 и 0,95 и т. д .». и «он обладает мощной интуитивной привлекательностью». [ 16 ] В классической литературе [ 3 ] функция доверительного распределения интерпретируется как функция распределения параметра θ , что невозможно, если не задействованы доверительные рассуждения, поскольку в частотной настройке параметры фиксированы и неслучайны.

Интерпретация функции CD полностью с частотной точки зрения, а не интерпретация ее как функции распределения (фиксированного/неслучайного) параметра является одним из основных отклонений недавних разработок по сравнению с классическим подходом. Преимущество рассмотрения доверительных распределений как чисто частотной концепции (аналогично точечной оценке) заключается в том, что теперь они свободны от тех ограничительных, если не спорных, ограничений, установленных Фишером для доверительных распределений. [ 6 ] [ 14 ]

Современное определение

[ редактировать ]

Применяется следующее определение; [ 12 ] [ 17 ] [ 18 ] Θ — это пространство параметров интересующего неизвестного параметра θ , а χ — это выборочное пространство, соответствующее данным X n = { X 1 , ..., X n }:

Функция H n (•) = H n ( X n , •) на χ × Θ → [0, 1] называется доверительным распределением (CD) для параметра θ , если она удовлетворяет двум требованиям:
  • R1) Для каждого данного X n χ n H ( (•) = H n ( X n , •) является непрерывной кумулятивной функцией распределения на Θ ;
  • (R2) При истинном значении параметра θ = θ 0 n H ) ( θ 0 H n ( X n , θ 0 ) как функция выборки X n следует равномерному распределению U [0, 1].

Кроме того, функция H является асимптотической CD ( aCD ), если требование U [0, 1] истинно только асимптотически и требование непрерывности на H n (•) опущено.

Говоря нетехническим языком, доверительное распределение является функцией как параметра, так и случайной выборки, с двумя требованиями. Первое требование (R1) просто требует, чтобы компакт-диск был распределением в пространстве параметров. Второе требование (R2) устанавливает ограничение на функцию, чтобы выводы (точечные оценки, доверительные интервалы, проверка гипотез и т. д.), основанные на доверительном распределении, имели желаемые частотные свойства. Это похоже на ограничения при точечной оценке для обеспечения определенных желаемых свойств, таких как несмещенность, последовательность, эффективность и т. д. [ 6 ] [ 19 ]

Доверительное распределение, полученное путем обращения верхних пределов доверительных интервалов (классическое определение), также удовлетворяет требованиям приведенного выше определения, и эта версия определения согласуется с классическим определением. [ 18 ]

В отличие от классического фидуциального вывода, для оценки параметра в любых конкретных условиях может быть доступно более одного доверительного распределения. Кроме того, в отличие от классического фидуциального вывода, оптимальность не является частью требования. В зависимости от настроек и используемого критерия иногда существует уникальное «лучшее» (с точки зрения оптимальности) доверительное распределение. Но иногда оптимальное доверительное распределение отсутствует или, в некоторых крайних случаях, мы даже не сможем найти значимое доверительное распределение. Это не отличается от практики точечной оценки.

Определение с измеримыми пространствами

[ редактировать ]

Доверительное распределение [ 20 ] для параметра в измеримом пространстве распределения является оценщиком с для семьи регионов доверия для с уровнем для всех уровней . Семейство регионов доверия не уникально. [ 21 ] Если существует только для , затем представляет собой доверительное распределение с установленным уровнем . Оба и все являются измеримыми функциями данных. Это означает, что является случайной мерой и представляет собой случайный набор. Если определяющее требование выполняется с равенством, то доверительное распределение является точным по определению. Если, кроме того, является вещественным параметром, то определение теории меры совпадает с приведенным выше классическим определением.

Пример 1: Нормальное среднее и дисперсия

[ редактировать ]

Предположим, что нормальная выборка X i ~ N ( µ , p 2 ), i = 1, 2, ..., n задано.

(1) Дисперсия σ 2 известен

Пусть Φ — кумулятивная функция распределения стандартного нормального распределения, и кумулятивная функция распределения Стьюдента распределение. Обе функции и данный

удовлетворяют двум требованиям в определении CD и являются функциями доверительного распределения для μ . [ 3 ] Более того,

удовлетворяет определению асимптотического доверительного распределения при n → ∞ и является асимптотическим доверительным распределением для μ . Использование и эквивалентны утверждению, что мы используем и оценить , соответственно.

(2) Дисперсия σ 2 неизвестно

Для параметра µ , поскольку включает неизвестный параметр σ и нарушает два требования в определении CD, он больше не является «оценкой распределения» или доверительным распределением для μ . [ 3 ] Однако, по-прежнему является компакт-диском для μ и является aCD для µ .

Для параметра σ 2 , кумулятивная функция распределения, зависящая от выборки

— функция доверительного распределения для σ 2 . [ 6 ] Здесь, – кумулятивная функция распределения распределение .

В случае, когда дисперсия σ 2 известно, является оптимальным с точки зрения получения кратчайших доверительных интервалов на любом заданном уровне. В случае, когда дисперсия σ 2 неизвестно, является оптимальным доверительным распределением для µ .

Пример 2: Двумерная нормальная корреляция

[ редактировать ]

Пусть ρ обозначает коэффициент корреляции двумерной нормальной популяции. Хорошо известно, что z Фишера определяется преобразованием Фишера :

имеет предельное распространение с высокой скоростью сходимости, где r — выборочная корреляция, а n — размер выборки.

Функция

является асимптотическим доверительным распределением для ρ . [ 22 ]

Точная доверительная плотность для ρ равна [ 23 ] [ 24 ]

где — гипергеометрическая функция Гаусса и . Это также апостериорная плотность априорного байесовского сопоставления для пяти параметров бинормального распределения. [ 25 ]

Самая последняя формула классической книги Фишера дает

где и . Эта формула была выведена Ч.Р. Рао . [ 26 ]

Пример 3: Бинормальное среднее

[ редактировать ]

Пусть данные генерируются где – неизвестный вектор на плоскости и имеет бинормальное и известное распределение на плоскости. Распределение определяет доверительное распределение для . Регионы доверия можно выбрать как внутреннюю часть эллипсов с центром в и оси, заданные собственными векторами ковариационной матрицы . Доверительное распределение в этом случае является бинормальным со средним значением и доверительные области могут быть выбраны многими другими способами. [ 21 ] Доверительное распределение в этом случае совпадает с байесовским апостериорным распределением с использованием правого априора Хаара. [ 27 ] Аргумент обобщается на случай неизвестного среднего значения. в бесконечномерном гильбертовом пространстве , но в этом случае доверительное распределение не является байесовским апостериором. [ 28 ]

Использование доверительных распределений для вывода

[ редактировать ]

Доверительный интервал

[ редактировать ]

Из определения CD видно, что интервал и обеспечить 100(1 - α )% доверительные интервалы разных видов для θ для любого α ∈ (0, 1). Также – доверительный интервал уровня 100(1 − α 1 α 2 )% для параметра θ для любых α 1 > 0, α 2 > 0 и α 1 + α 2 < 1. Здесь представляет собой 100 β %-квантиль или он находит решение для θ в уравнении . То же самое справедливо и для компакт-диска, где уровень доверия достигается в пределе. Некоторые авторы предложили использовать их для графического просмотра того, какие значения параметров соответствуют данным, а не для целей охвата или производительности. [ 29 ] [ 30 ]

Оценка баллов

[ редактировать ]

Точечные оценки также могут быть построены с учетом оценки доверительного распределения для интересующего параметра. Например, учитывая H n ( θ ) CD для параметра θ , естественный выбор точечных оценок включает медиану M n = H n −1 (1/2), среднее значение , а точка максимума плотности CD

При некоторых скромных условиях, среди других свойств, можно доказать, что все эти точечные оценки непротиворечивы. [ 6 ] [ 22 ] Определенные доверительные распределения могут дать оптимальные частотные оценки. [ 28 ]

Проверка гипотез

[ редактировать ]

Можно получить значение p для теста, как одностороннего, так и двустороннего, относительно параметра θ из его доверительного распределения H n ( θ ). [ 6 ] [ 22 ] Обозначим через вероятностную массу множества C при функции доверительного распределения Это p s (C) называется «поддержкой» в выводе CD, а в фидуциальной литературе также известно как «вера». [ 31 ] У нас есть

(1) Для одностороннего теста K 0 : θ C vs. K 1 : θ C с , где C имеет тип (−∞, b ] или [ b , ∞), из определения CD можно показать, что sup θ C P θ ( p s ( C ) ≤ α ) = α . Таким образом, p s ( C ) = H n ( C ) — соответствующее p-значение теста.

(2) Для одноэлементного теста K 0 : θ = b vs. K 1 : θ b , P { K 0 : θ = b } (2 min{ p s ( C lo )) из определения CD можно показать, что п s ( C вверх )} ≤ α ) знак равно α . Таким образом, 2 min{ p s ( C lo ), p s ( C up )} = 2 min { H n ( b ), 1 − H n ( b )} является соответствующим p-значением теста. Здесь C lo = (−∞, b ] и C up = [ b , ∞).

См. рисунок 1 из работы Се и Сингха (2011). [ 6 ] для графической иллюстрации вывода CD.

Реализации

[ редактировать ]

В нескольких статистических программах реализована возможность построения и построения графиков доверительных распределений.

Р , через concurve, [ 32 ] [ 33 ] pvaluefunctions, [ 34 ] и episheet[ 35 ] пакеты

Excel , через episheet[ 36 ]

Стата , иди concurve[ 32 ]

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б Фишер, Р.А. (1930). «Обратная вероятность». Учеб. Кембридж Пилос. Соц. 26 , 528–535.
  2. ^ Кокс, ДР (1958). «Некоторые проблемы, связанные со статистическим выводом», « Анналы математической статистики », «29» 357-372 (раздел 4, стр. 363). два : 10.1214/aoms/1177706618
  3. ^ Перейти обратно: а б с д и ж Се, М. (2013). «Ответ о доверительном распределении, оценщик частотного распределения параметра - обзор». Международное статистическое обозрение , 81 , 68-77. два : 10.1111/insr.12001
  4. ^ Эфрон, Б. (1998). «РАФишер в 21 веке» Статистическая наука. 13 95–122. JSTOR   2290557
  5. ^ Фрейзер, DAS (1991). «Статистический вывод: вероятность значимости». Журнал Американской статистической ассоциации , 86 , 258–265. JSTOR   2290557
  6. ^ Перейти обратно: а б с д и ж г час Се М. и Сингх К. (2013). «Распределение достоверности, оценка частотного распределения параметра - обзор (с обсуждением)». Международное статистическое обозрение , 81 , 3-39. два : 10.1111/insr.12000
  7. ^ Фрейзер, DAS (29 марта 2019 г.). «Функция p-значения и статистический вывод» . Американский статистик . 73 (суп1): 135–147. дои : 10.1080/00031305.2018.1556735 . ISSN   0003-1305 .
  8. ^ Нейман, Дж. (1937). «Очерк теории статистического оценивания, основанной на классической теории вероятностей». Фил. Пер. Рой. Соц А237 333–380
  9. ^ Фрейзер, DAS (2011). «Является ли апостериорный метод Байеса просто быстрой и грязной уверенностью?» Статистическая наука 26 , 299–316. JSTOR   23059129
  10. ^ Байес, Т. (1763). « Очерк решения проблемы учения о шансах ». Фил. Пер. Рой. Soc , Лондон 53 370–418 54 296–325. Перепечатано в Biometrika 45 (1958) 293–315.
  11. ^ Кокс, доктор медицинских наук (июнь 1958 г.). «Некоторые проблемы, связанные со статистическим выводом» . Анналы математической статистики . 29 (2): 357–372. дои : 10.1214/aoms/1177706618 . ISSN   0003-4851 .
  12. ^ Перейти обратно: а б Шведер Т. и Хьорт Н.Л. (2002). «Уверенность и вероятность», Скандинавский статистический журнал. 29 309–332. дои : 10.1111/1467-9469.00285
  13. ^ Перейти обратно: а б Забелл, С.Л. (1992). «РАФишер и фидуциальный аргумент», Стат. наук. , 7 , 369–387
  14. ^ Перейти обратно: а б Сингх К. и Се М. (2011). «Дискуссии на тему: «Является ли апостериорный метод Байеса просто быстрой и грязной уверенностью?» от DAS Fraser». Статистическая наука. Том. 26, 319–321. JSTOR   23059131
  15. ^ Кокс, ДР (2006). Принципы статистического вывода , CUP. ISBN   0-521-68567-2 . (стр. 66)
  16. ^ Перейти обратно: а б Эфрон, Б. (1993). «Байес и расчеты правдоподобия на основе доверительных интервалов. Биометрика , 80 3–26.
  17. ^ Сингх, К. Се, М. и Стродерман, МЫ (2001). «Доверительные распределения - концепция, теория и приложения». Технический отчет, Департамент статистики, Университет Рутгерса. Пересмотрено в 2004 году.
  18. ^ Перейти обратно: а б Сингх, К. Се, М. и Стродерман, МЫ (2005). «Объединение информации из независимых источников посредством доверительного распределения» Анналы статистики , 33 , 159–183. JSTOR   3448660
  19. ^ Се, М., Лю, Р., Дарамуджу, К.В., Олсан, В. (2012). «Объединение мнений экспертов с информацией биномиальных клинических испытаний». Анналы прикладной статистики. В печати.
  20. ^ Таральдсен, Гуннар (2021). «Совместное распределение доверия» . дои : 10.13140/RG.2.2.33079.85920 . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  21. ^ Перейти обратно: а б Лю, Дунган; Лю, Регина Ю.; Се, Минге (30 апреля 2021 г.). «Непараметрическое объединенное обучение для нескольких параметров: синтез выводов из различных источников с использованием глубины данных и доверительного распределения» . Журнал Американской статистической ассоциации . 117 (540): 2086–2104. дои : 10.1080/01621459.2021.1902817 . ISSN   0162-1459 . S2CID   233657455 .
  22. ^ Перейти обратно: а б с Сингх, К. Се, М. и Строудерман, МЫ (2007). «Оценка доверительного распределения (CD)-распределения параметра», в «Комплексных наборах данных и обратных задачах». Конспекты лекций IMS - серия монографий , 54 , (Р. Лю и др. Ред.) 132–150. JSTOR   20461464
  23. ^ Таральдсен, Гуннар (2021). «Плотность достоверности корреляции» . Санкхья А. 85 : 600–616. дои : 10.1007/s13171-021-00267-y . ISSN   0976-8378 . S2CID   244594067 .
  24. ^ Таральдсен, Гуннар (2020). «Уверенность в корреляции» . дои : 10.13140/RG.2.2.23673.49769 . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  25. ^ Бергер, Джеймс О.; Сунь, Дунчу (01 апреля 2008 г.). «Объективные априоры для двумерной нормальной модели» . Анналы статистики . 36 (2). arXiv : 0804.0987 . дои : 10.1214/07-AOS501 . ISSN   0090-5364 . S2CID   14703802 .
  26. ^ Фишер, Рональд Эйлмер, сэр (1973). Статистические методы и научные выводы ([3-е изд., Ред. и англ.] Изд.). Нью-Йорк: Хафнер Пресс. ISBN  0-02-844740-9 . OCLC   785822 . {{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )
  27. ^ Итон, Моррис Л.; Саддерт, Уильям Д. (2012). «Инвариантность, сопоставление моделей и сопоставление вероятностей» . Санкхья: Индийский статистический журнал, серия A (2008-) . 74 (2): 170–193. дои : 10.1007/s13171-012-0018-4 . ISSN   0976-836X . JSTOR   42003718 . S2CID   120705955 .
  28. ^ Перейти обратно: а б Таральдсен, Гуннар; Линдквист, Бо Генри (01 февраля 2013 г.). «Фидуциальная теория и оптимальный вывод» . Анналы статистики . 41 (1). arXiv : 1301.1717 . дои : 10.1214/13-AOS1083 . ISSN   0090-5364 . S2CID   88520957 .
  29. ^ Кокс, доктор медицинских наук; Хинкли, Д.В. (6 сентября 1979 г.). Теоретическая статистика . Чепмен и Холл/CRC. дои : 10.1201/b14832 . ISBN  978-0-429-17021-8 .
  30. ^ Рафи, Зад; Гренландия, Сандер (30 сентября 2020 г.). «Семантические и когнитивные инструменты в помощь статистической науке: замените уверенность и значимость совместимостью и неожиданностью» . Методология медицинских исследований BMC . 20 (1): 244. arXiv : 1909.08579 . дои : 10.1186/s12874-020-01105-9 . ISSN   1471-2288 . ПМЦ   7528258 . ПМИД   32998683 .
  31. ^ Кендалл, М., и Стюарт, А. (1974). Передовая теория статистики , Том?. (Глава 21). Уайли.
  32. ^ Перейти обратно: а б Рафи [авт, Зад; кре; Выготский, Эндрю Д. (20 апреля 2020 г.), Concurve: вычисляет и строит графики интервалов совместимости (доверительности), P-значений, S-значений и интервалов правдоподобия для формирования функций созвучия, неожиданности и правдоподобия , получено 05.05.2020 г. 05
  33. ^ «Скругленные графики кривых созвучия, функций p-значения и функций S-значения «Статистическое моделирование, причинный вывод и социальные науки» . statmodeling.stat.columbia.edu . Проверено 15 апреля 2020 г.
  34. ^ Инфангер, Денис (29 ноября 2019 г.), pvaluefunctions: создает и строит графики функций P-значения, функций S-значения, доверительных распределений и доверительных плотностей , получено 15 апреля 2020 г.
  35. ^ Блэк, Джеймс; Ротман, Кен; Телуолл, Саймон (23 января 2019 г.), эпилист: Эпилист Ротмана , получено 15 апреля 2020 г.
  36. ^ «Современная эпидемиология, 2-е издание» . www.krothman.org . Архивировано из оригинала 29 января 2020 г. Проверено 15 апреля 2020 г.

Библиография

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a0cfba9ac22883108eb3fa87f76c575b__1720180620
URL1:https://arc.ask3.ru/arc/aa/a0/5b/a0cfba9ac22883108eb3fa87f76c575b.html
Заголовок, (Title) документа по адресу, URL1:
Confidence distribution - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)