Распределение уверенности
В статистическом выводе концепцию доверительного распределения ( CD ) часто называют функцией распределения в пространстве параметров, которая может представлять доверительные интервалы всех уровней для интересующего параметра. Исторически сложилось так, что он обычно строился путем инвертирования верхних пределов нижних доверительных интервалов всех уровней, а также обычно ассоциировался с реперным показателем. [ 1 ] интерпретация ( фидуциальное распределение ), хотя это чисто частотная концепция. [ 2 ] Доверительное распределение НЕ является функцией распределения вероятностей интересующего параметра, но все же может быть функцией, полезной для получения выводов. [ 3 ]
В последние годы наблюдается всплеск возобновления интереса к доверительным распределениям. [ 3 ] В более поздних разработках концепция доверительного распределения стала чисто частотной концепцией без какой-либо достоверной интерпретации или обоснования. Концептуально доверительное распределение ничем не отличается от точечной или интервальной оценки ( доверительный интервал ), но оно использует функцию распределения, зависящую от выборки, в пространстве параметров (вместо точки или интервала) для оценки интересующего параметра.
Простым примером доверительного распределения, широко используемого в статистической практике, является бутстрап- распределение. [ 4 ] Разработка и интерпретация бутстрап-распределения не требует каких-либо фидуциальных рассуждений; то же самое верно и для концепции доверительного распределения. Но понятие доверительного распределения гораздо шире, чем понятие бутстрап-распределения. В частности, недавние исследования показывают, что оно охватывает и объединяет широкий спектр примеров: от обычных параметрических случаев (включая большинство примеров классической разработки фидуциального распределения Фишера) до бутстреп-распределений, p-значения и т. д. функций [ 5 ] нормализованные функции правдоподобия и, в некоторых случаях, байесовские априорные и байесовские апостериорные функции . [ 6 ]
Точно так же, как байесовское апостериорное распределение содержит множество информации для любого типа байесовского вывода , доверительное распределение содержит множество информации для построения почти всех типов частотных выводов, включая точечные оценки , доверительные интервалы , критические значения, статистическую мощность и p- ценности, [ 7 ] среди других. Некоторые недавние события подчеркнули многообещающий потенциал концепции компакт-дисков как эффективного инструмента вывода. [ 3 ]
История
[ редактировать ]Нейман (1937) [ 8 ] представил идею «доверительности» в своей основополагающей статье о доверительных интервалах, которая прояснила свойство частого повторения. По словам Фрейзера, [ 9 ] зародыш (идея) доверительного распределения можно проследить даже до Байеса (1763). [ 10 ] и Фишер (1930). [ 1 ] Хотя эта фраза, кажется, впервые была использована у Кокса (1958). [ 11 ] Некоторые исследователи рассматривают доверительное распределение как «неймановскую интерпретацию доверительных распределений Фишера». [ 12 ] что «яростно оспаривалось Фишером». [ 13 ] Считается также, что эти «непродуктивные споры» и «упрямая настойчивость» Фишера [ 13 ] может быть причиной того, что концепция доверительного распределения долгое время неверно истолковывалась как фидуциальная концепция и не была полностью разработана в рамках частотной модели. [ 6 ] [ 14 ] Действительно, доверительное распределение представляет собой чисто частотную концепцию с чисто частотной интерпретацией, хотя оно также связано с концепциями байесовского и фидуциального вывода.
Определение
[ редактировать ]Классическое определение
[ редактировать ]Классически доверительное распределение определяется путем инвертирования верхних пределов ряда нижних доверительных интервалов. [ 15 ] [ 16 ] [ нужна страница ] В частности,
- Для каждого α в (0, 1) пусть (−∞, ξ n ( α )] будет 100α% доверительным интервалом нижней стороны для θ , где ξ n ( α ) = ξ n ( X n ,α) является непрерывным и увеличиваясь по α для каждой выборки X n . Тогда H n (•) = ξ n. −1 (•) — доверительное распределение для θ .
Эфрон заявил, что это распределение «присваивает вероятность 0,05 θ , находящемуся между верхними конечными точками доверительного интервала 0,90 и 0,95 и т. д .». и «он обладает мощной интуитивной привлекательностью». [ 16 ] В классической литературе [ 3 ] функция доверительного распределения интерпретируется как функция распределения параметра θ , что невозможно, если не задействованы доверительные рассуждения, поскольку в частотной настройке параметры фиксированы и неслучайны.
Интерпретация функции CD полностью с частотной точки зрения, а не интерпретация ее как функции распределения (фиксированного/неслучайного) параметра является одним из основных отклонений недавних разработок по сравнению с классическим подходом. Преимущество рассмотрения доверительных распределений как чисто частотной концепции (аналогично точечной оценке) заключается в том, что теперь они свободны от тех ограничительных, если не спорных, ограничений, установленных Фишером для доверительных распределений. [ 6 ] [ 14 ]
Современное определение
[ редактировать ]Применяется следующее определение; [ 12 ] [ 17 ] [ 18 ] Θ — это пространство параметров интересующего неизвестного параметра θ , а χ — это выборочное пространство, соответствующее данным X n = { X 1 , ..., X n }:
- Функция H n (•) = H n ( X n , •) на χ × Θ → [0, 1] называется доверительным распределением (CD) для параметра θ , если она удовлетворяет двум требованиям:
- R1) Для каждого данного X n ∈ χ n H ( (•) = H n ( X n , •) является непрерывной кумулятивной функцией распределения на Θ ;
- (R2) При истинном значении параметра θ = θ 0 n H ) ( θ 0 ≡ H n ( X n , θ 0 ) как функция выборки X n следует равномерному распределению U [0, 1].
Кроме того, функция H является асимптотической CD ( aCD ), если требование U [0, 1] истинно только асимптотически и требование непрерывности на H n (•) опущено.
Говоря нетехническим языком, доверительное распределение является функцией как параметра, так и случайной выборки, с двумя требованиями. Первое требование (R1) просто требует, чтобы компакт-диск был распределением в пространстве параметров. Второе требование (R2) устанавливает ограничение на функцию, чтобы выводы (точечные оценки, доверительные интервалы, проверка гипотез и т. д.), основанные на доверительном распределении, имели желаемые частотные свойства. Это похоже на ограничения при точечной оценке для обеспечения определенных желаемых свойств, таких как несмещенность, последовательность, эффективность и т. д. [ 6 ] [ 19 ]
Доверительное распределение, полученное путем обращения верхних пределов доверительных интервалов (классическое определение), также удовлетворяет требованиям приведенного выше определения, и эта версия определения согласуется с классическим определением. [ 18 ]
В отличие от классического фидуциального вывода, для оценки параметра в любых конкретных условиях может быть доступно более одного доверительного распределения. Кроме того, в отличие от классического фидуциального вывода, оптимальность не является частью требования. В зависимости от настроек и используемого критерия иногда существует уникальное «лучшее» (с точки зрения оптимальности) доверительное распределение. Но иногда оптимальное доверительное распределение отсутствует или, в некоторых крайних случаях, мы даже не сможем найти значимое доверительное распределение. Это не отличается от практики точечной оценки.
Определение с измеримыми пространствами
[ редактировать ]Доверительное распределение [ 20 ] для параметра в измеримом пространстве распределения является оценщиком с для семьи регионов доверия для с уровнем для всех уровней . Семейство регионов доверия не уникально. [ 21 ] Если существует только для , затем представляет собой доверительное распределение с установленным уровнем . Оба и все являются измеримыми функциями данных. Это означает, что является случайной мерой и представляет собой случайный набор. Если определяющее требование выполняется с равенством, то доверительное распределение является точным по определению. Если, кроме того, является вещественным параметром, то определение теории меры совпадает с приведенным выше классическим определением.
Примеры
[ редактировать ]Пример 1: Нормальное среднее и дисперсия
[ редактировать ]Предположим, что нормальная выборка X i ~ N ( µ , p 2 ), i = 1, 2, ..., n задано.
(1) Дисперсия σ 2 известен
Пусть Φ — кумулятивная функция распределения стандартного нормального распределения, и кумулятивная функция распределения Стьюдента распределение. Обе функции и данный
удовлетворяют двум требованиям в определении CD и являются функциями доверительного распределения для μ . [ 3 ] Более того,
удовлетворяет определению асимптотического доверительного распределения при n → ∞ и является асимптотическим доверительным распределением для μ . Использование и эквивалентны утверждению, что мы используем и оценить , соответственно.
(2) Дисперсия σ 2 неизвестно
Для параметра µ , поскольку включает неизвестный параметр σ и нарушает два требования в определении CD, он больше не является «оценкой распределения» или доверительным распределением для μ . [ 3 ] Однако, по-прежнему является компакт-диском для μ и является aCD для µ .
Для параметра σ 2 , кумулятивная функция распределения, зависящая от выборки
— функция доверительного распределения для σ 2 . [ 6 ] Здесь, – кумулятивная функция распределения распределение .
В случае, когда дисперсия σ 2 известно, является оптимальным с точки зрения получения кратчайших доверительных интервалов на любом заданном уровне. В случае, когда дисперсия σ 2 неизвестно, является оптимальным доверительным распределением для µ .
Пример 2: Двумерная нормальная корреляция
[ редактировать ]Пусть ρ обозначает коэффициент корреляции двумерной нормальной популяции. Хорошо известно, что z Фишера определяется преобразованием Фишера :
имеет предельное распространение с высокой скоростью сходимости, где r — выборочная корреляция, а n — размер выборки.
Функция
является асимптотическим доверительным распределением для ρ . [ 22 ]
Точная доверительная плотность для ρ равна [ 23 ] [ 24 ]
где — гипергеометрическая функция Гаусса и . Это также апостериорная плотность априорного байесовского сопоставления для пяти параметров бинормального распределения. [ 25 ]
Самая последняя формула классической книги Фишера дает
где и . Эта формула была выведена Ч.Р. Рао . [ 26 ]
Пример 3: Бинормальное среднее
[ редактировать ]Пусть данные генерируются где – неизвестный вектор на плоскости и имеет бинормальное и известное распределение на плоскости. Распределение определяет доверительное распределение для . Регионы доверия можно выбрать как внутреннюю часть эллипсов с центром в и оси, заданные собственными векторами ковариационной матрицы . Доверительное распределение в этом случае является бинормальным со средним значением и доверительные области могут быть выбраны многими другими способами. [ 21 ] Доверительное распределение в этом случае совпадает с байесовским апостериорным распределением с использованием правого априора Хаара. [ 27 ] Аргумент обобщается на случай неизвестного среднего значения. в бесконечномерном гильбертовом пространстве , но в этом случае доверительное распределение не является байесовским апостериором. [ 28 ]
Использование доверительных распределений для вывода
[ редактировать ]Доверительный интервал
[ редактировать ]
Из определения CD видно, что интервал и обеспечить 100(1 - α )% доверительные интервалы разных видов для θ для любого α ∈ (0, 1). Также – доверительный интервал уровня 100(1 − α 1 − α 2 )% для параметра θ для любых α 1 > 0, α 2 > 0 и α 1 + α 2 < 1. Здесь представляет собой 100 β %-квантиль или он находит решение для θ в уравнении . То же самое справедливо и для компакт-диска, где уровень доверия достигается в пределе. Некоторые авторы предложили использовать их для графического просмотра того, какие значения параметров соответствуют данным, а не для целей охвата или производительности. [ 29 ] [ 30 ]
Оценка баллов
[ редактировать ]Точечные оценки также могут быть построены с учетом оценки доверительного распределения для интересующего параметра. Например, учитывая H n ( θ ) CD для параметра θ , естественный выбор точечных оценок включает медиану M n = H n −1 (1/2), среднее значение , а точка максимума плотности CD
При некоторых скромных условиях, среди других свойств, можно доказать, что все эти точечные оценки непротиворечивы. [ 6 ] [ 22 ] Определенные доверительные распределения могут дать оптимальные частотные оценки. [ 28 ]
Проверка гипотез
[ редактировать ]Можно получить значение p для теста, как одностороннего, так и двустороннего, относительно параметра θ из его доверительного распределения H n ( θ ). [ 6 ] [ 22 ] Обозначим через вероятностную массу множества C при функции доверительного распределения Это p s (C) называется «поддержкой» в выводе CD, а в фидуциальной литературе также известно как «вера». [ 31 ] У нас есть
(1) Для одностороннего теста K 0 : θ ∈ C vs. K 1 : θ ∈ C с , где C имеет тип (−∞, b ] или [ b , ∞), из определения CD можно показать, что sup θ ∈ C P θ ( p s ( C ) ≤ α ) = α . Таким образом, p s ( C ) = H n ( C ) — соответствующее p-значение теста.
(2) Для одноэлементного теста K 0 : θ = b vs. K 1 : θ ≠ b , P { K 0 : θ = b } (2 min{ p s ( C lo )) из определения CD можно показать, что п s ( C вверх )} ≤ α ) знак равно α . Таким образом, 2 min{ p s ( C lo ), p s ( C up )} = 2 min { H n ( b ), 1 − H n ( b )} является соответствующим p-значением теста. Здесь C lo = (−∞, b ] и C up = [ b , ∞).
См. рисунок 1 из работы Се и Сингха (2011). [ 6 ] для графической иллюстрации вывода CD.
Реализации
[ редактировать ]В нескольких статистических программах реализована возможность построения и построения графиков доверительных распределений.
Р , через concurve
, [ 32 ] [ 33 ] pvaluefunctions
, [ 34 ] и episheet
[ 35 ] пакеты
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б Фишер, Р.А. (1930). «Обратная вероятность». Учеб. Кембридж Пилос. Соц. 26 , 528–535.
- ^ Кокс, ДР (1958). «Некоторые проблемы, связанные со статистическим выводом», « Анналы математической статистики », «29» 357-372 (раздел 4, стр. 363). два : 10.1214/aoms/1177706618
- ^ Перейти обратно: а б с д и ж Се, М. (2013). «Ответ о доверительном распределении, оценщик частотного распределения параметра - обзор». Международное статистическое обозрение , 81 , 68-77. два : 10.1111/insr.12001
- ^ Эфрон, Б. (1998). «РАФишер в 21 веке» Статистическая наука. 13 95–122. JSTOR 2290557
- ^ Фрейзер, DAS (1991). «Статистический вывод: вероятность значимости». Журнал Американской статистической ассоциации , 86 , 258–265. JSTOR 2290557
- ^ Перейти обратно: а б с д и ж г час Се М. и Сингх К. (2013). «Распределение достоверности, оценка частотного распределения параметра - обзор (с обсуждением)». Международное статистическое обозрение , 81 , 3-39. два : 10.1111/insr.12000
- ^ Фрейзер, DAS (29 марта 2019 г.). «Функция p-значения и статистический вывод» . Американский статистик . 73 (суп1): 135–147. дои : 10.1080/00031305.2018.1556735 . ISSN 0003-1305 .
- ^ Нейман, Дж. (1937). «Очерк теории статистического оценивания, основанной на классической теории вероятностей». Фил. Пер. Рой. Соц А237 333–380
- ^ Фрейзер, DAS (2011). «Является ли апостериорный метод Байеса просто быстрой и грязной уверенностью?» Статистическая наука 26 , 299–316. JSTOR 23059129
- ^ Байес, Т. (1763). « Очерк решения проблемы учения о шансах ». Фил. Пер. Рой. Soc , Лондон 53 370–418 54 296–325. Перепечатано в Biometrika 45 (1958) 293–315.
- ^ Кокс, доктор медицинских наук (июнь 1958 г.). «Некоторые проблемы, связанные со статистическим выводом» . Анналы математической статистики . 29 (2): 357–372. дои : 10.1214/aoms/1177706618 . ISSN 0003-4851 .
- ^ Перейти обратно: а б Шведер Т. и Хьорт Н.Л. (2002). «Уверенность и вероятность», Скандинавский статистический журнал. 29 309–332. дои : 10.1111/1467-9469.00285
- ^ Перейти обратно: а б Забелл, С.Л. (1992). «РАФишер и фидуциальный аргумент», Стат. наук. , 7 , 369–387
- ^ Перейти обратно: а б Сингх К. и Се М. (2011). «Дискуссии на тему: «Является ли апостериорный метод Байеса просто быстрой и грязной уверенностью?» от DAS Fraser». Статистическая наука. Том. 26, 319–321. JSTOR 23059131
- ^ Кокс, ДР (2006). Принципы статистического вывода , CUP. ISBN 0-521-68567-2 . (стр. 66)
- ^ Перейти обратно: а б Эфрон, Б. (1993). «Байес и расчеты правдоподобия на основе доверительных интервалов. Биометрика , 80 3–26.
- ^ Сингх, К. Се, М. и Стродерман, МЫ (2001). «Доверительные распределения - концепция, теория и приложения». Технический отчет, Департамент статистики, Университет Рутгерса. Пересмотрено в 2004 году.
- ^ Перейти обратно: а б Сингх, К. Се, М. и Стродерман, МЫ (2005). «Объединение информации из независимых источников посредством доверительного распределения» Анналы статистики , 33 , 159–183. JSTOR 3448660
- ^ Се, М., Лю, Р., Дарамуджу, К.В., Олсан, В. (2012). «Объединение мнений экспертов с информацией биномиальных клинических испытаний». Анналы прикладной статистики. В печати.
- ^ Таральдсен, Гуннар (2021). «Совместное распределение доверия» . дои : 10.13140/RG.2.2.33079.85920 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Перейти обратно: а б Лю, Дунган; Лю, Регина Ю.; Се, Минге (30 апреля 2021 г.). «Непараметрическое объединенное обучение для нескольких параметров: синтез выводов из различных источников с использованием глубины данных и доверительного распределения» . Журнал Американской статистической ассоциации . 117 (540): 2086–2104. дои : 10.1080/01621459.2021.1902817 . ISSN 0162-1459 . S2CID 233657455 .
- ^ Перейти обратно: а б с Сингх, К. Се, М. и Строудерман, МЫ (2007). «Оценка доверительного распределения (CD)-распределения параметра», в «Комплексных наборах данных и обратных задачах». Конспекты лекций IMS - серия монографий , 54 , (Р. Лю и др. Ред.) 132–150. JSTOR 20461464
- ^ Таральдсен, Гуннар (2021). «Плотность достоверности корреляции» . Санкхья А. 85 : 600–616. дои : 10.1007/s13171-021-00267-y . ISSN 0976-8378 . S2CID 244594067 .
- ^ Таральдсен, Гуннар (2020). «Уверенность в корреляции» . дои : 10.13140/RG.2.2.23673.49769 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Бергер, Джеймс О.; Сунь, Дунчу (01 апреля 2008 г.). «Объективные априоры для двумерной нормальной модели» . Анналы статистики . 36 (2). arXiv : 0804.0987 . дои : 10.1214/07-AOS501 . ISSN 0090-5364 . S2CID 14703802 .
- ^ Фишер, Рональд Эйлмер, сэр (1973). Статистические методы и научные выводы ([3-е изд., Ред. и англ.] Изд.). Нью-Йорк: Хафнер Пресс. ISBN 0-02-844740-9 . OCLC 785822 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Итон, Моррис Л.; Саддерт, Уильям Д. (2012). «Инвариантность, сопоставление моделей и сопоставление вероятностей» . Санкхья: Индийский статистический журнал, серия A (2008-) . 74 (2): 170–193. дои : 10.1007/s13171-012-0018-4 . ISSN 0976-836X . JSTOR 42003718 . S2CID 120705955 .
- ^ Перейти обратно: а б Таральдсен, Гуннар; Линдквист, Бо Генри (01 февраля 2013 г.). «Фидуциальная теория и оптимальный вывод» . Анналы статистики . 41 (1). arXiv : 1301.1717 . дои : 10.1214/13-AOS1083 . ISSN 0090-5364 . S2CID 88520957 .
- ^ Кокс, доктор медицинских наук; Хинкли, Д.В. (6 сентября 1979 г.). Теоретическая статистика . Чепмен и Холл/CRC. дои : 10.1201/b14832 . ISBN 978-0-429-17021-8 .
- ^ Рафи, Зад; Гренландия, Сандер (30 сентября 2020 г.). «Семантические и когнитивные инструменты в помощь статистической науке: замените уверенность и значимость совместимостью и неожиданностью» . Методология медицинских исследований BMC . 20 (1): 244. arXiv : 1909.08579 . дои : 10.1186/s12874-020-01105-9 . ISSN 1471-2288 . ПМЦ 7528258 . ПМИД 32998683 .
- ^ Кендалл, М., и Стюарт, А. (1974). Передовая теория статистики , Том?. (Глава 21). Уайли.
- ^ Перейти обратно: а б Рафи [авт, Зад; кре; Выготский, Эндрю Д. (20 апреля 2020 г.), Concurve: вычисляет и строит графики интервалов совместимости (доверительности), P-значений, S-значений и интервалов правдоподобия для формирования функций созвучия, неожиданности и правдоподобия , получено 05.05.2020 г. 05
- ^ «Скругленные графики кривых созвучия, функций p-значения и функций S-значения «Статистическое моделирование, причинный вывод и социальные науки» . statmodeling.stat.columbia.edu . Проверено 15 апреля 2020 г.
- ^ Инфангер, Денис (29 ноября 2019 г.), pvaluefunctions: создает и строит графики функций P-значения, функций S-значения, доверительных распределений и доверительных плотностей , получено 15 апреля 2020 г.
- ^ Блэк, Джеймс; Ротман, Кен; Телуолл, Саймон (23 января 2019 г.), эпилист: Эпилист Ротмана , получено 15 апреля 2020 г.
- ^ «Современная эпидемиология, 2-е издание» . www.krothman.org . Архивировано из оригинала 29 января 2020 г. Проверено 15 апреля 2020 г.
Библиография
[ редактировать ]- Се М. и Сингх К. (2013). [1] «Доверительное распределение, оценка частотного распределения параметра: обзор». Международное статистическое обозрение , 81 , 3–39.
- Шведер Т. и Хьорт Н.Л. (2016). [2] Достоверность, правдоподобие, вероятность: статистический вывод с доверительными распределениями . Лондон: Издательство Кембриджского университета. ISBN 9781139046671
- Фишер, Р.А. (1956). Статистические методы и научные выводы . Нью-Йорк: Хафнер. ISBN 0-02-844740-9 .
- Фишер, Р.А. (1955). «Статистические методы и научная индукция» Дж. Рой. Статист. Соц. Сер. Б. 17, 69—78. (критика статистических теорий Ежи Неймана и Абрахама Вальда с фидуциальной точки зрения)
- Ханниг, Дж. (2009). « Об обобщенном фидуциальном выводе ». Statistica Sinica , 19 , 491–544.
- Лоулесс Ф. и Фредетт М. (2005). « Интервалы частотного прогнозирования и прогнозируемые распределения ». Биометрика. 92(3) 529–542.
- Леманн, Э.Л. (1993). « Теории Фишера, Неймана-Пирсона о проверке гипотез: одна теория или две? » Журнал Американской статистической ассоциации 88 1242–1249.
- Нейман, Ежи (1956). «Примечание к статье сэра Рональда Фишера». Журнал Королевского статистического общества . Серия Б (Методическая) 18 (2): 288–294. JSTOR 2983716 . (ответ Фишеру 1955, который диагностирует ошибочность «доверительного вывода»)
- Шведер Т., Садыкова Д., Руг Д. и Коски В. (2010) « Оценки численности популяции на основе аэрофотографических исследований естественно и изменчиво маркированных гренландских китов » Журнал сельскохозяйственной биологической и экологической статистики 2010 15: 1–19
- Битюков С., Красников Н., Надараджа С. и Смирнова В. (2010) « Доверительные распределения в статистическом выводе ». Материалы конференции AIP, 1305 , 346-353.
- Сингх К. и Се М. (2012). «CD-апостериорный --- объединение априорных данных и данных посредством доверительных распределений». Современные разработки в области байесовского анализа и теории статистических решений: праздничный сборник Уильяма Э. Стродермана. (Д. Фурдринье и др., ред.). Сборник IMS, том 8, 200–214.