Интервальная оценка

В статистике . интервальная оценка — это использование выборочных данных для оценки интервала значений возможных параметра интересующего В этом отличие от точечной оценки , которая дает одно значение. ^[1]

Наиболее распространенными формами интервальной оценки являются доверительные интервалы ( частотный метод) и достоверные интервалы ( байесовский метод ). ^[2] Менее распространенные формы включают интервалы правдоподобия , доверительные интервалы интервалы допуска и , интервалы прогнозирования . Для нестатистического метода интервальные оценки можно вывести с помощью нечеткой логики .

Типы интервальной оценки

Доверительные интервалы

Доверительные интервалы используются для оценки интересующего параметра на основе выборочного набора данных, обычно это среднее значение или стандартное отклонение . Доверительный интервал означает, что существует 100γ% уверенность в том, что интересующий параметр находится в пределах нижней и верхней границы. Распространенное заблуждение относительно доверительных интервалов состоит в том, что 100γ% набора данных соответствует границам или выше/ниже границ. Это называется интервалом допуска, который обсуждается ниже.

Существует несколько методов построения доверительного интервала, правильный выбор зависит от анализируемых данных. Для нормального распределения с известной дисперсией используется z-таблица для создания интервала, в котором уровень достоверности 100γ% может быть получен вокруг выборочного среднего значения из набора данных из n измерений. Для биномиального распределения доверительные интервалы можно аппроксимировать с помощью приближенного метода Уолда , интервала Джеффриса и интервала Клоппера-Пирсона . Метод Джеффри также можно использовать для аппроксимации интервалов распределения Пуассона . ^[3] Если базовое распределение неизвестно, можно использовать начальную загрузку , чтобы создать границы медианы набора данных.

Достоверные интервалы

В отличие от доверительного интервала, достоверный интервал требует предварительного предположения, изменения предположения с использованием фактора Байеса и определения апостериорного распределения . Используя апостериорное распределение, можно определить 100γ% вероятность того, что интересующий параметр включен, в отличие от доверительного интервала, где можно быть на 100γ% уверенным , что оценка включена в интервал. ^[4]

${\text{Posterior}}\ \propto \ {\text{Likelihood}}\times {\text{Prior}}$

Хотя предварительное предположение полезно для предоставления большего количества данных для построения интервала, оно лишает доверительный интервал объективности. Априорный результат будет использоваться для информирования апостериорного прогноза, если его не оспаривать, этот априор может привести к неверным прогнозам. ^[5]

Границы доверительного интервала являются переменными, в отличие от доверительного интервала. Существует несколько методов определения того, где должны быть расположены правильные верхний и нижний пределы. Общие методы настройки границ интервала включают интервал наибольшей апостериорной плотности (HPDI), интервал с равными хвостами или выбор центра интервала вокруг среднего значения.

Менее распространенные формы

На основе вероятности

Использует принципы функции правдоподобия для оценки интересующего параметра. Используя метод, основанный на правдоподобии, можно найти доверительные интервалы для экспоненциальных, Вейбулловских и логнормальных средних. Кроме того, подходы, основанные на правдоподобии, могут дать доверительные интервалы для стандартного отклонения. Также возможно создать интервал прогнозирования, объединив функцию правдоподобия и будущую случайную величину. ^[3]

Фидуциальный

Фидуциальный вывод использует набор данных, тщательно удаляет шум и восстанавливает оценку распределения, обобщенное доверительное распределение (GFD). Без использования теоремы Байеса не существует априорного предположения, как и в случае доверительных интервалов.

Фидуциальный вывод является менее распространенной формой статистического вывода . У основателя Р. А. Фишера , который занимался разработкой методов обратной вероятности, были свои вопросы по поводу обоснованности процесса. Хотя фидуциальный вывод был разработан в начале двадцатого века, в конце двадцатого века считалось, что этот метод уступает частотному и байесовскому подходам, но занимает важное место в историческом контексте для статистического вывода. Однако современные подходы обобщили доверительный интервал в обобщенный доверительный вывод (GFI), который можно использовать для оценки дискретных и непрерывных наборов данных. ^[6]

Толерантность

Интервалы допуска используют совокупность собранных наборов данных для получения интервала в пределах допуска, содержащего значения 100γ%. Примеры, обычно используемые для описания интервалов допуска, включают производство. В этом контексте оценивается процент существующего набора продуктов, чтобы гарантировать, что процент населения включен в пределы допуска. При создании интервалов допуска границы можно записать в виде верхнего и нижнего предела допуска, используя выборочное среднее значение . $\mu$ и выборочное стандартное отклонение , с.

$(l_{b},u_{b})=\mu \pm k_{2}s$ для двусторонних интервалов

для двусторонних интервалов

А в случае односторонних интервалов, где допуск требуется только выше или ниже критического значения,

$l_{b}=\mu -k_{1}s$

$u_{b}=\mu +k_{1}s$

$k_{i}$ зависит от распределения и количества сторон i в интервальной оценке. В нормальном распределении $k_{2}$ может быть выражено как ^[7]

$k_{2}=z_{\alpha /2}{\sqrt {\frac {\nu (1+{\frac {1}{N}})}{\chi _{1-\alpha ,\nu }^{2}}}}$

Где,

$\chi _{1-\alpha ,\nu }^{2}$ - критическое значение распределения хи-квадрат с использованием $\nu$ степени свободы, превышаемые с вероятностью $\alpha$ .

$z_{\alpha /2}$ – критические значения, полученные из нормального распределения.

Прогноз

Интервал прогнозирования оценивает интервал, содержащий будущие выборки с некоторой уверенностью, γ. Интервалы прогнозирования можно использовать как для байесовского , так и для частотного контекста. Эти интервалы обычно используются в наборах данных регрессии, но интервалы прогнозирования не используются для экстраполяции за пределы экспериментально контролируемых параметров предыдущих данных. ^[8]

Нечеткая логика

Нечеткая логика используется для обработки принятия решений небинарным способом для искусственного интеллекта, медицинских решений и других областей. В общем, он принимает входные данные, отображает их через системы нечеткого вывода и выдает выходное решение. Этот процесс включает в себя фаззификацию, оценку правил нечеткой логики и дефаззификацию. При оценке правил нечеткой логики функции принадлежности преобразуют нашу недвоичную входную информацию в материальные переменные. Эти функции принадлежности необходимы для прогнозирования неопределенности системы.

Односторонний против двустороннего

Двусторонние интервалы оценивают интересующий параметр Θ с уровнем достоверности γ, используя более низкую ( $l_{b}$ ) и верхняя граница ( $u_{b}$ ). Примеры могут включать оценку среднего роста мужчин в географическом регионе или длины конкретного стола, изготовленного производителем. В этих случаях обычно оценивают центральное значение параметра. Обычно это представляется в форме, аналогичной приведенному ниже уравнению.

$P(l_{b}<\Theta <u_{b})=\gamma$

В отличие от двустороннего интервала, односторонний интервал использует уровень достоверности γ для построения минимальной или максимальной границы, которая прогнозирует интересующий параметр с вероятностью γ*100%. Обычно односторонний интервал требуется, когда минимальная или максимальная граница оценки не представляет интереса. Когда речь идет о минимальном прогнозируемом значении Θ, больше не требуется находить верхние границы оценки, что приводит к уменьшенной форме двусторонней оценки.

$P(l_{b}<\Theta )=\gamma$

В результате удаления верхней границы и сохранения уверенности нижняя граница ( $l_{b}$ ) увеличится. Аналогично, если речь идет о поиске только верхней границы оценки параметра, верхняя граница будет уменьшаться. Односторонний интервал обычно встречается при обеспечении качества производства материалов , где ожидаемое значение прочности материала Θ должно быть выше определенного минимального значения ( $l_{b}$ ) с некоторой уверенностью (100γ%). В этом случае производитель не заботится о выпуске слишком прочного продукта, верхней границы нет ( $u_{b}$ ).

Будьте осторожны при использовании и построении оценок

При определении значимости параметра лучше всего понимать данные и методы их сбора. Прежде чем собирать данные, эксперимент следует спланировать таким образом, чтобы неопределенность данных заключалась в изменчивости выборки, а не в статистической ошибке . ^[9] После экспериментов типичным первым шагом в создании интервальных оценок является построение графика с использованием различных графических методов. Исходя из этого, можно определить распределение выборок из набора данных. Создание границ интервала с неверными предположениями на основе распределения делает прогноз ошибочным. ^[10]

Когда сообщаются интервальные оценки, они должны иметь общепринятую интерпретацию как внутри научного сообщества, так и за его пределами. Интервальные оценки, полученные с помощью нечеткой логики, имеют гораздо большее значение для конкретного приложения.

В часто встречающихся ситуациях следует использовать наборы стандартных процедур, которые можно использовать при условии проверки и обоснованности любых необходимых допущений. Это применимо как к доверительным интервалам, так и к доверительным интервалам. Однако в более новых ситуациях необходимо иметь указания о том, как можно формулировать интервальные оценки. В этом отношении доверительные интервалы и доверительные интервалы имеют схожее положение, но есть два различия. Во-первых, доверительные интервалы могут легко обрабатывать априорную информацию, а доверительные интервалы — нет. Во-вторых, доверительные интервалы более гибки и могут использоваться практически в большем количестве ситуаций, чем доверительные интервалы: одна из областей, где достоверные интервалы страдают по сравнению с ними, — это работа с непараметрическими моделями .

Должны быть способы проверки эффективности процедур интервальной оценки. Это возникает потому, что многие такие процедуры включают в себя различного рода аппроксимации и существует необходимость проверить, что фактическое выполнение процедуры близко к заявленному. Использование стохастического моделирования делает это простым в случае доверительных интервалов, но это несколько более проблематично для достоверных интервалов, где необходимо должным образом учитывать априорную информацию. Проверка достоверных интервалов может выполняться для ситуаций, не представляющих априорной информации, но проверка включает в себя проверку долгосрочных частотных свойств процедур.

Северини обсуждает условия, при которых правдоподобные интервалы и доверительные интервалы будут давать аналогичные результаты, а также обсуждает как вероятности покрытия вероятных интервалов, так и апостериорные вероятности, связанные с доверительными интервалами. ^[11]

В теории принятия решений , которая является распространенным подходом и обоснованием байесовской статистики, интервальная оценка не представляет прямого интереса. Результатом является решение, а не интервальная оценка, и поэтому сторонники байесовской теории принятия решений используют действие Байеса : они минимизируют ожидаемую потерю функции потерь по отношению ко всему апостериорному распределению, а не к конкретному интервалу.

Приложения

Применение доверительных интервалов используется для решения множества проблем, связанных с неопределенностью. Кац (1975) предлагает различные проблемы и преимущества использования интервальных оценок в судебных разбирательствах. ^[12] Альтмен (1990) обсуждает использование доверительных интервалов и рекомендации по их использованию в медицинских исследованиях. ^[13] В производстве также часто встречаются интервальные оценки срока службы продукта или оценки допусков продукта. Микер и Эскобар (1998) представляют методы анализа данных о надежности при параметрической и непараметрической оценке, включая прогнозирование будущих случайных величин (интервалы прогнозирования). ^[14]

См. также

Правило 68–95–99,7
Алгоритмический вывод
Вероятность покрытия
Статистика оценки
Индукция (философия)
Погрешность
Множественные сравнения
Философия статистики
Прогнозирующий вывод
Проблема Беренса-Фишера Это сыграло важную роль в развитии теории, лежащей в основе применимых статистических методологий.

Ссылки

^ Нейман, Дж. (1937). «Очерк теории статистического оценивания, основанной на классической теории вероятностей» . Философские труды Лондонского королевского общества. Серия А, Математические и физические науки . 236 (767). Королевское общество: 333–380. Бибкод : 1937RSPTA.236..333N . дои : 10.1098/rsta.1937.0005 . ISSN 0080-4614 . JSTOR 91337 . S2CID 19584450 . Проверено 15 июля 2021 г.
^ Северини, Томас А. (1991). «О взаимосвязи между байесовскими и небайесовскими интервальными оценками». Журнал Королевского статистического общества, серия B (методологический) . 53 (3). Уайли: 611–618. дои : 10.1111/j.2517-6161.1991.tb01849.x . ISSN 0035-9246 .
^ Jump up to: ^а ^б Микер, Уильям К.; Хан, Джеральд Дж.; Эскобар, Луис А. (27 марта 2017 г.). Статистические интервалы: Руководство для практиков и исследователей . Серия Уайли по вероятности и статистике (1-е изд.). Уайли. дои : 10.1002/9781118594841 . ISBN 978-0-471-68717-7 .
^ Эспаньхол, Луис; Валлио, Кайо-Сайн; Коста, Лусиола Менезес; Сараджотто, Бруно Т. (01.07.2019). «Понимание и интерпретация доверительных и вероятных интервалов оценок эффекта» . Бразильский журнал физиотерапии . 23 (4): 290–301. дои : 10.1016/j.bjpt.2018.12.006 . ISSN 1413-3555 . ПМК 6630113 . ПМИД 30638956 .
^ Ли, Питер М. (2012). Байесовская статистика: введение (4-е изд., 1-е изд.). Чичестер: Уайли. ISBN 978-1-118-33257-3 .
^ Ханниг, Ян; Айер, Хари; Лай, Рэнди CS; Ли, Томас CM (2 июля 2016 г.). «Обобщенный фидуциальный вывод: обзор и новые результаты». Журнал Американской статистической ассоциации . 111 (515): 1346–1361. дои : 10.1080/01621459.2016.1165102 . ISSN 0162-1459 .
^ Хоу, WG (июнь 1969 г.). «Двусторонние пределы допуска для нормальной популяции, некоторые улучшения» . Журнал Американской статистической ассоциации . 64 (326): 610. дои : 10.2307/2283644 . ISSN 0162-1459 .
^ Вардеман, Стивен Б. (1992). «А как насчет других интервалов?» . Американский статистик . 46 (3): 193–197. дои : 10.2307/2685212 . ISSN 0003-1305 .
^ Хан, Джеральд Дж.; Микер, Уильям К. (1993). «Предположения для статистических выводов» . Американский статистик . 47 (1): 1–11. дои : 10.2307/2684774 . ISSN 0003-1305 .
^ Хан, Джеральд Дж.; Доганаксой, Неджип; Микер, Уильям К. (01 августа 2019 г.). «Статистические интервалы, а не статистическая значимость» . Значение . 16 (4): 20–22. дои : 10.1111/j.1740-9713.2019.01298.x . ISSN 1740-9705 .
^ Северини, Томас А. (1993). «Оценки байесовских интервалов, которые также являются доверительными интервалами» . Журнал Королевского статистического общества. Серия Б (Методическая) . 55 (2): 533–540. ISSN 0035-9246 .
^ Кац, Лео (1975). «Представление оценки доверительного интервала как доказательства в судебном процессе» . Американский статистик . 29 (4): 138–142. дои : 10.2307/2683480 . ISSN 0003-1305 .
^ Альтман, Дуглас Г., изд. (2011). Уверенная статистика: доверительные интервалы и статистические рекомендации; [включает диск] (2-е изд., [Начдр.] изд.). Лондон: Книги BMJ. ISBN 978-0-7279-1375-3 .
^ Микер, Уильям К.; Эскобар, Луис А. (1998). Статистические методы для получения данных о надежности . Ряды Уайли в вероятности и статистике Раздел «Прикладная вероятность и статистика». Нью-Йорк Вайнхайм: Уайли. ISBN 978-0-471-14328-4 .

Библиография

Кендалл, М.Г. и Стюарт, А. (1973). Передовая теория статистики. Том 2: Вывод и взаимосвязь (3-е издание). Гриффин, Лондон.

В приведенной выше главе 20 рассматриваются доверительные интервалы, а в главе 21 рассматриваются доверительные интервалы и байесовские интервалы , а также обсуждается сравнение трех подходов. Обратите внимание, что эта работа предшествует современным методологиям, требующим больших вычислительных затрат. Кроме того, в главе 21 обсуждается проблема Беренса–Фишера.

Микер, У.К., Хан, Г.Дж. и Эскобар, Луизиана (2017). Статистические интервалы: Руководство для практиков и исследователей (2-е издание). Джон Уайли и сыновья.

Внешние ссылки

Введение в нечеткую математику https://web.archive.org/web/20061205114153/http://blog.peltarion.com/2006/10/25/fuzzy-math-part-1-the-theory
Что такое нечеткая логика? https://www.youtube.com/watch?v=__0nZuG4sTw

[Neyman1937-1] Нейман, Дж. (1937). «Очерк теории статистического оценивания, основанной на классической теории вероятностей» . Философские труды Лондонского королевского общества. Серия А, Математические и физические науки . 236 (767). Королевское общество: 333–380. Бибкод : 1937RSPTA.236..333N . дои : 10.1098/rsta.1937.0005 . ISSN 0080-4614 . JSTOR 91337 . S2CID 19584450 . Проверено 15 июля 2021 г.

[Severini1991-2] Северини, Томас А. (1991). «О взаимосвязи между байесовскими и небайесовскими интервальными оценками». Журнал Королевского статистического общества, серия B (методологический) . 53 (3). Уайли: 611–618. дои : 10.1111/j.2517-6161.1991.tb01849.x . ISSN 0035-9246 .

[:0-3] Jump up to: ^а ^б Микер, Уильям К.; Хан, Джеральд Дж.; Эскобар, Луис А. (27 марта 2017 г.). Статистические интервалы: Руководство для практиков и исследователей . Серия Уайли по вероятности и статистике (1-е изд.). Уайли. дои : 10.1002/9781118594841 . ISBN 978-0-471-68717-7 .

[4] Эспаньхол, Луис; Валлио, Кайо-Сайн; Коста, Лусиола Менезес; Сараджотто, Бруно Т. (01.07.2019). «Понимание и интерпретация доверительных и вероятных интервалов оценок эффекта» . Бразильский журнал физиотерапии . 23 (4): 290–301. дои : 10.1016/j.bjpt.2018.12.006 . ISSN 1413-3555 . ПМК 6630113 . ПМИД 30638956 .

[5] Ли, Питер М. (2012). Байесовская статистика: введение (4-е изд., 1-е изд.). Чичестер: Уайли. ISBN 978-1-118-33257-3 .

[6] Ханниг, Ян; Айер, Хари; Лай, Рэнди CS; Ли, Томас CM (2 июля 2016 г.). «Обобщенный фидуциальный вывод: обзор и новые результаты». Журнал Американской статистической ассоциации . 111 (515): 1346–1361. дои : 10.1080/01621459.2016.1165102 . ISSN 0162-1459 .

[7] Хоу, WG (июнь 1969 г.). «Двусторонние пределы допуска для нормальной популяции, некоторые улучшения» . Журнал Американской статистической ассоциации . 64 (326): 610. дои : 10.2307/2283644 . ISSN 0162-1459 .

[8] Вардеман, Стивен Б. (1992). «А как насчет других интервалов?» . Американский статистик . 46 (3): 193–197. дои : 10.2307/2685212 . ISSN 0003-1305 .

[9] Хан, Джеральд Дж.; Микер, Уильям К. (1993). «Предположения для статистических выводов» . Американский статистик . 47 (1): 1–11. дои : 10.2307/2684774 . ISSN 0003-1305 .

[10] Хан, Джеральд Дж.; Доганаксой, Неджип; Микер, Уильям К. (01 августа 2019 г.). «Статистические интервалы, а не статистическая значимость» . Значение . 16 (4): 20–22. дои : 10.1111/j.1740-9713.2019.01298.x . ISSN 1740-9705 .

[11] Северини, Томас А. (1993). «Оценки байесовских интервалов, которые также являются доверительными интервалами» . Журнал Королевского статистического общества. Серия Б (Методическая) . 55 (2): 533–540. ISSN 0035-9246 .

[12] Кац, Лео (1975). «Представление оценки доверительного интервала как доказательства в судебном процессе» . Американский статистик . 29 (4): 138–142. дои : 10.2307/2683480 . ISSN 0003-1305 .

[13] Альтман, Дуглас Г., изд. (2011). Уверенная статистика: доверительные интервалы и статистические рекомендации; [включает диск] (2-е изд., [Начдр.] изд.). Лондон: Книги BMJ. ISBN 978-0-7279-1375-3 .

[14] Микер, Уильям К.; Эскобар, Луис А. (1998). Статистические методы для получения данных о надежности . Ряды Уайли в вероятности и статистике Раздел «Прикладная вероятность и статистика». Нью-Йорк Вайнхайм: Уайли. ISBN 978-0-471-14328-4 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]