Интервал допуска

Интервал толерантности ( TI ) — это статистический интервал , в который с некоторым уровнем достоверности попадает определенная выборочная доля популяции . «Более конкретно, интервал допуска 100× p %/100×(1-α) обеспечивает пределы, в пределах которых по крайней мере определенная доля ( p ) популяции попадает с заданным уровнем достоверности (1-α)». [1] «Интервал толерантности (TI) ( p , 1-α) на основе выборки строится так, чтобы он включал по крайней мере часть p выборочной совокупности с достоверностью 1-α; такой TI обычно называют p- контент — (1-α) покрытие TI». [2] (TL) (p, 1−α) «Верхний предел допуска — это просто верхний доверительный предел 1−α для 100 p- процентиля населения». [2]

Определение [ править ]

Данный

  • наблюдения которые являются реализацией независимых случайных величин которые имеют общее распространение , с неизвестным параметром
  • случайная величина из того же дистрибутива и независимо от первого переменные.

Тогда интервал допуска с конечными точками который имеет определяющее свойство: , без ссылки на образец .

Это отличается от интервала прогнозирования с конечными точками. имеет определяющее свойство .

Расчет [ править ]

Односторонние нормальные интервалы допуска имеют точное решение с точки зрения выборочного среднего и выборочной дисперсии на основе нецентрального t -распределения . [3] Двусторонние нормальные интервалы допуска можно получить на основе нецентрального распределения хи-квадрат . [3]

Связь с другими интервалами [ править ]

«В случае с известными параметрами интервал допуска 95% и интервал прогнозирования 95% одинаковы». [4] Если бы мы знали точные параметры популяции, мы смогли бы вычислить диапазон, в который попадает определенная часть популяции. Например, если мы знаем, что популяция обычно распределяется со средним значением и стандартное отклонение , то интервал включает 95% населения (1,96 — это z-показатель для 95% охвата нормально распределенного населения).

Однако если у нас есть только выборка из совокупности, мы знаем только выборочное среднее значение. и выборочное стандартное отклонение , которые являются лишь оценками истинных параметров. В этом случае не обязательно будет включать 95% населения из-за различий в этих оценках. Интервал допуска ограничивает это отклонение, вводя уровень достоверности. , который представляет собой уверенность, с которой этот интервал действительно включает указанную долю населения. Для нормально распределенной популяции z-показатель можно преобразовать в « фактор k » или коэффициент толерантности. [5] для данного с помощью справочных таблиц или нескольких аппроксимирующих формул. [6] «Поскольку степени свободы приближаются к бесконечности, интервалы прогнозирования и допуска становятся равными». [7]

Интервал допуска менее широко известен, чем доверительный интервал и интервал прогнозирования , на эту ситуацию сетуют некоторые преподаватели, поскольку это может привести к неправильному использованию других интервалов, где интервал допуска более уместен. [8] [9]

Интервал допуска отличается от доверительного интервала тем, что доверительный интервал ограничивает однозначный параметр совокупности ( например, среднее значение или дисперсию ) с некоторой уверенностью, в то время как интервал допуска ограничивает диапазон значений данных, который включает определенную долю население. В то время как размер доверительного интервала полностью обусловлен ошибкой выборки и будет приближаться к интервалу нулевой ширины при истинном параметре совокупности по мере увеличения размера выборки, размер интервала допуска частично обусловлен ошибкой выборки, а частично фактической дисперсией генеральной совокупности, и будет приближаться к интервалу вероятности генеральной совокупности по мере увеличения размера выборки. [8] [9]

Интервал допуска связан с интервалом прогнозирования , поскольку оба ограничивают вариации в будущих выборках. Однако интервал прогнозирования ограничивает только одну будущую выборку, тогда как интервал допуска ограничивает всю совокупность (т. е. произвольную последовательность будущих выборок). охватывает определенную долю популяции Другими словами, интервал прогнозирования в среднем , тогда как интервал допуска охватывает ее с определенным уровнем достоверности , что делает интервал допуска более подходящим, если один интервал предназначен для связывания нескольких будущих выборок. [9] [10]

Примеры [ править ]

[8] приводит следующий пример:

Итак, рассмотрим еще раз пресловутый EPA сценарий проверки пробега , в котором несколько номинально идентичных автомобилей конкретной модели тестируются для получения данных о пробеге. . Если такие данные обработаны для получения 95% доверительного интервала для среднего пробега модели, их можно, например, использовать для прогнозирования среднего или общего потребления бензина парком таких автомобилей на протяжении первых 5000 миль. использования. Однако такой интервал не принесет особой пользы человеку, арендующему одну из этих машин и задающемуся вопросом, хватит ли (полного) 10-галлонного бака бензина, чтобы проехать 350 миль до места назначения. Для этой работы интервал прогнозирования был бы гораздо полезнее. (Рассмотрите различные последствия «уверенности на 95%», что вместо того, чтобы быть «уверенным на 95%», что .) Но ни доверительный интервал для ни интервал прогнозирования для одного дополнительного пробега — это именно то, что нужно инженеру-конструктору, которому поручено определить, какой объем бензобака действительно необходим модели, чтобы гарантировать, что 99% произведенных автомобилей будут иметь запас хода в 400 миль. Что действительно нужно инженеру, так это интервал допуска для дроби. пробега таких автомобилей.

Другой пример приводится: [10]

Уровни свинца в воздухе были собраны из различные зоны внутри объекта. Было отмечено, что логарифмически преобразованные уровни свинца хорошо соответствуют нормальному распределению (т. е. данные взяты из логарифмически нормального распределения ). Пусть и соответственно обозначают среднее значение совокупности и дисперсию для логарифмически преобразованных данных. Если обозначает соответствующую случайную величину, таким образом, мы имеем . Мы отмечаем, что средний уровень свинца в воздухе. Доверительный интервал для можно построить обычным способом, исходя из t -распределения ; это, в свою очередь, обеспечит доверительный интервал для среднего уровня свинца в воздухе. Если и обозначают выборочное среднее и стандартное отклонение логарифмически преобразованных данных для выборки размера n, 95% доверительный интервал для дается , где обозначает квантиль t -распределения с степени свободы. Также может представлять интерес получение 95%-ной верхней доверительной границы для медианного уровня свинца в воздухе. Такая граница для дается . Следовательно, 95%-ная верхняя доверительная граница для медианного опережения по воздуху определяется выражением . Теперь предположим, что мы хотим спрогнозировать уровень свинца в воздухе в определенной зоне лаборатории. Верхний предел прогнозирования в 95 % для логарифмически преобразованного уровня отведений определяется выражением . Аналогичным образом можно вычислить интервал двустороннего прогнозирования. Смысл и интерпретация этих интервалов хорошо известны. Например, если доверительный интервал вычисляется повторно на основе независимых выборок, 95% интервалов, вычисленных таким образом, будут включать истинное значение , в долгосрочной перспективе. Другими словами, интервал предназначен для предоставления информации о параметре только. Интервал прогнозирования имеет аналогичную интерпретацию и предназначен для предоставления информации только об одном уровне отведения. Теперь предположим, что мы хотим использовать выборку, чтобы сделать вывод о том, находятся ли по крайней мере 95% уровней свинца среди населения ниже порогового значения. Доверительный интервал и интервал прогнозирования не могут ответить на этот вопрос, поскольку доверительный интервал предназначен только для медианного уровня отведения, а интервал прогнозирования — только для одного уровня отведения. Что требуется, так это интервал допуска; более конкретно, верхний предел допуска. Верхний предел допуска должен рассчитываться при условии, что по крайней мере 95% уровней свинца в популяции находятся ниже предела, с определенным уровнем достоверности, скажем, 99%.

См. также [ править ]

Ссылки [ править ]

  1. ^ Д. С. Янг (2010), Рецензии на книги: «Области статистической толерантности: теория, приложения и вычисления», ТЕХНОМЕТРИКА, ФЕВРАЛЬ 2010 г., VOL. 52, НЕТ. 1, стр. 143-144.
  2. ^ Jump up to: Перейти обратно: а б Кришнамурти, К. и Лиан, Сяодун (2011) «Приблизительные интервалы допуска в закрытой форме для некоторых общих линейных моделей и сравнительных исследований», Журнал статистических вычислений и моделирования, впервые опубликовано: 13 июня 2011 г. дои : 10.1080/00949655.2010.545061
  3. ^ Jump up to: Перейти обратно: а б Дерек С. Янг (август 2010 г.). «допуск: пакет R для оценки интервалов допуска» . Журнал статистического программного обеспечения . 36 (5): 1–39. ISSN   1548-7660 . Проверено 19 февраля 2013 г. , стр.23
  4. ^ Томас П. Райан (22 июня 2007 г.). Современная инженерная статистика . Джон Уайли и сыновья. стр. 222–. ISBN  978-0-470-12843-5 . Проверено 22 февраля 2013 г.
  5. ^ «Статистическая интерпретация данных. Часть 6. Определение статистических интервалов допуска» . ИСО 16269-6. 2014. с. 2.
  6. ^ «Интервалы допуска для нормального распределения» . Справочник по инженерной статистике . НИСТ/Сематех. 2010 . Проверено 26 августа 2011 г.
  7. ^ Де Грайз, С.; Лангханс, И.; Вандебрук, М. (2007). «Использование правильных интервалов для прогнозирования: руководство по интервалам допуска для обычной регрессии наименьших квадратов». Хемометрика и интеллектуальные лабораторные системы . 87 (2): 147. doi : 10.1016/j.chemolab.2007.03.002 .
  8. ^ Jump up to: Перейти обратно: а б с Стивен Б. Вардеман (1992). «А как насчет других интервалов?». Американский статистик . 46 (3): 193–197. дои : 10.2307/2685212 . JSTOR   2685212 .
  9. ^ Jump up to: Перейти обратно: а б с Марк Дж. Нельсон (14 августа 2011 г.). «Возможно, вам понадобится интервал допуска» . Проверено 26 августа 2011 г.
  10. ^ Jump up to: Перейти обратно: а б К. Кришнамурти (2009). Области статистической толерантности: теория, приложения и расчеты . Джон Уайли и сыновья. стр. 1–6. ISBN  978-0-470-38026-0 .

Дальнейшее чтение [ править ]

  • Хан, Джеральд Дж.; Микер, Уильям К.; Эскобар, Луис А. (2017). Статистические интервалы: Руководство для практиков и исследователей (2-е изд.). Джон Уайли и сыновья, Инкорпорейтед. ISBN  978-0-471-68717-7 .