тест Граббса
В статистике используется тест Граббса или тест Граббса (названный в честь Фрэнка Э. Граббса , опубликовавшего тест в 1950 году). [ 1 ] ), также известный как максимального нормализованного остатка тест или критерий предельного стьюдентизированного отклонения , представляет собой тест , используемый для обнаружения выбросов в одномерном наборе данных, который, как предполагается, поступает из нормально распределенной совокупности.
Определение
[ редактировать ]Тест Граббса основан на предположении о нормальности . То есть, прежде чем применять тест Граббса, следует сначала убедиться, что данные могут быть разумно аппроксимированы нормальным распределением. [ 2 ]
Тест Граббса обнаруживает по одному выбросу за раз. Этот выброс удаляется из набора данных, и тест повторяется до тех пор, пока выбросы не будут обнаружены. Однако несколько итераций изменяют вероятность обнаружения, и тест не следует использовать для выборок размером шесть или меньше, поскольку он часто помечает большинство точек как выбросы. [ 3 ]
Тест Граббса определяется для следующих гипотез :
- H 0 : В наборе данных нет выбросов.
- H a : В наборе данных есть ровно один выброс.
Статистика теста Граббса определяется как
с и обозначая выборочное среднее и стандартное отклонение соответственно. Статистика теста Граббса представляет собой наибольшее абсолютное отклонение от выборочного среднего значения в единицах выборочного стандартного отклонения.
Это двусторонний тест , для которого гипотеза об отсутствии выбросов отклоняется на уровне значимости α, если
где t α/(2 N ), N −2 обозначает верхнее критическое значение с t-распределения N − 2 степенями свободы и уровнем значимости α/(2 N ).
Односторонний случай
[ редактировать ]Тест Граббса также можно определить как односторонний тест, заменяя α/(2 N ) на α/ N . Чтобы проверить, является ли минимальное значение выбросом, используется тестовая статистика:
где Y min обозначает минимальное значение. Чтобы проверить, является ли максимальное значение выбросом, используется тестовая статистика:
где Y max обозначает максимальное значение.
Связанные методы
[ редактировать ]несколько графических методов Для обнаружения выбросов можно использовать . На простом графике последовательности прогонов , ящичковой диаграмме или гистограмме должны быть видны любые явно выдающиеся точки. Обычный вероятностный график также может оказаться полезным.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Граббс, Фрэнк Э. (1950). «Примерные критерии для проверки отдаленных наблюдений» . Анналы математической статистики . 21 (1): 27–58. дои : 10.1214/aoms/1177729885 . hdl : 2027.42/182780 .
- ^ Цитируется из Справочника по инженерному делу и статистике , параграф 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm.
- ^ Адикарам, ККЛБ; Хусейн, Массачусетс; Эффенбергер, М.; Беккер, Т. (14 января 2015 г.). «Методика преобразования данных для повышения эффективности обнаружения выбросов теста Граббса для данных, которые, как ожидается, будут следовать линейной зависимости» . Журнал прикладной математики . 2015 : 1–9. дои : 10.1155/2015/708948 .
Дальнейшее чтение
[ редактировать ]- Граббс, Фрэнк (февраль 1969 г.). «Процедуры обнаружения посторонних наблюдений в выборках». Технометрика . 11 (1). Технометрика, Vol. 11, № 1: 2–21. дои : 10.2307/1266761 . JSTOR 1266761 .
- Стефанский, В. (1972). «Отказ от выбросов в факторных планах». Технометрика . 14 (2). Технометрика, Vol. 14, № 2: 469–479. дои : 10.2307/1267436 . JSTOR 1267436 .
Эта статья включает общедоступные материалы Национального института стандартов и технологий.