Тест Андерсона-Дарлинга
Тест Андерсона-Дарлинга — это статистический тест того, получена ли данная выборка данных из заданного распределения вероятностей . В своей базовой форме тест предполагает, что в тестируемом распределении нет параметров, подлежащих оценке, и в этом случае тест и его набор критических значений не зависят от распределения. Однако тест чаще всего используется в контексте, когда тестируется семейство распределений, и в этом случае необходимо оценить параметры этого семейства и принять это во внимание при корректировке либо тестовой статистики, либо ее критических значений. Применительно к проверке того, адекватно ли нормальное распределение описывает набор данных, оно является одним из наиболее мощных статистических инструментов для обнаружения большинства отклонений от нормальности . [ 1 ] [ 2 ] с K Критерии Андерсона-Дарлинга -выборкой доступны для проверки того, можно ли смоделировать несколько наборов наблюдений как исходящие из одной совокупности, где функцию распределения не требуется указывать .
Помимо использования в качестве теста соответствия распределений, его можно использовать при оценке параметров в качестве основы для процедуры оценки минимального расстояния .
Тест назван в честь Теодора Уилбура Андерсона (1918–2016) и Дональда А. Дарлинга (1915–2014), которые изобрели его в 1952 году. [ 3 ]
Одновыборочный тест
[ редактировать ]Статистики Андерсона–Дарлинга и Крамера–фон Мизеса относятся к классу квадратичная статистика EDF (тесты на основе эмпирической функции распределения ). [ 2 ] Если предполагаемое распределение , а эмпирическая (выборочная) кумулятивная функция распределения равна , то квадратичная статистика EDF измеряет расстояние между и к
где - количество элементов в выборке, а является весовой функцией. Когда весовая функция , статистика – статистика Крамера–фон Мизеса . Тест Андерсона-Дарлинга (1954) [ 4 ] зависит от расстояния
который получается, когда весовая функция равна . Таким образом, по сравнению с расстоянием Крамера – фон Мизеса , расстояние Андерсона – Дарлинга придает больший вес наблюдениям в хвостах распределения.
Базовая статистика теста
[ редактировать ]Тест Андерсона-Дарлинга оценивает, происходит ли выборка из указанного распределения. Он использует тот факт, что при наличии гипотетического основного распределения и предположении, что данные действительно возникают из этого распределения, можно предположить, что кумулятивная функция распределения (CDF) данных следует равномерному распределению . Затем данные можно проверить на единообразие с помощью дистанционного теста (Шапиро, 1980). Формула тестовой статистики чтобы оценить, есть ли данные (обратите внимание, что данные должны быть приведены в порядок) поступает из CDF является
где
Затем статистику теста можно сравнить с критическими значениями теоретического распределения. В этом случае никакие параметры не оцениваются по отношению к кумулятивной функции распределения .
Тесты для семейств дистрибутивов
[ редактировать ]По сути, одна и та же тестовая статистика может использоваться при проверке соответствия семейства распределений, но затем ее необходимо сравнить с критическими значениями, соответствующими этому семейству теоретических распределений и зависящими также от метода, используемого для оценки параметров.
Тест на нормальность
[ редактировать ]Эмпирическое тестирование выявило [ 5 ] что тест Андерсона-Дарлинга не так хорош, как тест Шапиро-Уилка , но лучше, чем другие тесты. Стивенс [ 1 ] найденный быть одной из лучших статистических данных эмпирической функции распределения для обнаружения большинства отклонений от нормальности.
Вычисления различаются в зависимости от того, что известно о распределении: [ 6 ]
- Случай 0: Среднее значение и дисперсия оба известны.
- Случай 1: Дисперсия известно, но среднее значение неизвестно.
- Случай 2: Среднее значение известно, но дисперсия неизвестно.
- Случай 3: Оба средних значения и дисперсия неизвестны.
наблюдений n , , для , переменной необходимо отсортировать так, чтобы и обозначения в дальнейшем предполагают, что X i представляет упорядоченные наблюдения. Позволять
Ценности стандартизированы для создания новых ценностей , заданный
Со стандартным нормальным CDF , рассчитывается с использованием
Альтернативное выражение, в котором на каждом этапе суммирования учитывается только одно наблюдение:
Модифицированную статистику можно рассчитать с помощью
Если или превышает заданное критическое значение, то гипотеза нормальности отклоняется с некоторый уровень значимости. Критические значения приведены в таблице ниже для значений . [ 1 ] [ 7 ]
Примечание 1: Если = 0 или любой (0 или 1) тогда не может быть вычислен и не определен.
Примечание 2: Приведенная выше формула корректировки взята из книги Shorack & Wellner (1986, стр. 239). При сравнении различных источников требуется осторожность, поскольку зачастую конкретная формула корректировки не указывается.
Примечание 3: Стивенс [ 1 ] отмечает, что тест становится лучше, когда параметры вычисляются на основе данных, даже если они известны.
Примечание 4: Марсалья и Марсалья. [ 7 ] предоставьте более точный результат для случая 0 на уровне 85% и 99%.
Случай | н | 15% | 10% | 5% | 2.5% | 1% |
---|---|---|---|---|---|---|
0 | ≥ 5 | 1.621 | 1.933 | 2.492 | 3.070 | 3.878 |
1 | 0.908 | 1.105 | 1.304 | 1.573 | ||
2 | ≥ 5 | 1.760 | 2.323 | 2.904 | 3.690 | |
3 | 10 | 0.514 | 0.578 | 0.683 | 0.779 | 0.926 |
20 | 0.528 | 0.591 | 0.704 | 0.815 | 0.969 | |
50 | 0.546 | 0.616 | 0.735 | 0.861 | 1.021 | |
100 | 0.559 | 0.631 | 0.754 | 0.884 | 1.047 | |
0.576 | 0.656 | 0.787 | 0.918 | 1.092 |
Альтернативно, для случая 3, приведенного выше (как среднее значение, так и дисперсия неизвестны), Д'Агостино (1986) [ 6 ] в таблице 4.7 на с. 123 и на страницах 372–373 приводится скорректированная статистика:
и нормальность отвергается, если превышает 0,631, 0,754, 0,884, 1,047 или 1,159 на уровнях значимости 10%, 5%, 2,5%, 1% и 0,5% соответственно; процедура действительна для размера выборки не менее n=8. Формулы расчета p -значений для других значений приведены в таблице 4.9 на с. 127 в той же книге.
Тесты для других дистрибутивов
[ редактировать ]Выше предполагалось, что переменная тестировался на нормальное распределение. Можно протестировать любое другое семейство распределений, но тест для каждого семейства реализуется с использованием различных модификаций базовой тестовой статистики, и это относится к критическим значениям, специфичным для этого семейства распределений. Модификации статистики и таблиц критических значений даны Стивенсом (1986). [ 2 ] для экспоненциального распределения, распределения экстремальных значений, распределения Вейбулла, гамма-распределения, логистического распределения, распределения Коши и фон Мизеса. Тесты на (двухпараметрическое) логарифмически нормальное распределение можно реализовать путем преобразования данных с помощью логарифма и использования приведенного выше теста на нормальность. Подробности необходимых модификаций тестовой статистики и критических значений для нормального и экспоненциального распределения были опубликованы Пирсоном и Хартли (1972, таблица 54). Подробности об этих распределениях, с добавлением распределения Гамбеля , также даны Шораком и Веллнером (1986, стр. 239). Подробности логистического распределения даны Стивенсом (1979). Тест для распределения Вейбулла (с двумя параметрами) можно получить, воспользовавшись тем фактом, что логарифм переменной Вейбулла имеет распределение Гамбеля .
Непараметрические k -выборки тесты
[ редактировать ]Фриц Шольц и Майкл А. Стивенс (1987) обсуждают тест, основанный на мере согласия Андерсона-Дарлинга между распределениями, для определения того, могло ли несколько случайных выборок с возможно разными размерами выборки возникнуть из одного и того же распределения, где это распределение не указано. [ 8 ] Пакет R kSamples и Python пакет Scipy реализуют этот ранговый тест для сравнения k выборок среди нескольких других подобных ранговых тестов. [ 9 ] [ 10 ]
Для выборок, статистику можно вычислить следующим образом в предположении, что функция распределения из -я выборка является непрерывной
где
- количество наблюдений в -й образец
- общее количество наблюдений во всех выборках
- это объединенная упорядоченная выборка
- количество наблюдений в -ая выборка, не превышающая . [ 8 ]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д Стивенс, Массачусетс (1974). «Статистика EDF по точности соответствия и некоторые сравнения». Журнал Американской статистической ассоциации . 69 (347): 730–737. дои : 10.2307/2286009 . JSTOR 2286009 .
- ^ Jump up to: а б с М. А. Стивенс (1986). «Тесты на основе статистики EDF». В Д'Агостино, РБ; Стивенс, Массачусетс (ред.). Методы согласия . Нью-Йорк: Марсель Деккер. ISBN 0-8247-7487-6 .
- ^ Андерсон, ТВ ; Дарлинг, Д.А. (1952). «Асимптотическая теория некоторых критериев согласия», основанная на случайных процессах» . Анналы математической статистики . 23 (2): 193–212. дои : 10.1214/aoms/1177729437 .
- ^ Андерсон, ТВ; Дарлинг, Д.А. (1954). «Проверка пригодности». Журнал Американской статистической ассоциации . 49 (268): 765–769. дои : 10.2307/2281537 . JSTOR 2281537 .
- ^ Разали, Норнадия; Вау, Яп Би (2011). «Сравнение мощности тестов Шапиро-Уилка, Колмогорова-Смирнова, Лиллифорса и Андерсона-Дарлинга». Журнал статистического моделирования и аналитики . 2 (1): 21–33.
- ^ Jump up to: а б Ральф Б. Д'Агостино (1986). «Тесты нормального распределения». В Д'Агостино, РБ; Стивенс, Массачусетс (ред.). Методы согласия . Нью-Йорк: Марсель Деккер. ISBN 0-8247-7487-6 .
- ^ Jump up to: а б Марсалья, Г. (2004). «Оценка распределения Андерсона-Дарлинга» . Журнал статистического программного обеспечения . 9 (2): 730–737. CiteSeerX 10.1.1.686.1363 . дои : 10.18637/jss.v009.i02 .
- ^ Jump up to: а б Шольц, ФРВ; Стивенс, Массачусетс (1987). «К-образец Тесты Андерсона – Дарлинга». Журнал Американской статистической ассоциации . 82 (399): 918–924. дои : 10.1080/01621459.1987.10478517 .
- ^ «kSamples: ранговые тесты K-выборки и их комбинации» . Р-проект .
- ^ «Тест Андерсона-Дарлинга для k-выборок. Пакет Scipy» .
Дальнейшее чтение
[ редактировать ]- Кордер, Г.В., Форман, Д.И. (2009). Непараметрическая статистика для нестатистиков: пошаговый подход Wiley, ISBN 978-0-470-45461-9
- Мехта, С. (2014) Темы статистики ISBN 978-1499273533
- Пирсон Э.С., Хартли, Х.О. (редакторы) (1972) Таблицы биометрики для статистиков , Том II. ЧАШКА. ISBN 0-521-06937-8 .
- Шапиро, СС (1980) Как проверить нормальность и другие предположения о распределении. В: Основные ссылки ASQC по контролю качества: статистические методы 3, стр. 1–78.
- Шорак, Г. Р. , Веллнер, Дж. А. (1986) Эмпирические процессы с применением к статистике , Уайли. ISBN 0-471-86725-X .
- Стивенс, Массачусетс (1979) Критерий соответствия логистическому распределению на основе эмпирической функции распределения , Биометрика, 66(3), 591–5.