Jump to content

Тест Андерсона-Дарлинга

Тест Андерсона-Дарлинга — это статистический тест того, получена ли данная выборка данных из заданного распределения вероятностей . В своей базовой форме тест предполагает, что в тестируемом распределении нет параметров, подлежащих оценке, и в этом случае тест и его набор критических значений не зависят от распределения. Однако тест чаще всего используется в контексте, когда тестируется семейство распределений, и в этом случае необходимо оценить параметры этого семейства и принять это во внимание при корректировке либо тестовой статистики, либо ее критических значений. Применительно к проверке того, адекватно ли нормальное распределение описывает набор данных, оно является одним из наиболее мощных статистических инструментов для обнаружения большинства отклонений от нормальности . [ 1 ] [ 2 ] с K Критерии Андерсона-Дарлинга -выборкой доступны для проверки того, можно ли смоделировать несколько наборов наблюдений как исходящие из одной совокупности, где функцию распределения не требуется указывать .

Помимо использования в качестве теста соответствия распределений, его можно использовать при оценке параметров в качестве основы для процедуры оценки минимального расстояния .

Тест назван в честь Теодора Уилбура Андерсона (1918–2016) и Дональда А. Дарлинга (1915–2014), которые изобрели его в 1952 году. [ 3 ]

Одновыборочный тест

[ редактировать ]

Статистики Андерсона–Дарлинга и Крамера–фон Мизеса относятся к классу квадратичная статистика EDF (тесты на основе эмпирической функции распределения ). [ 2 ] Если предполагаемое распределение , а эмпирическая (выборочная) кумулятивная функция распределения равна , то квадратичная статистика EDF измеряет расстояние между и к

где - количество элементов в выборке, а является весовой функцией. Когда весовая функция , статистика – статистика Крамера–фон Мизеса . Тест Андерсона-Дарлинга (1954) [ 4 ] зависит от расстояния

который получается, когда весовая функция равна . Таким образом, по сравнению с расстоянием Крамера – фон Мизеса , расстояние Андерсона – Дарлинга придает больший вес наблюдениям в хвостах распределения.

Базовая статистика теста

[ редактировать ]

Тест Андерсона-Дарлинга оценивает, происходит ли выборка из указанного распределения. Он использует тот факт, что при наличии гипотетического основного распределения и предположении, что данные действительно возникают из этого распределения, можно предположить, что кумулятивная функция распределения (CDF) данных следует равномерному распределению . Затем данные можно проверить на единообразие с помощью дистанционного теста (Шапиро, 1980). Формула тестовой статистики чтобы оценить, есть ли данные (обратите внимание, что данные должны быть приведены в порядок) поступает из CDF является

где

Затем статистику теста можно сравнить с критическими значениями теоретического распределения. В этом случае никакие параметры не оцениваются по отношению к кумулятивной функции распределения .

Тесты для семейств дистрибутивов

[ редактировать ]

По сути, одна и та же тестовая статистика может использоваться при проверке соответствия семейства распределений, но затем ее необходимо сравнить с критическими значениями, соответствующими этому семейству теоретических распределений и зависящими также от метода, используемого для оценки параметров.

Тест на нормальность

[ редактировать ]

Эмпирическое тестирование выявило [ 5 ] что тест Андерсона-Дарлинга не так хорош, как тест Шапиро-Уилка , но лучше, чем другие тесты. Стивенс [ 1 ] найденный быть одной из лучших статистических данных эмпирической функции распределения для обнаружения большинства отклонений от нормальности.

Вычисления различаются в зависимости от того, что известно о распределении: [ 6 ]

  • Случай 0: Среднее значение и дисперсия оба известны.
  • Случай 1: Дисперсия известно, но среднее значение неизвестно.
  • Случай 2: Среднее значение известно, но дисперсия неизвестно.
  • Случай 3: Оба средних значения и дисперсия неизвестны.

наблюдений n , , для , переменной необходимо отсортировать так, чтобы и обозначения в дальнейшем предполагают, что X i представляет упорядоченные наблюдения. Позволять

Ценности стандартизированы для создания новых ценностей , заданный

Со стандартным нормальным CDF , рассчитывается с использованием

Альтернативное выражение, в котором на каждом этапе суммирования учитывается только одно наблюдение:

Модифицированную статистику можно рассчитать с помощью

Если или превышает заданное критическое значение, то гипотеза нормальности отклоняется с некоторый уровень значимости. Критические значения приведены в таблице ниже для значений . [ 1 ] [ 7 ]

Примечание 1: Если = 0 или любой (0 или 1) тогда не может быть вычислен и не определен.

Примечание 2: Приведенная выше формула корректировки взята из книги Shorack & Wellner (1986, стр. 239). При сравнении различных источников требуется осторожность, поскольку зачастую конкретная формула корректировки не указывается.

Примечание 3: Стивенс [ 1 ] отмечает, что тест становится лучше, когда параметры вычисляются на основе данных, даже если они известны.

Примечание 4: Марсалья и Марсалья. [ 7 ] предоставьте более точный результат для случая 0 на уровне 85% и 99%.

Случай н 15% 10% 5% 2.5% 1%
0 ≥ 5 1.621 1.933 2.492 3.070 3.878
1 0.908 1.105 1.304 1.573
2 ≥ 5 1.760 2.323 2.904 3.690
3 10 0.514 0.578 0.683 0.779 0.926
20 0.528 0.591 0.704 0.815 0.969
50 0.546 0.616 0.735 0.861 1.021
100 0.559 0.631 0.754 0.884 1.047
0.576 0.656 0.787 0.918 1.092

Альтернативно, для случая 3, приведенного выше (как среднее значение, так и дисперсия неизвестны), Д'Агостино (1986) [ 6 ] в таблице 4.7 на с. 123 и на страницах 372–373 приводится скорректированная статистика:

и нормальность отвергается, если превышает 0,631, 0,754, 0,884, 1,047 или 1,159 на уровнях значимости 10%, 5%, 2,5%, 1% и 0,5% соответственно; процедура действительна для размера выборки не менее n=8. Формулы расчета p -значений для других значений приведены в таблице 4.9 на с. 127 в той же книге.

Тесты для других дистрибутивов

[ редактировать ]

Выше предполагалось, что переменная тестировался на нормальное распределение. Можно протестировать любое другое семейство распределений, но тест для каждого семейства реализуется с использованием различных модификаций базовой тестовой статистики, и это относится к критическим значениям, специфичным для этого семейства распределений. Модификации статистики и таблиц критических значений даны Стивенсом (1986). [ 2 ] для экспоненциального распределения, распределения экстремальных значений, распределения Вейбулла, гамма-распределения, логистического распределения, распределения Коши и фон Мизеса. Тесты на (двухпараметрическое) логарифмически нормальное распределение можно реализовать путем преобразования данных с помощью логарифма и использования приведенного выше теста на нормальность. Подробности необходимых модификаций тестовой статистики и критических значений для нормального и экспоненциального распределения были опубликованы Пирсоном и Хартли (1972, таблица 54). Подробности об этих распределениях, с добавлением распределения Гамбеля , также даны Шораком и Веллнером (1986, стр. 239). Подробности логистического распределения даны Стивенсом (1979). Тест для распределения Вейбулла (с двумя параметрами) можно получить, воспользовавшись тем фактом, что логарифм переменной Вейбулла имеет распределение Гамбеля .

Непараметрические k -выборки тесты

[ редактировать ]

Фриц Шольц и Майкл А. Стивенс (1987) обсуждают тест, основанный на мере согласия Андерсона-Дарлинга между распределениями, для определения того, могло ли несколько случайных выборок с возможно разными размерами выборки возникнуть из одного и того же распределения, где это распределение не указано. [ 8 ] Пакет R kSamples и Python пакет Scipy реализуют этот ранговый тест для сравнения k выборок среди нескольких других подобных ранговых тестов. [ 9 ] [ 10 ]

Для выборок, статистику можно вычислить следующим образом в предположении, что функция распределения из -я выборка является непрерывной

где

  • количество наблюдений в -й образец
  • общее количество наблюдений во всех выборках
  • это объединенная упорядоченная выборка
  • количество наблюдений в -ая выборка, не превышающая . [ 8 ]

См. также

[ редактировать ]
  1. ^ Jump up to: а б с д Стивенс, Массачусетс (1974). «Статистика EDF по точности соответствия и некоторые сравнения». Журнал Американской статистической ассоциации . 69 (347): 730–737. дои : 10.2307/2286009 . JSTOR   2286009 .
  2. ^ Jump up to: а б с М. А. Стивенс (1986). «Тесты на основе статистики EDF». В Д'Агостино, РБ; Стивенс, Массачусетс (ред.). Методы согласия . Нью-Йорк: Марсель Деккер. ISBN  0-8247-7487-6 .
  3. ^ Андерсон, ТВ ; Дарлинг, Д.А. (1952). «Асимптотическая теория некоторых критериев согласия», основанная на случайных процессах» . Анналы математической статистики . 23 (2): 193–212. дои : 10.1214/aoms/1177729437 .
  4. ^ Андерсон, ТВ; Дарлинг, Д.А. (1954). «Проверка пригодности». Журнал Американской статистической ассоциации . 49 (268): 765–769. дои : 10.2307/2281537 . JSTOR   2281537 .
  5. ^ Разали, Норнадия; Вау, Яп Би (2011). «Сравнение мощности тестов Шапиро-Уилка, Колмогорова-Смирнова, Лиллифорса и Андерсона-Дарлинга». Журнал статистического моделирования и аналитики . 2 (1): 21–33.
  6. ^ Jump up to: а б Ральф Б. Д'Агостино (1986). «Тесты нормального распределения». В Д'Агостино, РБ; Стивенс, Массачусетс (ред.). Методы согласия . Нью-Йорк: Марсель Деккер. ISBN  0-8247-7487-6 .
  7. ^ Jump up to: а б Марсалья, Г. (2004). «Оценка распределения Андерсона-Дарлинга» . Журнал статистического программного обеспечения . 9 (2): 730–737. CiteSeerX   10.1.1.686.1363 . дои : 10.18637/jss.v009.i02 .
  8. ^ Jump up to: а б Шольц, ФРВ; Стивенс, Массачусетс (1987). «К-образец Тесты Андерсона – Дарлинга». Журнал Американской статистической ассоциации . 82 (399): 918–924. дои : 10.1080/01621459.1987.10478517 .
  9. ^ «kSamples: ранговые тесты K-выборки и их комбинации» . Р-проект .
  10. ^ «Тест Андерсона-Дарлинга для k-выборок. Пакет Scipy» .

Дальнейшее чтение

[ редактировать ]
  • Кордер, Г.В., Форман, Д.И. (2009). Непараметрическая статистика для нестатистиков: пошаговый подход Wiley, ISBN   978-0-470-45461-9
  • Мехта, С. (2014) Темы статистики ISBN   978-1499273533
  • Пирсон Э.С., Хартли, Х.О. (редакторы) (1972) Таблицы биометрики для статистиков , Том II. ЧАШКА. ISBN   0-521-06937-8 .
  • Шапиро, СС (1980) Как проверить нормальность и другие предположения о распределении. В: Основные ссылки ASQC по контролю качества: статистические методы 3, стр. 1–78.
  • Шорак, Г. Р. , Веллнер, Дж. А. (1986) Эмпирические процессы с применением к статистике , Уайли. ISBN   0-471-86725-X .
  • Стивенс, Массачусетс (1979) Критерий соответствия логистическому распределению на основе эмпирической функции распределения , Биометрика, 66(3), 591–5.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f65805936352be633282ac8b8a03ed85__1708805040
URL1:https://arc.ask3.ru/arc/aa/f6/85/f65805936352be633282ac8b8a03ed85.html
Заголовок, (Title) документа по адресу, URL1:
Anderson–Darling test - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)