тест Вальда
В статистике тест Вальда (названный в честь Абрахама Вальда ) оценивает ограничения статистических параметров на основе взвешенного расстояния между неограниченной оценкой и ее предполагаемым значением при нулевой гипотезе , где вес — это точность оценки. [1] [2] Интуитивно понятно, что чем больше это взвешенное расстояние, тем менее вероятно, что ограничение истинно. Хотя конечные выборочные распределения тестов Вальда обычно неизвестны, [3] : 138 оно имеет асимптотику χ 2 -распределение при нулевой гипотезе — факт, который можно использовать для определения статистической значимости . [4]
Вместе с тестом множителя Лагранжа и тестом отношения правдоподобия тест Вальда является одним из трех классических подходов к проверке гипотез . Преимущество теста Вальда перед двумя другими состоит в том, что он требует только оценки неограниченной модели, что снижает вычислительную нагрузку по сравнению с тестом отношения правдоподобия. Однако основным недостатком является то, что (в конечных выборках) он не инвариантен к изменениям представления нулевой гипотезы; другими словами, алгебраически эквивалентные выражения ограничения нелинейных параметров могут привести к различным значениям тестовой статистики. [5] [6] Это потому, что статистика Вальда получена из разложения Тейлора : [7] а разные способы записи эквивалентных нелинейных выражений приводят к нетривиальным различиям в соответствующих коэффициентах Тейлора. [8] Другая аберрация, известная как эффект Хаука-Доннера, [9] может произойти в биномиальных моделях , когда оцениваемый (неограниченный) параметр близок к границе - пространства параметров например, подобранная вероятность чрезвычайно близка к нулю или единице - что приводит к тому, что критерий Вальда больше не увеличивается монотонно на расстоянии между неограниченный и ограниченный параметр. [10] [11]
Математические детали [ править ]
По критерию Вальда оценка который был найден, когда максимизирующий аргумент неограниченной функции правдоподобия сравнивается с гипотетическим значением . В частности, квадрат разности взвешивается по кривизне логарифмической функции правдоподобия.
Тестирование по одному параметру [ править ]
Если гипотеза включает ограничение только с одним параметром, то статистика Вальда принимает следующий вид:
которое при нулевой гипотезе следует асимптотике χ 2 -распределение с одной степенью свободы. Квадратный корень из статистики Вальда с одним ограничением можно понимать как (псевдо) t -отношение , которое, однако, на самом деле не является t -распределенным, за исключением особого случая линейной регрессии с нормально распределенными ошибками. [12] В общем, это соответствует асимптотическому z распределению . [13]
где — стандартная ошибка (SE) оценки максимального правдоподобия (MLE), квадратный корень дисперсии. Существует несколько способов последовательной оценки , матрицы дисперсии которая в конечных выборках приводит к альтернативным оценкам стандартных ошибок и соответствующей тестовой статистики и p -значений . [3] : 129 Достоверность получения асимптотически нормального распределения после добавления модуля MLE оценки в ЮЭ опирается на теорему Слуцкого .
Тест(ы) по нескольким параметрам [ править ]
Тест Вальда можно использовать для проверки одной гипотезы по нескольким параметрам, а также для совместной проверки нескольких гипотез по одному/множеству параметров. Позволять быть нашей выборочной оценкой параметров P (т. е. это вектор), который должен асимптотически следовать нормальному распределению с ковариационной матрицей V , . Проверка Q - гипотез по параметрам P выражается через матрица Р :
Распределение тестовой статистики при нулевой гипотезе равно
что, в свою очередь, подразумевает
где является оценкой ковариационной матрицы. [14]
Нелинейная гипотеза
В стандартной форме тест Вальда используется для проверки линейных гипотез, которые могут быть представлены одной R. матрицей Если кто-то желает проверить нелинейную гипотезу вида:
Статистика теста становится:
где является производной c, оцененной в средстве выборочной оценки. Этот результат получен с помощью дельта-метода , который использует аппроксимацию дисперсии первого порядка.
Неинвариантность к повторной параметризации [ править ]
Тот факт, что используется аппроксимация дисперсии, имеет тот недостаток, что статистика Вальда не инвариантна к нелинейному преобразованию/перепараметризации гипотезы: она может давать разные ответы на один и тот же вопрос, в зависимости от того, как сформулирован вопрос. . [15] [5] Например, вопрос о том, является ли R = 1, — это то же самое, что вопрос о том, является ли log R = 0; но статистика Вальда для R = 1 не совпадает со статистикой Вальда для log R = 0 (поскольку, как правило, нет четкой зависимости между стандартными ошибками R и log R , поэтому ее необходимо аппроксимировать). [16]
Вальда Альтернативы тесту
Существует несколько альтернатив критерию Вальда, а именно тест отношения правдоподобия и тест множителя Лагранжа (также известный как критерий оценки). Роберт Ф. Энгл показал, что эти три теста: тест Вальда, тест отношения правдоподобия и тест множителя Лагранжа эквивалентны асимптотически . [17] Хотя они асимптотически эквивалентны, в конечных выборках они могут расходиться настолько, что приводят к разным выводам.
Есть несколько причин предпочесть тест отношения правдоподобия или множитель Лагранжа критерию Вальда: [18] [19] [20]
- Неинвариантность: Как утверждалось выше, тест Вальда не инвариантен при перепараметризации, в то время как тесты отношения правдоподобия дадут точно такой же ответ, независимо от того, работаем ли мы с R , log R или любым другим монотонным преобразованием R . [5]
- Другая причина заключается в том, что тест Вальда использует две аппроксимации (мы знаем стандартную ошибку или информацию Фишера и оценку максимального правдоподобия), тогда как тест отношения правдоподобия зависит только от соотношения функций правдоподобия при нулевой гипотезе и альтернативной гипотезе.
- Тест Вальда требует оценки с использованием максимизирующего аргумента, что соответствует «полной» модели. В некоторых случаях модель проще при нулевой гипотезе, поэтому можно предпочесть использовать тест оценки (также называемый тестом множителя Лагранжа), который имеет то преимущество, что его можно сформулировать в ситуациях, когда изменчивость максимизирующего элемента велика. трудно оценить или вычислить оценку в соответствии с оценщиком максимального правдоподобия сложно; например, тест Кокрана-Мантела-Хэнзеля является оценочным тестом. [21]
См. также [ править ]
- Чау-тест
- Последовательный тест отношения вероятностей
- Тест Суп-Вальда
- Стьюдента t -тест
- Уэлча t -критерий
Ссылки [ править ]
- ^ Фармейр, Людвиг; Кнейб, Томас; Ланг, Стефан; Маркс, Брайан (2013). Регрессия: модели, методы и приложения . Берлин: Шпрингер. п. 663. ИСБН 978-3-642-34332-2 .
- ^ Уорд, Майкл Д .; Алквист, Джон С. (2018). Максимальное правдоподобие для социальных наук: стратегии анализа . Издательство Кембриджского университета . п. 36. ISBN 978-1-316-63682-4 .
- ^ Перейти обратно: а б Мартин, Вэнс; Херн, Стэн; Харрис, Дэвид (2013). Эконометрическое моделирование с использованием временных рядов: спецификация, оценка и тестирование . Издательство Кембриджского университета. ISBN 978-0-521-13981-6 .
- ^ Дэвидсон, Рассел; Маккиннон, Джеймс Г. (1993). «Метод максимального правдоподобия: основные понятия и обозначения». Оценка и вывод в эконометрике . Нью-Йорк: Издательство Оксфордского университета. п. 89. ИСБН 0-19-506011-3 .
- ^ Перейти обратно: а б с Грегори, Аллан В.; Велл, Майкл Р. (1985). «Формулирование критериев Вальда нелинейных ограничений» . Эконометрика . 53 (6): 1465–1468. дои : 10.2307/1913221 . JSTOR 1913221 .
- ^ Филлипс, печатная плата ; Пак, Джун Ю. (1988). «О формулировке критериев нелинейных ограничений Вальда» (PDF) . Эконометрика . 56 (5): 1065–1083. дои : 10.2307/1911359 . JSTOR 1911359 .
- ^ Хаяси, Фумио (2000). Эконометрика . Принстон: Издательство Принстонского университета. стр. 489–491. ISBN 1-4008-2383-8 . ,
- ^ Лафонтен, Франсин; Уайт, Кеннет Дж. (1986). «Получение любой статистики Уолда, которую вы хотите». Письма по экономике . 21 (1): 35–40. дои : 10.1016/0165-1765(86)90117-5 .
- ^ Хаук, Уолтер В. младший; Доннер, Аллан (1977). «Тест Вальда применительно к гипотезам в логит-анализе». Журнал Американской статистической ассоциации . 72 (360а): 851–853. дои : 10.1080/01621459.1977.10479969 .
- ^ Кинг, Максвелл Л.; Го, Ким-Ленг (2002). «Усовершенствования теста Вальда» . Справочник по прикладной эконометрике и статистическим выводам . Нью-Йорк: Марсель Деккер. стр. 251–276. ISBN 0-8247-0652-8 .
- ^ Да, Томас Уильям (2022). «Об эффекте Хаука-Доннера в тестах Вальда: обнаружение, переломные моменты и характеристика пространства параметров». Журнал Американской статистической ассоциации . 117 (540): 1763–1774. arXiv : 2001.08431 . дои : 10.1080/01621459.2021.1886936 .
- ^ Кэмерон, А. Колин ; Триведи, Правин К. (2005). Микроэконометрика: Методы и приложения . Нью-Йорк: Издательство Кембриджского университета. п. 137. ИСБН 0-521-84805-9 .
- ^ Дэвидсон, Рассел; Маккиннон, Джеймс Г. (1993). «Метод максимального правдоподобия: основные понятия и обозначения». Оценка и вывод в эконометрике . Нью-Йорк: Издательство Оксфордского университета. п. 89. ИСБН 0-19-506011-3 .
- ^ Харрелл, Фрэнк Э. младший (2001). «Раздел 9.3.1». Стратегии регрессионного моделирования . Нью-Йорк: Springer-Verlag. ISBN 0387952322 .
- ^ Страхи, Томас Р.; Бенишу, Жак; Гейл, Митчелл Х. (1996). «Напоминание об ошибочности статистики Вальда». Американский статистик . 50 (3): 226–227. дои : 10.1080/00031305.1996.10474384 .
- ^ Кричли, Фрэнк; Марриотт, Пол; Лосось, Марк (1996). «О дифференциальной геометрии теста Вальда с нелинейными ограничениями». Эконометрика . 64 (5): 1213–1222. дои : 10.2307/2171963 . hdl : 1814/524 . JSTOR 2171963 .
- ^ Энгл, Роберт Ф. (1983). «Вальд, отношение правдоподобия и тесты множителей Лагранжа в эконометрике». В Интрилигаторе, доктор медицины; Грилихес, З. (ред.). Справочник по эконометрике . Том. II. Эльзевир. стр. 796–801. ISBN 978-0-444-86185-6 .
- ^ Харрелл, Фрэнк Э. младший (2001). «Раздел 9.3.3». Стратегии регрессионного моделирования . Нью-Йорк: Springer-Verlag. ISBN 0387952322 .
- ^ Коллетт, Дэвид (1994). Моделирование данных о выживаемости в медицинских исследованиях . Лондон: Чепмен и Холл. ISBN 0412448807 .
- ^ Павитан, Юди (2001). По всей вероятности . Нью-Йорк: Издательство Оксфордского университета. ISBN 0198507658 .
- ^ Агрести, Алан (2002). Категориальный анализ данных (2-е изд.). Уайли. п. 232 . ISBN 0471360937 .
Дальнейшее чтение [ править ]
- Грин, Уильям Х. (2012). Эконометрический анализ (Седьмое международное изд.). Бостон: Пирсон. стр. 155–161 . ISBN 978-0-273-75356-8 .
- Кмента, Ян (1986). Элементы эконометрики (второе изд.). Нью-Йорк: Макмиллан. стр. 492–493 . ISBN 0-02-365070-2 .
- Томас, Р.Л. (1993). Вводная эконометрика: теория и применение (второе изд.). Лондон: Лонгман. стр. 73–77. ISBN 0-582-07378-2 .