Jump to content

лесной тест

(Перенаправлено из статистики Уолда )

В статистике тест Вальда (названный в честь Абрахама Вальда ) оценивает ограничения на статистические параметры на основе взвешенного расстояния между неограниченной оценкой и ее предполагаемым значением при нулевой гипотезе , где вес — это точность оценки. [1] [2] Интуитивно понятно, что чем больше это взвешенное расстояние, тем менее вероятно, что ограничение истинно. Хотя конечные выборочные распределения тестов Вальда обычно неизвестны, [3] : 138  оно имеет асимптотику χ 2 -распределение при нулевой гипотезе — факт, который можно использовать для определения статистической значимости . [4]

Вместе с тестом множителя Лагранжа и тестом отношения правдоподобия тест Вальда является одним из трех классических подходов к проверке гипотез . Преимущество теста Вальда перед двумя другими заключается в том, что он требует только оценки неограниченной модели, что снижает вычислительную нагрузку по сравнению с тестом отношения правдоподобия. Однако основным недостатком является то, что (в конечных выборках) он не инвариантен к изменениям представления нулевой гипотезы; другими словами, алгебраически эквивалентные выражения ограничения нелинейных параметров могут приводить к различным значениям тестовой статистики. [5] [6] Это потому, что статистика Вальда получена из разложения Тейлора : [7] а разные способы записи эквивалентных нелинейных выражений приводят к нетривиальным различиям в соответствующих коэффициентах Тейлора. [8] Другая аберрация, известная как эффект Хаука-Доннера, [9] может произойти в биномиальных моделях, когда оцениваемый (неограниченный) параметр близок к границе пространства параметров - например, подобранная вероятность чрезвычайно близка к нулю или единице - что приводит к тому, что критерий Вальда больше не увеличивается монотонно на расстоянии между неограниченный и ограниченный параметр. [10] [11]

Математические детали

[ редактировать ]

По критерию Вальда оценка который был найден, когда максимизирующий аргумент неограниченной функции правдоподобия сравнивается с гипотетическим значением . В частности, квадрат разности взвешивается по кривизне логарифмической функции правдоподобия.

Тестирование по одному параметру

[ редактировать ]

Если гипотеза включает ограничение только с одним параметром, то статистика Вальда принимает следующий вид:

которое при нулевой гипотезе следует асимптотике χ 2 -распределение с одной степенью свободы. Квадратный корень из статистики Вальда с одним ограничением можно понимать как (псевдо) t -отношение , которое, однако, на самом деле не является t -распределенным, за исключением особого случая линейной регрессии с нормально распределенными ошибками. [12] В общем, это соответствует асимптотическому z распределению . [13]

где стандартная ошибка (SE) оценки максимального правдоподобия (MLE), квадратный корень дисперсии. Существует несколько способов последовательной оценки матрицы дисперсии , которая в конечных выборках приводит к альтернативным оценкам стандартных ошибок и соответствующей тестовой статистики и p -значений . [3] : 129  Достоверность получения асимптотически нормального распределения после добавления модуля MLE оценки в ЮЭ опирается на теорему Слуцкого .

Тест(ы) по нескольким параметрам

[ редактировать ]

Тест Вальда можно использовать для проверки одной гипотезы по нескольким параметрам, а также для совместной проверки нескольких гипотез по одному/множеству параметров. Позволять быть нашей выборочной оценкой параметров P (т. е. это вектор), который должен асимптотически следовать нормальному распределению с ковариационной матрицей   V , .Проверка Q -гипотез по параметрам P выражается через матрица Р :

Распределение тестовой статистики при нулевой гипотезе равно

что, в свою очередь, подразумевает

где является оценкой ковариационной матрицы. [14]

Доказательство

Нелинейная гипотеза

[ редактировать ]

которые могут быть представлены одной матрицей R. В стандартной форме тест Вальда используется для проверки линейных гипотез , Если кто-то желает проверить нелинейную гипотезу вида:

Статистика теста становится:

где является производной c, оцененной в средстве выборочной оценки. Этот результат получен с помощью дельта-метода , который использует аппроксимацию дисперсии первого порядка.

Неинвариантность к повторным параметризациям

[ редактировать ]

Тот факт, что используется аппроксимация дисперсии, имеет тот недостаток, что статистика Вальда не инвариантна к нелинейному преобразованию/перепараметризации гипотезы: она может давать разные ответы на один и тот же вопрос, в зависимости от того, как сформулирован вопрос. . [15] [5] Например, вопрос о том, R = 1, — это то же самое, что вопрос о том, log R = 0; но статистика Вальда для R = 1 не совпадает со статистикой Вальда для log R = 0 (поскольку, как правило, нет четкой зависимости между стандартными ошибками R и log R , поэтому ее необходимо аппроксимировать). [16]

Альтернативы тесту Вальда

[ редактировать ]

Существует несколько альтернатив критерию Вальда, а именно тест отношения правдоподобия и тест множителя Лагранжа (также известный как критерий оценки). Роберт Ф. Энгл показал, что эти три теста: тест Вальда, тест отношения правдоподобия и тест множителя Лагранжа эквивалентны асимптотически . [17] Хотя они асимптотически эквивалентны, в конечных выборках они могут расходиться настолько, что приводят к разным выводам.

Есть несколько причин предпочесть тест отношения правдоподобия или множитель Лагранжа критерию Вальда: [18] [19] [20]

  • Неинвариантность: Как утверждалось выше, тест Вальда не инвариантен при перепараметризации, в то время как тесты отношения правдоподобия дадут точно такой же ответ, независимо от того, работаем ли мы с R , log R или любым другим монотонным преобразованием R . [5]
  • Другая причина заключается в том, что тест Вальда использует две аппроксимации (мы знаем стандартную ошибку или информацию Фишера и оценку максимального правдоподобия), тогда как тест отношения правдоподобия зависит только от соотношения функций правдоподобия при нулевой гипотезе и альтернативной гипотезе.
  • Тест Вальда требует оценки с использованием максимизирующего аргумента, что соответствует «полной» модели. В некоторых случаях модель проще при нулевой гипотезе, поэтому можно предпочесть использовать тест оценки (также называемый тестом множителя Лагранжа), который имеет то преимущество, что его можно сформулировать в ситуациях, когда изменчивость максимизирующего элемента велика. трудно оценить или вычислить оценку в соответствии с оценщиком максимального правдоподобия сложно; например, тест Кокрана-Мантела-Хэнзеля является оценочным тестом. [21]

См. также

[ редактировать ]
  1. ^ Фармейр, Людвиг; Кнейб, Томас; Ланг, Стефан; Маркс, Брайан (2013). Регрессия: модели, методы и приложения . Берлин: Шпрингер. п. 663. ИСБН  978-3-642-34332-2 .
  2. ^ Уорд, Майкл Д .; Алквист, Джон С. (2018). Максимальное правдоподобие для социальных наук: стратегии анализа . Издательство Кембриджского университета . п. 36. ISBN  978-1-316-63682-4 .
  3. ^ Jump up to: а б Мартин, Вэнс; Херн, Стэн; Харрис, Дэвид (2013). Эконометрическое моделирование с использованием временных рядов: спецификация, оценка и тестирование . Издательство Кембриджского университета. ISBN  978-0-521-13981-6 .
  4. ^ Дэвидсон, Рассел; Маккиннон, Джеймс Г. (1993). «Метод максимального правдоподобия: основные понятия и обозначения». Оценка и вывод в эконометрике . Нью-Йорк: Издательство Оксфордского университета. п. 89. ИСБН  0-19-506011-3 .
  5. ^ Jump up to: а б с Грегори, Аллан В.; Велл, Майкл Р. (1985). «Формулирование критериев Вальда нелинейных ограничений» . Эконометрика . 53 (6): 1465–1468. дои : 10.2307/1913221 . JSTOR   1913221 .
  6. ^ Филлипс, печатная плата ; Пак, Джун Ю. (1988). «О формулировке критериев нелинейных ограничений Вальда» (PDF) . Эконометрика . 56 (5): 1065–1083. дои : 10.2307/1911359 . JSTOR   1911359 .
  7. ^ Хаяси, Фумио (2000). Эконометрика . Принстон: Издательство Принстонского университета. стр. 489–491. ISBN  1-4008-2383-8 . ,
  8. ^ Лафонтен, Франсин; Уайт, Кеннет Дж. (1986). «Получение любой статистики Уолда, которую вы хотите». Письма по экономике . 21 (1): 35–40. дои : 10.1016/0165-1765(86)90117-5 .
  9. ^ Хаук, Уолтер В. младший; Доннер, Аллан (1977). «Тест Вальда применительно к гипотезам в логит-анализе». Журнал Американской статистической ассоциации . 72 (360а): 851–853. дои : 10.1080/01621459.1977.10479969 .
  10. ^ Кинг, Максвелл Л.; Го, Ким-Ленг (2002). «Усовершенствования теста Вальда» . Справочник по прикладной эконометрике и статистическим выводам . Нью-Йорк: Марсель Деккер. стр. 251–276. ISBN  0-8247-0652-8 .
  11. ^ Да, Томас Уильям (2022). «Об эффекте Хаука-Доннера в тестах Вальда: обнаружение, переломные моменты и характеристика пространства параметров». Журнал Американской статистической ассоциации . 117 (540): 1763–1774. arXiv : 2001.08431 . дои : 10.1080/01621459.2021.1886936 .
  12. ^ Кэмерон, А. Колин ; Триведи, Правин К. (2005). Микроэконометрика: Методы и приложения . Нью-Йорк: Издательство Кембриджского университета. п. 137. ИСБН  0-521-84805-9 .
  13. ^ Дэвидсон, Рассел; Маккиннон, Джеймс Г. (1993). «Метод максимального правдоподобия: основные понятия и обозначения». Оценка и вывод в эконометрике . Нью-Йорк: Издательство Оксфордского университета. п. 89. ИСБН  0-19-506011-3 .
  14. ^ Харрелл, Фрэнк Э. младший (2001). «Раздел 9.3.1». Стратегии регрессионного моделирования . Нью-Йорк: Springer-Verlag. ISBN  0387952322 .
  15. ^ Страхи, Томас Р.; Бенишу, Жак; Гейл, Митчелл Х. (1996). «Напоминание об ошибочности статистики Вальда». Американский статистик . 50 (3): 226–227. дои : 10.1080/00031305.1996.10474384 .
  16. ^ Кричли, Фрэнк; Марриотт, Пол; Лосось, Марк (1996). «О дифференциальной геометрии теста Вальда с нелинейными ограничениями». Эконометрика . 64 (5): 1213–1222. дои : 10.2307/2171963 . hdl : 1814/524 . JSTOR   2171963 .
  17. ^ Энгл, Роберт Ф. (1983). «Вальд, отношение правдоподобия и тесты множителей Лагранжа в эконометрике». В Интрилигаторе, доктор медицины; Грилихес, З. (ред.). Справочник по эконометрике . Том. II. Эльзевир. стр. 796–801. ISBN  978-0-444-86185-6 .
  18. ^ Харрелл, Фрэнк Э. младший (2001). «Раздел 9.3.3». Стратегии регрессионного моделирования . Нью-Йорк: Springer-Verlag. ISBN  0387952322 .
  19. ^ Коллетт, Дэвид (1994). Моделирование данных о выживаемости в медицинских исследованиях . Лондон: Чепмен и Холл. ISBN  0412448807 .
  20. ^ Павитан, Юди (2001). По всей вероятности . Нью-Йорк: Издательство Оксфордского университета. ISBN  0198507658 .
  21. ^ Агрести, Алан (2002). Категориальный анализ данных (2-е изд.). Уайли. п. 232 . ISBN  0471360937 .

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2dbeb72272df267d1cc4254b705870f9__1711138380
URL1:https://arc.ask3.ru/arc/aa/2d/f9/2dbeb72272df267d1cc4254b705870f9.html
Заголовок, (Title) документа по адресу, URL1:
Wald test - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)