тест Вальда

В статистике тест Вальда (названный в честь Абрахама Вальда ) оценивает ограничения статистических параметров на основе взвешенного расстояния между неограниченной оценкой и ее предполагаемым значением при нулевой гипотезе , где вес — это точность оценки. ^[1]^[2]Интуитивно понятно, что чем больше это взвешенное расстояние, тем менее вероятно, что ограничение истинно. Хотя конечные выборочные распределения тестов Вальда обычно неизвестны, ^[3]^: 138 оно имеет асимптотику χ ²-распределение при нулевой гипотезе — факт, который можно использовать для определения статистической значимости . ^[4]

Вместе с тестом множителя Лагранжа и тестом отношения правдоподобия тест Вальда является одним из трех классических подходов к проверке гипотез . Преимущество теста Вальда перед двумя другими состоит в том, что он требует только оценки неограниченной модели, что снижает вычислительную нагрузку по сравнению с тестом отношения правдоподобия. Однако основным недостатком является то, что (в конечных выборках) он не инвариантен к изменениям представления нулевой гипотезы; другими словами, алгебраически эквивалентные выражения ограничения нелинейных параметров могут привести к различным значениям тестовой статистики. ^[5]^[6] Это потому, что статистика Вальда получена из разложения Тейлора : ^[7] а разные способы записи эквивалентных нелинейных выражений приводят к нетривиальным различиям в соответствующих коэффициентах Тейлора. ^[8] Другая аберрация, известная как эффект Хаука-Доннера, ^[9] может произойти в биномиальных моделях , когда оцениваемый (неограниченный) параметр близок к границе - пространства параметров например, подобранная вероятность чрезвычайно близка к нулю или единице - что приводит к тому, что критерий Вальда больше не увеличивается монотонно на расстоянии между неограниченный и ограниченный параметр. ^[10]^[11]

Математические детали [ править ]

По критерию Вальда оценка ${\hat {\theta }}$ который был найден, когда максимизирующий аргумент неограниченной функции правдоподобия сравнивается с гипотетическим значением $\theta _{0}$ . В частности, квадрат разности ${\hat {\theta }}-\theta _{0}$ взвешивается по кривизне логарифмической функции правдоподобия.

Тестирование по одному параметру [ править ]

Если гипотеза включает ограничение только с одним параметром, то статистика Вальда принимает следующий вид:

W={\frac {{({\widehat {\theta }}-\theta _{0})}^{2}}{\operatorname {var} ({\hat {\theta }})}}

которое при нулевой гипотезе следует асимптотике χ ²-распределение с одной степенью свободы. Квадратный корень из статистики Вальда с одним ограничением можно понимать как (псевдо) t -отношение , которое, однако, на самом деле не является t -распределенным, за исключением особого случая линейной регрессии с нормально распределенными ошибками. ^[12] В общем, это соответствует асимптотическому z распределению . ^[13]

{\sqrt {W}}={\frac {{\widehat {\theta }}-\theta _{0}}{\operatorname {se} ({\hat {\theta }})}}

где $\operatorname {se} ({\widehat {\theta }})$ — стандартная ошибка (SE) оценки максимального правдоподобия (MLE), квадратный корень дисперсии. Существует несколько способов последовательной оценки , матрицы дисперсии которая в конечных выборках приводит к альтернативным оценкам стандартных ошибок и соответствующей тестовой статистики и p -значений . ^[3]^: 129 Достоверность получения асимптотически нормального распределения после добавления модуля MLE оценки ${\hat {\theta }}$ в ЮЭ опирается на теорему Слуцкого .

Тест(ы) по нескольким параметрам [ править ]

Тест Вальда можно использовать для проверки одной гипотезы по нескольким параметрам, а также для совместной проверки нескольких гипотез по одному/множеству параметров. Позволять ${\hat {\theta }}_{n}$ быть нашей выборочной оценкой параметров P (т. е. ${\hat {\theta }}_{n}$ это $P\times 1$ вектор), который должен асимптотически следовать нормальному распределению с ковариационной матрицей V , ${\sqrt {n}}({\hat {\theta }}_{n}-\theta )\,\xrightarrow {\mathcal {D}} \,N(0,V)$ . Проверка Q - гипотез по параметрам P выражается через $Q\times P$ матрица Р :

H_{0}:R\theta =r

H_{1}:R\theta \neq r

Распределение тестовой статистики при нулевой гипотезе равно

(R{\hat {\theta }}_{n}-r)'[R({\hat {V}}_{n}/n)R']^{-1}(R{\hat {\theta }}_{n}-r)/Q\quad \xrightarrow {\mathcal {D}} \quad F(Q,n-P)\quad {\xrightarrow[{n\rightarrow \infty }]{\mathcal {D}}}\quad \chi _{Q}^{2}/Q,

что, в свою очередь, подразумевает

(R{\hat {\theta }}_{n}-r)'[R({\hat {V}}_{n}/n)R']^{-1}(R{\hat {\theta }}_{n}-r)\quad {\xrightarrow[{n\rightarrow \infty }]{\mathcal {D}}}\quad \chi _{Q}^{2},

где ${\hat {V}}_{n}$ является оценкой ковариационной матрицы. ^[14]

Доказательство

Suppose ${\sqrt {n}}({\hat {\theta }}_{n}-\theta )\,\xrightarrow {\mathcal {D}} \,N(0,V)$ . Then, by Slutsky's theorem and by the properties of the normal distribution, multiplying by R has distribution:

R{\sqrt {n}}({\hat {\theta }}_{n}-\theta )={\sqrt {n}}(R{\hat {\theta }}_{n}-r)\,\xrightarrow {\mathcal {D}} \,N(0,RVR')

Recalling that a quadratic form of normal distribution has a Chi-squared distribution:

{\sqrt {n}}(R{\hat {\theta }}_{n}-r)'[RVR']^{-1}{\sqrt {n}}(R{\hat {\theta }}_{n}-r)\,\xrightarrow {\mathcal {D}} \,\chi _{Q}^{2}

Rearranging n finally gives:

(R{\hat {\theta }}_{n}-r)'[R(V/n)R']^{-1}(R{\hat {\theta }}_{n}-r)\quad \xrightarrow {\mathcal {D}} \quad \chi _{Q}^{2}

What if the covariance matrix is not known a-priori and needs to be estimated from the data? If we have a consistent estimator ${\hat {V}}_{n}$ of $V$ such that $V^{-1}{\hat {V}}_{n}$ has a determinant that is distributed $\chi _{n-P}^{2}$ , then by the independence of the covariance estimator and equation above, we have:

(R{\hat {\theta }}_{n}-r)'[R({\hat {V}}_{n}/n)R']^{-1}(R{\hat {\theta }}_{n}-r)/Q\quad \xrightarrow {\mathcal {D}} \quad F(Q,n-P)

Нелинейная гипотеза

В стандартной форме тест Вальда используется для проверки линейных гипотез, которые могут быть представлены одной R. матрицей Если кто-то желает проверить нелинейную гипотезу вида:

H_{0}:c(\theta )=0

H_{1}:c(\theta )\neq 0

Статистика теста становится:

c\left({\hat {\theta }}_{n}\right)'\left[c'\left({\hat {\theta }}_{n}\right)\left({\hat {V}}_{n}/n\right)c'\left({\hat {\theta }}_{n}\right)'\right]^{-1}c\left({\hat {\theta }}_{n}\right)\quad {\xrightarrow {\mathcal {D}}}\quad \chi _{Q}^{2}

где $c'({\hat {\theta }}_{n})$ является производной c, оцененной в средстве выборочной оценки. Этот результат получен с помощью дельта-метода , который использует аппроксимацию дисперсии первого порядка.

Неинвариантность к повторной параметризации [ править ]

Тот факт, что используется аппроксимация дисперсии, имеет тот недостаток, что статистика Вальда не инвариантна к нелинейному преобразованию/перепараметризации гипотезы: она может давать разные ответы на один и тот же вопрос, в зависимости от того, как сформулирован вопрос. . ^[15]^[5]Например, вопрос о том, является ли R = 1, — это то же самое, что вопрос о том, является ли log R = 0; но статистика Вальда для R = 1 не совпадает со статистикой Вальда для log R = 0 (поскольку, как правило, нет четкой зависимости между стандартными ошибками R и log R , поэтому ее необходимо аппроксимировать). ^[16]

Вальда Альтернативы тесту

Существует несколько альтернатив критерию Вальда, а именно тест отношения правдоподобия и тест множителя Лагранжа (также известный как критерий оценки). Роберт Ф. Энгл показал, что эти три теста: тест Вальда, тест отношения правдоподобия и тест множителя Лагранжа эквивалентны асимптотически . ^[17] Хотя они асимптотически эквивалентны, в конечных выборках они могут расходиться настолько, что приводят к разным выводам.

Есть несколько причин предпочесть тест отношения правдоподобия или множитель Лагранжа критерию Вальда: ^[18]^[19]^[20]

Неинвариантность: Как утверждалось выше, тест Вальда не инвариантен при перепараметризации, в то время как тесты отношения правдоподобия дадут точно такой же ответ, независимо от того, работаем ли мы с R , log R или любым другим монотонным преобразованием R . ^[5]
Другая причина заключается в том, что тест Вальда использует две аппроксимации (мы знаем стандартную ошибку или информацию Фишера и оценку максимального правдоподобия), тогда как тест отношения правдоподобия зависит только от соотношения функций правдоподобия при нулевой гипотезе и альтернативной гипотезе.
Тест Вальда требует оценки с использованием максимизирующего аргумента, что соответствует «полной» модели. В некоторых случаях модель проще при нулевой гипотезе, поэтому можно предпочесть использовать тест оценки (также называемый тестом множителя Лагранжа), который имеет то преимущество, что его можно сформулировать в ситуациях, когда изменчивость максимизирующего элемента велика. трудно оценить или вычислить оценку в соответствии с оценщиком максимального правдоподобия сложно; например, тест Кокрана-Мантела-Хэнзеля является оценочным тестом. ^[21]

См. также [ править ]

Ссылки [ править ]

^ Фармейр, Людвиг; Кнейб, Томас; Ланг, Стефан; Маркс, Брайан (2013). Регрессия: модели, методы и приложения . Берлин: Шпрингер. п. 663. ИСБН 978-3-642-34332-2 .
^ Уорд, Майкл Д .; Алквист, Джон С. (2018). Максимальное правдоподобие для социальных наук: стратегии анализа . Издательство Кембриджского университета . п. 36. ISBN 978-1-316-63682-4 .
^ Перейти обратно: ^а ^б Мартин, Вэнс; Херн, Стэн; Харрис, Дэвид (2013). Эконометрическое моделирование с использованием временных рядов: спецификация, оценка и тестирование . Издательство Кембриджского университета. ISBN 978-0-521-13981-6 .
^ Дэвидсон, Рассел; Маккиннон, Джеймс Г. (1993). «Метод максимального правдоподобия: основные понятия и обозначения». Оценка и вывод в эконометрике . Нью-Йорк: Издательство Оксфордского университета. п. 89. ИСБН 0-19-506011-3 .
^ Перейти обратно: ^а ^б ^с Грегори, Аллан В.; Велл, Майкл Р. (1985). «Формулирование критериев Вальда нелинейных ограничений» . Эконометрика . 53 (6): 1465–1468. дои : 10.2307/1913221 . JSTOR 1913221 .
^ Филлипс, печатная плата ; Пак, Джун Ю. (1988). «О формулировке критериев нелинейных ограничений Вальда» (PDF) . Эконометрика . 56 (5): 1065–1083. дои : 10.2307/1911359 . JSTOR 1911359 .
^ Хаяси, Фумио (2000). Эконометрика . Принстон: Издательство Принстонского университета. стр. 489–491. ISBN 1-4008-2383-8 . ,
^ Лафонтен, Франсин; Уайт, Кеннет Дж. (1986). «Получение любой статистики Уолда, которую вы хотите». Письма по экономике . 21 (1): 35–40. дои : 10.1016/0165-1765(86)90117-5 .
^ Хаук, Уолтер В. младший; Доннер, Аллан (1977). «Тест Вальда применительно к гипотезам в логит-анализе». Журнал Американской статистической ассоциации . 72 (360а): 851–853. дои : 10.1080/01621459.1977.10479969 .
^ Кинг, Максвелл Л.; Го, Ким-Ленг (2002). «Усовершенствования теста Вальда» . Справочник по прикладной эконометрике и статистическим выводам . Нью-Йорк: Марсель Деккер. стр. 251–276. ISBN 0-8247-0652-8 .
^ Да, Томас Уильям (2022). «Об эффекте Хаука-Доннера в тестах Вальда: обнаружение, переломные моменты и характеристика пространства параметров». Журнал Американской статистической ассоциации . 117 (540): 1763–1774. arXiv : 2001.08431 . дои : 10.1080/01621459.2021.1886936 .
^ Кэмерон, А. Колин ; Триведи, Правин К. (2005). Микроэконометрика: Методы и приложения . Нью-Йорк: Издательство Кембриджского университета. п. 137. ИСБН 0-521-84805-9 .
^ Дэвидсон, Рассел; Маккиннон, Джеймс Г. (1993). «Метод максимального правдоподобия: основные понятия и обозначения». Оценка и вывод в эконометрике . Нью-Йорк: Издательство Оксфордского университета. п. 89. ИСБН 0-19-506011-3 .
^ Харрелл, Фрэнк Э. младший (2001). «Раздел 9.3.1». Стратегии регрессионного моделирования . Нью-Йорк: Springer-Verlag. ISBN 0387952322 .
^ Страхи, Томас Р.; Бенишу, Жак; Гейл, Митчелл Х. (1996). «Напоминание об ошибочности статистики Вальда». Американский статистик . 50 (3): 226–227. дои : 10.1080/00031305.1996.10474384 .
^ Кричли, Фрэнк; Марриотт, Пол; Лосось, Марк (1996). «О дифференциальной геометрии теста Вальда с нелинейными ограничениями». Эконометрика . 64 (5): 1213–1222. дои : 10.2307/2171963 . hdl : 1814/524 . JSTOR 2171963 .
^ Энгл, Роберт Ф. (1983). «Вальд, отношение правдоподобия и тесты множителей Лагранжа в эконометрике». В Интрилигаторе, доктор медицины; Грилихес, З. (ред.). Справочник по эконометрике . Том. II. Эльзевир. стр. 796–801. ISBN 978-0-444-86185-6 .
^ Харрелл, Фрэнк Э. младший (2001). «Раздел 9.3.3». Стратегии регрессионного моделирования . Нью-Йорк: Springer-Verlag. ISBN 0387952322 .
^ Коллетт, Дэвид (1994). Моделирование данных о выживаемости в медицинских исследованиях . Лондон: Чепмен и Холл. ISBN 0412448807 .
^ Павитан, Юди (2001). По всей вероятности . Нью-Йорк: Издательство Оксфордского университета. ISBN 0198507658 .
^ Агрести, Алан (2002). Категориальный анализ данных (2-е изд.). Уайли. п. 232 . ISBN 0471360937 .

Дальнейшее чтение [ править ]

Грин, Уильям Х. (2012). Эконометрический анализ (Седьмое международное изд.). Бостон: Пирсон. стр. 155–161 . ISBN 978-0-273-75356-8 .
Кмента, Ян (1986). Элементы эконометрики (второе изд.). Нью-Йорк: Макмиллан. стр. 492–493 . ISBN 0-02-365070-2 .
Томас, Р.Л. (1993). Вводная эконометрика: теория и применение (второе изд.). Лондон: Лонгман. стр. 73–77. ISBN 0-582-07378-2 .

Внешние ссылки [ править ]

Тест Вальда на самые ранние известные варианты употребления некоторых математических слов.

[1] Фармейр, Людвиг; Кнейб, Томас; Ланг, Стефан; Маркс, Брайан (2013). Регрессия: модели, методы и приложения . Берлин: Шпрингер. п. 663. ИСБН 978-3-642-34332-2 .

[2] Уорд, Майкл Д .; Алквист, Джон С. (2018). Максимальное правдоподобие для социальных наук: стратегии анализа . Издательство Кембриджского университета . п. 36. ISBN 978-1-316-63682-4 .

[EconometricModelling-3] Перейти обратно: ^а ^б Мартин, Вэнс; Херн, Стэн; Харрис, Дэвид (2013). Эконометрическое моделирование с использованием временных рядов: спецификация, оценка и тестирование . Издательство Кембриджского университета. ISBN 978-0-521-13981-6 .

[4] Дэвидсон, Рассел; Маккиннон, Джеймс Г. (1993). «Метод максимального правдоподобия: основные понятия и обозначения». Оценка и вывод в эконометрике . Нью-Йорк: Издательство Оксфордского университета. п. 89. ИСБН 0-19-506011-3 .

[GregoryVeall1985-5] Перейти обратно: ^а ^б ^с Грегори, Аллан В.; Велл, Майкл Р. (1985). «Формулирование критериев Вальда нелинейных ограничений» . Эконометрика . 53 (6): 1465–1468. дои : 10.2307/1913221 . JSTOR 1913221 .

[6] Филлипс, печатная плата ; Пак, Джун Ю. (1988). «О формулировке критериев нелинейных ограничений Вальда» (PDF) . Эконометрика . 56 (5): 1065–1083. дои : 10.2307/1911359 . JSTOR 1911359 .

[7] Хаяси, Фумио (2000). Эконометрика . Принстон: Издательство Принстонского университета. стр. 489–491. ISBN 1-4008-2383-8 . ,

[8] Лафонтен, Франсин; Уайт, Кеннет Дж. (1986). «Получение любой статистики Уолда, которую вы хотите». Письма по экономике . 21 (1): 35–40. дои : 10.1016/0165-1765(86)90117-5 .

[9] Хаук, Уолтер В. младший; Доннер, Аллан (1977). «Тест Вальда применительно к гипотезам в логит-анализе». Журнал Американской статистической ассоциации . 72 (360а): 851–853. дои : 10.1080/01621459.1977.10479969 .

[10] Кинг, Максвелл Л.; Го, Ким-Ленг (2002). «Усовершенствования теста Вальда» . Справочник по прикладной эконометрике и статистическим выводам . Нью-Йорк: Марсель Деккер. стр. 251–276. ISBN 0-8247-0652-8 .

[11] Да, Томас Уильям (2022). «Об эффекте Хаука-Доннера в тестах Вальда: обнаружение, переломные моменты и характеристика пространства параметров». Журнал Американской статистической ассоциации . 117 (540): 1763–1774. arXiv : 2001.08431 . дои : 10.1080/01621459.2021.1886936 .

[12] Кэмерон, А. Колин ; Триведи, Правин К. (2005). Микроэконометрика: Методы и приложения . Нью-Йорк: Издательство Кембриджского университета. п. 137. ИСБН 0-521-84805-9 .

[13] Дэвидсон, Рассел; Маккиннон, Джеймс Г. (1993). «Метод максимального правдоподобия: основные понятия и обозначения». Оценка и вывод в эконометрике . Нью-Йорк: Издательство Оксфордского университета. п. 89. ИСБН 0-19-506011-3 .

[14] Харрелл, Фрэнк Э. младший (2001). «Раздел 9.3.1». Стратегии регрессионного моделирования . Нью-Йорк: Springer-Verlag. ISBN 0387952322 .

[15] Страхи, Томас Р.; Бенишу, Жак; Гейл, Митчелл Х. (1996). «Напоминание об ошибочности статистики Вальда». Американский статистик . 50 (3): 226–227. дои : 10.1080/00031305.1996.10474384 .

[16] Кричли, Фрэнк; Марриотт, Пол; Лосось, Марк (1996). «О дифференциальной геометрии теста Вальда с нелинейными ограничениями». Эконометрика . 64 (5): 1213–1222. дои : 10.2307/2171963 . hdl : 1814/524 . JSTOR 2171963 .

[17] Энгл, Роберт Ф. (1983). «Вальд, отношение правдоподобия и тесты множителей Лагранжа в эконометрике». В Интрилигаторе, доктор медицины; Грилихес, З. (ред.). Справочник по эконометрике . Том. II. Эльзевир. стр. 796–801. ISBN 978-0-444-86185-6 .

[18] Харрелл, Фрэнк Э. младший (2001). «Раздел 9.3.3». Стратегии регрессионного моделирования . Нью-Йорк: Springer-Verlag. ISBN 0387952322 .

[19] Коллетт, Дэвид (1994). Моделирование данных о выживаемости в медицинских исследованиях . Лондон: Чепмен и Холл. ISBN 0412448807 .

[20] Павитан, Юди (2001). По всей вероятности . Нью-Йорк: Издательство Оксфордского университета. ISBN 0198507658 .

[21] Агрести, Алан (2002). Категориальный анализ данных (2-е изд.). Уайли. п. 232 . ISBN 0471360937 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]