Теорема Уилкса
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
В статистике теорема Уилкса предлагает асимптотическое распределение статистики логарифмического отношения правдоподобия, которое можно использовать для получения доверительных интервалов для оценок максимального правдоподобия или в качестве тестовой статистики для выполнения теста отношения правдоподобия .
Статистические тесты (такие как проверка гипотез ) обычно требуют знания распределения вероятностей тестовой статистики . Это часто является проблемой для отношений правдоподобия , где распределение вероятностей определить очень сложно.
Удобный результат Сэмюэля С. Уилкса гласит, что по мере приближения размера выборки , распределение тестовой статистики асимптотически приближается к хи-квадрату ( ) распределение при нулевой гипотезе . [ 1 ] Здесь, обозначает отношение правдоподобия , а распределение имеет степени свободы, равные разнице размерностей и , где это полное пространство параметров и — это подмножество пространства параметров, связанное с . Этот результат означает, что для больших выборок и большого разнообразия гипотез практик может вычислить отношение правдоподобия. для получения данных и сравнения к значение, соответствующее желаемой статистической значимости , в качестве приблизительного статистического теста.
Теорема больше не применяется, когда истинное значение параметра находится на границе пространства параметров: теорема Уилкса предполагает, что «истинные», но неизвестные значения оцениваемых параметров лежат внутри поддерживаемого параметров пространства . На практике проблема заметна, если оценка лежит на этой границе. В этом случае критерий правдоподобия по-прежнему является разумной тестовой статистикой и даже обладает некоторыми свойствами асимптотической оптимальности, но значимость ( значение p ) не может быть надежно оценена с использованием распределения хи-квадрат с числом степеней свободы, заданным формулой Уилкс. В некоторых случаях асимптотическое распределение статистики по нулевой гипотезе представляет собой смесь распределений хи-квадрат с разным числом степеней свободы.
Использовать
[ редактировать ]Каждая из двух конкурирующих моделей, нулевая модель и альтернативная модель, отдельно адаптируется к данным и регистрируется логарифмическое правдоподобие . Статистика теста (часто обозначаемая D ) в два раза превышает логарифм отношения правдоподобия, т. е . она в два раза превышает разницу логарифмов правдоподобия:
Модель с большим количеством параметров (здесь альтернатива ) всегда будет подходить как минимум так же хорошо, т. е. иметь ту же или большую логарифмическую вероятность, чем модель с меньшим количеством параметров (здесь null ). Является ли соответствие значительно лучшим и, таким образом, следует ли отдать предпочтение, определяется путем определения того, насколько вероятно ( p -значение ) наблюдать такую разницу D только случайно , если бы модель с меньшим количеством параметров была верной. Если нулевая гипотеза представляет собой частный случай альтернативной гипотезы, распределение вероятностей проверочной статистики представляет собой примерно распределение хи-квадрат со степенями свободы, равными , [ 2 ] соответственно количество свободных параметров моделей alter и null .
Например: если нулевая модель имеет 1 параметр и логарифмическое правдоподобие -8024, а альтернативная модель имеет 3 параметра и логарифмическое правдоподобие -8012, то вероятность этой разницы равна значению хи-квадрат с степеней свободы и равен . Некоторые предположения [ 1 ] должно быть выполнено, чтобы статистика следовала распределению хи-квадрат , но эмпирические значения p также могут быть вычислены, если эти условия не выполняются.
Примеры
[ редактировать ]Подбрасывание монеты
[ редактировать ]Примером теста Пирсона является сравнение двух монет, чтобы определить, имеют ли они одинаковую вероятность выпадения орла. Наблюдения можно поместить в таблицу непредвиденных обстоятельств , строки которой соответствуют монете, а столбцы — орлу или решке. Элементами таблицы непредвиденных обстоятельств будет количество раз, когда каждая монета выпала орел или решка. Содержимое этой таблицы — наши X. наблюдения
Здесь Θ состоит из возможных комбинаций значений параметров , , , и , которые представляют собой вероятность того, что монеты 1 и 2 выпадут орлом или решкой. Далее, и . Пространство гипотез H ограничено обычными ограничениями на распределение вероятностей: , и . Пространство нулевой гипотезы это подпространство, в котором . Размерность полного пространства параметров Θ равна 2 (любое из и любой из можно рассматривать как свободные параметры согласно гипотезе ) и размерность равно 1 (только один из можно считать свободным параметром при нулевой гипотезе ).
Письмо за лучшие оценки согласно гипотезе H оценка максимального правдоподобия определяется выражением
Аналогично, оценки максимального правдоподобия при нулевой гипотезе даны
который не зависит от монеты i .
Гипотезу и нулевую гипотезу можно немного переписать, чтобы они удовлетворяли ограничениям на то, чтобы логарифм отношения правдоподобия имел желаемое распределение. Поскольку ограничение приводит к сведению двумерного H к одномерному , асимптотическое распределение для теста будет , распределение с одной степенью свободы.
Для общей таблицы непредвиденных обстоятельств мы можем записать статистику логарифмического отношения правдоподобия как
Недействительность моделей случайных или смешанных эффектов.
[ редактировать ]Теорема Уилкса предполагает, что истинные, но неизвестные значения оцениваемых параметров находятся внутри пространства параметров . Это обычно нарушается в моделях случайных или смешанных эффектов , например, когда один из компонентов дисперсии незначителен по сравнению с другими. В некоторых таких случаях один компонент дисперсии может быть фактически нулевым по сравнению с другими, или в других случаях модели могут быть неправильно вложены.
Чтобы внести ясность: эти ограничения теоремы Уилкса не отменяют никаких степенных свойств конкретного теста отношения правдоподобия. [ 3 ] Единственная проблема заключается в том, что распределение иногда является плохим выбором для оценки статистической значимости результата.
Плохие примеры
[ редактировать ]Пинейро и Бейтс (2000) показали, что истинное распределение этой статистики хи-квадрат отношения правдоподобия может существенно отличаться от наивного. – часто резко. [ 4 ] Наивные предположения могут дать вероятности значимости ( p -значения) , которые в среднем слишком велики в некоторых случаях и слишком малы в других.
В общем, для проверки случайных эффектов рекомендуют использовать метод ограниченного максимального правдоподобия (REML). Они говорят, что для тестирования с фиксированными эффектами «тест отношения правдоподобия для соответствия REML невозможен», поскольку изменение спецификации фиксированных эффектов меняет смысл смешанных эффектов, и поэтому ограниченная модель не вложена в более крупную модель. [ 4 ] В качестве демонстрации они установили нулевое значение одной или двух дисперсий случайных эффектов в смоделированных тестах. В этих конкретных примерах смоделированные значения p с ограничениями k наиболее точно соответствовали смеси 50–50 и . (При k = 1 , равно 0 с вероятностью 1. Это означает, что хорошее приближение было ) [ 4 ]
Пиньейро и Бейтс также смоделировали тесты с различными фиксированными эффектами. В одном тесте фактора с 4 уровнями ( степени свободы = 3) они обнаружили, что смесь 50–50 и хорошо соответствовало фактическим значениям p, полученным с помощью моделирования – и ошибка в использовании наивного «Может быть, это не слишком тревожит». [ 4 ]
Однако в другом тесте фактора с 15 уровнями они нашли разумное соответствие – на 4 больше степеней свободы, чем 14, которые можно было бы получить при наивном (неуместном) применении теоремы Уилкса, а смоделированное значение p было в несколько раз наивным. . Они приходят к выводу, что для тестирования фиксированных эффектов «разумно использовать моделирование». [ а ]
См. также
[ редактировать ]Примечания
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б Уилкс, Сэмюэл С. (1938). «Распределение отношения правдоподобия по большой выборке для проверки сложных гипотез» . Анналы математической статистики . 9 (1): 60–62. дои : 10.1214/aoms/1177732360 .
- ^ Хюльзенбек, JP; Крэндалл, Калифорния (1997). «Оценка филогении и проверка гипотез с использованием максимального правдоподобия». Ежегодный обзор экологии и систематики . 28 : 437–466. doi : 10.1146/annurev.ecolsys.28.1.437 .
- ^ Нейман, Ежи ; Пирсон, Эгон С. (1933). «К проблеме наиболее эффективной проверки статистических гипотез» (PDF) . Философские труды Королевского общества A: Математические, физические и технические науки . 231 (694–706): 289–337. Бибкод : 1933RSPTA.231..289N . дои : 10.1098/rsta.1933.0009 . JSTOR 91247 .
- ^ Jump up to: а б с д и Пиньейру, Хосе К.; Бейтс, Дуглас М. (2000). Модели со смешанными эффектами в S и S-PLUS . Спрингер-Верлаг. стр. 82–93. ISBN 0-387-98957-9 .
- ^ «Имитировать результаты
lme
модели» (PDF) . R-project.org (документация по программному обеспечению). Пакетnlme
. 12 мая 2019 г. стр. 281–282 . Проверено 8 июня 2019 г.
Другие источники
[ редактировать ]- Казелла, Джордж; Бергер, Роджер Л. (2001). Статистический вывод (второе изд.). ISBN 0-534-24312-6 .
- Настроение, утро; Грейбилл, ФА (1963). Введение в теорию статистики (2-е изд.). МакГроу-Хилл. ISBN 978-0070428638 .
- Кокс, доктор медицинских наук; Хинкли, Д.В. (1974). Теоретическая статистика . Чепмен и Холл. ISBN 0-412-12420-3 .
- Стюарт, А.; Орд, К.; Арнольд, С. (1999). Продвинутая теория статистики Кендалла . Том. 2А. Лондон: Арнольд . ISBN 978-0-340-66230-4 .