Jump to content

Теорема Уилкса

В статистике теорема Уилкса предлагает асимптотическое распределение статистики логарифмического отношения правдоподобия, которое можно использовать для получения доверительных интервалов для оценок максимального правдоподобия или в качестве тестовой статистики для выполнения теста отношения правдоподобия .

Статистические тесты (такие как проверка гипотез ) обычно требуют знания распределения вероятностей тестовой статистики . Это часто является проблемой для отношений правдоподобия , где распределение вероятностей определить очень сложно.

Удобный результат Сэмюэля С. Уилкса гласит, что по мере приближения размера выборки , распределение тестовой статистики асимптотически приближается к хи-квадрату ( ) распределение при нулевой гипотезе . [ 1 ] Здесь, обозначает отношение правдоподобия , а распределение имеет степени свободы, равные разнице размерностей и , где это полное пространство параметров и — это подмножество пространства параметров, связанное с . Этот результат означает, что для больших выборок и большого разнообразия гипотез практик может вычислить отношение правдоподобия. для получения данных и сравнения к значение, соответствующее желаемой статистической значимости , в качестве приблизительного статистического теста.

Теорема больше не применяется, когда истинное значение параметра находится на границе пространства параметров: теорема Уилкса предполагает, что «истинные», но неизвестные значения оцениваемых параметров лежат внутри поддерживаемого параметров пространства . На практике проблема заметна, если оценка лежит на этой границе. В этом случае критерий правдоподобия по-прежнему является разумной тестовой статистикой и даже обладает некоторыми свойствами асимптотической оптимальности, но значимость ( значение p ) не может быть надежно оценена с использованием распределения хи-квадрат с числом степеней свободы, заданным формулой Уилкс. В некоторых случаях асимптотическое распределение статистики по нулевой гипотезе представляет собой смесь распределений хи-квадрат с разным числом степеней свободы.

Использовать

[ редактировать ]

Каждая из двух конкурирующих моделей, нулевая модель и альтернативная модель, отдельно адаптируется к данным и регистрируется логарифмическое правдоподобие . Статистика теста (часто обозначаемая D ) в два раза превышает логарифм отношения правдоподобия, т. е . она в два раза превышает разницу логарифмов правдоподобия:

Модель с большим количеством параметров (здесь альтернатива ) всегда будет подходить как минимум так же хорошо, т. е. иметь ту же или большую логарифмическую вероятность, чем модель с меньшим количеством параметров (здесь null ). Является ли соответствие значительно лучшим и, таким образом, следует ли отдать предпочтение, определяется путем определения того, насколько вероятно ( p -значение ) наблюдать такую ​​разницу D только случайно , если бы модель с меньшим количеством параметров была верной. Если нулевая гипотеза представляет собой частный случай альтернативной гипотезы, распределение вероятностей проверочной статистики представляет собой примерно распределение хи-квадрат со степенями свободы, равными , [ 2 ] соответственно количество свободных параметров моделей alter и null .

Например: если нулевая модель имеет 1 параметр и логарифмическое правдоподобие -8024, а альтернативная модель имеет 3 параметра и логарифмическое правдоподобие -8012, то вероятность этой разницы равна значению хи-квадрат с степеней свободы и равен . Некоторые предположения [ 1 ] должно быть выполнено, чтобы статистика следовала распределению хи-квадрат , но эмпирические значения p также могут быть вычислены, если эти условия не выполняются.

Подбрасывание монеты

[ редактировать ]

Примером теста Пирсона является сравнение двух монет, чтобы определить, имеют ли они одинаковую вероятность выпадения орла. Наблюдения можно поместить в таблицу непредвиденных обстоятельств , строки которой соответствуют монете, а столбцы — орлу или решке. Элементами таблицы непредвиденных обстоятельств будет количество раз, когда каждая монета выпала орел или решка. Содержимое этой таблицы — наши X. наблюдения

Здесь Θ состоит из возможных комбинаций значений параметров , , , и , которые представляют собой вероятность того, что монеты 1 и 2 выпадут орлом или решкой. Далее, и . Пространство гипотез H ограничено обычными ограничениями на распределение вероятностей: , и . Пространство нулевой гипотезы это подпространство, в котором . Размерность полного пространства параметров Θ равна 2 (любое из и любой из можно рассматривать как свободные параметры согласно гипотезе ) и размерность равно 1 (только один из можно считать свободным параметром при нулевой гипотезе ).

Письмо за лучшие оценки согласно гипотезе H оценка максимального правдоподобия определяется выражением

Аналогично, оценки максимального правдоподобия при нулевой гипотезе даны

который не зависит от монеты i .

Гипотезу и нулевую гипотезу можно немного переписать, чтобы они удовлетворяли ограничениям на то, чтобы логарифм отношения правдоподобия имел желаемое распределение. Поскольку ограничение приводит к сведению двумерного H к одномерному , асимптотическое распределение для теста будет , распределение с одной степенью свободы.

Для общей таблицы непредвиденных обстоятельств мы можем записать статистику логарифмического отношения правдоподобия как

Недействительность моделей случайных или смешанных эффектов.

[ редактировать ]

Теорема Уилкса предполагает, что истинные, но неизвестные значения оцениваемых параметров находятся внутри пространства параметров . Это обычно нарушается в моделях случайных или смешанных эффектов , например, когда один из компонентов дисперсии незначителен по сравнению с другими. В некоторых таких случаях один компонент дисперсии может быть фактически нулевым по сравнению с другими, или в других случаях модели могут быть неправильно вложены.

Чтобы внести ясность: эти ограничения теоремы Уилкса не отменяют никаких степенных свойств конкретного теста отношения правдоподобия. [ 3 ] Единственная проблема заключается в том, что распределение иногда является плохим выбором для оценки статистической значимости результата.

Плохие примеры

[ редактировать ]

Пинейро и Бейтс (2000) показали, что истинное распределение этой статистики хи-квадрат отношения правдоподобия может существенно отличаться от наивного. – часто резко. [ 4 ] Наивные предположения могут дать вероятности значимости ( p -значения) , которые в среднем слишком велики в некоторых случаях и слишком малы в других.

В общем, для проверки случайных эффектов рекомендуют использовать метод ограниченного максимального правдоподобия (REML). Они говорят, что для тестирования с фиксированными эффектами «тест отношения правдоподобия для соответствия REML невозможен», поскольку изменение спецификации фиксированных эффектов меняет смысл смешанных эффектов, и поэтому ограниченная модель не вложена в более крупную модель. [ 4 ] В качестве демонстрации они установили нулевое значение одной или двух дисперсий случайных эффектов в смоделированных тестах. В этих конкретных примерах смоделированные значения p с ограничениями k наиболее точно соответствовали смеси 50–50 и . (При k = 1 , равно 0 с вероятностью 1. Это означает, что хорошее приближение было ) [ 4 ]

Пиньейро и Бейтс также смоделировали тесты с различными фиксированными эффектами. В одном тесте фактора с 4 уровнями ( степени свободы = 3) они обнаружили, что смесь 50–50 и хорошо соответствовало фактическим значениям p, полученным с помощью моделирования – и ошибка в использовании наивного «Может быть, это не слишком тревожит». [ 4 ]

Однако в другом тесте фактора с 15 уровнями они нашли разумное соответствие – на 4 больше степеней свободы, чем 14, которые можно было бы получить при наивном (неуместном) применении теоремы Уилкса, а смоделированное значение p было в несколько раз наивным. . Они приходят к выводу, что для тестирования фиксированных эффектов «разумно использовать моделирование». [ а ]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Пиньейро и Бейтс (2000) [ 4 ] предоставил simulate.lme функционировать в своих nlme пакет для S-PLUS и R для поддержки моделирования REML; см. исх. [ 5 ]
  1. ^ Jump up to: а б Уилкс, Сэмюэл С. (1938). «Распределение отношения правдоподобия по большой выборке для проверки сложных гипотез» . Анналы математической статистики . 9 (1): 60–62. дои : 10.1214/aoms/1177732360 .
  2. ^ Хюльзенбек, JP; Крэндалл, Калифорния (1997). «Оценка филогении и проверка гипотез с использованием максимального правдоподобия». Ежегодный обзор экологии и систематики . 28 : 437–466. doi : 10.1146/annurev.ecolsys.28.1.437 .
  3. ^ Нейман, Ежи ; Пирсон, Эгон С. (1933). «К проблеме наиболее эффективной проверки статистических гипотез» (PDF) . Философские труды Королевского общества A: Математические, физические и технические науки . 231 (694–706): 289–337. Бибкод : 1933RSPTA.231..289N . дои : 10.1098/rsta.1933.0009 . JSTOR   91247 .
  4. ^ Jump up to: а б с д и Пиньейру, Хосе К.; Бейтс, Дуглас М. (2000). Модели со смешанными эффектами в S и S-PLUS . Спрингер-Верлаг. стр. 82–93. ISBN  0-387-98957-9 .
  5. ^ «Имитировать результаты lme модели» (PDF) . R-project.org (документация по программному обеспечению). Пакет nlme. 12 мая 2019 г. стр. 281–282 . Проверено 8 июня 2019 г.

Другие источники

[ редактировать ]
  • Казелла, Джордж; Бергер, Роджер Л. (2001). Статистический вывод (второе изд.). ISBN  0-534-24312-6 .
  • Настроение, утро; Грейбилл, ФА (1963). Введение в теорию статистики (2-е изд.). МакГроу-Хилл. ISBN  978-0070428638 .
  • Кокс, доктор медицинских наук; Хинкли, Д.В. (1974). Теоретическая статистика . Чепмен и Холл. ISBN  0-412-12420-3 .
  • Стюарт, А.; Орд, К.; Арнольд, С. (1999). Продвинутая теория статистики Кендалла . Том. 2А. Лондон: Арнольд . ISBN  978-0-340-66230-4 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5c092db476a7fc1e4b6931e4210c2821__1723551180
URL1:https://arc.ask3.ru/arc/aa/5c/21/5c092db476a7fc1e4b6931e4210c2821.html
Заголовок, (Title) документа по адресу, URL1:
Wilks' theorem - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)