Парадокс Линдли
Парадокс Линдли — это нелогичная ситуация в статистике , в которой байесовский и частотный подходы к проблеме проверки гипотез дают разные результаты для определенных вариантов априорного распределения . Проблема разногласий между двумя подходами обсуждалась в учебнике Гарольда Джеффриса 1939 года; [ 1 ] это стало известно как парадокс Линдли после того, как Деннис Линдли назвал это разногласие парадоксом в статье 1957 года. [ 2 ]
называются парадоксом Несмотря на то, что различия в результатах байесовского и частотного подходов , их можно объяснить тем, что они используются для ответа на фундаментально разные вопросы, а не фактическим разногласием между двумя методами.
Тем не менее, для большого класса априорных подходов различия между частотным и байесовским подходами вызваны сохранением фиксированного уровня значимости: как признавал даже Линдли, «теория не оправдывает практику сохранения фиксированного уровня значимости» и даже «некоторые вычисления Профессор Пирсон в обсуждении этой статьи подчеркнул, как уровень значимости должен был бы меняться в зависимости от размера выборки, если бы потери и априорные вероятности оставались фиксированными». [ 2 ] Фактически, если критическое значение увеличивается с размером выборки достаточно быстро, то расхождение между частотным и байесовским подходами становится незначительным по мере увеличения размера выборки. [ 3 ]
Парадокс продолжает оставаться источником активных дискуссий. [ 3 ] [ 4 ] [ 5 ] [ 6 ]
Описание парадокса
[ редактировать ]Результат некоторого эксперимента имеет два возможных объяснения – гипотезы и – и некоторое предварительное распределение представление неопределенности относительно того, какая гипотеза является более точной, прежде чем принимать во внимание .
Парадокс Линдли возникает, когда
- Результат является «значимым» по частотному критерию указывая достаточные доказательства для отклонения скажем, на уровне 5%, и
- Апостериорная вероятность данный высок, что указывает на убедительные доказательства того, что лучше согласуется с чем
Эти результаты могут возникнуть одновременно, когда очень специфичен, более размыты, и предыдущее распределение не сильно отдает предпочтение тому или другому, как показано ниже.
Численный пример
[ редактировать ]Следующий числовой пример иллюстрирует парадокс Линдли. В определенном городе за определенный период времени родился 49 581 мальчик и 48 870 девочек. Наблюдаемая доля рождений мужского пола, таким образом, составляет 451 ≈ 49 0,5036 581/98 . Мы предполагаем, что доля рождений мужского пола является биномиальной переменной с параметром Мы заинтересованы в проверке того, составляет 0,5 или какое-либо другое значение. То есть наша нулевая гипотеза и альтернатива
Частотный подход
[ редактировать ]Частотный подход к тестированию состоит в том, чтобы вычислить p-значение , вероятность наблюдения за долей мальчиков, по крайней мере, такой же большой, как предполагая это правда. Поскольку число рождений очень велико, мы можем использовать нормальное приближение для доли рождений мужского пола. с и вычислить
Мы были бы столь же удивлены, если бы увидели 49 581 рождение девочек, т.е. поэтому специалист по частоте обычно выполняет двусторонний тест, для которого значение p будет равно В обоих случаях значение p ниже уровня значимости α = 5%, поэтому частотный подход отвергает поскольку это не согласуется с наблюдаемыми данными.
Байесовский подход
[ редактировать ]Если предположить, что нет причин отдавать предпочтение одной гипотезе перед другой, байесовский подход будет заключаться в присвоении априорных вероятностей. и равномерное распределение по под а затем вычислить апостериорную вероятность используя теорему Байеса :
После наблюдения мальчики из рождений, мы можем вычислить апостериорную вероятность каждой гипотезы, используя функцию массы вероятности для биномиальной переменной:
где это бета-функция .
Из этих значений мы находим апостериорную вероятность что решительно благоприятствует над .
Два подхода — байесовский и частотный — кажутся конфликтующими, и в этом «парадокс».
Согласование байесовского и частотного подходов
[ редактировать ]Нееман [ 3 ] предложил адаптацию уровня значимости к размеру выборки, чтобы контролировать ложноположительные результаты: α n , так что α n = n − р с г > 1/2 . По крайней мере, в числовом примере, если принять r = 1/2 , уровень значимости составит 0,00318, поэтому специалист по частоте не будет отвергать нулевую гипотезу, которая согласуется с байесовским подходом.
Неинформативные априоры
[ редактировать ]
Если мы используем неинформативный априор и проверяем гипотезу, более похожую на гипотезу частотного подхода, парадокс исчезает.
Например, если мы вычислим апостериорное распределение , используя равномерное априорное распределение на (т.е. ), мы находим
Если мы воспользуемся этим, чтобы проверить вероятность того, что новорожденный с большей вероятностью будет мальчиком, чем девочкой, т.е. мы находим
Другими словами, весьма вероятно, что доля рождений мужского пола превышает 0,5.
Ни один из анализов не дает непосредственной оценки размера эффекта , но оба могут быть использованы, например, для определения того, превысит ли доля рождений мальчиков какой-то конкретный порог.
Отсутствие настоящего парадокса
[ редактировать ]![]() | Этот раздел включает в себя список использованной литературы , связанную литературу или внешние ссылки , но его источники остаются неясными, поскольку в нем отсутствуют встроенные цитаты . ( Июль 2012 г. ) |
Кажущееся разногласие между двумя подходами вызвано сочетанием факторов. Во-первых, частотный подход выше тестов без ссылки на . Байесовский подход оценивает как альтернатива и находит, что первое лучше согласуется с наблюдениями. Это связано с тем, что последняя гипотеза гораздо более расплывчата, поскольку может быть где угодно , что приводит к очень низкой апостериорной вероятности. Чтобы понять почему, полезно рассмотреть две гипотезы как генераторы наблюдений:
- Под , мы выбираем и спросите, насколько вероятно появление 49 581 мальчика на 98 451 рождение.
- Под , мы выбираем случайным образом из любого места в пределах от 0 до 1 и задайте тот же вопрос.
Большинство возможных значений для под очень плохо подтверждаются наблюдениями. По сути, кажущееся разногласие между методами — это вовсе не разногласие, а скорее два разных утверждения о том, как гипотезы соотносятся с данными:
- Частый пользователь обнаруживает, что является плохим объяснением наблюдения.
- Байесианцы считают, что является гораздо лучшим объяснением наблюдения, чем
Соотношение полов новорожденных, по данным частотного теста, неправдоподобно 50/50 мужской/женский. Однако соотношение 50/50 является лучшим приближением, чем большинство, но не все другие соотношения. Гипотеза соответствовало бы наблюдению гораздо лучше, чем почти все другие соотношения, включая
Например, этот выбор гипотез и априорных вероятностей подразумевает утверждение «если > 0,49 и < 0,51, то априорная вероятность ровно 0,5 составляет 0,50/0,51 ≈ 98%». Учитывая такое сильное предпочтение легко понять, почему байесовский подход благоприятствует перед лицом хотя наблюдаемое значение ложь от 0,5. Отклонение более 2 σ от считается значимым в частотном подходе, но его значение отменяется априорным в байесовском подходе.
Глядя на это с другой стороны, мы видим, что априорное распределение по существу плоское с дельта-функцией при Понятно, что это сомнительно. Фактически, представляя действительные числа как непрерывные, было бы более логично предположить, что любое данное число не может быть в точности значением параметра, т. е. мы должны предположить, что
Более реалистичное распределение для в альтернативной гипотезе дает менее неожиданный результат для задней части Например, если мы заменим с т.е. оценка максимального правдоподобия для апостериорная вероятность будет всего 0,07 по сравнению с 0,93 для (конечно, на самом деле нельзя использовать MLE как часть предыдущего дистрибутива).
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ Джеффрис, Гарольд (1939). Теория Вероятностей . Издательство Оксфордского университета . МР 0000924 .
- ^ Jump up to: а б Линдли, Д.В. (1957). «Статистический парадокс». Биометрия . 44 (1–2): 187–192. дои : 10.1093/biomet/44.1-2.187 . JSTOR 2333251 .
- ^ Jump up to: а б с Нааман, Михаил (1 января 2016 г.). «Почти надежная проверка гипотез и разрешение парадокса Джеффриса-Линдли» . Электронный статистический журнал . 10 (1): 1526–1550. дои : 10.1214/16-EJS1146 . ISSN 1935-7524 .
- ^ Спанос, Арис (2013). «Кто должен бояться парадокса Джеффриса-Линдли?». Философия науки . 80 (1): 73–93. дои : 10.1086/668875 . S2CID 85558267 .
- ^ Шпренгер, Январь (2013). «Проверка точной нулевой гипотезы: случай парадокса Линдли» (PDF) . Философия науки . 80 (5): 733–744. дои : 10.1086/673730 . hdl : 2318/1657960 . S2CID 27444939 .
- ^ Роберт, Кристиан П. (2014). «О парадоксе Джеффриса-Линдли». Философия науки . 81 (2): 216–232. arXiv : 1303.5973 . дои : 10.1086/675729 . S2CID 120002033 .
Дальнейшее чтение
[ редактировать ]- Шафер, Гленн (1982). «Парадокс Линдли». Журнал Американской статистической ассоциации . 77 (378): 325–334. дои : 10.2307/2287244 . JSTOR 2287244 . МР 0664677 .