Jump to content

Парадокс Линдли

Парадокс Линдли — это нелогичная ситуация в статистике , в которой байесовский и частотный подходы к проблеме проверки гипотез дают разные результаты для определенных вариантов априорного распределения . Проблема разногласий между двумя подходами обсуждалась в учебнике Гарольда Джеффриса 1939 года; [ 1 ] это стало известно как парадокс Линдли после того, как Деннис Линдли назвал это разногласие парадоксом в статье 1957 года. [ 2 ]

называются парадоксом Несмотря на то, что различия в результатах байесовского и частотного подходов , их можно объяснить тем, что они используются для ответа на фундаментально разные вопросы, а не фактическим разногласием между двумя методами.

Тем не менее, для большого класса априорных подходов различия между частотным и байесовским подходами вызваны сохранением фиксированного уровня значимости: как признавал даже Линдли, «теория не оправдывает практику сохранения фиксированного уровня значимости» и даже «некоторые вычисления Профессор Пирсон в обсуждении этой статьи подчеркнул, как уровень значимости должен был бы меняться в зависимости от размера выборки, если бы потери и априорные вероятности оставались фиксированными». [ 2 ] Фактически, если критическое значение увеличивается с размером выборки достаточно быстро, то расхождение между частотным и байесовским подходами становится незначительным по мере увеличения размера выборки. [ 3 ]

Парадокс продолжает оставаться источником активных дискуссий. [ 3 ] [ 4 ] [ 5 ] [ 6 ]

Описание парадокса

[ редактировать ]

Результат некоторого эксперимента имеет два возможных объяснения – гипотезы и – и некоторое предварительное распределение представление неопределенности относительно того, какая гипотеза является более точной, прежде чем принимать во внимание .

Парадокс Линдли возникает, когда

  1. Результат является «значимым» по частотному критерию указывая достаточные доказательства для отклонения скажем, на уровне 5%, и
  2. Апостериорная вероятность данный высок, что указывает на убедительные доказательства того, что лучше согласуется с чем

Эти результаты могут возникнуть одновременно, когда очень специфичен, более размыты, и предыдущее распределение не сильно отдает предпочтение тому или другому, как показано ниже.

Численный пример

[ редактировать ]

Следующий числовой пример иллюстрирует парадокс Линдли. В определенном городе за определенный период времени родился 49 581 мальчик и 48 870 девочек. Наблюдаемая доля рождений мужского пола, таким образом, составляет 451 49 0,5036 581/98 . Мы предполагаем, что доля рождений мужского пола является биномиальной переменной с параметром Мы заинтересованы в проверке того, составляет 0,5 или какое-либо другое значение. То есть наша нулевая гипотеза и альтернатива

Частотный подход

[ редактировать ]

Частотный подход к тестированию состоит в том, чтобы вычислить p-значение , вероятность наблюдения за долей мальчиков, по крайней мере, такой же большой, как предполагая это правда. Поскольку число рождений очень велико, мы можем использовать нормальное приближение для доли рождений мужского пола. с и вычислить

Мы были бы столь же удивлены, если бы увидели 49 581 рождение девочек, т.е. поэтому специалист по частоте обычно выполняет двусторонний тест, для которого значение p будет равно В обоих случаях значение p ниже уровня значимости α = 5%, поэтому частотный подход отвергает поскольку это не согласуется с наблюдаемыми данными.

Байесовский подход

[ редактировать ]

Если предположить, что нет причин отдавать предпочтение одной гипотезе перед другой, байесовский подход будет заключаться в присвоении априорных вероятностей. и равномерное распределение по под а затем вычислить апостериорную вероятность используя теорему Байеса :

После наблюдения мальчики из рождений, мы можем вычислить апостериорную вероятность каждой гипотезы, используя функцию массы вероятности для биномиальной переменной:

где это бета-функция .

Из этих значений мы находим апостериорную вероятность что решительно благоприятствует над .

Два подхода — байесовский и частотный — кажутся конфликтующими, и в этом «парадокс».

Согласование байесовского и частотного подходов

[ редактировать ]

Нееман [ 3 ] предложил адаптацию уровня значимости к размеру выборки, чтобы контролировать ложноположительные результаты: α n , так что α n = n р с г > 1/2 . По крайней мере, в числовом примере, если принять r = 1/2 , уровень значимости составит 0,00318, поэтому специалист по частоте не будет отвергать нулевую гипотезу, которая согласуется с байесовским подходом.

Неинформативные априоры

[ редактировать ]
Распределение p при нулевой гипотезе и апостериорное распределение p

Если мы используем неинформативный априор и проверяем гипотезу, более похожую на гипотезу частотного подхода, парадокс исчезает.

Например, если мы вычислим апостериорное распределение , используя равномерное априорное распределение на (т.е. ), мы находим

Если мы воспользуемся этим, чтобы проверить вероятность того, что новорожденный с большей вероятностью будет мальчиком, чем девочкой, т.е. мы находим

Другими словами, весьма вероятно, что доля рождений мужского пола превышает 0,5.

Ни один из анализов не дает непосредственной оценки размера эффекта , но оба могут быть использованы, например, для определения того, превысит ли доля рождений мальчиков какой-то конкретный порог.

Отсутствие настоящего парадокса

[ редактировать ]

Кажущееся разногласие между двумя подходами вызвано сочетанием факторов. Во-первых, частотный подход выше тестов без ссылки на . Байесовский подход оценивает как альтернатива и находит, что первое лучше согласуется с наблюдениями. Это связано с тем, что последняя гипотеза гораздо более расплывчата, поскольку может быть где угодно , что приводит к очень низкой апостериорной вероятности. Чтобы понять почему, полезно рассмотреть две гипотезы как генераторы наблюдений:

  • Под , мы выбираем и спросите, насколько вероятно появление 49 581 мальчика на 98 451 рождение.
  • Под , мы выбираем случайным образом из любого места в пределах от 0 до 1 и задайте тот же вопрос.

Большинство возможных значений для под очень плохо подтверждаются наблюдениями. По сути, кажущееся разногласие между методами — это вовсе не разногласие, а скорее два разных утверждения о том, как гипотезы соотносятся с данными:

  • Частый пользователь обнаруживает, что является плохим объяснением наблюдения.
  • Байесианцы считают, что является гораздо лучшим объяснением наблюдения, чем

Соотношение полов новорожденных, по данным частотного теста, неправдоподобно 50/50 мужской/женский. Однако соотношение 50/50 является лучшим приближением, чем большинство, но не все другие соотношения. Гипотеза соответствовало бы наблюдению гораздо лучше, чем почти все другие соотношения, включая

Например, этот выбор гипотез и априорных вероятностей подразумевает утверждение «если > 0,49 и < 0,51, то априорная вероятность ровно 0,5 составляет 0,50/0,51 ≈ 98%». Учитывая такое сильное предпочтение легко понять, почему байесовский подход благоприятствует перед лицом хотя наблюдаемое значение ложь от 0,5. Отклонение более 2 σ от считается значимым в частотном подходе, но его значение отменяется априорным в байесовском подходе.

Глядя на это с другой стороны, мы видим, что априорное распределение по существу плоское с дельта-функцией при Понятно, что это сомнительно. Фактически, представляя действительные числа как непрерывные, было бы более логично предположить, что любое данное число не может быть в точности значением параметра, т. е. мы должны предположить, что

Более реалистичное распределение для в альтернативной гипотезе дает менее неожиданный результат для задней части Например, если мы заменим с т.е. оценка максимального правдоподобия для апостериорная вероятность будет всего 0,07 по сравнению с 0,93 для (конечно, на самом деле нельзя использовать MLE как часть предыдущего дистрибутива).

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Джеффрис, Гарольд (1939). Теория Вероятностей . Издательство Оксфордского университета . МР   0000924 .
  2. ^ Jump up to: а б Линдли, Д.В. (1957). «Статистический парадокс». Биометрия . 44 (1–2): 187–192. дои : 10.1093/biomet/44.1-2.187 . JSTOR   2333251 .
  3. ^ Jump up to: а б с Нааман, Михаил (1 января 2016 г.). «Почти надежная проверка гипотез и разрешение парадокса Джеффриса-Линдли» . Электронный статистический журнал . 10 (1): 1526–1550. дои : 10.1214/16-EJS1146 . ISSN   1935-7524 .
  4. ^ Спанос, Арис (2013). «Кто должен бояться парадокса Джеффриса-Линдли?». Философия науки . 80 (1): 73–93. дои : 10.1086/668875 . S2CID   85558267 .
  5. ^ Шпренгер, Январь (2013). «Проверка точной нулевой гипотезы: случай парадокса Линдли» (PDF) . Философия науки . 80 (5): 733–744. дои : 10.1086/673730 . hdl : 2318/1657960 . S2CID   27444939 .
  6. ^ Роберт, Кристиан П. (2014). «О парадоксе Джеффриса-Линдли». Философия науки . 81 (2): 216–232. arXiv : 1303.5973 . дои : 10.1086/675729 . S2CID   120002033 .

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 9b59761d58320d56fdff563595667362__1721008140
URL1:https://arc.ask3.ru/arc/aa/9b/62/9b59761d58320d56fdff563595667362.html
Заголовок, (Title) документа по адресу, URL1:
Lindley's paradox - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)