Jump to content

Байесовский фактор

(Перенаправлено из факторов Байеса )

Фактор Байеса представляет собой соотношение двух конкурирующих статистических моделей, представленных их доказательствами , и используется для количественной оценки поддержки одной модели над другой. [1] Рассматриваемые модели могут иметь общий набор параметров, например нулевую гипотезу и альтернативу, но это не обязательно; например, это также может быть нелинейная модель по сравнению с ее линейной аппроксимацией . Фактор Байеса можно рассматривать как байесовский аналог теста отношения правдоподобия , хотя он использует интегрированную (т. е. предельную) вероятность, а не максимизированную вероятность. Таким образом, обе величины совпадают только при простых гипотезах (например, двух конкретных значениях параметров). [2] Кроме того, в отличие от проверки значимости нулевой гипотезы , факторы Байеса поддерживают оценку доказательств в пользу нулевой гипотезы, а не только позволяют отвергнуть или не отвергнуть нулевую гипотезу. [3]

Несмотря на концептуальную простоту, вычисление фактора Байеса может оказаться сложной задачей в зависимости от сложности модели и гипотез. [4] Поскольку выражения предельного правдоподобия в закрытой форме, как правило, недоступны, численные аппроксимации, основанные на выборках MCMC . были предложены [5] В некоторых особых случаях можно получить упрощенные алгебраические выражения; например, соотношение плотности Сэвиджа – Дики в случае точной (ограниченной равенством) гипотезы против неограниченной альтернативы. [6] [7] Другое приближение, полученное путем применения аппроксимации Лапласа к интегрированному правдоподобию, известно как байесовский информационный критерий (BIC); [8] в больших наборах данных коэффициент Байеса будет приближаться к BIC по мере того, как влияние априорных значений ослабевает. В небольших наборах данных априорные значения обычно имеют значение и не должны быть неправильными, поскольку фактор Байеса будет неопределенным, если любой из двух интегралов в его отношении не является конечным.

Определение

[ редактировать ]

Фактор Байеса — это соотношение двух предельных правдоподобий; то есть вероятности двух статистических моделей, интегрированные по априорным вероятностям их параметров. [9]

Апостериорная вероятность модели M с учетом данных D определяется теоремой Байеса :

Ключевой термин, зависящий от данных представляет вероятность того, что некоторые данные будут получены в предположении модели M ; правильная его оценка является ключом к сравнению байесовских моделей.

Учитывая задачу выбора модели , в которой нужно выбрать между двумя моделями на основе наблюдаемых данных D , правдоподобие двух разных моделей M 1 и M 2 , параметризованных векторами параметров модели и , оценивается коэффициентом Байеса K, определяемым выражением

Когда две модели имеют одинаковую априорную вероятность, так что , фактор Байеса равен отношению апостериорных вероятностей M 1 и M 2 . Если вместо интеграла фактора Байеса используется правдоподобие, соответствующее оценке максимального правдоподобия параметра для каждой статистической модели, то тест становится классическим тестом отношения правдоподобия . В отличие от теста отношения правдоподобия, это сравнение байесовских моделей не зависит от какого-либо отдельного набора параметров, поскольку оно интегрируется по всем параметрам в каждой модели (относительно соответствующих априорных значений). Преимущество использования факторов Байеса состоит в том, что оно автоматически и вполне естественно включает в себя штраф за включение слишком большой структуры модели. [10] Таким образом, это защищает от переобучения . Для моделей, для которых явная версия правдоподобия недоступна или слишком дорога для численной оценки, приближенные байесовские вычисления . для выбора модели в байесовской структуре можно использовать [11] с оговоркой, что приближенные байесовские оценки байесовских факторов часто бывают необъективными. [12]

Другие подходы:

Интерпретация

[ редактировать ]

Значение K > 1 означает, что M 1 более сильно подтверждается рассматриваемыми данными, чем M 2 . Обратите внимание, что классическая проверка гипотез дает одной гипотезе (или модели) предпочтительный статус («нулевая гипотеза») и рассматривает только доказательства против нее. Тот факт, что фактор Байеса может предоставить доказательства в пользу , а не только против нулевой гипотезы, является одним из ключевых преимуществ этого метода анализа. [13]

Гарольд Джеффрис дал шкалу интерпретации K : [14]

К dСердце биты Сила доказательств
< 10 0 < 0 < 0 Отрицательный (поддерживает M 2 )
10 0 до 10 1/2 от 0 до 5 от 0 до 1,6 Едва ли стоит упоминания
10 1/2 до 10 1 от 5 до 10 от 1,6 до 3,3 Существенный
10 1 до 10 3/2 от 10 до 15 от 3,3 до 5,0 Сильный
10 3/2 до 10 2 от 15 до 20 от 5,0 до 6,6 Очень сильный
> 10 2 > 20 > 6,6 Решительный

Во втором столбце приведены соответствующие веса доказательств в децихартлеях (также известных как децибаны ); биты добавлены в третий столбец для ясности. По мнению И. Дж. Гуда, изменение веса доказательств на 1 децибан или 1/3 бита (т. е. изменение отношения шансов с четов примерно до 5:4) примерно настолько точно, насколько люди могут разумно воспринимать степень своей веры. в гипотезе в повседневном использовании. [15]

Альтернативная таблица, широко цитируемая, предоставлена ​​Кассом и Рафтери (1995): [10]

журнал 10 К К Сила доказательств
от 0 до 1/2 от 1 до 3,2 Не стоит большего, чем простое упоминание
1/2 к 1 от 3,2 до 10 Существенный
1 к 2 от 10 до 100 Сильный
> 2 > 100 Решительный

Предположим, у нас есть случайная величина , которая приводит либо к успеху, либо к неудаче. Мы хотим сравнить модель M 1 , где вероятность успеха равна q = 1 2 и другую модель M 2 , где q неизвестно, и мы берем априорное распределение для q, на равномерное [0,1]. Мы берем выборку из 200 человек и находим 115 успешных и 85 неудачных. Вероятность можно рассчитать в соответствии с биномиальным распределением :

Таким образом, мы имеем для M 1

тогда как для M 2 имеем

Тогда соотношение равно 1,2, о котором «едва ли стоит упоминать», даже если оно очень незначительно указывает на M 1 .

Проверка частотной гипотезы M . 1 (здесь рассматриваемая как нулевая гипотеза ) дала бы совсем другой результат Такой тест говорит, что M 1 следует отклонить на уровне значимости 5%, поскольку вероятность получения 115 или более успехов из выборки из 200, если q = 1 2 равно 0,02, а в качестве двустороннего критерия получения числа, столь же экстремального или более экстремального, чем 115, будет 0,04. Обратите внимание, что 115 отличается от 100 более чем на два стандартных отклонения. Таким образом, хотя проверка частотной гипотезы даст значимые результаты на уровне значимости 5%, фактор Байеса вряд ли считает это экстремальным результатом. Однако обратите внимание, что неравномерный априор (например, тот, который отражает тот факт, что вы ожидаете, что количество успехов и неудач будет одного и того же порядка) может привести к тому, что байесовский фактор будет более согласовываться с частотным коэффициентом. проверка гипотезы.

Классический тест отношения правдоподобия нашел бы оценку максимального правдоподобия для q , а именно , откуда

(вместо усреднения по всем возможным q ). Это дает отношение правдоподобия 0,1 и указывает на M 2 .

M 2 — более сложная модель, чем M 1 , поскольку у нее есть свободный параметр, который позволяет более точно моделировать данные. Способность факторов Байеса учитывать это является причиной того, что байесовский вывод был выдвинут в качестве теоретического обоснования и обобщения бритвы Оккама , уменьшающей ошибки типа I. [16]

С другой стороны, современный метод относительного правдоподобия учитывает количество свободных параметров в моделях, в отличие от классического отношения правдоподобия. Метод относительного правдоподобия можно применить следующим образом. Модель M 1 имеет 0 параметров, поэтому ее информационного критерия Акаике (AIC) равно значение . Модель M 2 имеет 1 параметр, поэтому ее значение AIC равно . Следовательно, M 1 примерно раз более вероятно, чем M 2, чтобы минимизировать потерю информации. Таким образом, М 2 несколько предпочтительнее, но М 1 нельзя исключать.

См. также

[ редактировать ]
Статистические коэффициенты
  1. ^ Мори, Ричард Д.; Ромейн, Ян-Виллем; Рудер, Джеффри Н. (2016). «Философия байесовских факторов и количественная оценка статистических данных» . Журнал математической психологии . 72 : 6–18. дои : 10.1016/j.jmp.2015.11.001 .
  2. ^ Лесаффр, Эммануэль; Лоусон, Эндрю Б. (2012). «Проверка байесовской гипотезы». Байесовская биостатистика . Сомерсет: Джон Уайли и сыновья. стр. 72–78. дои : 10.1002/9781119942412.ch3 . ISBN  978-0-470-01823-1 .
  3. ^ Ли, Александр; и др. (2020). «Байесовская методология сэра Гарольда Джеффриса как практическая альтернатива проверке гипотезы о значении P » . Вычислительный мозг и поведение . 3 (2): 153–161. дои : 10.1007/s42113-019-00070-x . hdl : 2066/226717 .
  4. ^ Льоренте, Фернандо; и др. (2023). «Вычисление предельного правдоподобия для выбора модели и проверки гипотез: обширный обзор». Обзор СИАМ . появиться: 3–58. arXiv : 2005.08334 . дои : 10.1137/20M1310849 . S2CID   210156537 .
  5. ^ Конгдон, Питер (2014). «Оценка вероятностей модели или предельной вероятности на практике». Прикладное байесовское моделирование (2-е изд.). Уайли. стр. 38–40. ISBN  978-1-119-95151-3 .
  6. ^ Куп, Гэри (2003). «Сравнение моделей: соотношение плотности Сэвиджа – Дики». Байесовская эконометрика . Сомерсет: Джон Уайли и сыновья. стр. 69–71. ISBN  0-470-84567-8 .
  7. ^ Вагенмейкерс, Эрик-Ян; Лодевикс, Том; Куриял, Химаншу; Грасман, Рауль (2010). «Проверка байесовских гипотез для психологов: учебное пособие по методу Сэвиджа – Дики» (PDF) . Когнитивная психология . 60 (3): 158–189. дои : 10.1016/j.cogpsych.2009.12.001 . ПМИД   20064637 . S2CID   206867662 .
  8. ^ Ибрагим, Джозеф Г.; Чен, Мин-Хуэй; Синха, Дебаджьоти (2001). «Сравнение моделей». Байесовский анализ выживания . Серия Спрингера по статистике. Нью-Йорк: Спрингер. стр. 246–254. дои : 10.1007/978-1-4757-3447-8_6 . ISBN  0-387-95277-2 .
  9. ^ Гилл, Джефф (2002). «Проверка байесовской гипотезы и фактор Байеса». Байесовские методы: подход социальных и поведенческих наук . Чепмен и Холл. стр. 199–237. ISBN  1-58488-288-3 .
  10. ^ Перейти обратно: а б Роберт Э. Касс и Адриан Э. Рафтери (1995). «Факторы Байеса» (PDF) . Журнал Американской статистической ассоциации . 90 (430): 791. дои : 10.2307/2291091 . JSTOR   2291091 .
  11. ^ Тони, Т.; Штумпф, магистр здравоохранения (2009). «Выбор моделей динамических систем на основе моделирования в системной и популяционной биологии» . Биоинформатика . 26 (1): 104–10. arXiv : 0911.1705 . doi : 10.1093/биоинформатика/btp619 . ПМК   2796821 . ПМИД   19880371 .
  12. ^ Роберт, CP; Ж. Корнюэ; Дж. Марин и Н.С. Пиллаи (2011). «Недостаток уверенности в выборе приближенной байесовской модели вычислений» . Труды Национальной академии наук . 108 (37): 15112–15117. Бибкод : 2011PNAS..10815112R . дои : 10.1073/pnas.1102900108 . ПМК   3174657 . ПМИД   21876135 .
  13. ^ Уильямс, Мэтт; Боат, Расмус; Филипп, Майкл (2017). «Использование байесовских факторов для проверки гипотез в исследованиях развития». Исследования в области человеческого развития . 14 : 321–337. дои : 10.1080/15427609.2017.1370964 .
  14. ^ Джеффрис, Гарольд (1998) [1961]. Теория вероятностей (3-е изд.). Оксфорд, Англия. п. 432. ИСБН  9780191589676 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  15. ^ Хорошо, Эй Джей (1979). «Исследования по истории вероятности и статистики. XXXVII Статистическая работа Тьюринга во Второй мировой войне». Биометрика . 66 (2): 393–396. дои : 10.1093/биомет/66.2.393 . МР   0548210 .
  16. ^ Затачивание бритвы Оккама на байесовском ремне

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 4b9cf2af0cadd699a191cb9414ba6539__1721355060
URL1:https://arc.ask3.ru/arc/aa/4b/39/4b9cf2af0cadd699a191cb9414ba6539.html
Заголовок, (Title) документа по адресу, URL1:
Bayes factor - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)