Jump to content

Байесовское иерархическое моделирование

Байесовское иерархическое моделирование — это статистическая модель, написанная в нескольких уровнях (иерархической форме), которая оценивает параметры апостериорного распределения с использованием байесовского метода . [1] Подмодели объединяются, образуя иерархическую модель, а теорема Байеса используется для их интеграции с наблюдаемыми данными и учета всей имеющейся неопределенности. Результатом этого интегрирования является апостериорное распределение, также известное как обновленная оценка вероятности, поскольку дополнительные данные о априорном распределении получены .

Частотная статистика может привести к выводам, которые кажутся несовместимыми с выводами, предлагаемыми байесовской статистикой, из-за байесовской трактовки параметров как случайных величин и использования субъективной информации при установлении предположений об этих параметрах. [2] Поскольку подходы отвечают на разные вопросы, формальные результаты не являются технически противоречивыми, но два подхода расходятся во мнениях относительно того, какой ответ имеет отношение к конкретным приложениям. Байесианцы утверждают, что нельзя игнорировать соответствующую информацию, касающуюся принятия решений и обновления убеждений, и что иерархическое моделирование может превзойти классические методы в приложениях, где респонденты предоставляют множественные данные наблюдений. Более того, модель оказалась надежной : апостериорное распределение менее чувствительно к более гибким иерархическим априорным значениям.

Иерархическое моделирование используется, когда информация доступна на нескольких различных уровнях единиц наблюдения. Например, при эпидемиологическом моделировании для описания путей распространения инфекции в нескольких странах единицами наблюдения являются страны, и каждая страна имеет свой собственный временной профиль ежедневных случаев заражения. [3] При анализе кривой падения добычи нефти или газа для описания кривой падения добычи нефти или газа для нескольких скважин единицами наблюдения являются нефтяные или газовые скважины в районе пласта, и каждая скважина имеет собственный временной профиль темпов добычи нефти или газа (обычно баррелей в месяц). [4] Структура данных для иерархического моделирования сохраняет вложенную структуру данных. Иерархическая форма анализа и организации помогает в понимании многопараметрических задач, а также играет важную роль в разработке вычислительных стратегий. [5]

Философия

[ редактировать ]

Статистические методы и модели обычно включают в себя несколько параметров, которые можно рассматривать как связанные или связанные таким образом, что проблема подразумевает зависимость совместной вероятностной модели от этих параметров. [6] Отдельные степени уверенности, выраженные в форме вероятностей, сопровождаются неопределенностью. [7] При этом происходит изменение степеней веры с течением времени. Как заявили профессор Хосе М. Бернардо и профессор Адриан Ф. Смит : «Актуальность процесса обучения состоит в эволюции индивидуальных и субъективных убеждений о реальности». Эти субъективные вероятности более непосредственно связаны с разумом, чем физические вероятности. [7] Следовательно, именно с этой необходимостью обновления убеждений байесианцы сформулировали альтернативную статистическую модель, которая учитывает предшествующее возникновение конкретного события. [8]

Теорема Байеса

[ редактировать ]

Предполагаемое возникновение реального события обычно приводит к изменению предпочтений между определенными вариантами. Это делается путем изменения степени убежденности человека в событиях, определяющих варианты. [9]

Предположим, что при исследовании эффективности сердечного лечения пациенты в больнице j имеют вероятность выживания , вероятность выживания будет обновляться с наступлением y , события, при котором создается спорная сыворотка, которая, как полагают некоторые, увеличивает выживаемость у сердечных пациентов.

Чтобы сделать обновленные заявления о вероятности Учитывая возникновение события y , мы должны начать с модели, обеспечивающей совместное распределение вероятностей для и й . Это можно записать как произведение двух распределений, которые часто называют предыдущим распределением. и распределение выборки соответственно:

Используя основное свойство условной вероятности , апостериорное распределение даст:

Это уравнение, показывающее связь между условной вероятностью и отдельными событиями, известно как теорема Байеса. Это простое выражение отражает техническую суть байесовского вывода, целью которого является включение обновленного убеждения: , подходящими и разрешимыми способами. [9]

Взаимозаменяемость

[ редактировать ]

Обычной отправной точкой статистического анализа является предположение, что n значения являются взаимозаменяемыми. Если нет информации – кроме данных y – для различения любого из отличается от любых других, и никакое упорядочение или группирование параметров невозможно, необходимо предположить симметрию между параметрами в их предыдущем распределении. [10] Эта симметрия вероятностно представлена ​​взаимозаменяемостью. Как правило, полезно и целесообразно моделировать данные из обменного распределения как независимо и одинаково распределенные с учетом некоторого неизвестного вектора параметров. , с раздачей .

Конечная заменяемость

[ редактировать ]

Для фиксированного числа n множество обменен, если совместная вероятность инвариантен относительно перестановок индексов. То есть для каждой перестановки или из (1, 2, …, n ), [11]

Ниже приведен взаимозаменяемый, но не независимый и идентичный (iid) пример:Рассмотрим урну с красным и синим шарами внутри с вероятностью рисования тоже. Шары вытягиваются без замены, т.е. после того, как из n шаров вытянут один, n для следующего розыгрыша останется − 1 шаров.

Поскольку вероятность выбора красного шара в первом розыгрыше и синего шара во втором розыгрыше равна вероятности выбора синего шара в первом розыгрыше и красного шара во втором розыгрыше, обе из которых равны 1/ 2 (т.е. ), затем и являются взаимозаменяемыми.

Но вероятность выбора красного шара во втором розыгрыше, учитывая, что красный шар уже был выбран в первом розыгрыше, равна 0 и не равна вероятности того, что красный шар будет выбран во втором розыгрыше, которая равна 1. /2 (т.е. ). Таким образом, и не являются независимыми.

Если независимы и одинаково распределены, то они взаимозаменяемы, но обратное не обязательно верно. [12]

Бесконечная заменяемость

[ редактировать ]

Бесконечная заменяемость — это свойство, согласно которому каждое конечное подмножество бесконечной последовательности , является сменным. То есть для любого n последовательность является сменным. [12]

Иерархические модели

[ редактировать ]

Компоненты

[ редактировать ]

Байесовское иерархическое моделирование использует две важные концепции для получения апостериорного распределения: [1] а именно:

  1. Гиперпараметры : параметры априорного распределения.
  2. Гиперприоры : распределения гиперпараметров

Предположим, что случайная величина Y соответствует нормальному распределению с параметром θ в качестве среднего значения и 1 в качестве дисперсии , то есть . Отношение тильды можно прочитать как «имеет распространение» или «распространяется как». Предположим также, что параметр имеет распределение, заданное нормальным распределением со средним значением и дисперсия 1, т.е. . Более того, следует другому распределению, заданному, например, стандартным нормальным распределением , . Параметр называется гиперпараметром, а его распределение определяется выражением является примером гиперприорного распределения. Обозначение распределения Y меняется при добавлении другого параметра, т.е. . Если есть еще один этап, скажем, следует другому нормальному распределению со средним значением и дисперсия , значение , и также можно назвать гиперпараметрами, хотя их распределения также являются гиперприорными распределениями. [6]

Позволять быть наблюдением и параметр, управляющий процессом генерации данных для . Предположим далее, что параметры генерируются путем обмена из общей совокупности, причем распределение регулируется гиперпараметром .
Байесовская иерархическая модель содержит следующие этапы:

Вероятность, как видно на этапе I, равна , с как его предварительное распространение. Обратите внимание, что вероятность зависит от только через .

Предварительное распределение на этапе I можно разбить на:

[из определения условной вероятности]

С как его гиперпараметр с гиперприорным распределением, .

Таким образом, апостериорное распределение пропорционально:

[с использованием теоремы Байеса]
[13]

Чтобы проиллюстрировать это, рассмотрим пример:Учитель хочет оценить, насколько хорошо студент сдал SAT . Учитель использует информацию об оценках ученика в средней школе и текущем среднем балле (GPA), чтобы получить оценку. Текущий средний балл студента, обозначаемый , имеет вероятность, заданную некоторой функцией вероятности с параметром , то есть . Этот параметр это балл студента по SAT. Оценка SAT рассматривается как выборка, полученная из общего распределения населения, индексированного по другому параметру. , который является оценкой учащегося в старшей школе (первокурсник, второкурсник, младший или старший). [14] То есть, . Более того, гиперпараметр следует своему собственному распределению, заданному , гиперприор.Чтобы определить балл SAT, учитывая информацию о среднем балле,

Вся информация в задаче будет использована для решения апостериорного распределения. Вместо решения только с использованием априорного распределения и функции правдоподобия использование гиперприорных методов дает больше информации, позволяющей сделать более точные предположения о поведении параметра. [15]

2-ступенчатая иерархическая модель

[ редактировать ]

В целом совместное апостериорное распределение интересов в двухступенчатых иерархических моделях выглядит следующим образом:

[15]

3-ступенчатая иерархическая модель

[ редактировать ]

Для трехэтапных иерархических моделей апостериорное распределение определяется следующим образом:

[15]

Байесовская нелинейная модель смешанных эффектов

[ редактировать ]
Байесовский цикл исследований с использованием байесовской нелинейной модели смешанных эффектов: (а) стандартный исследовательский цикл и (б) специфичный для Байеса рабочий процесс [16] .

Структура байесовского иерархического моделирования часто используется в различных приложениях. В частности, недавно были разработаны байесовские нелинейные модели смешанных эффектов. [ когда? ] уделялось значительное внимание. [ кем? ] Базовая версия байесовской нелинейной модели смешанных эффектов представлена ​​в виде следующей трехэтапной схемы:

Этап 1: Модель индивидуального уровня

Этап 2: Модель населения

Этап 3: Приор

Здесь, обозначает непрерывный отклик -й субъект в данный момент времени , и это -я ковариата -й предмет. Параметры, участвующие в модели, написаны греческими буквами. — известная функция, параметризованная -мерный вектор . Обычно является «нелинейной» функцией и описывает временную траекторию движения индивидуумов. В модели и описывают внутрииндивидуальную изменчивость и межиндивидуальную изменчивость соответственно. Если этап 3: Приоритет не рассматривается, то модель сводится к частотной нелинейной модели со смешанным эффектом.


Центральной задачей при применении байесовских нелинейных моделей смешанного эффекта является оценка апостериорной плотности:


На панели справа показан байесовский исследовательский цикл с использованием байесовской нелинейной модели смешанных эффектов. [16] Цикл исследования с использованием байесовской нелинейной модели смешанных эффектов состоит из двух этапов: (а) стандартный исследовательский цикл и (б) рабочий процесс, специфичный для Байеса. Стандартный цикл исследования включает обзор литературы, определение проблемы, определение вопроса и гипотезы исследования. Специфический для Байеса рабочий процесс состоит из трех подэтапов: (b)–(i) формализация предшествующих распределений на основе базовых знаний и предварительного выявления; (b)–(ii) определение функции правдоподобия на основе нелинейной функции ; и (b)–(iii) сделать апостериорный вывод. Полученный апостериорный вывод можно использовать для начала нового исследовательского цикла.

  1. ^ Jump up to: а б Алленби, Росси, Маккалок (январь 2005 г.). «Иерархическая модель Байеса: Руководство для практикующего» . Журнал байесовских приложений в маркетинге , стр. 1–4. Проверено 26 апреля 2014 г., с. 3
  2. ^ Гельман, Эндрю ; Карлин, Джон Б.; Стерн, Хэл С. и Рубин, Дональд Б. (2004). Байесовский анализ данных (второе изд.). Бока-Ратон, Флорида: CRC Press. стр. 4–5. ISBN  1-58488-388-Х .
  3. ^ Ли, Се Юн; Лей, Боуэн; Маллик, Бани (2020). «Оценка кривых распространения COVID-19 с использованием глобальных данных и заимствованной информации» . ПЛОС ОДИН . 15 (7): e0236860. arXiv : 2005.00662 . дои : 10.1371/journal.pone.0236860 . ПМК   7390340 . ПМИД   32726361 .
  4. ^ Ли, Се Юн; Маллик, Бани (2021). «Байесовское иерархическое моделирование: применение к результатам добычи в сланцах Игл Форд в Южном Техасе» . Санкхья Б. 84 : 1–43. дои : 10.1007/s13571-020-00245-8 .
  5. ^ Гельман и др. 2004 , с. 6.
  6. ^ Jump up to: а б Гельман и др. 2004 , с. 117.
  7. ^ Jump up to: а б Хорошо, И.Дж. (1980). «Немного истории иерархической байесовской методологии» . Статистика и оперативно-исследовательская работа . 31 : 489–519. дои : 10.1007/BF02888365 . S2CID   121270218 .
  8. ^ Бернардо, Смит (1994). Байесовская теория . Чичестер, Англия: John Wiley & Sons, ISBN   0-471-92416-4 , с. 23
  9. ^ Jump up to: а б Гельман и др. 2004 , стр. 6–8.
  10. ^ Бернардо, Дегроот, Линдли (сентябрь 1983 г.). «Материалы Второй Валенсийской международной встречи» . Байесовская статистика 2 . Амстердам: Elsevier Science Publishers BV, ISBN   0-444-87746-0 , стр. 167–168.
  11. ^ Гельман и др. 2004 , стр. 121–125.
  12. ^ Jump up to: а б Диаконис, Фридман (1980). «Конечные перестановочные последовательности» . Анналы вероятности, стр. 745–747.
  13. ^ Бернардо, Дегроот, Линдли (сентябрь 1983 г.). «Материалы Второй Валенсийской международной встречи» . Байесовская статистика 2 . Амстердам: Elsevier Science Publishers BV, ISBN   0-444-87746-0 , стр. 371–372.
  14. ^ Гельман и др. 2004 , стр. 120–121.
  15. ^ Jump up to: а б с Коробка GEP , Тяо Г.К. (1965). «Многопараметрическая задача с байесовской точки зрения» . Многопараметрические задачи с байесовской точки зрения Том 36 Номер 5 . Нью-Йорк: Джон Уайли и сыновья, ISBN   0-471-57428-7
  16. ^ Jump up to: а б Ли, Се Юн (2022). «Байесовские нелинейные модели для данных повторяющихся измерений: обзор, реализация и приложения» . Математика . 10 (6): 898. arXiv : 2201.12430 . дои : 10.3390/math10060898 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6f249816c47b5b98ac3f5967972efb87__1692304740
URL1:https://arc.ask3.ru/arc/aa/6f/87/6f249816c47b5b98ac3f5967972efb87.html
Заголовок, (Title) документа по адресу, URL1:
Bayesian hierarchical modeling - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)