Байесовское иерархическое моделирование
Часть серии о |
Байесовская статистика |
---|
Апостериорный = Вероятность × Априорный ÷ Доказательства |
Фон |
Модельное здание |
Апостериорное приближение |
Оценщики |
Приближение доказательств |
Оценка модели |
Байесовское иерархическое моделирование — это статистическая модель, написанная в нескольких уровнях (иерархической форме), которая оценивает параметры апостериорного распределения с использованием байесовского метода . [1] Подмодели объединяются, образуя иерархическую модель, а теорема Байеса используется для их интеграции с наблюдаемыми данными и учета всей имеющейся неопределенности. Результатом этого интегрирования является апостериорное распределение, также известное как обновленная оценка вероятности, поскольку дополнительные данные о априорном распределении получены .
Частотная статистика может привести к выводам, которые кажутся несовместимыми с выводами, предлагаемыми байесовской статистикой, из-за байесовской трактовки параметров как случайных величин и использования субъективной информации при установлении предположений об этих параметрах. [2] Поскольку подходы отвечают на разные вопросы, формальные результаты не являются технически противоречивыми, но два подхода расходятся во мнениях относительно того, какой ответ имеет отношение к конкретным приложениям. Байесианцы утверждают, что нельзя игнорировать соответствующую информацию, касающуюся принятия решений и обновления убеждений, и что иерархическое моделирование может превзойти классические методы в приложениях, где респонденты предоставляют множественные данные наблюдений. Более того, модель оказалась надежной : апостериорное распределение менее чувствительно к более гибким иерархическим априорным значениям.
Иерархическое моделирование используется, когда информация доступна на нескольких различных уровнях единиц наблюдения. Например, при эпидемиологическом моделировании для описания путей распространения инфекции в нескольких странах единицами наблюдения являются страны, и каждая страна имеет свой собственный временной профиль ежедневных случаев заражения. [3] При анализе кривой падения добычи нефти или газа для описания кривой падения добычи нефти или газа для нескольких скважин единицами наблюдения являются нефтяные или газовые скважины в районе пласта, и каждая скважина имеет собственный временной профиль темпов добычи нефти или газа (обычно баррелей в месяц). [4] Структура данных для иерархического моделирования сохраняет вложенную структуру данных. Иерархическая форма анализа и организации помогает в понимании многопараметрических задач, а также играет важную роль в разработке вычислительных стратегий. [5]
Философия
[ редактировать ]Статистические методы и модели обычно включают в себя несколько параметров, которые можно рассматривать как связанные или связанные таким образом, что проблема подразумевает зависимость совместной вероятностной модели от этих параметров. [6] Отдельные степени уверенности, выраженные в форме вероятностей, сопровождаются неопределенностью. [7] При этом происходит изменение степеней веры с течением времени. Как заявили профессор Хосе М. Бернардо и профессор Адриан Ф. Смит : «Актуальность процесса обучения состоит в эволюции индивидуальных и субъективных убеждений о реальности». Эти субъективные вероятности более непосредственно связаны с разумом, чем физические вероятности. [7] Следовательно, именно с этой необходимостью обновления убеждений байесианцы сформулировали альтернативную статистическую модель, которая учитывает предшествующее возникновение конкретного события. [8]
Теорема Байеса
[ редактировать ]Предполагаемое возникновение реального события обычно приводит к изменению предпочтений между определенными вариантами. Это делается путем изменения степени убежденности человека в событиях, определяющих варианты. [9]
Предположим, что при исследовании эффективности сердечного лечения пациенты в больнице j имеют вероятность выживания , вероятность выживания будет обновляться с наступлением y , события, при котором создается спорная сыворотка, которая, как полагают некоторые, увеличивает выживаемость у сердечных пациентов.
Чтобы сделать обновленные заявления о вероятности Учитывая возникновение события y , мы должны начать с модели, обеспечивающей совместное распределение вероятностей для и й . Это можно записать как произведение двух распределений, которые часто называют предыдущим распределением. и распределение выборки соответственно:
Используя основное свойство условной вероятности , апостериорное распределение даст:
Это уравнение, показывающее связь между условной вероятностью и отдельными событиями, известно как теорема Байеса. Это простое выражение отражает техническую суть байесовского вывода, целью которого является включение обновленного убеждения: , подходящими и разрешимыми способами. [9]
Взаимозаменяемость
[ редактировать ]Обычной отправной точкой статистического анализа является предположение, что n значения являются взаимозаменяемыми. Если нет информации – кроме данных y – для различения любого из отличается от любых других, и никакое упорядочение или группирование параметров невозможно, необходимо предположить симметрию между параметрами в их предыдущем распределении. [10] Эта симметрия вероятностно представлена взаимозаменяемостью. Как правило, полезно и целесообразно моделировать данные из обменного распределения как независимо и одинаково распределенные с учетом некоторого неизвестного вектора параметров. , с раздачей .
Конечная заменяемость
[ редактировать ]Для фиксированного числа n множество обменен, если совместная вероятность инвариантен относительно перестановок индексов. То есть для каждой перестановки или из (1, 2, …, n ), [11]
Ниже приведен взаимозаменяемый, но не независимый и идентичный (iid) пример:Рассмотрим урну с красным и синим шарами внутри с вероятностью рисования тоже. Шары вытягиваются без замены, т.е. после того, как из n шаров вытянут один, n для следующего розыгрыша останется − 1 шаров.
Поскольку вероятность выбора красного шара в первом розыгрыше и синего шара во втором розыгрыше равна вероятности выбора синего шара в первом розыгрыше и красного шара во втором розыгрыше, обе из которых равны 1/ 2 (т.е. ), затем и являются взаимозаменяемыми.
Но вероятность выбора красного шара во втором розыгрыше, учитывая, что красный шар уже был выбран в первом розыгрыше, равна 0 и не равна вероятности того, что красный шар будет выбран во втором розыгрыше, которая равна 1. /2 (т.е. ). Таким образом, и не являются независимыми.
Если независимы и одинаково распределены, то они взаимозаменяемы, но обратное не обязательно верно. [12]
Бесконечная заменяемость
[ редактировать ]Бесконечная заменяемость — это свойство, согласно которому каждое конечное подмножество бесконечной последовательности , является сменным. То есть для любого n последовательность является сменным. [12]
Иерархические модели
[ редактировать ]Компоненты
[ редактировать ]Байесовское иерархическое моделирование использует две важные концепции для получения апостериорного распределения: [1] а именно:
- Гиперпараметры : параметры априорного распределения.
- Гиперприоры : распределения гиперпараметров
Предположим, что случайная величина Y соответствует нормальному распределению с параметром θ в качестве среднего значения и 1 в качестве дисперсии , то есть . Отношение тильды можно прочитать как «имеет распространение» или «распространяется как». Предположим также, что параметр имеет распределение, заданное нормальным распределением со средним значением и дисперсия 1, т.е. . Более того, следует другому распределению, заданному, например, стандартным нормальным распределением , . Параметр называется гиперпараметром, а его распределение определяется выражением является примером гиперприорного распределения. Обозначение распределения Y меняется при добавлении другого параметра, т.е. . Если есть еще один этап, скажем, следует другому нормальному распределению со средним значением и дисперсия , значение , и также можно назвать гиперпараметрами, хотя их распределения также являются гиперприорными распределениями. [6]
Рамки
[ редактировать ]Позволять быть наблюдением и параметр, управляющий процессом генерации данных для . Предположим далее, что параметры генерируются путем обмена из общей совокупности, причем распределение регулируется гиперпараметром .
Байесовская иерархическая модель содержит следующие этапы:
Вероятность, как видно на этапе I, равна , с как его предварительное распространение. Обратите внимание, что вероятность зависит от только через .
Предварительное распределение на этапе I можно разбить на:
- [из определения условной вероятности]
С как его гиперпараметр с гиперприорным распределением, .
Таким образом, апостериорное распределение пропорционально:
- [с использованием теоремы Байеса]
- [13]
Пример
[ редактировать ]Чтобы проиллюстрировать это, рассмотрим пример:Учитель хочет оценить, насколько хорошо студент сдал SAT . Учитель использует информацию об оценках ученика в средней школе и текущем среднем балле (GPA), чтобы получить оценку. Текущий средний балл студента, обозначаемый , имеет вероятность, заданную некоторой функцией вероятности с параметром , то есть . Этот параметр это балл студента по SAT. Оценка SAT рассматривается как выборка, полученная из общего распределения населения, индексированного по другому параметру. , который является оценкой учащегося в старшей школе (первокурсник, второкурсник, младший или старший). [14] То есть, . Более того, гиперпараметр следует своему собственному распределению, заданному , гиперприор.Чтобы определить балл SAT, учитывая информацию о среднем балле,
Вся информация в задаче будет использована для решения апостериорного распределения. Вместо решения только с использованием априорного распределения и функции правдоподобия использование гиперприорных методов дает больше информации, позволяющей сделать более точные предположения о поведении параметра. [15]
2-ступенчатая иерархическая модель
[ редактировать ]В целом совместное апостериорное распределение интересов в двухступенчатых иерархических моделях выглядит следующим образом:
3-ступенчатая иерархическая модель
[ редактировать ]Для трехэтапных иерархических моделей апостериорное распределение определяется следующим образом:
Байесовская нелинейная модель смешанных эффектов
[ редактировать ]Структура байесовского иерархического моделирования часто используется в различных приложениях. В частности, недавно были разработаны байесовские нелинейные модели смешанных эффектов. [ когда? ] уделялось значительное внимание. [ кем? ] Базовая версия байесовской нелинейной модели смешанных эффектов представлена в виде следующей трехэтапной схемы:
Этап 1: Модель индивидуального уровня
Этап 2: Модель населения
Этап 3: Приор
Здесь, обозначает непрерывный отклик -й субъект в данный момент времени , и это -я ковариата -й предмет. Параметры, участвующие в модели, написаны греческими буквами. — известная функция, параметризованная -мерный вектор . Обычно является «нелинейной» функцией и описывает временную траекторию движения индивидуумов. В модели и описывают внутрииндивидуальную изменчивость и межиндивидуальную изменчивость соответственно. Если этап 3: Приоритет не рассматривается, то модель сводится к частотной нелинейной модели со смешанным эффектом.
Центральной задачей при применении байесовских нелинейных моделей смешанного эффекта является оценка апостериорной плотности:
На панели справа показан байесовский исследовательский цикл с использованием байесовской нелинейной модели смешанных эффектов. [16] Цикл исследования с использованием байесовской нелинейной модели смешанных эффектов состоит из двух этапов: (а) стандартный исследовательский цикл и (б) рабочий процесс, специфичный для Байеса. Стандартный цикл исследования включает обзор литературы, определение проблемы, определение вопроса и гипотезы исследования. Специфический для Байеса рабочий процесс состоит из трех подэтапов: (b)–(i) формализация предшествующих распределений на основе базовых знаний и предварительного выявления; (b)–(ii) определение функции правдоподобия на основе нелинейной функции ; и (b)–(iii) сделать апостериорный вывод. Полученный апостериорный вывод можно использовать для начала нового исследовательского цикла.
Ссылки
[ редактировать ]- ^ Jump up to: а б Алленби, Росси, Маккалок (январь 2005 г.). «Иерархическая модель Байеса: Руководство для практикующего» . Журнал байесовских приложений в маркетинге , стр. 1–4. Проверено 26 апреля 2014 г., с. 3
- ^ Гельман, Эндрю ; Карлин, Джон Б.; Стерн, Хэл С. и Рубин, Дональд Б. (2004). Байесовский анализ данных (второе изд.). Бока-Ратон, Флорида: CRC Press. стр. 4–5. ISBN 1-58488-388-Х .
- ^ Ли, Се Юн; Лей, Боуэн; Маллик, Бани (2020). «Оценка кривых распространения COVID-19 с использованием глобальных данных и заимствованной информации» . ПЛОС ОДИН . 15 (7): e0236860. arXiv : 2005.00662 . дои : 10.1371/journal.pone.0236860 . ПМК 7390340 . ПМИД 32726361 .
- ^ Ли, Се Юн; Маллик, Бани (2021). «Байесовское иерархическое моделирование: применение к результатам добычи в сланцах Игл Форд в Южном Техасе» . Санкхья Б. 84 : 1–43. дои : 10.1007/s13571-020-00245-8 .
- ^ Гельман и др. 2004 , с. 6.
- ^ Jump up to: а б Гельман и др. 2004 , с. 117.
- ^ Jump up to: а б Хорошо, И.Дж. (1980). «Немного истории иерархической байесовской методологии» . Статистика и оперативно-исследовательская работа . 31 : 489–519. дои : 10.1007/BF02888365 . S2CID 121270218 .
- ^ Бернардо, Смит (1994). Байесовская теория . Чичестер, Англия: John Wiley & Sons, ISBN 0-471-92416-4 , с. 23
- ^ Jump up to: а б Гельман и др. 2004 , стр. 6–8.
- ^ Бернардо, Дегроот, Линдли (сентябрь 1983 г.). «Материалы Второй Валенсийской международной встречи» . Байесовская статистика 2 . Амстердам: Elsevier Science Publishers BV, ISBN 0-444-87746-0 , стр. 167–168.
- ^ Гельман и др. 2004 , стр. 121–125.
- ^ Jump up to: а б Диаконис, Фридман (1980). «Конечные перестановочные последовательности» . Анналы вероятности, стр. 745–747.
- ^ Бернардо, Дегроот, Линдли (сентябрь 1983 г.). «Материалы Второй Валенсийской международной встречи» . Байесовская статистика 2 . Амстердам: Elsevier Science Publishers BV, ISBN 0-444-87746-0 , стр. 371–372.
- ^ Гельман и др. 2004 , стр. 120–121.
- ^ Jump up to: а б с Коробка GEP , Тяо Г.К. (1965). «Многопараметрическая задача с байесовской точки зрения» . Многопараметрические задачи с байесовской точки зрения Том 36 Номер 5 . Нью-Йорк: Джон Уайли и сыновья, ISBN 0-471-57428-7
- ^ Jump up to: а б Ли, Се Юн (2022). «Байесовские нелинейные модели для данных повторяющихся измерений: обзор, реализация и приложения» . Математика . 10 (6): 898. arXiv : 2201.12430 . дои : 10.3390/math10060898 .