Байесовское иерархическое моделирование
Часть серии на |
Байесовская статистика |
---|
![]() |
Задняя = вероятность × предыдущие доказательства |
Фон |
Модель здания |
Заднее приближение |
Оценки |
Доказательства приближения |
Оценка модели |
Байесовское иерархическое моделирование - это статистическая модель, написанная в нескольких уровнях (иерархическая форма), которая оценивает параметры заднего распределения с использованием байесовского метода . [ 1 ] Подмодели объединяются для формирования иерархической модели, и теорема Байеса используется для интеграции их с наблюдаемыми данными и учетом всей присутствующей неопределенности. Результатом этой интеграции является апостериорное распределение, также известное как обновленная оценка вероятности, как дополнительные доказательства в предыдущем распределении приобретается .
Частые статистические данные могут привести к выводам, по -видимому, несовместимым с таковыми, предлагаемыми байесовской статистикой из -за байесовской обработки параметров в качестве случайных величин и ее использования субъективной информации при установлении предположений об этих параметрах. [ 2 ] Поскольку подходы отвечают на разные вопросы, формальные результаты не являются технически противоречивыми, но два подхода не согласны с тем, какой ответ имеет отношение к конкретным приложениям. Байесовцы утверждают, что соответствующая информация, касающаяся принятия решений и обновления убеждений, не может быть проигнорирована, и что иерархическое моделирование может отменить классические методы в приложениях, где респонденты предоставляют несколько наблюдений. Более того, модель оказалась надежной , а заднее распределение менее чувствительно к более гибким иерархическим априорсам.
Иерархическое моделирование используется, когда информация доступна на нескольких разных уровнях наблюдательных единиц. Например, в эпидемиологическом моделировании для описания траекторий инфекции для нескольких стран наблюдательных единиц - это страны, и каждая страна имеет свой собственный временный профиль ежедневных инфицированных случаев. [ 3 ] В анализе кривой снижения для описания кривой снижения добычи нефти или газа для нескольких скважин наблюдательные единицы представляют собой нефтяные или газовые скважины в регионе резервуара, и каждая скважина имеет собственное височное профиль нефтегазовых или газовых показателей (обычно, бочки в месяц). [ 4 ] Структура данных для иерархического моделирования сохраняет вложенную структуру данных. Иерархическая форма анализа и организации помогает в понимании многопараметрических проблем, а также играет важную роль в разработке вычислительных стратегий. [ 5 ]
Философия
[ редактировать ]Статистические методы и модели обычно включают несколько параметров, которые можно рассматривать как связанные или связанные таким образом, чтобы эта проблема подразумевала зависимость модели совместной вероятности для этих параметров. [ 6 ] Индивидуальные степени веры, выраженные в форме вероятностей, сопровождаются неопределенностью. [ 7 ] Среди это изменение степени веры с течением времени. Как было заявлено профессор Хосе М. Бернардо и профессор Адриан Ф. Смит , «актуальность учебного процесса состоит в эволюции индивидуальных и субъективных убеждений в реальности». Эти субъективные вероятности более непосредственно вовлечены в ум, а не физические вероятности. [ 7 ] Следовательно, именно с этой необходимостью обновления убеждений Байесов сформулировала альтернативную статистическую модель, которая учитывает предыдущее возникновение конкретного события. [ 8 ]
Теорема Байеса
[ редактировать ]Предполагаемое появление события реального мира обычно изменяет предпочтения между определенными вариантами. Это делается путем изменения степени веры, прикрепленных к человеку, к событиям, определяющим варианты. [ 9 ]
Предположим, в исследовании эффективности сердечных методов лечения, причем пациенты в больнице J имеют вероятность выживания вероятность выживания будет обновлена с помощью Y , события, в котором создается противоречивая сыворотка, которая, как считает некоторыми, увеличивает выживаемость у пациентов с сердцем.
Чтобы сделать обновленные вероятностные заявления о , учитывая возникновение события Y , мы должны начать с модели, обеспечивающей совместное распределение вероятностей для и у Это может быть написано как продукт двух распределений, которые часто называют предыдущим распределением и распределение отбора проб соответственно:
Используя основное свойство условной вероятности , апостериорное распределение даст:
Это уравнение, показывающее взаимосвязь между условной вероятностью и отдельными событиями, известно как теорема Байеса. Это простое выражение инкапсулирует техническое ядро байесовского вывода, целью которого является включение обновленного убеждения, , в соответствующих и решаемых способах. [ 9 ]
Обменение
[ редактировать ]Обычной отправной точкой статистического анализа является предположение, что n значения обмениваются. Если нет информации, кроме данных y , не доступна для различения какого -либо из Из любого других, и никакое упорядочение или группировка параметров не может быть сделано, нужно предположить симметрию между параметрами в их предыдущем распределении. [ 10 ] Эта симметрия представлена вероятностью путем обмена. Как правило, полезно и целесообразно моделировать данные из обменного распределения как независимо и идентично распределенного , с учетом некоторого неизвестного вектора параметров , с распределением .
Конечная обмена
[ редактировать ]Для фиксированного числа n набор Обменен, если совместная вероятность является инвариантным под перестановкой индексов. То есть для каждой перестановки или (1, 2,…, n ), [ 11 ]
Ниже приведено обменное, но не независимое и идентичное (IID), пример: Рассмотрим урну с красным мячом и синим шаром внутри, с вероятностью рисования тоже. Шары нарисованы без замены, т.е. После того, как один шарик будет вытянут из N шарики . шариков, для следующего розыгрыша останутся оставшиеся
Поскольку вероятность выбора красного шарика в первом розыгрыше и синего шарика во втором розыгрыше равен вероятности выбора синего шарика на первом розыгрыше и красного на втором розыгрыше, оба из которых равны 1// 2 (т.е. ), затем и обмениваются.
Но вероятность выбора красного шарика во втором розыгрыше, учитывая, что красный шарик уже был выбран в первом розыгрыше 0, и не равна вероятности того, что красный шарик выбран во втором розыгрыше, который равен 1 /2 (т.е. ) Таким образом, и не независимы.
Если являются независимыми и идентично распределенными, тогда они обменяются, но обратное не обязательно верно. [ 12 ]
Бесконечная обмену
[ редактировать ]Бесконечная обмену - это свойство, которое каждая конечная подмножество бесконечной последовательности , Обменен. То есть для любого n , последовательность Обменен. [ 12 ]
Иерархические модели
[ редактировать ]Компоненты
[ редактировать ]Байесовское иерархическое моделирование использует две важные понятия в получении заднего распределения, [ 1 ] а именно:
- Гиперпараметры : параметры предыдущего распределения
- Гиперприоры : распределение гиперпараметров
Предположим, что случайная переменная Y следует за нормальным распределением с параметрами как среднее и 1 как дисперсия , то есть Полем Отношение Тильде может быть прочитано как «имеет распределение» или »распределено как». Предположим также, что параметр имеет распределение, приведенное в результате нормального распределения со средним значением и дисперсия 1, т.е. Полем Более того, следует еще одно распределение, приведенное, например, стандартным нормальным распределением , Полем Параметр называется гиперпараметром, в то время как его распределение дано является примером гиперприорского распределения. Обозначение распределения y изменений при добавлении другого параметра, т.е. Полем Если есть еще один этап, скажем, следует другому нормальному распределению со средним и дисперсия , значение , и Также можно назвать гиперпараметрами, в то время как их распределения также являются гиперприорскими распределениями. [ 6 ]
Рамки
[ редактировать ]Позволять быть наблюдением и параметр, регулирующий процесс генерирования данных для Полем Далее предположим, что параметры генерируются обменными из общей численности населения, с распределением, регулируемого гиперпараметром .
Байесовская иерархическая модель содержит следующие этапы:
Вероятность, как видно на стадии I есть , с как его предварительное распределение. Обратите внимание, что вероятность зависит от только через .
Предыдущее распределение с этапа, на которое я могу быть разбит:
- [Из определения условной вероятности]
С в качестве гиперпараметра с гиперприорским распределением, .
Таким образом, заднее распределение пропорционально:
- [Использование теоремы Байеса]
- [ 13 ]
Пример
[ редактировать ]Чтобы дополнительно проиллюстрировать это, рассмотрите пример: Учитель хочет оценить, насколько хорошо ученик преуспел в SAT . Преподаватель использует информацию о оценках средней школы ученика и среднем значении (GPA), чтобы придумать оценку. Нынешний средний балл студента, обозначенный , имеет вероятность, заданная некоторой вероятностной функцией с параметрами IE Полем Этот параметр SAT SAC студента. Оценка SAT рассматривается как выборка, поступающая из общего распределения населения, индексируемого другим параметром , который является средней школой ученика (первокурсник, второкурсник, младший или старший). [ 14 ] То есть, Полем Более того, гиперпараметр следует своему собственному распределению, данным , гиперприор. Решить для оценки SAT, предоставленного информации о среднем GPA,
Вся информация в задаче будет использоваться для решения для апостериорного распределения. Вместо того, чтобы решать только использование предыдущего распределения и функции вероятности, использование гиперприоров дает больше информации, чтобы привести более точные убеждения в поведении параметра. [ 15 ]
2-ступенчатая иерархическая модель
[ редактировать ]В целом, совместное заднее распределение интереса к 2-ступенчатым иерархическим моделям:
3-ступенчатая иерархическая модель
[ редактировать ]Для трехэтапных иерархических моделей заднее распределение определяется:
Байесовская нелинейная модель смешанных эффектов
[ редактировать ]
Структура байесовского иерархического моделирования часто используется в различных приложениях. В частности, модели байесовских нелинейных смешанных эффектов недавно [ когда? ] получил значительное внимание. [ кем? ] Основная версия байесовских нелинейных моделей смешанных эффектов представлена в качестве следующего трехэтапного:
Этап 1: модель индивидуального уровня
Этап 2: Модель населения
Этап 3: Приор
Здесь, обозначает непрерывную реакцию -Т -предмет в то время , и является -6 ковариата -Т -субъект. Параметры, связанные с моделью, написаны греческими буквами. является известной функцией, параметризованной -Сянный вектор Полем Обычно, является «нелинейной» функцией и описывает временную траекторию отдельных лиц. В модели, и Опишите внутри-индивидуальную изменчивость и между индивидуальной изменчивостью соответственно. Если этап 3: ранее не учитывается, то модель сводится к частой нелинейной модели смешанного эффекта.
Центральной задачей в применении байесовских нелинейных моделей смешанного эффекта является оценка задней плотности:
Панель справа отображает байесовский исследовательский цикл с использованием байесовской нелинейной модели смешанных эффектов. [ 16 ] Исследовательский цикл с использованием байесовской нелинейной модели смешанных эффектов включает в себя два этапа: (а) стандартный цикл исследования и (б) байесовский специфический рабочий процесс. Стандартный исследовательский цикл включает в себя обзор литературы, определение проблемы и указание вопроса исследования и гипотезы. Байесовский рабочий процесс включает в себя три подметки: (b)-(i) формализация предыдущих распределений, основанных на фоновых знаниях и предварительной выявлении; (б) - (ii) определение функции вероятности на основе нелинейной функции ; и (b) - (iii) сделать задний вывод. Полученный задний вывод может быть использован для запуска нового цикла исследования.
Ссылки
[ редактировать ]- ^ Jump up to: а беременный Алленби, Росси, МакКаллох (январь 2005 г.). «Иерархическая модель байеса: гид практикующих» . Журнал байесовских приложений в маркетинге , с. 1–4. Получено 26 апреля 2014 г., с. 3
- ^ Гелман, Эндрю ; Карлин, Джон Б.; Стерн, Хэл С. и Рубин, Дональд Б. (2004). Байесовский анализ данных (второе изд.). Бока Ратон, Флорида: CRC Press. С. 4–5. ISBN 1-58488-388-х .
- ^ Ли, Се Юн; Лей, Боуэн; Маллик, Бани (2020). «Оценка кривых распространения COVID-19, интегрирующих глобальные данные и информацию о заимствовании» . Plos один . 15 (7): E0236860. Arxiv : 2005.00662 . doi : 10.1371/journal.pone.0236860 . PMC 7390340 . PMID 32726361 .
- ^ Ли, Се Юн; Маллик, Бани (2021). «Байесовское иерархическое моделирование: применение к производству приводит к сланцу Eagle Ford в Южном Техасе» . Санкхья б . 84 : 1–43. doi : 10.1007/s13571-020-00245-8 .
- ^ Приходите, возьми. 2004 , с. 6
- ^ Jump up to: а беременный Прийти. 2004 , с. 117
- ^ Jump up to: а беременный Хорошо, IJ (1980). Суна " Страницы 31 : 489–519. doi : 10.1007/ bf02888366 S2CID 121270218 .
- ^ Бернардо, Смит (1994). Байесовская теория . Чичестер, Англия: Джон Уайли и сыновья, ISBN 0-471-92416-4 , P. 23
- ^ Jump up to: а беременный Прийти. 2004 , с. 6–8.
- ^ Бернардо, ДеГрот, Линдли (сентябрь 1983 г.). «Труды второй международной встречи Валенсии» . Байесовская статистика 2 . Амстердам: Elsevier Science Publishers BV, ISBN 0-444-87746-0 , стр. 167-168
- ^ Приходите, возьми. 2004 , с. 121–125.
- ^ Jump up to: а беременный Diaconis, Freedman (1980). «Конечные обменные последовательности» . Анналы вероятности, с. 745–747
- ^ Бернардо, ДеГрот, Линдли (сентябрь 1983 г.). «Труды второй международной встречи Валенсии» . Байесовская статистика 2 . Амстердам: Elsevier Science Publishers BV, ISBN 0-444-87746-0 , стр. 371-372
- ^ Приходите, возьми. 2004 , с. 120–121.
- ^ Jump up to: а беременный в Box Gep , Tiao GC (1965). «Многоараметр проблемы с байесовской точки зрения» . Многоараметры из байесовской точки зрения точка зрения Том 36 Номер 5 . Нью -Йорк: Джон Уайли и сыновья, ISBN 0-471-57428-7
- ^ Jump up to: а беременный Lee, Se Yoon (2022). «Байесовские нелинейные модели для повторных данных измерения: обзор, реализация и приложения» . Математика . 10 (6): 898. Arxiv : 2201.12430 . doi : 10.3390/math10060898 .