Интегрированные вложенные аппроксимации Лапласа
Часть серии о |
Байесовская статистика |
---|
Апостериорный = Вероятность × Априорный ÷ Доказательства |
Фон |
Модельное здание |
Апостериорное приближение |
Оценщики |
Приближение доказательств |
Оценка модели |
Интегрированные вложенные аппроксимации Лапласа ( INLA ) — это метод приближенного байесовского вывода, основанный на методе Лапласа . [1] Он предназначен для класса моделей, называемых латентными моделями Гаусса (LGM), для которых он может быть быстрой и точной альтернативой методам Монте-Карло для цепей Маркова для вычисления апостериорных маргинальных распределений. [2] [3] [4] Благодаря своей относительной скорости даже при работе с большими наборами данных для определенных проблем и моделей, INLA стал популярным методом вывода в прикладной статистике, в частности в пространственной статистике , экологии и эпидемиологии . [5] [6] [7] Также возможно объединить INLA с частных производных методом конечных элементов в решением стохастического уравнения для изучения, например, пространственных точечных процессов и моделей распределения видов . [8] [9] Метод INLA реализован в R-INLA R. пакете [10]
Скрытые гауссовы модели
[ редактировать ]Позволять обозначают переменную ответа (то есть наблюдения), которая принадлежит экспоненциальному семейству со средним значением (из ) будучи связанным с линейным предиктором через соответствующую функцию ссылки . Линейный предиктор может принимать форму (байесовской) аддитивной модели. Все скрытые эффекты (линейный предиктор, точка пересечения, коэффициенты возможных ковариат и т. д.) коллективно обозначаются вектором . Гиперпараметры модели обозначаются . Согласно байесовской статистике, и являются случайными величинами с априорными распределениями.
Наблюдения считаются условно независимыми, если и : где – набор индексов наблюдаемых элементов (некоторые элементы могут быть ненаблюдаемыми, и для них INLA вычисляет апостериорное прогнозируемое распределение). Обратите внимание, что линейный предиктор является частью .
Чтобы модель была скрытой гауссовой моделью, предполагается, что представляет собой гауссово марковское случайное поле (GMRF). [1] (то есть многомерная гауссиана с дополнительными свойствами условной независимости) с плотностью вероятности где это -зависимая матрица разреженной точности и является его определяющим фактором. Матрица точности разрежена из-за предположения GMRF. Предыдущее распределение поскольку гиперпараметры не обязательно должны быть гауссовскими. Однако количество гиперпараметров, , предполагается небольшим (скажем, менее 15).
Приблизительный байесовский вывод с помощью INLA
[ редактировать ]В байесовском выводе нужно найти апостериорное распределение скрытых переменных. и . Применение теоремы Байеса совместное заднее распределение и дается Получение точного заднего изображения, как правило, является очень сложной задачей. В INLA основная цель – сблизить задние края. где .
Ключевая идея INLA заключается в построении вложенных аппроксимаций, заданных формулой где представляет собой приблизительную апостериорную плотность. Приближение к предельной плотности получается вложенным способом путем первой аппроксимации и , а затем численно интегрируя как где суммирование ведется по значениям , с весами интегрирования, заданными выражением . Приближение вычисляется путем численного интегрирования из .
Чтобы получить приблизительное распределение , можно использовать соотношение как отправная точка. Затем получается при определенном значении гиперпараметров с приближением Лапласа [1] где представляет собой гауссово приближение к чей режим в данный момент является . Режим можно найти численно, например, с помощью метода Ньютона-Рафсона .
Хитрость приведенного выше приближения Лапласа заключается в том, что приближение Гаусса применяется к полному условию в знаменателе, поскольку он обычно близок к гауссову из-за свойства GMRF . Применение здесь аппроксимации повышает точность метода, поскольку апостериорный само по себе не обязательно должно быть близко к гауссову, поэтому приближение Гаусса не применяется напрямую к . Второе важное свойство GMRF — разреженность прецизионной матрицы. , требуется для эффективного вычисления для каждого значения . [1]
Получение приблизительного распределения является более сложным, и метод INLA предоставляет для этого три варианта: аппроксимация Гаусса, аппроксимация Лапласа или упрощенная аппроксимация Лапласа. [1] Для численного интегрирования, чтобы получить , также доступны три варианта: поиск по сетке, центральный составной дизайн или эмпирический Байес. [1]
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и ж Рю, Ховард; Мартино, Сара; Шопен, Николя (2009). «Приблизительный байесовский вывод для скрытых гауссовских моделей с использованием интегрированных вложенных аппроксимаций Лапласа». ЮР Статист. Соц. Б. 71 (2): 319–392. дои : 10.1111/j.1467-9868.2008.00700.x . S2CID 1657669 .
- ^ Тейлор, Бенджамин М.; Диггл, Питер Дж. (2014). «INLA или MCMC? Учебное пособие и сравнительная оценка пространственного прогнозирования в логарифмических гауссовских процессах Кокса». Журнал статистических вычислений и моделирования . 84 (10): 2266–2284. arXiv : 1202.1738 . дои : 10.1080/00949655.2013.788653 . S2CID 88511801 .
- ^ Тенг, М.; Нату, Ф.; Джонсон, Т.Д. (2017). «Байесовские вычисления для логгауссовских процессов Кокса: сравнительный анализ методов» . Журнал статистических вычислений и моделирования . 87 (11): 2227–2252. дои : 10.1080/00949655.2017.1326117 . ПМК 5708893 . ПМИД 29200537 .
- ^ Ван, Сяофэн; Юэ, Ю Райан; Далеко, Джулиан Дж. (2018). Моделирование байесовской регрессии с помощью INLA . Чепмен и Холл/CRC. ISBN 9781498727259 .
- ^ Бланджиардо, Марта; Камелетти, Микела (2015). Пространственные и пространственно-временные байесовские модели с R-INLA . Джон Вили и сыновья, ООО ISBN 9781118326558 .
- ^ Опиц, Т. (2017). «Скрытое гауссово моделирование и INLA: обзор с акцентом на приложения пространства-времени». Журнал Французского статистического общества . 158 : 62–85. arXiv : 1708.02723 .
- ^ Морага, Паула (2019). Геопространственные данные о здоровье: моделирование и визуализация с помощью R-INLA и Shiny . Чепмен и Холл/CRC. ISBN 9780367357955 .
- ^ Линдгрен, Финн; Рю, Ховард; Линдстрем, Йохан (2011). «Явная связь между гауссовскими полями и гауссовскими марковскими случайными полями: подход стохастического уравнения в частных производных». ЮР Статист. Соц. Б. 73 (4): 423–498. дои : 10.1111/j.1467-9868.2011.00777.x . hdl : 20.500.11820/1084d335-e5b4-4867-9245-ec9c4f6f4645 . S2CID 120949984 .
- ^ Лезама-Очоа, Северная Каролина; Грация Пеннино, М.; Холл, Массачусетс; Лопес Дж.; Муруа, Х. (2020). «Использование подхода байесовского моделирования (INLA-SPDE) для прогнозирования появления Spinetail Devil Ray (Mobular mobular)» . Научные отчеты . 10 (1): 18822. Бибкод : 2020NatSR..1018822L . дои : 10.1038/s41598-020-73879-3 . ПМК 7606447 . ПМИД 33139744 .
- ^ «Проект Р-ИНЛА» . Проверено 21 апреля 2022 г.
Дальнейшее чтение
[ редактировать ]- Гомес-Рубио, Виргилио (2021). Байесовский вывод с INLA . Чепмен и Холл/CRC. ISBN 978-1-03-217453-2 .