Алгоритм Ланжевена, адаптированный к Метрополису
В вычислительной статистике алгоритм Ланжевена с поправкой на Метрополис (MALA) или Ланжевена Монте-Карло (LMC) представляет собой метод Монте-Карло с цепью Маркова (MCMC) для получения случайных выборок - последовательностей случайных наблюдений - из распределения вероятностей , для которого прямая выборка затруднена. . Как следует из названия, MALA использует комбинацию двух механизмов для генерации состояний случайного блуждания которого является целевое распределение вероятностей , инвариантной мерой :
- новые состояния предлагаются с использованием ( перезатухающей ) динамики Ланжевена , которая использует оценки градиента целевой функции плотности вероятности ;
- эти предложения принимаются или отклоняются с использованием алгоритма Метрополиса-Гастингса , который использует оценки целевой плотности вероятности (но не ее градиента).
Неформально, динамика Ланжевена направляет случайное блуждание к областям с высокой вероятностью наподобие градиентного потока, в то время как механизм принятия/отклонения Метрополиса-Гастингса улучшает свойства смешивания и сходимости этого случайного блуждания. MALA была первоначально предложена Джулианом Бесагом в 1994 году. [ 1 ] (хотя метод Смарт Монте-Карло был введен уже в 1978 г.) [ 2 ] ) и его свойства были подробно исследованы Гаретом Робертсом совместно с Ричардом Твиди. [ 3 ] и Джефф Розенталь . [ 4 ] С тех пор было введено множество вариаций и усовершенствований, например, многообразный вариант Джиролами и Колдерхеда (2011). [ 5 ] Метод эквивалентен использованию гамильтонового алгоритма Монте-Карло (гибридного Монте-Карло) только с одним дискретным шагом по времени. [ 5 ]
Дополнительная информация
[ редактировать ]Позволять обозначим функцию плотности вероятности на , из которого желательно получить ансамбль независимых и одинаково распределенных выборок. Мы рассматриваем перезатухающую диффузию Ланжевена-Ито.
управляется производной по времени стандартного броуновского движения . (Обратите внимание, что другая часто используемая нормировка для этой диффузии:
что порождает ту же динамику.) В пределе, когда , это распределение вероятностей из приближается к стационарному распределению, также инвариантному относительно диффузии, которое мы обозначим . Оказывается, на самом деле .
Приблизительные выборочные траектории диффузии Ланжевена могут быть созданы многими методами дискретного времени. Одним из самых простых является метод Эйлера–Маруямы с фиксированным шагом по времени. . Мы устанавливаем а затем рекурсивно определить приближение к истинному решению к
где каждый является независимым выводом из многомерного нормального распределения со средним значением 0 и ковариационной матрицей, равной идентификационная матрица . Обратите внимание, что обычно распределяется со средним значением и ковариация равна раз идентификационная матрица.
В отличие от метода Эйлера–Маруямы для моделирования диффузии Ланжевена, который всегда обновляет согласно правилу обновления
MALA включает дополнительный шаг. Мы рассматриваем приведенное выше правило обновления как определение предложения. для нового государства,
Данное предложение принимается или отклоняется согласно алгоритму Метрополиса-Гастингса:
где
– плотность вероятности перехода из к (обратите внимание, что в целом ). Позволять быть получено из непрерывного равномерного распределения на интервале . Если , то предложение принимается и мы устанавливаем ; в противном случае предложение отклоняется, и мы устанавливаем .
Комбинированная динамика диффузии Ланжевена и алгоритма Метрополиса – Гастингса удовлетворяют детальным условиям баланса, необходимым для существования уникального инвариантного стационарного распределения. . По сравнению с наивным Метрополисом-Гастингсом, MALA имеет то преимущество, что обычно предлагает перемещение в регионы с более высоким уровнем доходов. вероятности, которые затем с большей вероятностью будут приняты. С другой стороны, когда сильно анизотропен (т.е. меняется в одних направлениях гораздо быстрее, чем в других), необходимо принять чтобы правильно уловить динамику Ланжевена; использование положительно определенной предварительной обработки матрицы может помочь облегчить эту проблему, создавая предложения в соответствии с
так что имеет в виду и ковариация .
Можно показать, что для ограниченных классов целевых распределений оптимальная скорость принятия этого алгоритма равна ; если на практике обнаруживается, что они существенно отличаются, должны быть соответствующим образом изменены. [ 4 ]
Ссылки
[ редактировать ]- ^ Дж. Бесаг (1994). «Комментарии к «Представлениям знаний в сложных системах» У. Гренандера и М. И. Миллера». Журнал Королевского статистического общества, серия B. 56 : 591–592.
- ^ Росски, П.Дж.; Долл, Джей Ди; Фридман, Х.Л. (1978). «Брауновская динамика как умное моделирование Монте-Карло». Журнал химической физики . 69 (10): 4628. Бибкод : 1978ЖЧФ..69.4628Р . дои : 10.1063/1.436415 .
- ^ Г.О. Робертс и Р.Л. Твиди (1996). «Экспоненциальная сходимость распределений Ланжевена и их дискретных аппроксимаций» . Бернулли . 2 (4): 341–363. дои : 10.2307/3318418 . JSTOR 3318418 .
- ^ Jump up to: а б Г.О. Робертс и Дж.С. Розенталь (1998). «Оптимальное масштабирование дискретных приближений к диффузии Ланжевена». Журнал Королевского статистического общества, серия B. 60 (1): 255–268. дои : 10.1111/1467-9868.00123 . S2CID 5831882 .
- ^ Jump up to: а б М. Джиролами и Б. Колдерхед (2011). «Риманово многообразие, Ланжевена и гамильтоновы методы Монте-Карло». Журнал Королевского статистического общества, серия B. 73 (2): 123–214. CiteSeerX 10.1.1.190.580 . дои : 10.1111/j.1467-9868.2010.00765.x .