Jump to content

Алгоритм Ланжевена, адаптированный к Метрополису

В вычислительной статистике алгоритм Ланжевена с поправкой на Метрополис (MALA) или Ланжевена Монте-Карло (LMC) представляет собой метод Монте-Карло с цепью Маркова (MCMC) для получения случайных выборок - последовательностей случайных наблюдений - из распределения вероятностей , для которого прямая выборка затруднена. . Как следует из названия, MALA использует комбинацию двух механизмов для генерации состояний случайного блуждания которого является целевое распределение вероятностей , инвариантной мерой :

Неформально, динамика Ланжевена направляет случайное блуждание к областям с высокой вероятностью наподобие градиентного потока, в то время как механизм принятия/отклонения Метрополиса-Гастингса улучшает свойства смешивания и сходимости этого случайного блуждания. MALA была первоначально предложена Джулианом Бесагом в 1994 году. [ 1 ] (хотя метод Смарт Монте-Карло был представлен еще в 1978 году). [ 2 ] ) и его свойства были подробно исследованы Гаретом Робертсом совместно с Ричардом Твиди. [ 3 ] и Джефф Розенталь . [ 4 ] С тех пор было введено множество вариаций и усовершенствований, например, многообразный вариант Джиролами и Колдерхеда (2011). [ 5 ] Метод эквивалентен использованию гамильтонового алгоритма Монте-Карло (гибридного Монте-Карло) только с одним дискретным шагом по времени. [ 5 ]

Дополнительная информация

[ редактировать ]

Позволять обозначим функцию плотности вероятности на , из которого желательно получить ансамбль независимых и одинаково распределенных выборок. Мы рассматриваем перезатухающую диффузию Ланжевена-Ито.

управляется производной по времени стандартного броуновского движения . (Обратите внимание, что другая часто используемая нормировка для этой диффузии:

что порождает ту же динамику.) В пределе, когда , это распределение вероятностей из приближается к стационарному распределению, также инвариантному относительно диффузии, которое мы обозначим . Оказывается, на самом деле .

Приблизительные выборочные траектории диффузии Ланжевена могут быть созданы многими методами дискретного времени. Одним из самых простых является метод Эйлера–Маруямы с фиксированным шагом по времени. . Мы устанавливаем а затем рекурсивно определить приближение к истинному решению к

где каждый является независимым выводом из многомерного нормального распределения со средним значением 0 и ковариационной матрицей, равной идентификационная матрица . Обратите внимание, что обычно распределяется со средним значением и ковариация равна раз идентификационная матрица.

В отличие от метода Эйлера–Маруямы для моделирования диффузии Ланжевена, который всегда обновляет согласно правилу обновления

MALA включает дополнительный шаг. Мы рассматриваем приведенное выше правило обновления как определение предложения. для нового государства,

Данное предложение принимается или отклоняется согласно алгоритму Метрополиса-Гастингса:

где

– плотность вероятности перехода из к (обратите внимание, что в целом ). Позволять быть получено из непрерывного равномерного распределения на интервале . Если , то предложение принимается и мы устанавливаем ; в противном случае предложение отклоняется, и мы устанавливаем .

Комбинированная динамика диффузии Ланжевена и алгоритма Метрополиса – Гастингса удовлетворяют детальным условиям баланса, необходимым для существования уникального инвариантного стационарного распределения. . По сравнению с наивным Метрополисом-Гастингсом, MALA имеет то преимущество, что обычно предлагает перемещение в регионы с более высоким уровнем доходов. вероятности, которые затем с большей вероятностью будут приняты. С другой стороны, когда сильно анизотропен (т.е. меняется в одних направлениях гораздо быстрее, чем в других), необходимо принять чтобы правильно уловить динамику Ланжевена; использование положительно определенной предварительной обусловленности матрицы может помочь облегчить эту проблему, создавая предложения в соответствии с

так что имеет в виду и ковариация .

Можно показать, что для ограниченных классов целевых распределений оптимальная скорость принятия этого алгоритма равна ; если на практике обнаруживается, что они существенно отличаются, должны быть соответствующим образом изменены. [ 4 ]

  1. ^ Дж. Бесаг (1994). «Комментарии к «Представлениям знаний в сложных системах» У. Гренандера и М. И. Миллера». Журнал Королевского статистического общества, серия B. 56 : 591–592.
  2. ^ Росски, П.Дж.; Долл, Джей Ди; Фридман, Х.Л. (1978). «Брауновская динамика как умное моделирование Монте-Карло». Журнал химической физики . 69 (10): 4628. Бибкод : 1978ЖЧФ..69.4628Р . дои : 10.1063/1.436415 .
  3. ^ Г.О. Робертс и Р.Л. Твиди (1996). «Экспоненциальная сходимость распределений Ланжевена и их дискретных аппроксимаций» . Бернулли . 2 (4): 341–363. дои : 10.2307/3318418 . JSTOR   3318418 .
  4. ^ Jump up to: а б Г. О. Робертс и Дж. С. Розенталь (1998). «Оптимальное масштабирование дискретных приближений к диффузии Ланжевена». Журнал Королевского статистического общества, серия B. 60 (1): 255–268. дои : 10.1111/1467-9868.00123 . S2CID   5831882 .
  5. ^ Jump up to: а б М. Джиролами и Б. Колдерхед (2011). «Риманово многообразие, Ланжевена и гамильтоновы методы Монте-Карло». Журнал Королевского статистического общества, серия B. 73 (2): 123–214. CiteSeerX   10.1.1.190.580 . дои : 10.1111/j.1467-9868.2010.00765.x .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e957417ebf32ab5d5d0689201248453b__1721405880
URL1:https://arc.ask3.ru/arc/aa/e9/3b/e957417ebf32ab5d5d0689201248453b.html
Заголовок, (Title) документа по адресу, URL1:
Metropolis-adjusted Langevin algorithm - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)