Гамильтониан Монте-Карло
Гамильтонов алгоритм Монте-Карло (первоначально известный как гибридный Монте-Карло ) представляет собой метод Монте-Карло с цепью Маркова для получения последовательности случайных выборок , которые сходятся к распределению в соответствии с целевым распределением вероятностей, для которого прямая выборка затруднена. Эту последовательность можно использовать для оценки интегралов относительно целевого распределения ( ожидаемых значений ).
Гамильтониан Монте-Карло соответствует экземпляру алгоритма Метрополиса-Гастингса , в котором эволюция гамильтоновой динамики моделируется с использованием обратимого во времени и сохраняющего объем числового интегратора (обычно интегратора чехарды ), чтобы предложить переход к новой точке в пространстве состояний. По сравнению с использованием гауссовского распределения предложений случайного блуждания в алгоритме Метрополиса – Гастингса, гамильтониан Монте-Карло уменьшает корреляцию между последовательными выборочными состояниями, предлагая переходы к удаленным состояниям, которые поддерживают высокую вероятность принятия из-за приблизительных энергосберегающих свойств моделируемого гамильтониана. динамический при использовании симплектического интегратора . Уменьшенная корреляция означает, что требуется меньше выборок цепи Маркова для аппроксимации интегралов относительно целевого распределения вероятностей для заданной ошибки Монте-Карло .
Первоначально алгоритм был предложен Саймоном Дуэйном, Энтони Кеннеди, Брайаном Пендлтоном и Дунканом Роуэтом в 1987 году для расчетов в решеточной квантовой хромодинамике . [1] В 1996 году Рэдфорд М. Нил показал, как этот метод можно использовать для более широкого класса статистических задач, в частности для искусственных нейронных сетей . [2] Однако бремя необходимости обеспечения градиентов байесовской сети задержало более широкое внедрение алгоритма в статистике и других количественных дисциплинах, пока в середине 2010-х годов разработчики Стэна не реализовали HMC в сочетании с автоматическим дифференцированием . [3]
Алгоритм
[ редактировать ]Предположим, что целевое распределение для выборки равно для ( ) и цепочка образцов требуется.
Гамильтона Уравнения :
где и являются -я компонента вектора положения и импульса соответственно и является гамильтонианом. Позволять если массовая матрица симметрична и положительно определена, то гамильтониан равен
где это потенциальная энергия . Потенциальная энергия цели определяется как
что происходит от фактора Больцмана . Заметим, что гамильтониан в этой формулировке безразмерен, поскольку экспоненциальный вес вероятности должен быть четко определен. Например, в моделировании при конечной температуре фактор (с постоянной Больцмана ) непосредственно поглощается и .
Алгоритму требуется положительное целое число для количества шагов чехарды. и положительное число для размера шага . Предположим, что цепь находится в . Позволять . Во-первых, случайный гауссов импульс взято из . Далее частица будет двигаться в условиях гамильтоновой динамики за время , это делается путем численного решения уравнений Гамильтона с использованием алгоритма чехарды . Векторы положения и импульса по времени с использованием алгоритма чехарды: [4]
Эти уравнения следует применять к и раз, чтобы получить и .
Алгоритм чехарды представляет собой приближенное решение движения невзаимодействующих классических частиц. Если оно точное, то решение никогда не изменит начальное случайно сгенерированное распределение энергии, поскольку энергия сохраняется для каждой частицы в присутствии классического поля потенциальной энергии. Чтобы достичь термодинамического равновесного распределения, частицы должны каким-то образом взаимодействовать, например, с окружающей тепловой баней, чтобы вся система могла принимать разные энергии с вероятностями в соответствии с распределением Больцмана.
Один из способов продвинуть систему к термодинамически равновесному распределению — изменить состояние частиц с помощью алгоритма Метрополиса–Гастингса . Итак, сначала применяется шаг чехарды, затем шаг Метрополиса-Гастингса.
Переход от к является
где
Полное обновление состоит из первой случайной выборки импульсов. (независимо от предыдущих итераций), затем интегрирование уравнений движения (например, с помощью чехарды) и, наконец, получение новой конфигурации на этапе принятия/отклонения Метрополиса-Гастингса. Этот механизм обновления повторяется для получения .
Нет разворотного пробоотборника
[ редактировать ]Пробоотборник без разворота (NUTS) [5] является расширением путем управления автоматически. Тюнинг является критическим. Например, в одномерном случае, потенциал что соответствует потенциалу простого гармонического осциллятора . Для слишком большой, частица будет колебаться и, таким образом, тратить время вычислений. Для слишком мала, частица будет вести себя как случайное блуждание.
Проще говоря, NUTS случайным образом запускает гамильтонову динамику как вперед, так и назад во времени, пока не будет выполнено условие разворота. Когда это происходит, для выборки MCMC выбирается случайная точка пути, и процесс повторяется с этой новой точки.
В деталях строится двоичное дерево , позволяющее отслеживать путь шагов чехарды. Для изготовления образца MCMC проводится итерационная процедура. Переменная среза отбирается. Позволять и быть положением и импульсом идущей вперед частицы соответственно. Сходным образом, и для обратной частицы. На каждой итерации двоичное дерево случайным образом равномерно выбирает, чтобы переместить переднюю частицу вперед во времени или обратную частицу назад во времени. Также для каждой итерации количество шагов чехарды увеличивается в 2 раза. Например, в первой итерации частица, идущая вперед, перемещается вперед во времени, используя 1 шаг чехарды. На следующей итерации обратная частица движется назад во времени, используя 2 чехарды.
Итерационная процедура продолжается до тех пор, пока не будет выполнено условие разворота, т.е.
или когда гамильтониан становится неточным
или
где, например, .
Как только условие разворота выполнено, следующий образец MCMC, , получается путем равномерной выборки пути чехарды, прослеженного двоичным деревом который удовлетворяет
Обычно это удовлетворяется, если остальные параметры HMC разумны.
См. также
[ редактировать ]- Динамический метод Монте-Карло
- Программное обеспечение для молекулярного моделирования Монте-Карло
- Stan — вероятностный язык программирования, реализующий HMC.
- PyMC — язык вероятностного программирования, реализующий HMC.
- Алгоритм Ланжевена, адаптированный к Метрополису
Ссылки
[ редактировать ]- ^ Дуэйн, Саймон; Кеннеди, Энтони Д.; Пендлтон, Брайан Дж.; Роуэт, Дункан (1987). «Гибрид Монте-Карло». Буквы по физике Б. 195 (2): 216–222. Бибкод : 1987PhLB..195..216D . дои : 10.1016/0370-2693(87)91197-X .
- ^ Нил, Рэдфорд М. (1996). «Реализация Монте-Карло». Байесовское обучение для нейронных сетей . Конспект лекций по статистике. Том. 118. Спрингер. стр. 55–98. дои : 10.1007/978-1-4612-0745-0_3 . ISBN 0-387-94724-8 .
- ^ Гельман, Эндрю; Ли, Дэниел; Го, Цзицян (2015). «Стэн: вероятностный язык программирования для байесовского вывода и оптимизации». Журнал образовательной и поведенческой статистики . 40 (5): 530–543. дои : 10.3102/1076998615606113 . S2CID 18351694 .
- ^ Бетанкур, Майкл (15 июля 2018 г.). «Концептуальное введение в гамильтониан Монте-Карло». arXiv : 1701.02434 [ stat.ME ].
- ^ Хоффман, Мэтью Д.; Гельман, Эндрю (2014). «Пробоотборник без разворота: адаптивная настройка длины пути в гамильтоновом методе Монте-Карло» . Журнал исследований машинного обучения . 15 (1): 1593–1623 . Проверено 28 марта 2024 г.
Дальнейшее чтение
[ редактировать ]- Бетанкур, Майкл; Джиролами, Марк (2015). «Гамильтониан Монте-Карло для иерархических моделей». В Упадхьяе — Сатьяншу Кумар; и др. (ред.). Современные тенденции в области применения байесовской методологии . ЦРК Пресс. стр. 79–101. ISBN 978-1-4822-3511-1 .
- Бетанкур, Майкл (2018). «Концептуальное введение в гамильтониан Монте-Карло». arXiv : 1701.02434 [ stat.ME ].
- Барбу, Адриан; Чжу, Сон-Чун (2020). «Гамильтониан и Ланжевен Монте-Карло». Методы Монте-Карло . Сингапур: Спрингер. стр. 281–326. ISBN 978-981-13-2970-8 .
- Нил, Рэдфорд М. (2011). «MCMC с использованием гамильтоновой динамики» (PDF) . У Стива Брукса; Эндрю Гельман; Галин Л. Джонс; Сяо-Ли Мэн (ред.). Справочник цепей Маркова Монте-Карло . Чепмен и Холл/CRC. ISBN 9781420079418 .
Внешние ссылки
[ редактировать ]- Бетанкур, Майкл. «Эффективный байесовский вывод с гамильтоновым методом Монте-Карло» . MLSS Исландия 2014 — через YouTube .
- МакЭлрит, Ричард. «Марковская цепь Монте-Карло» . Статистическое переосмысление 2022 — через YouTube .
- Гамильтониан Монте-Карло с нуля
- Оптимизация и методы Монте-Карло