Jump to content

Цепь Маркова Монте-Карло

(Перенаправлено из сети Маркова в Монте-Карло )

В статистике ( цепь Маркова Монте-Карло MCMC ) представляет собой класс алгоритмов, используемых для извлечения выборок из распределения вероятностей . Учитывая распределение вероятностей, можно построить цепь Маркова цепи Маркова , распределение элементов которой аппроксимирует ее, то есть равновесное распределение соответствует целевому распределению. Чем больше шагов включено, тем точнее распределение выборки соответствует фактическому желаемому распределению.

Методы Монте-Карло для цепей Маркова используются для изучения распределений вероятностей, которые слишком сложны или слишком многомерны, чтобы их можно было изучать только с помощью аналитических методов. Существуют различные алгоритмы построения таких цепей Маркова, в том числе алгоритм Метрополиса – Гастингса .

Приложения

[ редактировать ]

Методы MCMC в основном используются для расчета численных аппроксимаций многомерных интегралов , например, в байесовской статистике , вычислительной физике , [ 1 ] вычислительная биология [ 2 ] и компьютерная лингвистика . [ 3 ] [ 4 ]

В байесовской статистике методы Монте-Карло для цепей Маркова обычно используются для расчета моментов и вероятных интервалов апостериорных распределений вероятностей . Использование методов MCMC позволяет рассчитывать большие иерархические модели , требующие интегрирования сотен и тысяч неизвестных параметров. [ 5 ]

При выборке редких событий они также используются для создания выборок, которые постепенно заполняют область редких сбоев. [ нужна ссылка ]

Общее объяснение

[ редактировать ]
Сходимость алгоритма Метрополиса–Гастингса . Цепь Маркова Монте-Карло пытается аппроксимировать синее распределение оранжевым распределением.

Методы Монте-Карло для цепей Маркова создают выборки из непрерывной случайной величины с плотностью вероятности , пропорциональной известной функции. Эти выборки можно использовать для оценки интеграла по этой переменной, например ее ожидаемого значения или дисперсии .

Практически ансамбль цепей обычно разрабатывается, начиная с набора точек, произвольно выбранных и достаточно удаленных друг от друга. Эти цепочки представляют собой стохастические процессы «ходоков», которые движутся случайным образом в соответствии с алгоритмом, который ищет места с достаточно высоким вкладом в интеграл для перехода в следующие, присваивая им более высокие вероятности.

Методы Монте-Карло случайного блуждания — это своего рода случайное моделирование или метод Монте-Карло . Однако, в то время как случайные выборки подынтегрального выражения, используемые в обычном интегрировании Монте-Карло, являются статистически независимыми , те, которые используются в MCMC, являются автокоррелированными . Корреляция выборок приводит к необходимости использования центральной предельной теоремы цепи Маркова при оценке погрешности средних значений.

Эти алгоритмы создают цепи Маркова так, что они имеют равновесное распределение. [ сломанный якорь ] что пропорционально заданной функции.

Уменьшение корреляции

[ редактировать ]

Хотя методы MCMC были созданы для решения многомерных задач лучше, чем общие алгоритмы Монте-Карло, когда число измерений увеличивается, они также имеют тенденцию страдать от проклятия размерности : области с более высокой вероятностью имеют тенденцию растягиваться и теряться в увеличивающемся объеме пространства. это мало что дает в интеграл. Одним из способов решения этой проблемы может быть сокращение шагов шагающего, чтобы он не пытался постоянно выйти из области с наибольшей вероятностью, хотя в этом случае процесс будет сильно автокоррелированным и дорогим (т. е. для точного определения потребуется много шагов). результат). Более сложные методы, такие как гамильтониан Монте-Карло и алгоритм Ванга и Ландау, используют различные способы уменьшения этой автокорреляции, сохраняя при этом процесс в областях, которые дают более высокий вклад в интеграл. Эти алгоритмы обычно основаны на более сложной теории, их сложнее реализовать, но они обычно сходятся быстрее.

Случайное блуждание

[ редактировать ]
  • Алгоритм Метрополиса – Гастингса : этот метод генерирует цепь Маркова, используя плотность предложений для новых шагов и метод отклонения некоторых из предложенных ходов. На самом деле это общая структура, которая включает в себя в качестве особых случаев самый первый и более простой MCMC (алгоритм Метрополиса) и многие более поздние альтернативы, перечисленные ниже.
    • Выборка Гиббса : когда целевое распределение является многомерным, алгоритм выборки Гиббса [ 6 ] обновляет каждую координату из ее полного условного распределения с учетом других координат. Выборку Гиббса можно рассматривать как частный случай алгоритма Метрополиса – Гастингса с коэффициентом приемлемости, равномерно равным 1. Когда получение данных из полных условных распределений затруднено, используются другие сэмплеры внутри Гиббса (например, см. [ 7 ] [ 8 ] ). Сэмплирование Гиббса популярно отчасти потому, что оно не требует какой-либо «настройки». Структура алгоритма выборки Гиббса очень напоминает структуру вариационного вывода по восхождению координат, поскольку оба алгоритма используют полностью условные распределения в процедуре обновления. [ 9 ]
    • Алгоритм Ланжевена с поправкой на Метрополис и другие методы, которые полагаются на градиент (и, возможно, вторую производную) целевой плотности журнала, чтобы предложить шаги, которые с большей вероятностью будут в направлении более высокой плотности вероятности. [ 10 ]
    • Гамильтониан (или гибрид) Монте-Карло (HMC): пытается избежать поведения случайного блуждания, вводя вспомогательный вектор импульса и реализуя гамильтонову динамику , поэтому функция потенциальной энергии является целевой плотностью. Выборки импульса отбрасываются после выборки. Результатом гибридного метода Монте-Карло является то, что предложения перемещаются по выборочному пространству более крупными шагами; поэтому они менее коррелированы и быстрее сходятся к целевому распределению.
    • Псевдомаргинальный Метрополис – Гастингс : этот метод заменяет оценку плотности целевого распределения несмещенной оценкой и полезен, когда целевая плотность недоступна аналитически, например, в моделях со скрытыми переменными .
  • Срезовая выборка . Этот метод основан на принципе, согласно которому можно выполнить выборку из распределения, равномерно отбирая образцы из области под графиком функции плотности. Он чередует равномерную выборку в вертикальном направлении с равномерной выборкой из горизонтального «среза», определенного текущим положением по вертикали.
  • Метрополис с множественными попытками : этот метод представляет собой разновидность алгоритма Метрополиса – Гастингса, который допускает несколько попыток в каждой точке. Позволяя делать более крупные шаги на каждой итерации, это помогает справиться с проклятием размерности.
  • Обратимый прыжок : этот метод представляет собой вариант алгоритма Метрополиса – Гастингса, который позволяет делать предложения, изменяющие размерность пространства. [ 11 ] Методы Монте-Карло для цепей Маркова, изменяющие размерность, уже давно используются в приложениях статистической физики , где для некоторых задач используется распределение, представляющее собой большой канонический ансамбль (например, когда число молекул в ящике является переменным). Но вариант с обратимым скачком полезен при выполнении выборки Монте-Карло или Гиббса цепи Маркова по непараметрическим байесовским моделям, таким как модели, включающие процесс Дирихле или процесс китайского ресторана , где количество смешивающихся компонентов/кластеров/и т. д. автоматически выводится из данных.

Методы взаимодействующих частиц

[ редактировать ]

Взаимодействующие методологии MCMC представляют собой класс методов частиц среднего поля для получения случайных выборок из последовательности вероятностных распределений с возрастающим уровнем сложности выборки. [ 12 ] Эти вероятностные модели включают модели состояния пространства путей с увеличивающимся временным горизонтом, апостериорные распределения относительно последовательности частичных наблюдений, увеличивающиеся наборы уровней ограничений для условных распределений, графики понижения температуры, связанные с некоторыми распределениями Больцмана – Гиббса, и многие другие. В принципе, любой сэмплер Монте-Карло с цепью Маркова можно превратить во взаимодействующий сэмплер Монте-Карло с цепью Маркова. Эти взаимодействующие пробоотборники Монте-Карло с цепью Маркова можно интерпретировать как способ параллельного запуска последовательности пробоотборников Монте-Карло с цепью Маркова. Например, взаимодействующие алгоритмы моделирования отжига основаны на независимых движениях Метрополиса – Гастингса, последовательно взаимодействующих с механизмом типа выбора-ресемплинга. В отличие от традиционных методов Монте-Карло с цепью Маркова, параметр точности этого класса взаимодействующих пробоотборников Монте-Карло с цепью Маркова связан только с количеством взаимодействующих пробоотборников Монте-Карло с цепью Маркова. Эти передовые методологии частиц относятся к классу моделей частиц Фейнмана – Каца. [ 13 ] [ 14 ] также называемые последовательными методами Монте-Карло или методами фильтрации частиц в сообществах байесовского вывода и обработки сигналов . [ 15 ] Взаимодействующие методы Монте-Карло цепи Маркова также можно интерпретировать как алгоритм мутационного отбора генетических частиц с мутациями Монте-Карло цепи Маркова.

Квази-Монте-Карло

[ редактировать ]

Метод квази-Монте-Карло является аналогом обычного метода Монте-Карло, который использует последовательности с низким расхождением вместо случайных чисел. [ 16 ] [ 17 ] Это дает ошибку интегрирования, которая затухает быстрее, чем ошибка истинной случайной выборки, что количественно определяется неравенством Коксмы-Главки . Эмпирически это позволяет на порядок уменьшить как ошибку оценки, так и время сходимости. [ нужна ссылка ] Методы квазимонте-карло для цепей Маркова [ 18 ] [ 19 ] такие как метод Array – RQMC, сочетающий рандомизированное моделирование квази-Монте-Карло и цепи Маркова путем моделирования цепочки одновременно, что лучше соответствует истинному распределению цепочки, чем при обычном MCMC. [ 20 ] В эмпирических экспериментах дисперсия среднего значения функции состояния иногда сходится со скоростью или даже быстрее, вместо Рассрочка Монте-Карло. [ 21 ]

Конвергенция

[ редактировать ]

Обычно нетрудно построить цепь Маркова с нужными свойствами. Более сложная проблема — определить, сколько шагов необходимо для сходимости к стационарному распределению в пределах приемлемой ошибки. [ 22 ] Хорошая цепь будет иметь быстрое перемешивание : стационарное распределение достигается быстро, начиная с произвольной позиции. Стандартный эмпирический метод оценки сходимости заключается в запуске нескольких независимых смоделированных цепей Маркова и проверке того, что соотношение межцепных и внутрицепочечных дисперсий для всех выбранных параметров близко к 1. [ 22 ] [ 23 ]

Обычно выборка методом Монте-Карло с помощью цепи Маркова может только аппроксимировать целевое распределение, поскольку всегда существует некоторый остаточный эффект начальной позиции. Более сложные алгоритмы на основе цепей Маркова, основанные на методе Монте-Карло, такие как связь из прошлого , могут создавать точные выборки за счет дополнительных вычислений и неограниченного (хотя и конечного по ожиданию) времени работы .

Многие методы Монте-Карло случайного блуждания движутся вокруг равновесного распределения относительно небольшими шагами, без тенденции к тому, чтобы шаги продвигались в одном и том же направлении. Эти методы легко реализовать и проанализировать, но, к сожалению, ходоку может потребоваться много времени, чтобы исследовать все пространство. Ходок часто поворачивается назад и охватывает уже пройденную землю.

Дальнейшее рассмотрение сходимости происходит в центральной предельной теореме цепи Маркова . Видеть [ 24 ] за обсуждение теории, связанной со сходимостью и стационарностью алгоритма Метрополиса–Гастингса.

Программное обеспечение

[ редактировать ]

Несколько программ предоставляют возможности выборки MCMC, например:

См. также

[ редактировать ]
  1. ^ Касим, МФ; Ботт, AFA; Цеферакос, П.; Лэмб, DQ; Грегори, Г.; Винко, С.М. (сентябрь 2019 г.). «Извлечение полей из протонной радиографии без профилей источника». Физический обзор E . 100 (3): 033208. arXiv : 1905.12934 . Бибкод : 2019PhRvE.100c3208K . дои : 10.1103/PhysRevE.100.033208 . ПМИД   31639953 . S2CID   170078861 .
  2. ^ Гупта, Анкур; Роулингс, Джеймс Б. (апрель 2014 г.). «Сравнение методов оценки параметров в стохастических химико-кинетических моделях: примеры из системной биологии» . Журнал Айше . 60 (4): 1253–1268. дои : 10.1002/aic.14409 . ПМЦ   4946376 . ПМИД   27429455 .
  3. ^ См. Гилл 2008.
  4. ^ См. Роберт и Казелла, 2004.
  5. ^ Банерджи, Судипто; Карлин, Брэдли П.; Гельфанд, Алан П. (12 сентября 2014 г.). Иерархическое моделирование и анализ пространственных данных (второе изд.). ЦРК Пресс. п. XIX. ISBN  978-1-4398-1917-3 .
  6. ^ Жеман, Стюарт; Геман, Дональд (ноябрь 1984 г.). «Стохастическая релаксация, распределения Гиббса и байесовское восстановление изображений» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . ПАМИ-6 (6): 721–741. дои : 10.1109/TPAMI.1984.4767596 . ISSN   0162-8828 . ПМИД   22499653 . S2CID   5837272 .
  7. ^ Гилкс, WR; Уайлд, П. (1 января 1992 г.). «Адаптивная отбраковочная выборка для выборки Гиббса». Журнал Королевского статистического общества. Серия C (Прикладная статистика) . 41 (2): 337–348. дои : 10.2307/2347565 . JSTOR   2347565 .
  8. ^ Гилкс, WR; Бест, Нью-Йорк ; Тан, KKC (1 января 1995 г.). «Выборка мегаполиса с адаптивным отклонением в рамках выборки Гиббса». Журнал Королевского статистического общества. Серия C (Прикладная статистика) . 44 (4): 455–472. дои : 10.2307/2986138 . JSTOR   2986138 .
  9. ^ Ли, Се Юн (2021). «Сэмплер Гиббса и вариационный вывод по координатному восхождению: теоретико-множественный обзор». Коммуникации в статистике - теория и методы . 51 (6): 1–21. arXiv : 2008.01006 . дои : 10.1080/03610926.2021.1921214 . S2CID   220935477 .
  10. ^ См. Страмер 1999.
  11. ^ См. Грин 1995.
  12. ^ Дель Мораль, Пьер (2013). Моделирование среднего поля для интегрирования Монте-Карло . Чепмен и Холл/CRC Press. п. 626.
  13. ^ Дель Мораль, Пьер (2004). Формулы Фейнмана–Каца. Генеалогические приближения и взаимодействующие частицы . Спрингер. п. 575.
  14. ^ Дель Мораль, Пьер; Микло, Лоран (2000). «Аппроксимация формул Фейнмана-Каца ветвящимися и взаимодействующими системами частиц с применением к нелинейной фильтрации». В Жаке Аземе; Мишель Леду; Мишель Эмери; Марк Йор (ред.). Семинар вероятностей XXXIV (PDF) . Конспект лекций по математике. Том. 1729. стр. 1–145. дои : 10.1007/bfb0103798 . ISBN  978-3-540-67314-9 .
  15. ^ Дель Мораль, Пьер (2006). «Последовательные пробоотборники Монте-Карло». Журнал Королевского статистического общества. Серия B (Статистическая методология) . 68 (3): 411–436. arXiv : cond-mat/0212648 . дои : 10.1111/j.1467-9868.2006.00553.x . S2CID   12074789 .
  16. ^ Папагеоргиу, Анаргирос; Трауб, Дж. Ф. (1996). «Победа над Монте-Карло» Риск . 9 (6): 63–65.
  17. ^ Соболь, Илья М (1998). «Об интеграциях квазимонте-карло». Математика и компьютеры в моделировании . 47 (2): 103–112. дои : 10.1016/s0378-4754(98)00096-2 .
  18. ^ Чен, С.; Дик, Йозеф; Оуэн, Арт Б. (2011). «Состоятельность цепи Маркова квази-Монте-Карло на непрерывных пространствах состояний» . Анналы статистики . 39 (2): 673–701. arXiv : 1105.1896 . дои : 10.1214/10-AOS831 .
  19. ^ Триббл, Сет Д. (2007). Алгоритмы Монте-Карло для цепей Маркова с использованием полностью равномерно распределенных управляющих последовательностей (Дисс.). Стэнфордский университет. ПроКвест   304808879 .
  20. ^ Л'Экуйер, П.; Леко, К.; Таффин, Б. (2008). «Рандомизированный метод квази-Монте-Карло моделирования цепей Маркова» (PDF) . Исследование операций . 56 (4): 958–975. дои : 10.1287/опре.1080.0556 .
  21. ^ Л'Экуйер, П.; Мангер, Д.; Леко, К.; Таффин, Б. (2018). «Методы сортировки и скорость сходимости для Array-RQMC: некоторые эмпирические сравнения». Математика и компьютеры в моделировании . 143 : 191–201. дои : 10.1016/j.matcom.2016.07.010 .
  22. ^ Jump up to: а б Гельман А.; Рубин, Д.Б. (1992). «Вывод на основе итеративного моделирования с использованием нескольких последовательностей (с обсуждением)» (PDF) . Статистическая наука . 7 (4): 457–511. Бибкод : 1992StaSc...7..457G . дои : 10.1214/ss/1177011136 .
  23. ^ Коулз, МК; Карлин, БП (1996). «Диагностика конвергенции Монте-Карло марковской цепи: сравнительный обзор». Журнал Американской статистической ассоциации . 91 (434): 883–904. CiteSeerX   10.1.1.53.3445 . дои : 10.1080/01621459.1996.10476956 .
  24. ^ Хилл, Южная Дакота; Сполл, Джей Си (2019). «Стационарность и сходимость алгоритма Метрополиса-Гастингса: взгляд на теоретические аспекты». Журнал IEEE Control Systems . 39 (1): 56–67. дои : 10.1109/MCS.2018.2876959 . S2CID   58672766 .
  25. ^ Форман-Макки, Дэниел; Хогг, Дэвид В.; Лэнг, Дастин; Гудман, Джонатан (25 ноября 2013 г.). «Ведущий: Молот MCMC». Публикации Тихоокеанского астрономического общества . 125 (925): 306–312. arXiv : 1202.3665 . Бибкод : 2013PASP..125..306F . дои : 10.1086/670067 . S2CID   88518555 .
  26. ^ Фан, Ду; Прадхан, Нирадж; Янковяк, Мартин (24 декабря 2019 г.), Составные эффекты для гибкого и ускоренного вероятностного программирования в NumPyro , doi : 10.48550/arXiv.1912.11554 , получено 21 августа 2024 г.

Источники

[ редактировать ]

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e3b4ca559596e291d9fbb44cf9ec84d6__1724729400
URL1:https://arc.ask3.ru/arc/aa/e3/d6/e3b4ca559596e291d9fbb44cf9ec84d6.html
Заголовок, (Title) документа по адресу, URL1:
Markov chain Monte Carlo - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)