Многократная попытка Метрополис
Многократный Метрополис (МТМ) — это метод выборки , который представляет собой модифицированную форму метода Метрополиса-Гастингса , впервые представленного Лю, Ляном и Вонгом в 2000 году.Он разработан, чтобы помочь траектории отбора проб быстрее сходиться,за счет увеличения как размера шага, так и скорости принятия.
Фон
[ редактировать ]Проблемы с Метрополис – Гастингс
[ редактировать ]В цепи Маркова Монте - Карло алгоритм Метрополиса – Гастингса (MH) можно использовать для выборки из распределения вероятностей , из которого трудно выполнить выборку напрямую. Однако алгоритм MH требует от пользователя предоставления распределения предложений, которое может быть относительно произвольным. Во многих случаях используется распределение Гаусса с центром в текущей точке вероятностного пространства вида . Это распределение предложений удобно для выборки и может быть лучшим выбором, если у вас мало знаний о целевом распределении. . При желании можно использовать более общее многомерное нормальное распределение , , где — это ковариационная матрица, которая, по мнению пользователя, аналогична целевому распределению.
Хотя этот метод должен сходиться к стационарному распределению в пределе бесконечного размера выборки, на практике прогресс может быть чрезвычайно медленным. Если слишком велико, почти все шаги алгоритма MH будут отклонены. С другой стороны, если слишком мал, почти все шаги будут приняты, и цепь Маркова будет похожа на случайное блуждание по вероятностному пространству. В более простом случае , мы видим это шаги всего лишь ведут нас на расстояние . В этом случае цепь Маркова не сможет полностью исследовать вероятностное пространство за разумный промежуток времени. Таким образом, алгоритм MH требует разумной настройки параметра масштаба ( или ).
Проблемы с высокой размерностью
[ редактировать ]Даже если параметр масштаба настроен правильно, по мере увеличения размерности проблемы прогресс все равно может оставаться чрезвычайно медленным. Чтобы убедиться в этом, снова рассмотрим . В одном измерении это соответствует распределению Гаусса со средним значением 0 и дисперсией 1. Для одного измерения это распределение имеет средний шаг, равный нулю, однако среднеквадратичный размер шага определяется выражением
По мере увеличения количества измерений ожидаемый размер шага становится все больше и больше. В размеры, вероятность перемещения на радиальное расстояние связано с распределением Чи и определяется выражением
Это распределение достигает максимума который для больших . Это означает, что размер шага будет увеличиваться примерно пропорционально квадратному корню из числа измерений. Для алгоритма MH большие шаги почти всегда попадают в области с низкой вероятностью и, следовательно, отклоняются.
Если мы теперь добавим параметр масштаба вернувшись, мы обнаруживаем, что для сохранения разумной степени принятия мы должны выполнить преобразование . В этой ситуации скорость принятия теперь можно сделать разумной, но исследование вероятностного пространства становится все более медленным. Чтобы убедиться в этом, рассмотрим срез по любому измерению проблемы. Выполнив приведенное выше преобразование масштаба, ожидаемый размер шага не будет равен ни одному измерению. но вместо этого . Поскольку этот размер шага намного меньше «истинного» масштаба распределения вероятностей (при условии, что каким-то образом известно априори, что является наилучшим возможным случаем), алгоритм выполняет случайное блуждание по каждому параметру.
Многократный алгоритм Метрополиса
[ редактировать ]Предполагать — произвольная функция предложения . Мы требуем, чтобы только если . Кроме того, — функция правдоподобия.
Определять где является неотрицательной симметричной функцией в и который может выбрать пользователь.
Теперь предположим, что текущее состояние . Алгоритм МТМ следующий:
1) Нарисуйте k независимых предложений по испытаниям. от . Вычислить веса для каждого из них.
2) Выберите из с вероятностью, пропорциональной весам.
3) Теперь создайте эталонный набор, нарисовав из распределения . Набор (текущая точка).
4) Принять с вероятностью
Можно показать, что этот метод удовлетворяет свойству детального баланса и, следовательно, создает обратимую цепь Маркова с как стационарное распределение.
Если симметрично (как и в случае многомерного нормального распределения ), то можно выбрать что дает .
Недостатки
[ редактировать ]Многократная попытка Метрополису необходимо вычислить энергию другие государства на каждом шагу.Если медленная часть процесса — вычисление энергии, то этот метод может быть медленнее.Если медленная часть процесса — это поиск соседей данной точки или генерация случайных чисел, то этот метод опять же может быть медленнее.Можно утверждать, что этот метод кажется быстрее только потому, что он требует гораздо больше вычислений за «один шаг», чем это делает Метрополис-Гастингс.
См. также
[ редактировать ]Ссылки
[ редактировать ]- Лю, Дж. С., Лян, Ф. и Вонг, WH (2000). Метод множественных попыток и локальная оптимизация выборки в мегаполисе, Журнал Американской статистической ассоциации , 95 (449): 121–134 JSTOR.