Метод перекрестной энтропии
Метод перекрестной энтропии ( CE ) метод — это Монте-Карло для выборки по важности и оптимизации . Он применим как к комбинаторным , так и к непрерывным задачам, как со статической, так и с шумной целью.
Этот метод аппроксимирует оптимальную выборочную оценку важности, повторяя два этапа: [1]
- Нарисуйте выборку из распределения вероятностей .
- Минимизируйте перекрестную энтропию между этим распределением и целевым распределением, чтобы получить лучшую выборку на следующей итерации.
Реувен Рубинштейн разработал этот метод в контексте моделирования редких событий , где необходимо оценивать крошечные вероятности, например, при анализе надежности сети, моделях массового обслуживания или анализе производительности телекоммуникационных систем. Этот метод также применялся к задачам коммивояжера , квадратичного присваивания , выравнивания последовательностей ДНК , максимального сокращения и распределения буфера.
Оценка посредством выборки по важности [ править ]
Рассмотрим общую задачу оценки величины
,
где это некоторая функция производительности и является членом некоторого параметрического семейства распределений. Используя выборку по важности, эту величину можно оценить как
,
где представляет собой случайную выборку из . Для позитива , теоретически оптимальная выборки важности плотность (PDF) определяется выражением
.
Однако это зависит от неизвестного . Метод CE направлен на аппроксимацию оптимальной PDF путем адаптивного выбора членов параметрического семейства, которые наиболее близки (в смысле Кульбака – Лейблера ) к оптимальной PDF. .
Общий алгоритм CE [ править ]
- Выберите исходный вектор параметров ; установите т = 1.
- Создать случайную выборку от
- Решите для , где
- Если сходимость достигнута, остановитесь ; в противном случае увеличьте t на 1 и повторите действия, начиная с шага 2.
В ряде случаев решение шага 3 можно найти аналитически . Ситуации, в которых это происходит,
- Когда принадлежит к естественному экспоненциальному семейству
- Когда дискретен с конечным носителем
- Когда и , затем соответствует оценке максимального правдоподобия, основанной на тех .
Непрерывная оптимизация — пример [ править ]
Тот же алгоритм CE можно использовать для оптимизации, а не для оценки. Предположим, задача состоит в максимизации некоторой функции , например, . Чтобы применить CE, сначала рассматривают связанную с ним стохастическую задачу оценки для данного уровня и параметрическое семейство , например, одномерный Гауссово распределение , параметризованный средним значением и дисперсия (так здесь). Следовательно, для данного , цель – найти так что сведен к минимуму. Это делается путем решения выборочной версии (стохастического аналога) задачи минимизации дивергенции КЛ, как на шаге 3 выше. Оказывается, что параметры, которые минимизируют стохастический аналог для этого выбора целевого распределения и Параметрическое семейство — это выборочное среднее и выборочная дисперсия, соответствующие элитным выборкам , то есть тем выборкам, которые имеют значение целевой функции. . Худшая из элитных выборок затем используется в качестве параметра уровня для следующей итерации. Это дает следующий рандомизированный алгоритм, который совпадает с так называемым алгоритмом оценки многомерного нормального алгоритма (EMNA), алгоритмом оценки распределения .
Псевдокод [ править ]
// Initialize parameters μ := −6 σ2 := 100 t := 0 maxits := 100 N := 100 Ne := 10 // While maxits not exceeded and not converged while t < maxits and σ2 > ε do // Obtain N samples from current sampling distribution X := SampleGaussian(μ, σ2, N) // Evaluate objective function at sampled points S := exp(−(X − 2) ^ 2) + 0.8 exp(−(X + 2) ^ 2) // Sort X by objective function values in descending order X := sort(X, S) // Update parameters of sampling distribution via elite samples μ := mean(X(1:Ne)) σ2 := var(X(1:Ne)) t := t + 1 // Return mean of final sampling distribution as solution return μ
Связанные методы [ править ]
- Имитация отжига
- Генетические алгоритмы
- Поиск гармонии
- Оценка алгоритма распределения
- Табу-поиск
- Стратегия естественной эволюции
См. также [ править ]
- Перекрестная энтропия
- Расхождение Кульбака – Лейблера
- Рандомизированный алгоритм
- Выборка по важности
Журнальные статьи [ править ]
- Де Бур, П.-Т., Крозе, Д.П., Маннор, С. и Рубинштейн, Р.Ю. (2005). Учебное пособие по методу перекрестной энтропии. Анналы исследования операций , 134 (1), 19–67. [1]
- Рубинштейн, Р.Ю. (1997). Оптимизация моделей компьютерного моделирования с редкими событиями, Европейский журнал операционных исследований , 99 , 89–112.
Программные реализации [ править ]
Ссылки [ править ]
- ^ Рубинштейн, Р.Ю. и Крозе, Д.П. (2004), Метод перекрестной энтропии: унифицированный подход к комбинаторной оптимизации, моделированию Монте-Карло и машинному обучению, Springer-Verlag, Нью-Йорк ISBN 978-0-387-21240-1 .