Jump to content

Метод перекрестной энтропии

Метод перекрестной энтропии ( CE ) метод — это Монте-Карло для выборки по важности и оптимизации . Он применим как к комбинаторным , так и к непрерывным задачам, как со статической, так и с шумной целью.

Этот метод аппроксимирует оптимальную выборочную оценку важности, повторяя два этапа: [1]

  1. Нарисуйте выборку из распределения вероятностей .
  2. Минимизируйте перекрестную энтропию между этим распределением и целевым распределением, чтобы получить лучшую выборку на следующей итерации.

Реувен Рубинштейн разработал этот метод в контексте моделирования редких событий , где необходимо оценивать крошечные вероятности, например, при анализе надежности сети, моделях массового обслуживания или анализе производительности телекоммуникационных систем. Этот метод также применялся к задачам коммивояжера , квадратичного присваивания , выравнивания последовательностей ДНК , максимального сокращения и распределения буфера.

Оценка посредством выборки по важности [ править ]

Рассмотрим общую задачу оценки величины

,

где это некоторая функция производительности и является членом некоторого параметрического семейства распределений. Используя выборку по важности, эту величину можно оценить как

,

где представляет собой случайную выборку из . Для позитива , теоретически оптимальная выборки важности плотность (PDF) определяется выражением

.

Однако это зависит от неизвестного . Метод CE направлен на аппроксимацию оптимальной PDF путем адаптивного выбора членов параметрического семейства, которые наиболее близки (в смысле Кульбака – Лейблера ) к оптимальной PDF. .

Общий алгоритм CE [ править ]

  1. Выберите исходный вектор параметров ; установите т = 1.
  2. Создать случайную выборку от
  3. Решите для , где
  4. Если сходимость достигнута, остановитесь ; в противном случае увеличьте t на 1 и повторите действия, начиная с шага 2.

В ряде случаев решение шага 3 можно найти аналитически . Ситуации, в которых это происходит,

Непрерывная оптимизация — пример [ править ]

Тот же алгоритм CE можно использовать для оптимизации, а не для оценки. Предположим, задача состоит в максимизации некоторой функции , например, . Чтобы применить CE, сначала рассматривают связанную с ним стохастическую задачу оценки для данного уровня и параметрическое семейство , например, одномерный Гауссово распределение , параметризованный средним значением и дисперсия (так здесь). Следовательно, для данного , цель – найти так что сведен к минимуму. Это делается путем решения выборочной версии (стохастического аналога) задачи минимизации дивергенции КЛ, как на шаге 3 выше. Оказывается, что параметры, которые минимизируют стохастический аналог для этого выбора целевого распределения и Параметрическое семейство — это выборочное среднее и выборочная дисперсия, соответствующие элитным выборкам , то есть тем выборкам, которые имеют значение целевой функции. . Худшая из элитных выборок затем используется в качестве параметра уровня для следующей итерации. Это дает следующий рандомизированный алгоритм, который совпадает с так называемым алгоритмом оценки многомерного нормального алгоритма (EMNA), алгоритмом оценки распределения .

Псевдокод [ править ]

// Initialize parameters
μ := −6
σ2 := 100
t := 0
maxits := 100
N := 100
Ne := 10
// While maxits not exceeded and not converged
while t < maxits and σ2 > ε do
    // Obtain N samples from current sampling distribution
    X := SampleGaussian(μ, σ2, N)
    // Evaluate objective function at sampled points
    S := exp(−(X − 2) ^ 2) + 0.8 exp(−(X + 2) ^ 2)
    // Sort X by objective function values in descending order
    X := sort(X, S)
    // Update parameters of sampling distribution via elite samples                  
    μ := mean(X(1:Ne))
    σ2 := var(X(1:Ne))
    t := t + 1
// Return mean of final sampling distribution as solution
return μ

Связанные методы [ править ]

См. также [ править ]

Журнальные статьи [ править ]

  • Де Бур, П.-Т., Крозе, Д.П., Маннор, С. и Рубинштейн, Р.Ю. (2005). Учебное пособие по методу перекрестной энтропии. Анналы исследования операций , 134 (1), 19–67. [1]
  • Рубинштейн, Р.Ю. (1997). Оптимизация моделей компьютерного моделирования с редкими событиями, Европейский журнал операционных исследований , 99 , 89–112.

Программные реализации [ править ]

Ссылки [ править ]

  1. ^ Рубинштейн, Р.Ю. и Крозе, Д.П. (2004), Метод перекрестной энтропии: унифицированный подход к комбинаторной оптимизации, моделированию Монте-Карло и машинному обучению, Springer-Verlag, Нью-Йорк ISBN   978-0-387-21240-1 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e339fb3744249105bd51b716e146052e__1701529380
URL1:https://arc.ask3.ru/arc/aa/e3/2e/e339fb3744249105bd51b716e146052e.html
Заголовок, (Title) документа по адресу, URL1:
Cross-entropy method - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)