Оптимизация MRF посредством двойной декомпозиции
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
При двойной декомпозиции проблема разбивается на более мелкие подзадачи и находится решение ослабленной проблемы. Этот метод можно использовать для оптимизации MRF . [1] Двойная декомпозиция применяется к программам марковской логики как метод вывода. [2]
Фон
[ редактировать ]Дискретная оптимизация MRF (вывод) очень важна в машинном обучении и компьютерном зрении , которая реализуется на графических процессорах CUDA. [3] Рассмотрим график с узлами и края . Цель — присвоить метку каждому чтобы энергия MRF была минимизирована:
(1)
MRF Основные методы оптимизации основаны на разрезах графов или передаче сообщений . Они полагаются на следующую формулировку целочисленного линейного программирования
(2)
Во многих приложениях переменные MRF представляют собой {0,1}-переменные, которые удовлетворяют: этикетка назначен на , пока , этикетки назначены .
Двойное разложение
[ редактировать ]Основная идея декомпозиции на удивление проста:
- разложить исходную сложную задачу на более мелкие решаемые подзадачи,
- Извлеките решение, умело комбинируя решения этих подзадач.
Пример задачи для декомпозиции:
где
В этой задаче минимизация каждого отдельного над это легко; но минимизация их суммы представляет собой сложную задачу. Поэтому проблему необходимо разложить с использованием вспомогательных переменных. и проблема будет в следующем:
где
Теперь мы можем ослабить ограничения с помощью множителей что дает нам следующую двойственную лагранжеву функцию:
Теперь мы устраняем от двойной функции путем минимизации по и двойная функция становится:
Мы можем поставить лагранжеву двойственную задачу:
(3) Проблема Мастера
(4) где Проблемы раба
Оптимизация MRF с помощью двойной декомпозиции
[ редактировать ]Исходная задача оптимизации MRF NP-сложна , и нам нужно преобразовать ее во что-то более простое.
представляет собой набор поддеревьев графа где его деревья покрывают все узлы и ребра основного графа. И MRF определены для каждого дерева в будет меньше. Вектор параметров MRF: а вектор переменных MRF равен , эти два просто меньше по сравнению с исходными векторами MRF. . Для всех векторов у нас будет следующее:
(5)
Где и обозначим все деревья чем содержать узел и край соответственно. Мы просто можем написать:
(6)
Нашими ограничениями будут:
(7)
Наша первоначальная задача MRF будет такой:
(8) где и
И у нас возникнет двойная проблема, которую мы искали:
(9) Проблема Мастера
где каждая функция определяется как:
(10) где Проблемы раба
Теоретические свойства
[ редактировать ]Теорема 1. Лагранжева релаксация (9) эквивалентна ЛП-релаксации (2).
Теорема 2. Если последовательность множителей удовлетворяет то алгоритм сходится к оптимальному решению (9).
Теорема 3. Расстояние текущего решения к оптимальному решению , который уменьшается на каждой итерации.
Теорема 4. Любое решение, полученное методом, удовлетворяет условию WTA (слабое древовидное согласие).
Теорема 5. Для бинарных МСО с субмодулярными энергиями метод вычисляет глобально оптимальное решение.
Ссылки
[ редактировать ]- ^ «Оптимизация MRF посредством двойной декомпозиции» (PDF) .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Фэн Ню и Се Чжан, Кристофер Ре и Джуд Шавлик (2012). Масштабирование вывода для марковской логики посредством двойной декомпозиции . 2012 IEEE 12-я Международная конференция по интеллектуальному анализу данных. IEEE. CiteSeerX 10.1.1.244.8755 . дои : 10.1109/icdm.2012.96 .
- ^ Шервин Рахимзаде Арашло и Йозеф Киттлер (2013). Эффективная обработка MRF для распознавания лиц в любой позе . 2013 Шестая международная конференция IEEE по биометрии: теория, приложения и системы (BTAS). IEEE. дои : 10.1109/btas.2013.6712721 .