Jump to content

Машина структурированных опорных векторов

Машина структурированных опорных векторов — это алгоритм машинного обучения , который обобщает классификатор машины опорных векторов (SVM). В то время как классификатор SVM поддерживает бинарную классификацию , мультиклассовую классификацию и регрессию , структурированный SVM позволяет обучать классификатор для общих структурированных выходных меток .

Например, образец экземпляра может представлять собой предложение естественного языка, а выходная метка — аннотированное дерево синтаксического анализа . Обучение классификатора состоит из показа пар правильных пар выборки и выходной метки. После обучения структурированная модель SVM позволяет предсказать для новых экземпляров выборки соответствующую выходную метку; то есть, учитывая предложение естественного языка, классификатор может создать наиболее вероятное дерево разбора.

Обучение

[ редактировать ]

Для набора обучающие экземпляры , из выборочного пространства и место для метки , структурированная SVM минимизирует следующую регуляризованную функцию риска.

Функция выпукла по поскольку максимум множества аффинных функций выпуклый. Функция измеряет расстояние в пространстве меток и является произвольной функцией (не обязательно метрикой ) , удовлетворяющей и . Функция — это функция признака, извлекающая некоторый вектор признаков из заданного образца и метки. Конструкция этой функции во многом зависит от приложения.

Поскольку приведенная выше регуляризованная функция риска недифференцируема, ее часто переформулируют в терминах квадратичной программы , вводя одну слабую переменную. для каждой выборки, каждая из которых представляет значение максимума. Стандартная основная формулировка структурированного SVM выглядит следующим образом.

Во время тестирования только образец известна, а функция прогнозирования сопоставляет его с предсказанной меткой из пространства меток . Для структурированных SVM, учитывая вектор полученная в результате обучения, функция прогнозирования имеет следующий вид.

Следовательно, максимизатор пространства меток является прогнозируемой меткой. Решением этого максимайзера является так называемая проблема вывода, похожая на максимальное апостериорное предсказание (MAP) в вероятностных моделях. В зависимости от структуры функции , решение максимизатора может оказаться сложной задачей.

Разделение

[ редактировать ]

Вышеупомянутая квадратичная программа включает в себя очень большое, возможно, бесконечное количество ограничений линейного неравенства. В общем, количество неравенств слишком велико, чтобы его можно было оптимизировать явно. Вместо этого проблема решается с помощью отложенной генерации ограничений , при которой используется только конечное и небольшое подмножество ограничений. Оптимизация по подмножеству ограничений расширяет допустимый набор и дает решение, которое обеспечивает нижнюю границу цели. Чтобы проверить, является ли решение нарушает ограничения полного набора неравенств, необходимо решить проблему разделения. Поскольку неравенства разлагаются по выборкам, для каждой выборки необходимо решить следующую проблему.

Правая цель, которую необходимо максимизировать, состоит из постоянной и член, зависящий от оптимизируемых переменных, а именно . Если достигнутая цель правой части меньше или равна нулю, то для этой выборки не существует нарушенных ограничений. Если оно строго больше нуля, то обнаружено наиболее нарушенное ограничение по отношению к этой выборке. Проблема расширяется из-за этого ограничения и решается. Процесс продолжается до тех пор, пока не будет выявлено ни одного нарушенного неравенства.

Если из приведенной выше задачи исключить константы, мы получим следующую задачу, которую необходимо решить.

Эта проблема очень похожа на проблему вывода. Единственное отличие заключается в добавлении термина . Чаще всего его выбирают таким, чтобы он имел естественную декомпозицию в пространстве меток. В этом случае влияние может быть закодировано в задаче вывода, и решение наиболее нарушающего ограничения эквивалентно решению задачи вывода.

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 273d2a19cc89a0184a89dcf6cf61eca5__1674975000
URL1:https://arc.ask3.ru/arc/aa/27/a5/273d2a19cc89a0184a89dcf6cf61eca5.html
Заголовок, (Title) документа по адресу, URL1:
Structured support vector machine - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)