Jump to content

Цепочки классификаторов

Цепочки классификаторов — это метод машинного обучения для преобразования задач в классификации по нескольким меткам . Он сочетает в себе вычислительную эффективность метода двоичной релевантности, сохраняя при этом возможность учитывать зависимости меток для классификации . [1]

Трансформация проблемы

[ редактировать ]

Существует несколько методов трансформации проблемы. Одним из них является метод бинарной релевантности (BR). Учитывая набор меток и набор данных с экземплярами формы где является вектором признаков и представляет собой набор меток, присвоенных экземпляру. BR преобразует набор данных в наборы данных и обучение бинарные классификаторы за каждую этикетку . При этом информация о зависимостях между метками не сохраняется. Это может привести к ситуации, когда экземпляру назначается набор меток, хотя эти метки никогда не встречаются вместе в наборе данных. Таким образом, информация о совместном появлении меток может помочь назначить правильные комбинации меток. Потеря этой информации может в некоторых случаях привести к снижению эффективности классификации. [2]

Другой подход, учитывающий корреляцию меток, — это метод Label Powerset (LP). Каждая комбинация меток в наборе данных считается одной меткой. После преобразования однокомпонентного классификатора обучается там, где это набор мощности всех меток в . Основным недостатком этого подхода является то, что количество комбинаций меток растет экспоненциально с увеличением количества меток. Например, набор данных с несколькими метками из 10 меток может иметь до комбинации этикеток. Это увеличивает время выполнения классификации.

Метод цепочек классификаторов основан на методе BR и эффективен даже для большого количества меток. Кроме того, он учитывает зависимости между метками.

Описание метода

[ редактировать ]

Для заданного набора меток модель цепочки классификаторов (CC) обучается классификаторы, как в методе двоичной релевантности. Все классификаторы связаны в цепочку через пространство признаков.

Учитывая набор данных, в котором -й экземпляр имеет форму где это подмножество ярлыков, это набор функций. Набор данных преобразуется в наборы данных, в которых экземпляры -й набор данных имеет вид . Если -th метка была присвоена экземпляру тогда является , иначе это . Таким образом, классификаторы выстраивают цепочку, в которой каждый из них обучается бинарной классификации одной метки. Функции, предоставленные каждому классификатору, расширяются двоичными значениями, которые указывают, какая из предыдущих меток была присвоена экземпляру.

При классификации новых экземпляров метки снова прогнозируются путем построения цепочки классификаторов. Классификация начинается с первого классификатора. и переходит к последнему путем передачи информации о метках между классификаторами через пространство признаков. Следовательно, зависимость между метками сохраняется. Однако результат может различаться для разных порядков цепей. Например, если метка часто встречается вместе с какой-либо другой меткой, то только экземпляры метки, расположенные позже в цепочке, будут иметь информацию о другой метке в своем векторе признаков. Для решения этой проблемы и повышения точности можно использовать ансамбль классификаторов. [3]

В ансамбле цепочек классификаторов (ECC) несколько классификаторов CC могут быть обучены со случайным порядком цепочек (т. е. случайным порядком меток) на случайном подмножестве набора данных. Метки нового экземпляра прогнозируются каждым классификатором отдельно. После этого для каждой метки подсчитывается общее количество предсказаний или «голосов». Метка принимается, если она была предсказана процентом классификаторов, превышающим некоторое пороговое значение.

Адаптации

[ редактировать ]

Существуют также цепочки регрессоров, которые сами по себе могут напоминать модели векторной авторегрессии , если порядок цепочки обеспечивает соблюдение временного порядка.

  1. ^ Читай, Джесси; Бернхард Пфарингер; Джефф Холмс; Эйбе Франк (2009). «Цепочки классификаторов для классификации по нескольким меткам» (PDF) . Материалы 13-й Европейской конференции по принципам и практике обнаружения знаний в базах данных и 20-й Европейской конференции по машинному обучению . 2009 .
  2. ^ Дембчинский, Кшиштоф; Виллем Вегеман; Вэйвэй Чэн; Эйке Хюллермайер (2010). «О зависимости от меток в классификации с несколькими метками» (PDF) . Материалы семинара по обучению на основе данных с несколькими метками . 2010 : 5–12.
  3. ^ Рокач, Лиор (2010). «Ансамблевые классификаторы» (PDF) . Артиф. Интел. Преподобный . 33 (1–2). Норвелл, Массачусетс, США: ACM: 1–39. дои : 10.1007/s10462-009-9124-7 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d6e7882f615e4229e7c2cde1c606ddf4__1686075180
URL1:https://arc.ask3.ru/arc/aa/d6/f4/d6e7882f615e4229e7c2cde1c606ddf4.html
Заголовок, (Title) документа по адресу, URL1:
Classifier chains - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)