Jump to content

Предпочтительное обучение

Обучение предпочтениям — это подполе машинного обучения , которое представляет собой метод классификации, основанный на наблюдаемой информации о предпочтениях. [1] С точки зрения обучения с учителем , обучение предпочтениям обучается на наборе предметов, которые имеют предпочтения в отношении меток или других предметов, и прогнозирует предпочтения для всех предметов.

Хотя концепция обучения по предпочтениям уже давно появилась во многих областях, таких как экономика , [2] это относительно новая тема в исследованиях искусственного интеллекта . За последнее десятилетие на нескольких семинарах обсуждалось обучение предпочтениям и связанные с ним темы. [3]

Основная задача обучения предпочтениям касается проблем « обучения ранжированию ». задачи классифицируются как три основные проблемы В соответствии с различными типами наблюдаемой информации о предпочтениях в книге «Обучение с предпочтениями» : [4]

Рейтинг меток

[ редактировать ]

В ранжировании меток модель имеет пространство экземпляров. и конечное множество меток . Информация о предпочтениях задается в виде указывающий экземпляр проявляет предпочтение в скорее, чем . Набор информации о предпочтениях используется в качестве обучающих данных в модели. Задача этой модели — найти рейтинг предпочтений среди меток для любого экземпляра.

Было замечено, что некоторые традиционные проблемы классификации можно обобщить в рамках проблемы ранжирования меток: [5] если учебный экземпляр помечен как класс , это означает, что . В с несколькими метками случае связан с набором меток и, таким образом, модель может извлечь набор информации о предпочтениях . Обучение модели предпочтений на основе этой информации о предпочтениях, а результат классификации экземпляра — это просто соответствующая метка высшего ранга.

Рейтинг экземпляров

[ редактировать ]

Рейтинг экземпляров также включает в себя пространство экземпляров. и набор этикеток . В этой задаче метки имеют фиксированный порядок. и каждый экземпляр связан с меткой . Предоставляя набор экземпляров в качестве обучающих данных, цель этой задачи — найти порядок ранжирования для нового набора экземпляров.

Рейтинг объектов

[ редактировать ]

Ранжирование объектов аналогично ранжированию экземпляров, за исключением того, что с экземплярами не связаны никакие метки. Учитывая набор информации о парных предпочтениях в форме и модель должна определить порядок ранжирования экземпляров.

Существует два практических представления информации о предпочтениях. . Один назначает и с двумя действительными числами и соответственно такой, что . Другой - присвоение двоичного значения для всех пар обозначая, является ли или . В соответствии с этими двумя разными представлениями в процессе обучения применяются два разных метода.

Функция полезности

[ редактировать ]

Если мы сможем найти соответствие данных действительным числам, то ранжирование данных можно будет решить путем ранжирования действительных чисел. Это отображение называется функцией полезности . Для ранжирования меток отображение представляет собой функцию такой, что . Например, ранжирование и ранжирование объектов, отображение является функцией .

Нахождение функции полезности — это задача регрессионного обучения, которая хорошо разработана в машинном обучении.

Отношения предпочтений

[ редактировать ]

Двоичное представление информации о предпочтениях называется отношением предпочтения. Для каждой пары альтернатив (экземпляров или меток) двоичный предикат может быть изучен с помощью обычного подхода обучения с контролем. Фюрнкранц и Хюллермайер предложили этот подход к проблеме ранжирования меток. [6] Для ранжирования объектов существует ранний подход Cohen et al. [7]

Использование отношений предпочтений для прогнозирования рейтинга будет не таким интуитивным. Поскольку отношение предпочтения не является транзитивным, это означает, что решение ранжирования, удовлетворяющее этим отношениям, иногда может быть недостижимым или может существовать более одного решения. Более распространенный подход заключается в поиске ранжирующего решения, которое максимально согласуется с отношениями предпочтения. Этот подход является естественным расширением парной классификации. [6]

Использование

[ редактировать ]

Изучение предпочтений можно использовать для ранжирования результатов поиска в соответствии с отзывами о предпочтениях пользователя. Учитывая запрос и набор документов, модель обучения используется для определения рейтинга документов, соответствующего релевантности этому запросу. Дополнительные обсуждения исследований в этой области можно найти в Те-Янь Лю . обзорной статье [8]

Еще одно применение обучения предпочтениям — рекомендательные системы . [9] Интернет-магазин может анализировать записи о покупках клиента, чтобы изучить модель предпочтений, а затем рекомендовать покупателям аналогичные продукты. Поставщики интернет-контента могут использовать рейтинги пользователей, чтобы предоставлять более предпочтительный для пользователей контент.

См. также

[ редактировать ]
  1. ^ Мори, Мехриар ; Ростамизаде, Афшин; Талвалкар, Амит (2012). Основы машинного обучения . США, Массачусетс: MIT Press. ISBN  9780262018258 .
  2. ^ Шогрен, Джейсон Ф.; Лист, Джон А.; Хейс, Дермот Дж. (2000). «Изучение предпочтений в последовательных экспериментальных аукционах» . Американский журнал экономики сельского хозяйства . 82 (4): 1016–1021. дои : 10.1111/0002-9092.00099 . S2CID   151493631 .
  3. ^ «Мастер-классы по обучению предпочтениям» . 23 января 2024 г.
  4. ^ Фюрнкранц, Йоханнес; Хюллермайер, Эйке (2011). «Обучение по предпочтениям: Введение» . Предпочтительное обучение . Springer-Verlag New York, Inc., стр. 3–8. ISBN  978-3-642-14124-9 .
  5. ^ Хар-пелед, Сариэль ; Рот, Дэн; Зимак, Дав (2003). «Классификация ограничений для многоклассовой классификации и ранжирования». В материалах 16-й ежегодной конференции по нейронным системам обработки информации, NIPS-02 : 785–792.
  6. ^ Перейти обратно: а б Фюрнкранц, Йоханнес; Хюллермайер, Эйке (2003). «Обучение и ранжирование парных предпочтений». Материалы 14-й Европейской конференции по машинному обучению : 145–156.
  7. ^ Коэн, Уильям В.; Шапире, Роберт Э.; Певец Йорам (1998). «Учимся упорядочивать вещи» . В материалах конференции 1997 г. по достижениям в области нейронных систем обработки информации : 451–457. ISBN  978-0-262-10076-2 .
  8. ^ Лю, Те-Янь (2009). «Учимся ранжировать поиск информации» . Основы и тенденции в области информационного поиска . 3 (3): 225–331. дои : 10.1561/1500000016 .
  9. ^ Джеммис, Марко Де; Яквинта, Лео; Лопс, Паскуале; Мусто, Катальдо; Нардуччи, Феделучио; Семераро, Джованни (2009). «Изучение моделей предпочтений в рекомендательных системах». Обучение предпочтениям в рекомендательных системах (PDF) . Том 41. стр. 387–407. дои : 10.1007/978-3-642-14125-6_18 . ISBN  978-3-642-14124-9 . {{cite book}}: |journal= игнорируется ( помогите )
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a46966908f2e26f68f434bb51629f533__1715610360
URL1:https://arc.ask3.ru/arc/aa/a4/33/a46966908f2e26f68f434bb51629f533.html
Заголовок, (Title) документа по адресу, URL1:
Preference learning - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)