Предпочтительное обучение

Обучение предпочтениям — это подполе машинного обучения , которое представляет собой метод классификации, основанный на наблюдаемой информации о предпочтениях. ^[1] С точки зрения обучения с учителем , обучение предпочтениям обучается на наборе предметов, которые имеют предпочтения в отношении меток или других предметов, и прогнозирует предпочтения для всех предметов.

Хотя концепция обучения по предпочтениям уже давно появилась во многих областях, таких как экономика , ^[2] это относительно новая тема в исследованиях искусственного интеллекта . За последнее десятилетие на нескольких семинарах обсуждалось обучение предпочтениям и связанные с ним темы. ^[3]

Задачи

Основная задача обучения предпочтениям касается проблем « обучения ранжированию ». задачи классифицируются как три основные проблемы В соответствии с различными типами наблюдаемой информации о предпочтениях в книге «Обучение с предпочтениями» : ^[4]

Рейтинг меток

В ранжировании меток модель имеет пространство экземпляров. $X=\{x_{i}\}\,\!$ и конечное множество меток $Y=\{y_{i}|i=1,2,\cdots ,k\}\,\!$ . Информация о предпочтениях задается в виде $y_{i}\succ _{x}y_{j}\,\!$ указывающий экземпляр $x\,\!$ проявляет предпочтение в $y_{i}\,\!$ скорее, чем $y_{j}\,\!$ . Набор информации о предпочтениях используется в качестве обучающих данных в модели. Задача этой модели — найти рейтинг предпочтений среди меток для любого экземпляра.

Было замечено, что некоторые традиционные проблемы классификации можно обобщить в рамках проблемы ранжирования меток: ^[5] если учебный экземпляр $x\,\!$ помечен как класс $y_{i}\,\!$ , это означает, что $\forall j\neq i,y_{i}\succ _{x}y_{j}\,\!$ . В с несколькими метками случае $x\,\!$ связан с набором меток $L\subseteq Y\,\!$ и, таким образом, модель может извлечь набор информации о предпочтениях $\{y_{i}\succ _{x}y_{j}|y_{i}\in L,y_{j}\in Y\backslash L\}\,\!$ . Обучение модели предпочтений на основе этой информации о предпочтениях, а результат классификации экземпляра — это просто соответствующая метка высшего ранга.

Рейтинг экземпляров

Рейтинг экземпляров также включает в себя пространство экземпляров. $X\,\!$ и набор этикеток $Y\,\!$ . В этой задаче метки имеют фиксированный порядок. $y_{1}\succ y_{2}\succ \cdots \succ y_{k}\,\!$ и каждый экземпляр $x_{l}\,\!$ связан с меткой $y_{l}\,\!$ . Предоставляя набор экземпляров в качестве обучающих данных, цель этой задачи — найти порядок ранжирования для нового набора экземпляров.

Рейтинг объектов

Ранжирование объектов аналогично ранжированию экземпляров, за исключением того, что с экземплярами не связаны никакие метки. Учитывая набор информации о парных предпочтениях в форме $x_{i}\succ x_{j}\,\!$ и модель должна определить порядок ранжирования экземпляров.

Техники

Существует два практических представления информации о предпочтениях. $A\succ B\,\!$ . Один назначает $A\,\!$ и $B\,\!$ с двумя действительными числами $a\,\!$ и $b\,\!$ соответственно такой, что $a>b\,\!$ . Другой - присвоение двоичного значения $V(A,B)\in \{0,1\}\,\!$ для всех пар $(A,B)\,\!$ обозначая, является ли $A\succ B\,\!$ или $B\succ A\,\!$ . В соответствии с этими двумя разными представлениями в процессе обучения применяются два разных метода.

Функция полезности

Если мы сможем найти соответствие данных действительным числам, то ранжирование данных можно будет решить путем ранжирования действительных чисел. Это отображение называется функцией полезности . Для ранжирования меток отображение представляет собой функцию $f:X\times Y\rightarrow \mathbb {R} \,\!$ такой, что $y_{i}\succ _{x}y_{j}\Rightarrow f(x,y_{i})>f(x,y_{j})\,\!$ . Например, ранжирование и ранжирование объектов, отображение является функцией $f:X\rightarrow \mathbb {R} \,\!$ .

Нахождение функции полезности — это задача регрессионного обучения, которая хорошо разработана в машинном обучении.

Отношения предпочтений

Двоичное представление информации о предпочтениях называется отношением предпочтения. Для каждой пары альтернатив (экземпляров или меток) двоичный предикат может быть изучен с помощью обычного подхода обучения с контролем. Фюрнкранц и Хюллермайер предложили этот подход к проблеме ранжирования меток. ^[6] Для ранжирования объектов существует ранний подход Cohen et al. ^[7]

Использование отношений предпочтений для прогнозирования рейтинга будет не таким интуитивным. Поскольку отношение предпочтения не является транзитивным, это означает, что решение ранжирования, удовлетворяющее этим отношениям, иногда может быть недостижимым или может существовать более одного решения. Более распространенный подход заключается в поиске ранжирующего решения, которое максимально согласуется с отношениями предпочтения. Этот подход является естественным расширением парной классификации. ^[6]

Использование

Изучение предпочтений можно использовать для ранжирования результатов поиска в соответствии с отзывами о предпочтениях пользователя. Учитывая запрос и набор документов, модель обучения используется для определения рейтинга документов, соответствующего релевантности этому запросу. Дополнительные обсуждения исследований в этой области можно найти в Те-Янь Лю . обзорной статье ^[8]

Еще одно применение обучения предпочтениям — рекомендательные системы . ^[9] Интернет-магазин может анализировать записи о покупках клиента, чтобы изучить модель предпочтений, а затем рекомендовать покупателям аналогичные продукты. Поставщики интернет-контента могут использовать рейтинги пользователей, чтобы предоставлять более предпочтительный для пользователей контент.

См. также

Учимся ранжировать

Ссылки

^ Мори, Мехриар ; Ростамизаде, Афшин; Талвалкар, Амит (2012). Основы машинного обучения . США, Массачусетс: MIT Press. ISBN 9780262018258 .
^ Шогрен, Джейсон Ф.; Лист, Джон А.; Хейс, Дермот Дж. (2000). «Изучение предпочтений в последовательных экспериментальных аукционах» . Американский журнал экономики сельского хозяйства . 82 (4): 1016–1021. дои : 10.1111/0002-9092.00099 . S2CID 151493631 .
^ «Мастер-классы по обучению предпочтениям» . 23 января 2024 г.
^ Фюрнкранц, Йоханнес; Хюллермайер, Эйке (2011). «Обучение по предпочтениям: Введение» . Предпочтительное обучение . Springer-Verlag New York, Inc., стр. 3–8. ISBN 978-3-642-14124-9 .
^ Хар-пелед, Сариэль ; Рот, Дэн; Зимак, Дав (2003). «Классификация ограничений для многоклассовой классификации и ранжирования». В материалах 16-й ежегодной конференции по нейронным системам обработки информации, NIPS-02 : 785–792.
^ Перейти обратно: ^а ^б Фюрнкранц, Йоханнес; Хюллермайер, Эйке (2003). «Обучение и ранжирование парных предпочтений». Материалы 14-й Европейской конференции по машинному обучению : 145–156.
^ Коэн, Уильям В.; Шапире, Роберт Э.; Певец Йорам (1998). «Учимся упорядочивать вещи» . В материалах конференции 1997 г. по достижениям в области нейронных систем обработки информации : 451–457. ISBN 978-0-262-10076-2 .
^ Лю, Те-Янь (2009). «Учимся ранжировать поиск информации» . Основы и тенденции в области информационного поиска . 3 (3): 225–331. дои : 10.1561/1500000016 .
^ Джеммис, Марко Де; Яквинта, Лео; Лопс, Паскуале; Мусто, Катальдо; Нардуччи, Феделучио; Семераро, Джованни (2009). «Изучение моделей предпочтений в рекомендательных системах». Обучение предпочтениям в рекомендательных системах (PDF) . Том 41. стр. 387–407. дои : 10.1007/978-3-642-14125-6_18 . ISBN 978-3-642-14124-9 . {{cite book}}: |journal= игнорируется ( помогите )

Внешние ссылки

Предпочтение Учебный сайт

[1] Мори, Мехриар ; Ростамизаде, Афшин; Талвалкар, Амит (2012). Основы машинного обучения . США, Массачусетс: MIT Press. ISBN 9780262018258 .

[SHOG00-2] Шогрен, Джейсон Ф.; Лист, Джон А.; Хейс, Дермот Дж. (2000). «Изучение предпочтений в последовательных экспериментальных аукционах» . Американский журнал экономики сельского хозяйства . 82 (4): 1016–1021. дои : 10.1111/0002-9092.00099 . S2CID 151493631 .

[WEB:WORKSHOP-3] «Мастер-классы по обучению предпочтениям» . 23 января 2024 г.

[FURN11-4] Фюрнкранц, Йоханнес; Хюллермайер, Эйке (2011). «Обучение по предпочтениям: Введение» . Предпочтительное обучение . Springer-Verlag New York, Inc., стр. 3–8. ISBN 978-3-642-14124-9 .

[HARP03-5] Хар-пелед, Сариэль ; Рот, Дэн; Зимак, Дав (2003). «Классификация ограничений для многоклассовой классификации и ранжирования». В материалах 16-й ежегодной конференции по нейронным системам обработки информации, NIPS-02 : 785–792.

[FURN03-6] Перейти обратно: ^а ^б Фюрнкранц, Йоханнес; Хюллермайер, Эйке (2003). «Обучение и ранжирование парных предпочтений». Материалы 14-й Европейской конференции по машинному обучению : 145–156.

[COHE98-7] Коэн, Уильям В.; Шапире, Роберт Э.; Певец Йорам (1998). «Учимся упорядочивать вещи» . В материалах конференции 1997 г. по достижениям в области нейронных систем обработки информации : 451–457. ISBN 978-0-262-10076-2 .

[LIU09-8] Лю, Те-Янь (2009). «Учимся ранжировать поиск информации» . Основы и тенденции в области информационного поиска . 3 (3): 225–331. дои : 10.1561/1500000016 .

[GEMM09-9] Джеммис, Марко Де; Яквинта, Лео; Лопс, Паскуале; Мусто, Катальдо; Нардуччи, Феделучио; Семераро, Джованни (2009). «Изучение моделей предпочтений в рекомендательных системах». Обучение предпочтениям в рекомендательных системах (PDF) . Том 41. стр. 387–407. дои : 10.1007/978-3-642-14125-6_18 . ISBN 978-3-642-14124-9 . {{cite book}}: |journal= игнорируется ( помогите )

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]