Jump to content

Адаптация домена

Различие между обычным машинным обучением и трансферным обучением , а также позиционирование адаптации предметной области

Адаптация домена [1] [2] [3] — это область, связанная с машинным обучением и трансферным обучением . Этот сценарий возникает, когда мы стремимся изучить модель на основе распределения исходных данных и применить эту модель к другому (но связанному) целевому распределению данных. Например, одна из задач общей задачи фильтрации спама состоит в адаптации модели от одного пользователя (исходная рассылка) к новому пользователю, который получает существенно отличающиеся электронные письма (целевая рассылка). Также было показано, что адаптация предметной области полезна для изучения несвязанных источников. [4] Обратите внимание: когда доступно более одного исходного дистрибутива, проблема называется адаптацией домена с несколькими источниками. [5]

Адаптация предметной области — это способность применять алгоритм, обученный в одном или нескольких «исходных доменах», к другому (но связанному) «целевому домену». Адаптация предметной области — это подкатегория трансферного обучения. При адаптации предметной области исходный и целевой домены имеют одинаковое пространство объектов (но разные распределения); Напротив, трансферное обучение включает случаи, когда пространство признаков целевого домена отличается от пространства или пространств исходного объекта. [6]

Сдвиг домена

[ редактировать ]

домена Смена , [7] или сдвиг распределения , [8] — это изменение в распределении данных между набором обучающих данных алгоритма и набором данных, с которым он сталкивается при развертывании. Подобные сдвиги предметной области часто встречаются в практических применениях искусственного интеллекта. Традиционные алгоритмы машинного обучения часто плохо адаптируются к изменениям в предметной области. Современное сообщество машинного обучения имеет множество различных стратегий, направленных на лучшую адаптацию к предметной области. [7]

  • Алгоритму, обученному на новостных лентах, возможно, придется адаптироваться к новому набору данных биомедицинских документов. [9]
  • Спам-фильтр, обученный в ходе обучения на определенной группе пользователей электронной почты, при развертывании должен адаптироваться к новому целевому пользователю. [10]
  • Применение диагностических алгоритмов искусственного интеллекта, обученных на размеченных данных, связанных с предыдущими заболеваниями, к новым неразмеченным данным, связанным с пандемией COVID-19 . [11]
  • Внезапные социальные изменения, такие как вспышка пандемии, могут представлять собой сдвиг в сфере деятельности и привести к сбою алгоритмов машинного обучения, обученных на уже устаревших данных о потребителях, и потребуется вмешательство. [12] [13]

Другие приложения включают обнаружение локализации Wi-Fi и многие аспекты компьютерного зрения . [6]

Формализация

[ редактировать ]

Позволять быть входным пространством (или пространством описания) и пусть быть выходным пространством (или пространством меток). Целью алгоритма машинного обучения является изучение математической модели (гипотезы). возможность прикрепить метку из к примеру из . Эта модель изучается на обучающем образце. .

Обычно при обучении с учителем (без адаптации предметной области) мы предполагаем, что примеры взяты iid из дистрибутива поддержки (неизвестно и исправлено). Тогда цель состоит в том, чтобы научиться (от ), так что он допускает как можно меньше ошибок при маркировке новых примеров, поступающих из дистрибутива. .

Основное различие между обучением с учителем и адаптацией предметной области состоит в том, что в последней ситуации мы изучаем два разных (но связанных) распределения. и на [ нужна ссылка ] . Тогда задача адаптации предметной области состоит в передаче знаний из исходной предметной области. к целевому . Цель состоит в том, чтобы научиться (из меченых или немаркированных образцов, поступающих из двух доменов), чтобы в целевом домене совершалось как можно меньше ошибок. [ нужна ссылка ] .

Основная проблема заключается в следующем: если модель изучается из исходной области, какова ее способность правильно маркировать данные, поступающие из целевой области?

Различные типы адаптации домена

[ редактировать ]

Существует несколько контекстов адаптации предметной области. Они различаются информацией, учитываемой для целевой задачи.

  1. Адаптация неконтролируемой области : обучающая выборка содержит набор помеченных исходных примеров, набор неразмеченных исходных примеров и набор неразмеченных целевых примеров.
  2. : Адаптация полуконтролируемой области в этой ситуации мы также рассматриваем «маленький» набор помеченных целевых примеров.
  3. Адаптация контролируемой области : все рассмотренные примеры должны быть помечены.

Четыре алгоритмических принципа

[ редактировать ]

Алгоритмы повторного взвешивания

[ редактировать ]

Цель состоит в том, чтобы повторно взвесить выборку с маркировкой источника так, чтобы она «выглядела» как целевая выборка (с точки зрения рассматриваемой меры ошибки). [14] [15]

Итерационные алгоритмы

[ редактировать ]

Метод адаптации заключается в итеративном «автоматическом присвоении меток» целевым примерам. [16] Принцип прост:

  1. модель усваивается из отмеченных примеров;
  2. автоматически помечает некоторые целевые примеры;
  3. новая модель изучается на основе новых помеченных примеров.

Обратите внимание, что существуют и другие итеративные подходы, но для них обычно нужны примеры с пометкой целей. [17] [18]

Поиск общего пространства представления

[ редактировать ]

Цель состоит в том, чтобы найти или построить общее пространство представления для двух областей. Цель состоит в том, чтобы получить пространство, в котором домены будут расположены близко друг к другу, сохраняя при этом хорошие результаты при выполнении задачи маркировки источника. Этого можно достичь за счет использования методов состязательного машинного обучения , в которых представления функций из образцов в разных областях должны быть неотличимы. [19] [20]

Иерархическая байесовская модель

[ редактировать ]

Цель состоит в том, чтобы построить байесовскую иерархическую модель. , что по сути является моделью факторизации для подсчетов , для получения скрытых представлений, зависящих от предметной области, позволяющих использовать как специфичные для предметной области, так и глобально общие скрытые факторы. [4]

Программное обеспечение

[ редактировать ]

За последние десятилетия было реализовано несколько компиляций алгоритмов адаптации предметной области и трансферного обучения:

  • АДАПТ [21] (Питон)
  • TLlib [22] (Питон)
  • Панель инструментов адаптации домена [23] (Малаб)
  1. ^ Редько, Евгений; Морвант, Эмили; Хабрар, Амори; Себбан, Марк; Беннани, Молодежь (2019). Достижения в области теории адаптации . ИСТЭ Пресс - Эльзевир. п. 187. ИСБН  9781785482366 .
  2. ^ Уздечка, Джон С.; Кокс, Стивен Дж (1990). «RecNorm: одновременная нормализация и классификация, применяемая к распознаванию речи» (PDF) . Конференция по нейронным системам обработки информации (NIPS) . стр. 234–240.
  3. ^ Бен-Давид, Шай; Блитцер, Джон; Краммер, Коби; Кулеша, Алекс; Перейра, Фернандо; Вортман Воан, Дженнифер (2010). «Теория обучения из разных областей» (PDF) . Машинное обучение . 79 (1–2): 151–175. дои : 10.1007/s10994-009-5152-4 .
  4. ^ Перейти обратно: а б Хаджирамезанали, Эхсан; Сиамак Замани Дадане; Карбалайгарех, Алиреза; Чжоу, Минъюань; Цянь, Сяонин (2018). «Байесовское многодоменное обучение для обнаружения подтипов рака на основе данных подсчета секвенирования следующего поколения». arXiv : 1810.09433 [ stat.ML ].
  5. ^ Краммер, Коби; Кернс, Майкл; Вортман, Дженифер (2008). «Обучение из нескольких источников» (PDF) . Журнал исследований машинного обучения . 9 : 1757–1774.
  6. ^ Перейти обратно: а б Сунь, Шилян; Ши, Хунлей; Ву, Юаньбинь (июль 2015 г.). «Обзор адаптации домена с несколькими источниками». Информационный синтез . 24 : 84–92. дои : 10.1016/j.inffus.2014.12.003 . S2CID   18385140 .
  7. ^ Перейти обратно: а б Сунь, Баочэнь, Цзяши Фэн и Кейт Саенко. «Возвращение удручающе простой адаптации домена». На тридцатой конференции AAAI по искусственному интеллекту. 2016.
  8. ^ Амодей, Дарио, Крис Ола, Джейкоб Стейнхардт, Пол Кристиано, Джон Шульман и Дэн Мане. «Конкретные проблемы безопасности ИИ». Препринт arXiv arXiv:1606.06565 (2016).
  9. ^ Доме III, Хэл. «Ужасительно простая адаптация домена». Препринт arXiv arXiv:0907.1815 (2009).
  10. ^ Бен-Дэвид, Шай, Джон Блитцер, Коби Краммер и Фернандо Перейра. «Анализ представлений для адаптации предметной области». В книге «Достижения в области нейронных систем обработки информации», стр. 137–144. 2007.
  11. ^ Ху, Ипэн; Джейкоб, Джозеф; Паркер, Джеффри Дж. М.; Хоукс, Дэвид Дж.; Херст, Джон Р.; Стоянов, Данаил (июнь 2020 г.). «Проблемы внедрения моделей искусственного интеллекта в условиях быстро развивающейся пандемии» . Природный машинный интеллект . 2 (6): 298–300. arXiv : 2005.12137 . дои : 10.1038/s42256-020-0185-2 . ISSN   2522-5839 .
  12. ^ Мэтьюз, Дилан (26 марта 2019 г.). «Катастрофа с искусственным интеллектом не будет похожа на Терминатора. Она будет более жуткой» . Вокс . Проверено 21 июня 2020 г.
  13. ^ «Наше странное поведение во время пандемии портит модели ИИ» . Обзор технологий Массачусетского технологического института . 11 мая 2020 г. Проверено 21 июня 2020 г.
  14. ^ Хуан, Цзяюань; Смола, Александр Дж.; Греттон, Артур; Боргвардт, Карстер М.; Шёлкопф, Бернхард (2006). «Коррекция систематической ошибки отбора выборки с помощью немаркированных данных» (PDF) . Конференция по нейронным системам обработки информации (NIPS) . стр. 601–608.
  15. ^ Симодайра, Хидетоши (2000). «Улучшение прогностического вывода при сдвиге ковариат путем взвешивания логарифмической функции правдоподобия» . Журнал статистического планирования и выводов . 90 (2): 227–244. дои : 10.1016/S0378-3758(00)00115-4 . S2CID   9238949 .
  16. ^ Гальего, Эй Джей; Кальво-Сарагоса, Дж.; Фишер, РБ (2020). «Поэтапное доменно-состязательное обучение нейронных сетей без присмотра» (PDF) . Транзакции IEEE в нейронных сетях и системах обучения . ПП (11): 4864–4878. дои : 10.1109/TNNLS.2020.3025954 . hdl : 20.500.11820/72ba0443-8a7d-4cdd-8212-38682d4f0730 . ПМИД   33027004 . S2CID   210164756 .
  17. ^ Ариеф-Анг, IB; Салим, Флорида; Гамильтон, М. (08 ноября 2017 г.). DA-HOC: адаптация полуконтролируемой области для прогнозирования занятости помещений с использованием данных датчика CO2 . 4-я Международная конференция ACM по системам энергоэффективной застроенной среды (BuildSys). Делфт, Нидерланды. стр. 1–10. дои : 10.1145/3137133.3137146 . ISBN  978-1-4503-5544-5 .
  18. ^ Ариеф-Анг, IB; Гамильтон, М.; Салим, федеральный округ (01 декабря 2018 г.). «Масштабируемый прогноз занятости помещения с переносимым разложением временных рядов данных датчика CO2». Транзакции ACM в сенсорных сетях . 14 (3–4): 21:1–21:28. дои : 10.1145/3217214 . S2CID   54066723 .
  19. ^ Ганин, Ярослав; Устинова, Евгения; Приглашение, Ханна; Жермен, Паскаль; Ларошель, Хьюго; Лавиолетт, Франсуа; Маршан, Марио; Лемпицкий, Виктор (2016). «Доменно-состязательное обучение нейронных сетей» (PDF) . Журнал исследований машинного обучения . 17 :1–35.
  20. ^ Хаджирамезанали, Эхсан; Сиамак Замани Дадане; Карбалайгарех, Алиреза; Чжоу, Минъюань; Цянь, Сяонин (2017). «Решение проблемы изменения внешнего вида уличной робототехники с помощью состязательной адаптации домена». arXiv : 1703.01461 [ cs.RO ].
  21. ^ де Мателен, Антуан и Дехигер, Франсуа и Ришар, Гийом и Мужо, Матильда и Ваятис, Николя (2020) «ADAPT: потрясающий набор инструментов Python для адаптации домена»
  22. ^ Миншэн Лонг Цзюньгуан Цзян, Бо Фу (2020) «Библиотека трансферного обучения».
  23. ^ Ке Ян. (2016) «Инструментарий для адаптации предметной области»
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6773ae0afc53e85db70d3ec00ea777e1__1712113920
URL1:https://arc.ask3.ru/arc/aa/67/e1/6773ae0afc53e85db70d3ec00ea777e1.html
Заголовок, (Title) документа по адресу, URL1:
Domain adaptation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)