Активное обучение (машинное обучение)
Часть серии о |
Машинное обучение и интеллектуальный анализ данных |
---|
Активное обучение — это особый случай машинного обучения , в котором алгоритм обучения может в интерактивном режиме запрашивать пользователя-человека (или какой-либо другой источник информации), чтобы пометить новые точки данных желаемыми результатами. Пользователь-человек должен обладать знаниями/опытом в проблемной области, включая возможность консультироваться/исследовать авторитетные источники, когда это необходимо. [1] [2] [3] В статистической литературе его иногда еще называют оптимальным планом эксперимента . [4] Источник информации также называют учителем или оракулом .
Бывают ситуации, когда немаркированных данных много, но маркировка вручную обходится дорого. В таком сценарии алгоритмы обучения могут активно запрашивать у пользователя/учителя метки. Этот тип итеративного контролируемого обучения называется активным обучением. Поскольку примеры выбирает учащийся, количество примеров для изучения концепции часто может быть намного меньше, чем количество, необходимое при обычном обучении с учителем. При таком подходе существует риск того, что алгоритм будет перегружен неинформативными примерами. Последние разработки посвящены многоуровневому активному обучению, [5] гибридное активное обучение [6] и активное обучение в однопроходном (онлайн) контексте, [7] объединение концепций из области машинного обучения (например, конфликтов и невежества) с адаптивными, поэтапными политиками обучения в области онлайн-машинного обучения . Использование активного обучения позволяет ускорить разработку алгоритма машинного обучения, когда для сравнительных обновлений потребуется квантовый или суперкомпьютер. [8]
Крупномасштабные проекты активного обучения могут выиграть от краудсорсинговых систем, таких как Amazon Mechanical Turk , которые включают в цикл активного обучения множество людей .
Определения [ править ]
Пусть T — общий набор всех рассматриваемых данных. Например, в задаче белковой инженерии T будет включать все белки, которые, как известно, обладают определенной интересной активностью, а также все дополнительные белки, которые можно проверить на наличие этой активности.
Во время каждой итерации i , T разбивается на три подмножества
- : Точки данных, где метка известна .
- : Точки данных, для которых метка неизвестна .
- : подмножество TU ,i для , выбранное маркировки.
Большинство текущих исследований в области активного обучения связаны с поиском наилучшего метода выбора точек данных для TC ,i .
Сценарии [ править ]
- Выборка на основе пула . В этом подходе, который является наиболее известным сценарием, [9] алгоритм обучения пытается оценить весь набор данных перед выбором точек данных (экземпляров) для маркировки. Часто он первоначально обучается на полностью размеченном подмножестве данных с использованием метода машинного обучения, такого как логистическая регрессия или SVM, который дает вероятности членства в классе для отдельных экземпляров данных. Экземпляры-кандидаты — это те, для которых прогноз наиболее неоднозначен. Экземпляры извлекаются из всего пула данных, и им присваивается показатель достоверности — показатель того, насколько хорошо учащийся «понимает» данные. Затем система выбирает случаи, в которых она наименее уверена, и запрашивает у учителя метки.
Теоретический недостаток выборки на основе пула заключается в том, что она требует большого объема памяти и, следовательно, ограничена в своих возможностях для обработки огромных наборов данных, но на практике фактором, ограничивающим скорость, является то, что преподавателем обычно является (утомляемый) человек-эксперт, который должен им будут платить за их усилия, а не за память компьютера. - Выборочная выборка на основе потоков . Здесь каждый последовательный немаркированный экземпляр проверяется по одному, при этом машина оценивает информативность каждого элемента по параметрам запроса. Учащийся сам решает, присвоить ли ему метку или запросить у учителя каждую точку данных. В отличие от выборки на основе пула, очевидным недостатком потоковых методов является то, что алгоритм обучения не имеет достаточной информации на ранних этапах процесса, чтобы принять обоснованное решение о назначении метки или задании преподавателем. максимально эффективно использовать наличие уже размеченных данных. Таким образом, учитель, скорее всего, потратит больше усилий на выдачу меток, чем при использовании пулового подхода.
- Синтез запроса на членство : здесь учащийся генерирует синтетические данные из основного естественного распределения. Например, если набор данных представляет собой изображения людей и животных, учащийся может отправить учителю обрезанное изображение ноги и запросить, принадлежит ли этот придаток животному или человеку. Это особенно полезно, если набор данных небольшой. [10]
Проблема здесь, как и во всех усилиях по созданию синтетических данных, заключается в обеспечении того, чтобы синтетические данные были согласованы с точки зрения соответствия ограничениям реальных данных. По мере увеличения количества переменных/признаков во входных данных и существования сильных зависимостей между переменными становится все труднее генерировать синтетические данные с достаточной точностью.
Например, чтобы создать синтетический набор данных для значений лабораторных тестов человека, сумма различных компонентов лейкоцитов (WBC) в разнице лейкоцитов должна равняться 100, поскольку числа компонентов на самом деле представляют собой проценты. Аналогично, ферменты аланиновая трансаминаза (АЛТ) и аспартат-трансаминаза (АСТ) измеряют функцию печени (хотя АСТ также вырабатывается другими тканями, например, легкими, поджелудочной железой). Синтетическая точка данных, при которой АСТ находится на нижней границе нормального диапазона (8- 33 ЕД/л) при уровне АЛТ, в несколько раз превышающем нормальный диапазон (4-35 ЕД/л) у моделируемого хронического больного, было бы физиологически невозможно.
Стратегии запросов [ править ]
Алгоритмы определения того, какие точки данных следует пометить, можно разделить на несколько различных категорий в зависимости от их назначения: [1]
- Баланс исследования и эксплуатации : выбор примеров для маркировки рассматривается как дилемма между исследованием и использованием представления пространства данных. Эта стратегия позволяет избежать этого компромисса, моделируя проблему активного обучения как проблему контекстуального бандита. Например, Бунеффуф и др. [11] предложить последовательный алгоритм под названием «Активная выборка Томпсона» (ATS), который в каждом раунде назначает распределение выборки в пуле, выбирает одну точку из этого распределения и запрашивает у оракула метку этой точки выборки.
- Ожидаемое изменение модели : отметьте те точки, которые больше всего изменят текущую модель.
- Ожидаемое уменьшение ошибок модели : отметьте те точки, которые в наибольшей степени уменьшат ошибку обобщения .
- Исследование экспоненциального градиента для активного обучения : [12] В этой статье автор предлагает последовательный алгоритм, названный экспоненциальным градиентом (EG)-активным, который может улучшить любой алгоритм активного обучения путем оптимального случайного исследования.
- Случайная выборка: выборка выбирается случайным образом. [13]
- Выборка по неопределенности : пометьте те точки, для которых текущая модель менее всего уверена в том, какими должны быть правильные выходные данные.
- Выборка по энтропии: формула энтропии используется для каждой выборки, и выборка с самой высокой энтропией считается наименее достоверной. [13]
- Маржинальная выборка: выборка с наименьшей разницей между двумя вероятностями самого высокого класса считается наиболее неопределенной. [13]
- Наименее уверенная выборка. Выборка с наименьшей наилучшей вероятностью считается наиболее неопределенной. [13]
- Запрос комитета : различные модели обучаются на текущих размеченных данных и голосуют за выходные данные за неразмеченные данные; обозначьте те пункты, по которым «комитет» не согласен больше всего
- Запрос из различных подпространств или разделов : [14] Если базовая модель представляет собой лес деревьев, конечные узлы могут представлять (перекрывающиеся) разделы исходного пространства объектов . Это дает возможность выбирать экземпляры из непересекающихся или минимально перекрывающихся разделов для маркировки.
- Уменьшение дисперсии : отметьте те точки, которые минимизируют дисперсию выходных данных, которая является одним из компонентов ошибки.
- Конформное предсказание : прогнозирует, что новая точка данных будет иметь метку, похожую на старые точки данных каким-то определенным образом, а степень сходства в старых примерах используется для оценки достоверности прогноза. [15]
- Несоответствие – сначала самый дальний обход : основным критерием выбора является несоответствие прогноза между текущей моделью и прогнозом ближайшего соседа. Он нацелен на ошибочно предсказанные точки данных. Второй критерий выбора — расстояние до ранее выбранных данных, самый дальний первым. Он направлен на оптимизацию разнообразия выбранных данных. [16]
- Стратегии маркировки, ориентированные на пользователя. Обучение осуществляется путем применения уменьшения размерности к графикам и цифрам, таким как точечные диаграммы. Затем пользователю предлагается пометить скомпилированные данные (категориальные, числовые, оценки релевантности, связь между двумя экземплярами). [17]
Было изучено множество алгоритмов, попадающих в эти категории. [1] [4] Хотя традиционные стратегии AL могут обеспечить выдающуюся эффективность, часто бывает сложно заранее предсказать, какая стратегия является наиболее подходящей в конкретной ситуации. В последние годы алгоритмы метаобучения набирают популярность. Некоторые из них были предложены для решения проблемы изучения стратегий AL вместо того, чтобы полагаться на стратегии, разработанные вручную. Тест, который сравнивает «подходы метаобучения к активному обучению» с «традиционным активным обучением, основанным на эвристике», может дать интуитивное представление о том, находится ли «активное обучение» на перепутье. [18]
Минимальная маргинальная гиперплоскость [ править ]
Некоторые алгоритмы активного обучения построены на машинах опорных векторов (SVM) и используют структуру SVM, чтобы определить, какие точки данных следует пометить. Такие методы обычно вычисляют границу W для каждого немаркированного элемента данных в T U,i и рассматривают W как n -мерное расстояние от этого элемента данных до разделяющей гиперплоскости.
Методы минимальной маргинальной гиперплоскости предполагают, что данные с наименьшим W — это те, в отношении которых SVM наиболее неопределенен, и поэтому их следует поместить в TC ,i для маркировки. Максимальная маргинальная гиперплоскость», выбирают данные с наибольшим W. Другие подобные методы, такие как « Методы компромисса выбирают сочетание наименьшего и наибольшего W .
См. также [ править ]
- Список наборов данных для исследований в области машинного обучения
- Сложность примера
- Байесовская оптимизация
- Обучение с подкреплением
Литература [ править ]
- Улучшение обобщения с помощью активного обучения, Дэвид Кон, Лес Атлас и Ричард Ладнер, Machine Learning 15, 201–221 (1994). https://doi.org/10.1007/BF00993277
- Балкан, Мария-Флорина и Ханнеке, Стив и Вортман, Дженнифер. (2008). Истинная выборочная сложность активного обучения. 45-56. https://link.springer.com/article/10.1007/s10994-010-5174-y
- Активное обучение и байесовская оптимизация : единая перспектива обучения с целью, Франческо Ди Фиоре, Микела Нарделли, Лаура Майнини, https://arxiv.org/abs/2303.01560v2
- Научимся активному обучению: подход к обучению с глубоким подкреплением, Мэн Фан, Юань Ли, Тревор Кон, https://arxiv.org/abs/1708.02383v1
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б с Сетлс, Берр (2010). «Обзор литературы по активному обучению» (PDF) . Технический отчет по компьютерным наукам 1648. Университет Висконсина-Мэдисона . Проверено 18 ноября 2014 г.
- ^ Рубенс, Нил; Элахи, Мехди; Сугияма, Масаси; Каплан, Дейн (2016). «Активное обучение в рекомендательных системах». В Риччи, Франческо; Рокач, Лиор; Шапира, Брача (ред.). Справочник по рекомендательным системам (PDF) (2-е изд.). Спрингер США. дои : 10.1007/978-1-4899-7637-6 . hdl : 11311/1006123 . ISBN 978-1-4899-7637-6 . S2CID 11569603 .
- ^ Дас, Шубхомой; Вонг, Венг-Кин; Дитерих, Томас; Ферн, Алан; Эммотт, Эндрю (2016). «Учет отзывов экспертов при активном обнаружении аномалий». В Бончи, Франческо; Доминго-Феррер, Хосеп; Баеза-Йейтс, Рикардо; Чжоу, Чжи-Хуа; У, Синьдун (ред.). 16-я Международная конференция IEEE по интеллектуальному анализу данных . IEEE. стр. 853–858. дои : 10.1109/ICDM.2016.0102 . ISBN 978-1-5090-5473-2 . S2CID 15285595 .
- ↑ Перейти обратно: Перейти обратно: а б Олссон, Фредрик (апрель 2009 г.). «Обзор литературы по активному машинному обучению в контексте обработки естественного языка» . Технический отчет SICS T2009:06.
- ^ Ян, Бишань; Сунь, Цзянь-Тао; Ван, Тэнцзяо; Чен, Чжэн (2009). «Эффективное активное обучение с несколькими метками для классификации текста» (PDF) . Материалы 15-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных - KDD '09 . п. 917. CiteSeerX 10.1.1.546.9358 . дои : 10.1145/1557019.1557119 . ISBN 978-1-60558-495-9 . S2CID 1979173 .
- ^ Лугхофер, Эдвин (февраль 2012 г.). «Гибридное активное обучение для сокращения усилий операторов по аннотированию в системах классификации». Распознавание образов . 45 (2): 884–896. Бибкод : 2012PatRe..45..884L . дои : 10.1016/j.patcog.2011.08.009 .
- ^ Лугхофер, Эдвин (2012). «Однопроходное активное обучение с конфликтами и незнанием». Развивающиеся системы . 3 (4): 251–271. дои : 10.1007/s12530-012-9060-7 . S2CID 43844282 .
- ^ Новиков, Иван (2021). «Пакет MLIP: моментные тензорные потенциалы с MPI и активным обучением» . Издательство ИОП . 2 (2): 3, 4. arXiv : 2007.08555 . дои : 10.1088/2632-2153/abc9fe .
- ^ ДатаРобот. «Активное машинное обучение: что это такое и как оно работает» . Блог DataRobot . DataRobot Inc. Проверено 30 января 2024 г.
- ^ Ван, Ляньтао; Ху, Сюэлэй; Юань, Бо; Лу, Цзяньфэн (5 января 2015 г.). «Активное обучение посредством синтеза запросов и поиска ближайшего соседа» (PDF) . Нейрокомпьютинг . 147 : 426–434. дои : 10.1016/j.neucom.2014.06.042 . S2CID 3027214 .
- ^ Бунефуф, Джалель; Ларош, Ромен; Урвой, Танги; Феро, Рафаэль; Аллесиардо, Робин (2014). «Контекстный бандит для активного обучения: Активный Томпсон» . В Лоо, СК; Яп, Канзас; Вонг, К.В.; Теох, А.; Хуанг, К. (ред.). Нейронная обработка информации (PDF) . Конспекты лекций по информатике. Том. 8834. стр. 405–412. дои : 10.1007/978-3-319-12637-1_51 . ISBN 978-3-319-12636-4 . S2CID 1701357 . Идентификатор HAL: hal-01069802.
- ^ Бунефуф, Джалель (8 января 2016 г.). «Исследование экспоненциального градиента для активного обучения» . Компьютеры . 5 (1): 1. arXiv : 1408.2196 . doi : 10.3390/computers5010001 . S2CID 14313852 .
- ↑ Перейти обратно: Перейти обратно: а б с д Фариа, Бруно; Пердигао, Дилан; Брас, Жоана; Маседо, Луис (2022). «Совместная роль размера пакета и стратегии запроса в прогнозировании на основе активного обучения - практический пример в области сердечного приступа». В Горети Маррейрос; Бруно Мартинс; Ана Пайва; Бернардете Рибейру; Альберто Сардинья (ред.). Прогресс в области искусственного интеллекта . 21-я конференция EPIA по искусственному интеллекту, EPIA 2022, Лиссабон, Португалия, 31 августа – 2 сентября 2022 г. Конспекты лекций по информатике. Том. 13566. стр. 464–475. дои : 10.1007/978-3-031-16474-3_38 . ISBN 978-3-031-16473-6 .
- ^ "shubhomoydas/ad_examples" . Гитхаб . Проверено 4 декабря 2018 г.
- ^ Макили, Ласаро Эмилио; Санчес, Хесус А. Вега; Дормидо-Канто, Себастьян (1 октября 2012 г.). «Активное обучение с использованием конформных предикторов: применение к классификации изображений». Наука и технология термоядерного синтеза . 62 (2): 347–355. Бибкод : 2012FuST...62..347M . дои : 10.13182/FST12-A14626 . ISSN 1536-1055 . S2CID 115384000 .
- ^ Чжао, Шуян; Хейттола, Тони; Виртанен, Туомас (2020). «Активное обучение обнаружению звуковых событий». Транзакции IEEE/ACM по обработке звука, речи и языка . arXiv : 2002.05033 .
- ^ Бернард, Юрген; Цеппельцауэр, Матиас; Леманн, Маркус; Мюллер, Мартин; Седлмайр, Майкл (июнь 2018 г.). «На пути к ориентированным на пользователя алгоритмам активного обучения». Форум компьютерной графики . 37 (3): 121–132. дои : 10.1111/cgf.13406 . ISSN 0167-7055 . S2CID 51875861 .
- ^ Дерёмо, Луи; Лемэр, Винсент (2020). Обучение активному обучению на перепутье? Оценка и обсуждение . Материалы семинара по интерактивному адаптивному обучению, проведенного совместно с Европейской конференцией по машинному обучению, принципам и практике обнаружения знаний в базах данных ({ECML} {PKDD} 2020), Гент, Бельгия, 2020. S2CID 221794570 .