Jump to content

Активное обучение (машинное обучение)

Активное обучение — это особый случай машинного обучения , в котором алгоритм обучения может в интерактивном режиме запрашивать пользователя-человека (или какой-либо другой источник информации), чтобы пометить новые точки данных желаемыми результатами. Пользователь-человек должен обладать знаниями/опытом в проблемной области, включая возможность консультироваться/исследовать авторитетные источники, когда это необходимо. [1] [2] [3] В статистической литературе его иногда еще называют оптимальным планом эксперимента . [4] Источник информации также называют учителем или оракулом .

Бывают ситуации, когда немаркированных данных много, но маркировка вручную обходится дорого. В таком сценарии алгоритмы обучения могут активно запрашивать у пользователя/учителя метки. Этот тип итеративного контролируемого обучения называется активным обучением. Поскольку примеры выбирает учащийся, количество примеров для изучения концепции часто может быть намного меньше, чем количество, необходимое при обычном обучении с учителем. При таком подходе существует риск того, что алгоритм будет перегружен неинформативными примерами. Последние разработки посвящены многоуровневому активному обучению, [5] гибридное активное обучение [6] и активное обучение в однопроходном (онлайн) контексте, [7] объединение концепций из области машинного обучения (например, конфликтов и невежества) с адаптивными, поэтапными политиками обучения в области онлайн-машинного обучения . Использование активного обучения позволяет ускорить разработку алгоритма машинного обучения, когда для сравнительных обновлений потребуется квантовый или суперкомпьютер. [8]

Крупномасштабные проекты активного обучения могут выиграть от краудсорсинговых систем, таких как Amazon Mechanical Turk , которые включают в цикл активного обучения множество людей .

Определения [ править ]

Пусть T — общий набор всех рассматриваемых данных. Например, в задаче белковой инженерии T будет включать все белки, которые, как известно, обладают определенной интересной активностью, а также все дополнительные белки, которые можно проверить на наличие этой активности.

Во время каждой итерации i , T разбивается на три подмножества

  1. : Точки данных, где метка известна .
  2. : Точки данных, для которых метка неизвестна .
  3. : подмножество TU ,i для , выбранное маркировки.

Большинство текущих исследований в области активного обучения связаны с поиском наилучшего метода выбора точек данных для TC ,i .

Сценарии [ править ]

  • Выборка на основе пула . В этом подходе, который является наиболее известным сценарием, [9] алгоритм обучения пытается оценить весь набор данных перед выбором точек данных (экземпляров) для маркировки. Часто он первоначально обучается на полностью размеченном подмножестве данных с использованием метода машинного обучения, такого как логистическая регрессия или SVM, который дает вероятности членства в классе для отдельных экземпляров данных. Экземпляры-кандидаты — это те, для которых прогноз наиболее неоднозначен. Экземпляры извлекаются из всего пула данных, и им присваивается показатель достоверности — показатель того, насколько хорошо учащийся «понимает» данные. Затем система выбирает случаи, в которых она наименее уверена, и запрашивает у учителя метки.
    Теоретический недостаток выборки на основе пула заключается в том, что она требует большого объема памяти и, следовательно, ограничена в своих возможностях для обработки огромных наборов данных, но на практике фактором, ограничивающим скорость, является то, что преподавателем обычно является (утомляемый) человек-эксперт, который должен им будут платить за их усилия, а не за память компьютера.
  • Выборочная выборка на основе потоков . Здесь каждый последовательный немаркированный экземпляр проверяется по одному, при этом машина оценивает информативность каждого элемента по параметрам запроса. Учащийся сам решает, присвоить ли ему метку или запросить у учителя каждую точку данных. В отличие от выборки на основе пула, очевидным недостатком потоковых методов является то, что алгоритм обучения не имеет достаточной информации на ранних этапах процесса, чтобы принять обоснованное решение о назначении метки или задании преподавателем. максимально эффективно использовать наличие уже размеченных данных. Таким образом, учитель, скорее всего, потратит больше усилий на выдачу меток, чем при использовании пулового подхода.
  • Синтез запроса на членство : здесь учащийся генерирует синтетические данные из основного естественного распределения. Например, если набор данных представляет собой изображения людей и животных, учащийся может отправить учителю обрезанное изображение ноги и запросить, принадлежит ли этот придаток животному или человеку. Это особенно полезно, если набор данных небольшой. [10]
    Проблема здесь, как и во всех усилиях по созданию синтетических данных, заключается в обеспечении того, чтобы синтетические данные были согласованы с точки зрения соответствия ограничениям реальных данных. По мере увеличения количества переменных/признаков во входных данных и существования сильных зависимостей между переменными становится все труднее генерировать синтетические данные с достаточной точностью.
    Например, чтобы создать синтетический набор данных для значений лабораторных тестов человека, сумма различных компонентов лейкоцитов (WBC) в разнице лейкоцитов должна равняться 100, поскольку числа компонентов на самом деле представляют собой проценты. Аналогично, ферменты аланиновая трансаминаза (АЛТ) и аспартат-трансаминаза (АСТ) измеряют функцию печени (хотя АСТ также вырабатывается другими тканями, например, легкими, поджелудочной железой). Синтетическая точка данных, при которой АСТ находится на нижней границе нормального диапазона (8- 33 ЕД/л) при уровне АЛТ, в несколько раз превышающем нормальный диапазон (4-35 ЕД/л) у моделируемого хронического больного, было бы физиологически невозможно.

Стратегии запросов [ править ]

Алгоритмы определения того, какие точки данных следует пометить, можно разделить на несколько различных категорий в зависимости от их назначения: [1]

  • Баланс исследования и эксплуатации : выбор примеров для маркировки рассматривается как дилемма между исследованием и использованием представления пространства данных. Эта стратегия позволяет избежать этого компромисса, моделируя проблему активного обучения как проблему контекстуального бандита. Например, Бунеффуф и др. [11] предложить последовательный алгоритм под названием «Активная выборка Томпсона» (ATS), который в каждом раунде назначает распределение выборки в пуле, выбирает одну точку из этого распределения и запрашивает у оракула метку этой точки выборки.
  • Ожидаемое изменение модели : отметьте те точки, которые больше всего изменят текущую модель.
  • Ожидаемое уменьшение ошибок модели : отметьте те точки, которые в наибольшей степени уменьшат ошибку обобщения .
  • Исследование экспоненциального градиента для активного обучения : [12] В этой статье автор предлагает последовательный алгоритм, названный экспоненциальным градиентом (EG)-активным, который может улучшить любой алгоритм активного обучения путем оптимального случайного исследования.
  • Случайная выборка: выборка выбирается случайным образом. [13]
  • Выборка по неопределенности : пометьте те точки, для которых текущая модель менее всего уверена в том, какими должны быть правильные выходные данные.
    • Выборка по энтропии: формула энтропии используется для каждой выборки, и выборка с самой высокой энтропией считается наименее достоверной. [13]
    • Маржинальная выборка: выборка с наименьшей разницей между двумя вероятностями самого высокого класса считается наиболее неопределенной. [13]
    • Наименее уверенная выборка. Выборка с наименьшей наилучшей вероятностью считается наиболее неопределенной. [13]
  • Запрос комитета : различные модели обучаются на текущих размеченных данных и голосуют за выходные данные за неразмеченные данные; обозначьте те пункты, по которым «комитет» не согласен больше всего
  • Запрос из различных подпространств или разделов : [14] Если базовая модель представляет собой лес деревьев, конечные узлы могут представлять (перекрывающиеся) разделы исходного пространства объектов . Это дает возможность выбирать экземпляры из непересекающихся или минимально перекрывающихся разделов для маркировки.
  • Уменьшение дисперсии : отметьте те точки, которые минимизируют дисперсию выходных данных, которая является одним из компонентов ошибки.
  • Конформное предсказание : прогнозирует, что новая точка данных будет иметь метку, похожую на старые точки данных каким-то определенным образом, а степень сходства в старых примерах используется для оценки достоверности прогноза. [15]
  • Несоответствие – сначала самый дальний обход : основным критерием выбора является несоответствие прогноза между текущей моделью и прогнозом ближайшего соседа. Он нацелен на ошибочно предсказанные точки данных. Второй критерий выбора — расстояние до ранее выбранных данных, самый дальний первым. Он направлен на оптимизацию разнообразия выбранных данных. [16]
  • Стратегии маркировки, ориентированные на пользователя. Обучение осуществляется путем применения уменьшения размерности к графикам и цифрам, таким как точечные диаграммы. Затем пользователю предлагается пометить скомпилированные данные (категориальные, числовые, оценки релевантности, связь между двумя экземплярами). [17]

Было изучено множество алгоритмов, попадающих в эти категории. [1] [4] Хотя традиционные стратегии AL могут обеспечить выдающуюся эффективность, часто бывает сложно заранее предсказать, какая стратегия является наиболее подходящей в конкретной ситуации. В последние годы алгоритмы метаобучения набирают популярность. Некоторые из них были предложены для решения проблемы изучения стратегий AL вместо того, чтобы полагаться на стратегии, разработанные вручную. Тест, который сравнивает «подходы метаобучения к активному обучению» с «традиционным активным обучением, основанным на эвристике», может дать интуитивное представление о том, находится ли «активное обучение» на перепутье. [18]

Минимальная маргинальная гиперплоскость [ править ]

Некоторые алгоритмы активного обучения построены на машинах опорных векторов (SVM) и используют структуру SVM, чтобы определить, какие точки данных следует пометить. Такие методы обычно вычисляют границу W для каждого немаркированного элемента данных в T U,i и рассматривают W как n -мерное расстояние от этого элемента данных до разделяющей гиперплоскости.

Методы минимальной маргинальной гиперплоскости предполагают, что данные с наименьшим W — это те, в отношении которых SVM наиболее неопределенен, и поэтому их следует поместить в TC ,i для маркировки. Максимальная маргинальная гиперплоскость», выбирают данные с наибольшим W. Другие подобные методы, такие как « Методы компромисса выбирают сочетание наименьшего и наибольшего W .

См. также [ править ]

Литература [ править ]

Ссылки [ править ]

  1. Перейти обратно: Перейти обратно: а б с Сетлс, Берр (2010). «Обзор литературы по активному обучению» (PDF) . Технический отчет по компьютерным наукам 1648. Университет Висконсина-Мэдисона . Проверено 18 ноября 2014 г.
  2. ^ Рубенс, Нил; Элахи, Мехди; Сугияма, Масаси; Каплан, Дейн (2016). «Активное обучение в рекомендательных системах». В Риччи, Франческо; Рокач, Лиор; Шапира, Брача (ред.). Справочник по рекомендательным системам (PDF) (2-е изд.). Спрингер США. дои : 10.1007/978-1-4899-7637-6 . hdl : 11311/1006123 . ISBN  978-1-4899-7637-6 . S2CID   11569603 .
  3. ^ Дас, Шубхомой; Вонг, Венг-Кин; Дитерих, Томас; Ферн, Алан; Эммотт, Эндрю (2016). «Учет отзывов экспертов при активном обнаружении аномалий». В Бончи, Франческо; Доминго-Феррер, Хосеп; Баеза-Йейтс, Рикардо; Чжоу, Чжи-Хуа; У, Синьдун (ред.). 16-я Международная конференция IEEE по интеллектуальному анализу данных . IEEE. стр. 853–858. дои : 10.1109/ICDM.2016.0102 . ISBN  978-1-5090-5473-2 . S2CID   15285595 .
  4. Перейти обратно: Перейти обратно: а б Олссон, Фредрик (апрель 2009 г.). «Обзор литературы по активному машинному обучению в контексте обработки естественного языка» . Технический отчет SICS T2009:06.
  5. ^ Ян, Бишань; Сунь, Цзянь-Тао; Ван, Тэнцзяо; Чен, Чжэн (2009). «Эффективное активное обучение с несколькими метками для классификации текста» (PDF) . Материалы 15-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных - KDD '09 . п. 917. CiteSeerX   10.1.1.546.9358 . дои : 10.1145/1557019.1557119 . ISBN  978-1-60558-495-9 . S2CID   1979173 .
  6. ^ Лугхофер, Эдвин (февраль 2012 г.). «Гибридное активное обучение для сокращения усилий операторов по аннотированию в системах классификации». Распознавание образов . 45 (2): 884–896. Бибкод : 2012PatRe..45..884L . дои : 10.1016/j.patcog.2011.08.009 .
  7. ^ Лугхофер, Эдвин (2012). «Однопроходное активное обучение с конфликтами и незнанием». Развивающиеся системы . 3 (4): 251–271. дои : 10.1007/s12530-012-9060-7 . S2CID   43844282 .
  8. ^ Новиков, Иван (2021). «Пакет MLIP: моментные тензорные потенциалы с MPI и активным обучением» . Издательство ИОП . 2 (2): 3, 4. arXiv : 2007.08555 . дои : 10.1088/2632-2153/abc9fe .
  9. ^ ДатаРобот. «Активное машинное обучение: что это такое и как оно работает» . Блог DataRobot . DataRobot Inc. Проверено 30 января 2024 г.
  10. ^ Ван, Ляньтао; Ху, Сюэлэй; Юань, Бо; Лу, Цзяньфэн (5 января 2015 г.). «Активное обучение посредством синтеза запросов и поиска ближайшего соседа» (PDF) . Нейрокомпьютинг . 147 : 426–434. дои : 10.1016/j.neucom.2014.06.042 . S2CID   3027214 .
  11. ^ Бунефуф, Джалель; Ларош, Ромен; Урвой, Танги; Феро, Рафаэль; Аллесиардо, Робин (2014). «Контекстный бандит для активного обучения: Активный Томпсон» . В Лоо, СК; Яп, Канзас; Вонг, К.В.; Теох, А.; Хуанг, К. (ред.). Нейронная обработка информации (PDF) . Конспекты лекций по информатике. Том. 8834. стр. 405–412. дои : 10.1007/978-3-319-12637-1_51 . ISBN  978-3-319-12636-4 . S2CID   1701357 . Идентификатор HAL: hal-01069802.
  12. ^ Бунефуф, Джалель (8 января 2016 г.). «Исследование экспоненциального градиента для активного обучения» . Компьютеры . 5 (1): 1. arXiv : 1408.2196 . doi : 10.3390/computers5010001 . S2CID   14313852 .
  13. Перейти обратно: Перейти обратно: а б с д Фариа, Бруно; Пердигао, Дилан; Брас, Жоана; Маседо, Луис (2022). «Совместная роль размера пакета и стратегии запроса в прогнозировании на основе активного обучения - практический пример в области сердечного приступа». В Горети Маррейрос; Бруно Мартинс; Ана Пайва; Бернардете Рибейру; Альберто Сардинья (ред.). Прогресс в области искусственного интеллекта . 21-я конференция EPIA по искусственному интеллекту, EPIA 2022, Лиссабон, Португалия, 31 августа – 2 сентября 2022 г. Конспекты лекций по информатике. Том. 13566. стр. 464–475. дои : 10.1007/978-3-031-16474-3_38 . ISBN  978-3-031-16473-6 .
  14. ^ "shubhomoydas/ad_examples" . Гитхаб . Проверено 4 декабря 2018 г.
  15. ^ Макили, Ласаро Эмилио; Санчес, Хесус А. Вега; Дормидо-Канто, Себастьян (1 октября 2012 г.). «Активное обучение с использованием конформных предикторов: применение к классификации изображений». Наука и технология термоядерного синтеза . 62 (2): 347–355. Бибкод : 2012FuST...62..347M . дои : 10.13182/FST12-A14626 . ISSN   1536-1055 . S2CID   115384000 .
  16. ^ Чжао, Шуян; Хейттола, Тони; Виртанен, Туомас (2020). «Активное обучение обнаружению звуковых событий». Транзакции IEEE/ACM по обработке звука, речи и языка . arXiv : 2002.05033 .
  17. ^ Бернард, Юрген; Цеппельцауэр, Матиас; Леманн, Маркус; Мюллер, Мартин; Седлмайр, Майкл (июнь 2018 г.). «На пути к ориентированным на пользователя алгоритмам активного обучения». Форум компьютерной графики . 37 (3): 121–132. дои : 10.1111/cgf.13406 . ISSN   0167-7055 . S2CID   51875861 .
  18. ^ Дерёмо, Луи; Лемэр, Винсент (2020). Обучение активному обучению на перепутье? Оценка и обсуждение . Материалы семинара по интерактивному адаптивному обучению, проведенного совместно с Европейской конференцией по машинному обучению, принципам и практике обнаружения знаний в базах данных ({ECML} {PKDD} 2020), Гент, Бельгия, 2020. S2CID   221794570 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ae50029306cb2b64beea4dae94092a7d__1716940260
URL1:https://arc.ask3.ru/arc/aa/ae/7d/ae50029306cb2b64beea4dae94092a7d.html
Заголовок, (Title) документа по адресу, URL1:
Active learning (machine learning) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)