Обучение с нулевым выстрелом
Обучение с нулевым выстрелом ( ZSL ) — это проблема глубокого обучения , при которой во время тестирования учащийся наблюдает за образцами из классов, которые не наблюдались во время обучения , и ему необходимо предсказать, к какому классу они принадлежат. Название представляет собой игру слов, основанную на более ранней концепции однократного обучения , в которой классификацию можно изучить только на одном или нескольких примерах.
Методы нулевого выстрела обычно работают путем связывания наблюдаемых и ненаблюдаемых классов с помощью некоторой формы вспомогательной информации, которая кодирует наблюдаемые отличительные свойства объектов. [1] Например, при наличии набора изображений животных, подлежащих классификации, а также вспомогательных текстовых описаний того, как выглядят животные, модель искусственного интеллекта, обученная распознавать лошадей, но никогда не получавшая зебру, все равно может распознавать зебру. когда он также знает, что зебры похожи на полосатых лошадей. Эта проблема широко изучается в компьютерном зрении , обработке естественного языка и машинном восприятии . [2]
Предыстория и история
[ редактировать ]Первая статья о нулевом обучении при обработке естественного языка появилась в 2008 году на AAAI'08 , но название, данное там парадигме обучения, было классификация без данных . [3] На той же конференции появилась первая статья о нулевом обучении в компьютерном зрении под названием « Обучение с нулевыми данными» . [4] Сам термин « обучение с нулевым выстрелом» впервые появился в литературе в 2009 году в статье Палатуччи, Хинтона, Померло и Митчелла на конференции NIPS'09 . [5] Эта терминология была повторена позже в другой статье по компьютерному зрению. [6] и термин « обучение с нулевым выстрелом» прижился как продолжение однократного обучения , которое было введено в компьютерное зрение несколькими годами ранее. [7]
В компьютерном зрении модели нулевого обучения изучают параметры видимых классов вместе с их представлениями классов и полагаются на репрезентативное сходство между метками классов, чтобы во время вывода экземпляры можно было классифицировать в новые классы.
В области обработки естественного языка ключевое техническое направление основано на способности «понимать метки» — представлять метки в том же семантическом пространстве, что и классифицируемые документы. Это поддерживает классификацию одного примера без наблюдения каких-либо аннотированных данных, что является самой чистой формой классификации с нулевым выстрелом. Оригинальная бумага [3] использовал представление явного семантического анализа (ESA), но в более поздних статьях использовались другие представления, включая плотные представления. Этот подход был также распространен на многоязычные домены, [8] [9] тонкая типизация объектов [10] и другие проблемы. Более того, помимо опоры исключительно на представления, вычислительный подход был расширен и теперь зависит от переноса из других задач, таких как текстовое следствие. [11] и ответы на вопросы. [12]
Оригинальная бумага [3] также указывает, что, помимо возможности классифицировать один пример, когда дан набор примеров, в предположении, что они происходят из одного и того же дистрибутива, можно повысить производительность полуконтролируемым способом (или трансдуктивным способом). обучение ).
В отличие от стандартного обобщения в машинном обучении, где классификаторы должны правильно классифицировать новые образцы по классам, которые они уже наблюдали во время обучения, в ZSL во время обучения классификатора не передаются образцы из классов. Поэтому это можно рассматривать как крайний случай адаптации предметной области .
Предварительная информация для классов с нулевым выстрелом
[ редактировать ]Естественно, об этих нулевых классах должна быть предоставлена некоторая вспомогательная информация, и этот тип информации может быть нескольких типов.
- Обучение с атрибутами: занятия сопровождаются заранее заданным структурированным описанием. Например, для описаний птиц это может включать «рыжая голова», «длинный клюв». [6] [13] Эти атрибуты часто организованы композиционно, и учет этой структуры улучшает обучение. [14] Хотя этот подход использовался в основном в компьютерном зрении, есть некоторые примеры его применения и в обработке естественного языка. [15]
- Обучение по текстовому описанию. Как отмечалось выше, это было ключевым направлением обработки естественного языка. Здесь метки классов имеют смысл и часто дополняются определениями или свободным текстовым описанием на естественном языке. Это может включать, например, описание класса в Википедии. [10] [16] [17]
- Класс-классовое сходство. Здесь классы встроены в непрерывное пространство. Классификатор с нулевым выстрелом может предсказать, что выборка соответствует некоторой позиции в этом пространстве, а ближайший встроенный класс используется в качестве прогнозируемого класса, даже если во время обучения такие выборки не наблюдались. [18]
Обобщенное обучение с нулевым выстрелом
[ редактировать ]Приведенная выше настройка ZSL предполагает, что во время тестирования предоставляются только нулевые образцы, а именно образцы из новых невидимых классов. При обобщенном обучении с нулевым выстрелом во время тестирования могут появляться образцы как из новых, так и из известных классов. Это создает новые проблемы для классификаторов во время тестирования, поскольку очень сложно оценить, является ли данная выборка новой или известной. Некоторые подходы к решению этой проблемы включают в себя:
- модуль шлюзования, который сначала обучается решать, принадлежит ли данная выборка к новому классу или к старому, а затем, во время вывода, выводит либо жесткое решение, [19] или мягкое вероятностное решение [20]
- генеративный модуль, который обучен генерировать представление признаков невидимых классов — стандартный классификатор затем может быть обучен на выборках из всех классов, видимых и невидимых. [21]
Области применения
[ редактировать ]Обучение с нулевым выстрелом было применено к следующим областям:
- классификация изображений
- семантическая сегментация
- генерация изображения
- обнаружение объектов
- обработка естественного языка
- вычислительная биология [22]
См. также
[ редактировать ]- Единоразовое обучение компьютерному зрению
- Трансферное обучение
- Быстрое картографирование
- Обучение на основе объяснений
Ссылки
[ редактировать ]- ^ Сиань, Юнцинь; Ламперт, Кристоф Х.; Шиле, Бернт; Аката, Зейнеп (23 сентября 2020 г.). «Обучение с нулевым выстрелом - комплексная оценка хорошего, плохого и уродливого». arXiv : 1707.00600 [ cs.CV ].
- ^ Сиань, Юнцинь; Шиле, Бернт; Аката, Зейнеп (2017). «Нулевое обучение – хорошее, плохое и ужасное». Материалы конференции IEEE по компьютерному зрению и распознаванию образов : 4582–4591. arXiv : 1703.04394 . Бибкод : 2017arXiv170304394X .
- ^ Jump up to: а б с Чанг, М.В. (2008). «Важность семантического представления: классификация без данных» . АААИ .
- ^ Ларошель, Хьюго (2008). «Обучение новым задачам без данных» (PDF) .
- ^ Палатуччи, Марк (2009). «Нулевое обучение с семантическими выходными кодами» (PDF) . НИПС .
- ^ Jump up to: а б Ламперт, CH (2009). «Научимся обнаруживать невидимые классы объектов путем передачи атрибутов между классами» . Конференция IEEE по компьютерному зрению и распознаванию образов : 951–958. CiteSeerX 10.1.1.165.9750 .
- ^ Миллер, Э.Г. (2000). «Обучение на одном примере с помощью общей плотности преобразований» (PDF) . ЦВПР .
- ^ Сун, Янцю (2019). «На пути к тематической классификации текстовых документов с нулевой вероятностью на любом языке» . Искусственный интеллект . 274 : 133–150. дои : 10.1016/j.artint.2019.02.002 .
- ^ Сун, Янцю (2016). «Межъязыковая классификация без данных для многих языков» (PDF) . ИДЖКАИ .
- ^ Jump up to: а б Чжоу, Бен (2018). «Типизация открытых сущностей с нулевым выстрелом как обоснование совместимости типов» (PDF) . ЕМНЛП . arXiv : 1907.03228 .
- ^ Инь, Вэньпэн (2019). «Сравнительный анализ классификации текста с нулевым выстрелом: наборы данных, оценка и подход к получению результатов» (PDF) . ЕМНЛП . arXiv : 1909.00161 .
- ^ Леви, Омер (2017). «Извлечение отношений с нулевым выстрелом посредством понимания чтения» (PDF) . КонНЛЛ . arXiv : 1706.04115 .
- ^ Ромера-Паредес, Бернардино; Торр, Филипп (2015). «Поразительно простой подход к обучению с нуля» (PDF) . Международная конференция по машинному обучению : 2152–2161.
- ^ Ацмон, Юваль; Чечик, Галь (2018). «Вероятностная группировка атрибутов И-ИЛИ для нулевого обучения» (PDF) . Неопределенность в искусственном интеллекте . arXiv : 1806.02664 . Бибкод : 2018arXiv180602664A .
- ^ Рот, Дэн (2009). «Аспектная категоризация текста с ненаблюдаемыми метками» . ИКДМ . CiteSeerX 10.1.1.148.9946 .
- ^ Ху, Р. Лили; Сюн, Цаймин; Сочер, Ричард (2018). «Классификация изображений с нулевым выстрелом, основанная на описаниях классов на естественном языке: подход метаобучения» (PDF) . НейриПС .
- ^ Шривастава, Шашанк; Лабутов Игорь; Митчелл, Том (2018). «Нулевое обучение классификаторов на основе количественной оценки естественного языка». Материалы 56-го ежегодного собрания Ассоциации компьютерной лингвистики (Том 1: Длинные статьи) . стр. 306–316. дои : 10.18653/v1/P18-1029 .
- ^ Фром, Андреа; и др. (2013). «Разработка: глубокая модель визуально-семантического внедрения» (PDF) . Достижения в области нейронных систем обработки информации : 2121–2129.
- ^ Сошер, Р; Ганджу, М; Мэннинг, CD; Нг, А. (2013). «Нулевое обучение посредством кросс-модального перевода». Нейронные системы обработки информации . arXiv : 1301.3666 . Бибкод : 2013arXiv1301.3666S .
- ^ Ацмон, Юваль (2019). «Адаптивное доверительное сглаживание для обобщенного обучения с нулевым выстрелом». Конференция IEEE по компьютерному зрению и распознаванию образов : 11671–11680. arXiv : 1812.09903 . Бибкод : 2018arXiv181209903A .
- ^ Феликс, Р; и др. (2018). «Мультимодальное цикличное обобщенное обучение с нулевым выстрелом». Материалы Европейской конференции по компьютерному зрению : 21–37. arXiv : 1808.00136 . Бибкод : 2018arXiv180800136F .
- ^ Виттманн, Брюс Дж.; Юэ, Исон; Арнольд, Фрэнсис Х. (04 декабря 2020 г.). «Направленная эволюция с помощью машинного обучения перемещается по комбинаторному эпистатическому ландшафту фитнеса с минимальной нагрузкой на скрининг» : 2020.12.04.408955. дои : 10.1101/2020.12.04.408955 . S2CID 227914824 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь )