Учебная программа
Часть серии о |
Машинное обучение и интеллектуальный анализ данных |
---|
Обучение по учебной программе — это метод машинного обучения , при котором модель обучается на примерах возрастающей сложности, при этом определение «сложности» может быть предоставлено извне или обнаружено автоматически в рамках процесса обучения. Это предназначено для более быстрого достижения хороших результатов или для достижения лучшего локального оптимума, если глобальный оптимум не найден. [1] [2]
Подход [ править ]
В целом обучение по учебной программе — это метод последовательного увеличения сложности примеров в обучающем наборе , который представляется модели в течение нескольких итераций обучения. При некоторых обстоятельствах это может дать лучшие результаты, чем немедленное подвергание модели воздействию всего обучающего набора; чаще всего, когда модель способна изучить общие принципы на более простых примерах, а затем постепенно включать более сложную и тонкую информацию по мере введения более сложных примеров, таких как крайние случаи . Было показано, что это работает во многих областях, скорее всего, как форма регуляризации . [3]
Существует несколько основных вариантов применения этой техники:
- Необходимо определить понятие «трудность». Это может быть результатом человеческой аннотации [4] [5] или внешняя эвристика ; например, при языковом моделировании более короткие предложения могут быть классифицированы как более простые, чем длинные. [6] Другой подход — использовать производительность другой модели, причем примеры, точно предсказанные этой моделью, классифицируются как более простые (обеспечивая связь с повышением ).
- Сложность можно постепенно увеличивать [7] или в отдельные эпохи, [8] и в детерминированном графике или в соответствии с распределением вероятностей . Это также можно смягчить требованием разнообразия на каждом этапе в тех случаях, когда более простые примеры могут быть непропорционально похожи друг на друга. [9]
- Приложения также должны определить график повышения сложности. Простые подходы могут использовать фиксированный график, например, обучение на простых примерах для половины доступных итераций, а затем на всех примерах для второй половины. [3] Другие подходы используют самостоятельное обучение для увеличения сложности пропорционально производительности модели на текущем наборе. [10]
Поскольку обучение по учебной программе касается только выбора и упорядочения обучающих данных, его можно комбинировать со многими другими методами машинного обучения. Успех метода предполагает, что модель, обученная для более простой версии задачи, может быть обобщена для более сложных версий, поэтому ее можно рассматривать как форму трансферного обучения . Некоторые авторы также считают, что обучение по учебной программе включает другие формы постепенно возрастающей сложности, такие как увеличение количества параметров модели. [11] Его часто комбинируют с обучением с подкреплением , например, сначала изучают упрощенную версию игры. [12]
Некоторые области показали успех в обучении вне учебной программы : сначала обучение на самых сложных примерах. Одним из примеров является метод распознавания речи ACCAN , который сначала обучается на примерах с самым высоким соотношением сигнал/шум . [13]
История [ править ]
Термин «обучение по учебной программе» был введен Йошуа Бенджио и др. в 2009 году. [14] применительно к психологической методике формирования у животных и структурированному обучению человека: начиная с простейших понятий и затем развивая их. Авторы также отмечают, что применение этого метода в машинном обучении уходит корнями в ранние исследования нейронных сетей , такие как статья Джеффри Элмана 1993 года « Обучение и разработка в нейронных сетях: важность начала с малого» . [15] Бенджио и др. показали хорошие результаты в решении задач классификации изображений , таких как определение геометрических фигур с постепенно усложняющимися формами, и языкового моделирования , таких как обучение с постепенно расширяющимся словарным запасом . Они приходят к выводу, что в отношении стратегий учебных программ «их благотворное влияние наиболее выражено на тесте».set», что предполагает хорошее обобщение.
С тех пор этот метод был применен во многих других областях:
- Обработка естественного языка :
- Распознавание изображений :
- Обучение с подкреплением :
- Игра [24]
- Обучение графам [25] [26]
- Матричная факторизация [27]
Ссылки [ править ]
- ^ Донг, Дэнке; Хуан, Динлун (2018) Го, Шэн; Чжан , Хаочжи ; . [ cs.Резюме ].
- ^ «Компетентностное обучение нейронному машинному переводу» . Проверено 29 марта 2024 г.
- ↑ Перейти обратно: Перейти обратно: а б Бенджио, Йошуа; Лурадур, Жером; Коллобер, Ронан; Уэстон, Джейсон (2009). «Обучение по учебной программе» . Материалы 26-й ежегодной международной конференции по машинному обучению . стр. 41–48. дои : 10.1145/1553374.1553380 . ISBN 978-1-60558-516-1 . Проверено 24 марта 2024 г.
- ^ «Учебная программа, состоящая из нескольких задач» . Проверено 29 марта 2024 г.
- ^ Ионеску, Раду Тудор; Алексей, Богдан; Леордану, Мариус; Попеску, Мариус; Пападопулос, Дим П.; Феррари, Витторио (2016). «Насколько это может быть сложно? Оценка сложности визуального поиска по изображению» . Конференция IEEE 2016 по компьютерному зрению и распознаванию образов (CVPR) (PDF) . стр. 2157–2166. дои : 10.1109/CVPR.2016.237 . ISBN 978-1-4673-8851-1 . Проверено 29 марта 2024 г.
- ^ «Детские шаги: как «меньше значит больше» при неконтролируемом анализе зависимостей» (PDF) . Проверено 29 марта 2024 г.
- ^ «Самостоятельное обучение моделям со скрытыми переменными» . 6 декабря 2010 г., стр. 1189–1197 . Проверено 29 марта 2024 г.
- ^ Тан, Е; Ян, Ю-Бин; Гао, Ян (2012). «Самостоятельное изучение словаря для классификации изображений» . Материалы 20-й международной конференции ACM по мультимедиа . стр. 833–836. дои : 10.1145/2393347.2396324 . ISBN 978-1-4503-1089-5 . Проверено 29 марта 2024 г.
- ^ «Разнообразная учебная программа для контролируемых задач компьютерного зрения» . Проверено 29 марта 2024 г.
- ^ «Самостоятельное обучение по программе» . Проверено 29 марта 2024 г.
- ^ Совяный, Петр; Раду Тудор Ионеску; Рота, Паоло; Себе, Нико (2021). «Обучение по учебной программе: опрос». arXiv : 2101.10382 [ cs.LG ].
- ^ Нарвекар, Санмит; Пэн, Бэй; Леонетти, Маттео; Синапов, Живко; Тейлор, Мэтью Э.; Стоун, Питер (январь 2020 г.). «Учебная программа для областей обучения с подкреплением: основа и исследование» . Журнал исследований машинного обучения . 21 (1): 181:7382–181:7431. arXiv : 2003.04960 . Проверено 29 марта 2024 г.
- ^ «Учебный метод обучения для повышения устойчивости к шуму при автоматическом распознавании речи» . Проверено 29 марта 2024 г.
- ^ Бенджио, Йошуа; Лурадур, Жером; Коллобер, Ронан; Уэстон, Джейсон (2009). «Обучение по учебной программе» . Материалы 26-й ежегодной международной конференции по машинному обучению . стр. 41–48. дои : 10.1145/1553374.1553380 . ISBN 978-1-60558-516-1 . Проверено 24 марта 2024 г.
- ^ Элман, Дж.Л. (1993). «Обучение и развитие в нейронных сетях: важность начинать с малого» . Познание . 48 (1): 71–99. дои : 10.1016/0010-0277(93)90058-4 . ПМИД 8403835 . Проверено 29 марта 2024 г.
- ^ «Изучение учебной программы с байесовской оптимизацией для изучения представлений слов для конкретных задач» . Проверено 29 марта 2024 г.
- ^ Гонг, Яньтао; Лю, Цао; Юань, Цзячжэнь; Ян, Фань; Цай, Сюньлян; Ван, Гуанлу; Чен, Цзяньсун; Ню, Жуйяо; Ван, Хоуфэн (2021). «Динамическое обучение по учебной программе на основе плотности для обнаружения намерений» . Материалы 30-й Международной конференции ACM по управлению информацией и знаниями . стр. 3034–3037. arXiv : 2108.10674 . дои : 10.1145/3459637.3482082 . ISBN 978-1-4503-8446-9 . Проверено 29 марта 2024 г.
- ^ «Визуализация и понимание учебного плана для сетей долгосрочной кратковременной памяти» . Проверено 29 марта 2024 г.
- ^ «Эмпирическое исследование учебной программы по нейронному машинному переводу» . Проверено 29 марта 2024 г.
- ^ «Оптимизация учебной программы на основе обучения с подкреплением для нейронного машинного перевода» . Проверено 29 марта 2024 г.
- ^ «Метод обучения по учебной программе для повышения устойчивости к шуму при автоматическом распознавании речи» . Проверено 29 марта 2024 г.
- ^ Хуан, Юге; Ван, Юхан; Тай, Ин; Лю, Сяомин; Шен, Пэнчэн; Ли, Шаосинь; Ли, Цзилинь; Хуан, Фейюэ (2020). «CurrICALFace: потеря адаптивного учебного плана для глубокого распознавания лиц» . Конференция IEEE/CVF 2020 года по компьютерному зрению и распознаванию образов (CVPR) . стр. 5900–5909. arXiv : 2004.00288 . дои : 10.1109/CVPR42600.2020.00594 . ISBN 978-1-7281-7168-5 . Проверено 29 марта 2024 г.
- ^ «Учебная программа самостоятельного обучения по обнаружению междоменных объектов» . Проверено 29 марта 2024 г.
- ^ «Автоматическое создание графиков учебных программ для агентов обучения с подкреплением» . 4 февраля 2017 г. стр. 2590–2596 . Проверено 29 марта 2024 г.
- ^ Гонг, Чен; Ян, Цзянь; Тао, Дачэн (2019). «Мультимодальное обучение по учебной программе с помощью графиков» . Транзакции ACM в интеллектуальных системах и технологиях . 10 (4): 1–25. дои : 10.1145/3322122 . Проверено 29 марта 2024 г.
- ^ Цюй, Мэн; Тан, Цзянь; Хан, Цзявэй (2018). Учебная программа по внедрению гетерогенной звездообразной сети посредством глубокого обучения с подкреплением . стр. 468–476. дои : 10.1145/3159652.3159711 . hdl : 2142/101634 . ISBN 978-1-4503-5581-0 . Проверено 29 марта 2024 г.
- ^ Самостоятельное обучение матричной факторизации . 25 января 2015 г. стр. 3196–3202. ISBN 978-0-262-51129-2 . Проверено 29 марта 2024 г.