Jump to content

Учебная программа

Обучение по учебной программе — это метод машинного обучения , при котором модель обучается на примерах возрастающей сложности, при этом определение «сложности» может быть предоставлено извне или обнаружено автоматически в рамках процесса обучения. Это предназначено для более быстрого достижения хороших результатов или для достижения лучшего локального оптимума, если глобальный оптимум не найден. [1] [2]

Подход [ править ]

В целом обучение по учебной программе — это метод последовательного увеличения сложности примеров в обучающем наборе , который представляется модели в течение нескольких итераций обучения. При некоторых обстоятельствах это может дать лучшие результаты, чем немедленное подвергание модели воздействию всего обучающего набора; чаще всего, когда модель способна изучить общие принципы на более простых примерах, а затем постепенно включать более сложную и тонкую информацию по мере введения более сложных примеров, таких как крайние случаи . Было показано, что это работает во многих областях, скорее всего, как форма регуляризации . [3]

Существует несколько основных вариантов применения этой техники:

  • Необходимо определить понятие «трудность». Это может быть результатом человеческой аннотации [4] [5] или внешняя эвристика ; например, при языковом моделировании более короткие предложения могут быть классифицированы как более простые, чем длинные. [6] Другой подход — использовать производительность другой модели, причем примеры, точно предсказанные этой моделью, классифицируются как более простые (обеспечивая связь с повышением ).
  • Сложность можно постепенно увеличивать [7] или в отдельные эпохи, [8] и в детерминированном графике или в соответствии с распределением вероятностей . Это также можно смягчить требованием разнообразия на каждом этапе в тех случаях, когда более простые примеры могут быть непропорционально похожи друг на друга. [9]
  • Приложения также должны определить график повышения сложности. Простые подходы могут использовать фиксированный график, например, обучение на простых примерах для половины доступных итераций, а затем на всех примерах для второй половины. [3] Другие подходы используют самостоятельное обучение для увеличения сложности пропорционально производительности модели на текущем наборе. [10]

Поскольку обучение по учебной программе касается только выбора и упорядочения обучающих данных, его можно комбинировать со многими другими методами машинного обучения. Успех метода предполагает, что модель, обученная для более простой версии задачи, может быть обобщена для более сложных версий, поэтому ее можно рассматривать как форму трансферного обучения . Некоторые авторы также считают, что обучение по учебной программе включает другие формы постепенно возрастающей сложности, такие как увеличение количества параметров модели. [11] Его часто комбинируют с обучением с подкреплением , например, сначала изучают упрощенную версию игры. [12]

Некоторые области показали успех в обучении вне учебной программы : сначала обучение на самых сложных примерах. Одним из примеров является метод распознавания речи ACCAN , который сначала обучается на примерах с самым высоким соотношением сигнал/шум . [13]

История [ править ]

Термин «обучение по учебной программе» был введен Йошуа Бенджио и др. в 2009 году. [14] применительно к психологической методике формирования у животных и структурированному обучению человека: начиная с простейших понятий и затем развивая их. Авторы также отмечают, что применение этого метода в машинном обучении уходит корнями в ранние исследования нейронных сетей , такие как статья Джеффри Элмана 1993 года « Обучение и разработка в нейронных сетях: важность начала с малого» . [15] Бенджио и др. показали хорошие результаты в решении задач классификации изображений , таких как определение геометрических фигур с постепенно усложняющимися формами, и языкового моделирования , таких как обучение с постепенно расширяющимся словарным запасом . Они приходят к выводу, что в отношении стратегий учебных программ «их благотворное влияние наиболее выражено на тесте».set», что предполагает хорошее обобщение.

С тех пор этот метод был применен во многих других областях:

Ссылки [ править ]

  1. ^ Донг, Дэнке; Хуан, Динлун (2018) Го, Шэн; Чжан , Хаочжи ; . [ cs.Резюме ].
  2. ^ «Компетентностное обучение нейронному машинному переводу» . Проверено 29 марта 2024 г.
  3. Перейти обратно: Перейти обратно: а б Бенджио, Йошуа; Лурадур, Жером; Коллобер, Ронан; Уэстон, Джейсон (2009). «Обучение по учебной программе» . Материалы 26-й ежегодной международной конференции по машинному обучению . стр. 41–48. дои : 10.1145/1553374.1553380 . ISBN  978-1-60558-516-1 . Проверено 24 марта 2024 г.
  4. ^ «Учебная программа, состоящая из нескольких задач» . Проверено 29 марта 2024 г.
  5. ^ Ионеску, Раду Тудор; Алексей, Богдан; Леордану, Мариус; Попеску, Мариус; Пападопулос, Дим П.; Феррари, Витторио (2016). «Насколько это может быть сложно? Оценка сложности визуального поиска по изображению» . Конференция IEEE 2016 по компьютерному зрению и распознаванию образов (CVPR) (PDF) . стр. 2157–2166. дои : 10.1109/CVPR.2016.237 . ISBN  978-1-4673-8851-1 . Проверено 29 марта 2024 г.
  6. ^ «Детские шаги: как «меньше значит больше» при неконтролируемом анализе зависимостей» (PDF) . Проверено 29 марта 2024 г.
  7. ^ «Самостоятельное обучение моделям со скрытыми переменными» . 6 декабря 2010 г., стр. 1189–1197 . Проверено 29 марта 2024 г.
  8. ^ Тан, Е; Ян, Ю-Бин; Гао, Ян (2012). «Самостоятельное изучение словаря для классификации изображений» . Материалы 20-й международной конференции ACM по мультимедиа . стр. 833–836. дои : 10.1145/2393347.2396324 . ISBN  978-1-4503-1089-5 . Проверено 29 марта 2024 г.
  9. ^ «Разнообразная учебная программа для контролируемых задач компьютерного зрения» . Проверено 29 марта 2024 г.
  10. ^ «Самостоятельное обучение по программе» . Проверено 29 марта 2024 г.
  11. ^ Совяный, Петр; Раду Тудор Ионеску; Рота, Паоло; Себе, Нико (2021). «Обучение по учебной программе: опрос». arXiv : 2101.10382 [ cs.LG ].
  12. ^ Нарвекар, Санмит; Пэн, Бэй; Леонетти, Маттео; Синапов, Живко; Тейлор, Мэтью Э.; Стоун, Питер (январь 2020 г.). «Учебная программа для областей обучения с подкреплением: основа и исследование» . Журнал исследований машинного обучения . 21 (1): 181:7382–181:7431. arXiv : 2003.04960 . Проверено 29 марта 2024 г.
  13. ^ «Учебный метод обучения для повышения устойчивости к шуму при автоматическом распознавании речи» . Проверено 29 марта 2024 г.
  14. ^ Бенджио, Йошуа; Лурадур, Жером; Коллобер, Ронан; Уэстон, Джейсон (2009). «Обучение по учебной программе» . Материалы 26-й ежегодной международной конференции по машинному обучению . стр. 41–48. дои : 10.1145/1553374.1553380 . ISBN  978-1-60558-516-1 . Проверено 24 марта 2024 г.
  15. ^ Элман, Дж.Л. (1993). «Обучение и развитие в нейронных сетях: важность начинать с малого» . Познание . 48 (1): 71–99. дои : 10.1016/0010-0277(93)90058-4 . ПМИД   8403835 . Проверено 29 марта 2024 г.
  16. ^ «Изучение учебной программы с байесовской оптимизацией для изучения представлений слов для конкретных задач» . Проверено 29 марта 2024 г.
  17. ^ Гонг, Яньтао; Лю, Цао; Юань, Цзячжэнь; Ян, Фань; Цай, Сюньлян; Ван, Гуанлу; Чен, Цзяньсун; Ню, Жуйяо; Ван, Хоуфэн (2021). «Динамическое обучение по учебной программе на основе плотности для обнаружения намерений» . Материалы 30-й Международной конференции ACM по управлению информацией и знаниями . стр. 3034–3037. arXiv : 2108.10674 . дои : 10.1145/3459637.3482082 . ISBN  978-1-4503-8446-9 . Проверено 29 марта 2024 г.
  18. ^ «Визуализация и понимание учебного плана для сетей долгосрочной кратковременной памяти» . Проверено 29 марта 2024 г.
  19. ^ «Эмпирическое исследование учебной программы по нейронному машинному переводу» . Проверено 29 марта 2024 г.
  20. ^ «Оптимизация учебной программы на основе обучения с подкреплением для нейронного машинного перевода» . Проверено 29 марта 2024 г.
  21. ^ «Метод обучения по учебной программе для повышения устойчивости к шуму при автоматическом распознавании речи» . Проверено 29 марта 2024 г.
  22. ^ Хуан, Юге; Ван, Юхан; Тай, Ин; Лю, Сяомин; Шен, Пэнчэн; Ли, Шаосинь; Ли, Цзилинь; Хуан, Фейюэ (2020). «CurrICALFace: потеря адаптивного учебного плана для глубокого распознавания лиц» . Конференция IEEE/CVF 2020 года по компьютерному зрению и распознаванию образов (CVPR) . стр. 5900–5909. arXiv : 2004.00288 . дои : 10.1109/CVPR42600.2020.00594 . ISBN  978-1-7281-7168-5 . Проверено 29 марта 2024 г.
  23. ^ «Учебная программа самостоятельного обучения по обнаружению междоменных объектов» . Проверено 29 марта 2024 г.
  24. ^ «Автоматическое создание графиков учебных программ для агентов обучения с подкреплением» . 4 февраля 2017 г. стр. 2590–2596 . Проверено 29 марта 2024 г.
  25. ^ Гонг, Чен; Ян, Цзянь; Тао, Дачэн (2019). «Мультимодальное обучение по учебной программе с помощью графиков» . Транзакции ACM в интеллектуальных системах и технологиях . 10 (4): 1–25. дои : 10.1145/3322122 . Проверено 29 марта 2024 г.
  26. ^ Цюй, Мэн; Тан, Цзянь; Хан, Цзявэй (2018). Учебная программа по внедрению гетерогенной звездообразной сети посредством глубокого обучения с подкреплением . стр. 468–476. дои : 10.1145/3159652.3159711 . hdl : 2142/101634 . ISBN  978-1-4503-5581-0 . Проверено 29 марта 2024 г.
  27. ^ Самостоятельное обучение матричной факторизации . 25 января 2015 г. стр. 3196–3202. ISBN  978-0-262-51129-2 . Проверено 29 марта 2024 г.

Дальнейшее чтение [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8399a72e5662c83306599a2d38b4a90e__1714758780
URL1:https://arc.ask3.ru/arc/aa/83/0e/8399a72e5662c83306599a2d38b4a90e.html
Заголовок, (Title) документа по адресу, URL1:
Curriculum learning - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)