Кривая обучения (машинное обучение)
Эта статья предоставляет недостаточный контекст для тех, кто не знаком с предметом . ( Март 2019 г. ) |
Часть серии о |
Машинное обучение и интеллектуальный анализ данных |
---|
В машинном обучении кривая обучения (или кривая обучения ) отображает оптимальное значение модели функции потерь для обучающего набора в сравнении с этой функцией потерь, оцененной на наборе проверочных данных с теми же параметрами, что и оптимальная функция. [1] Синонимы включают кривую ошибок , кривую опыта , кривую улучшения и кривую обобщения . [2]
Более абстрактно, кривая обучения — это кривая (усилие обучения) — (прогнозируемая производительность), где обычно усилия по обучению означают количество обучающих выборок, а прогностическая эффективность означает точность тестируемых образцов. [3]
Кривая машинного обучения полезна для многих целей, включая сравнение различных алгоритмов, [4] выбор параметров модели во время проектирования, [5] настройка оптимизации для улучшения сходимости и определение объема данных, используемых для обучения. [6]
Формальное определение [ править ]
Одна из моделей машинного обучения создает функцию , f(x) которая с учетом некоторой информации x предсказывает некоторую переменную y на основе обучающих данных. и . Она отличается от математической оптимизации, поскольку должен хорошо прогнозировать за пределами .
Мы часто ограничиваем возможные функции параметризованным семейством функций, , так что наша функция более обобщаема [7] или чтобы функция имела определенные свойства, например те, которые позволяют найти хорошее проще, или потому, что у нас есть некая априорная причина думать, что эти свойства верны. [7] : 172
Учитывая, что невозможно создать функцию, которая идеально соответствует нашим данным, необходимо создать функцию потерь. чтобы измерить, насколько хорош наш прогноз. Затем мы определяем процесс оптимизации, который находит что сводит к минимуму упоминается как .
Кривая обучения количеству данных [ править ]
Тогда, если наши данные обучения и наши данные проверки кривая обучения — это график двух кривых
где
Кривая обучения для количества итераций [ править ]
Многие процессы оптимизации являются итеративными: один и тот же шаг повторяется до тех пор, пока процесс не дойдет до оптимального значения. Градиентный спуск — один из таких алгоритмов. Если вы определите как приближение к оптимальному после шагов, кривая обучения – это график
Выбор размера набора обучающих данных [ править ]
Это инструмент, позволяющий выяснить, насколько модель машины выигрывает от добавления дополнительных обучающих данных и страдает ли оценщик больше от ошибки дисперсии или ошибки смещения. Если и оценка проверки, и оценка обучения сходятся к слишком низкому значению при увеличении размера обучающего набора, увеличение количества обучающих данных не принесет особой пользы. [8]
В области машинного обучения существуют два значения кривых обучения, различающихся по оси X кривых: опыт модели отображается либо как количество обучающих примеров, использованных для обучения, либо как количество итераций, использованных при обучении модели. [9]
См. также [ править ]
- Переобучение
- Компромисс смещения и дисперсии
- Выбор модели
- Перекрестная проверка (статистика)
- Срок действия (статистика)
- Верификация и валидация
- Двойной спуск
Ссылки [ править ]
- ^ «Мор, Феликс и ван Рейн, Ян Н. «Кривые обучения для принятия решений в контролируемом машинном обучении — опрос». Препринт arXiv arXiv:2201.12150 (2022)». arXiv : 2201.12150 .
- ^ Виринг, Том; Луг, Марко (01 июня 2023 г.). «Форма кривых обучения: обзор» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 45 (6): 7799–7819. arXiv : 2103.10948 . дои : 10.1109/TPAMI.2022.3220744 . ISSN 0162-8828 . ПМИД 36350870 .
- ^ Перлич, Клаудия (2010), «Кривые обучения в машинном обучении» , Саммут, Клод; Уэбб, Джеффри И. (ред.), Энциклопедия машинного обучения , Бостон, Массачусетс: Springer US, стр. 577–580, doi : 10.1007/978-0-387-30164-8_452 , ISBN 978-0-387-30164-8 , получено 6 июля 2023 г.
- ^ Мадхаван, PG (1997). «Новый алгоритм обучения рекуррентной нейронной сети для прогнозирования временных рядов» (PDF) . Журнал интеллектуальных систем . п. 113 Рис. 3.
- ^ «Машинное обучение 102: Практические советы» . Учебное пособие: Машинное обучение в астрономии с помощью Scikit-learn .
- ^ Мик, Кристофер; Тиссон, Бо; Хеккерман, Дэвид (лето 2002 г.). «Метод выборки по кривой обучения, применяемый к кластеризации на основе моделей» . Журнал исследований машинного обучения . 2 (3): 397. Архивировано из оригинала 15 июля 2013 г.
- ^ Jump up to: Перейти обратно: а б Гудфеллоу, Ян; Бенджио, Йошуа; Курвиль, Аарон (18 ноября 2016 г.). Глубокое обучение . МТИ Пресс. п. 108. ИСБН 978-0-262-03561-3 .
- ^ разработчики scikit-learn. «Кривые проверки: построение оценок для оценки моделей — документация scikit-learn 0.20.2» . Проверено 15 февраля 2019 г.
- ^ Саммут, Клод; Уэбб, Джеффри И. (ред.) (28 марта 2011 г.). Энциклопедия машинного обучения (1-е изд.). Спрингер. п. 578. ИСБН 978-0-387-30768-8 .