Jump to content

Кривая обучения (машинное обучение)

Кривая обучения, показывающая оценку обучения и оценку перекрестной проверки

В машинном обучении кривая обучения (или кривая обучения ) отображает оптимальное значение модели функции потерь для обучающего набора в сравнении с этой функцией потерь, оцененной на наборе проверочных данных с теми же параметрами, что и оптимальная функция. [1] Синонимы включают кривую ошибок , кривую опыта , кривую улучшения и кривую обобщения . [2]

Более абстрактно, кривая обучения — это кривая (усилие обучения) — (прогнозируемая производительность), где обычно усилия по обучению означают количество обучающих выборок, а прогностическая эффективность означает точность тестируемых образцов. [3]

Кривая машинного обучения полезна для многих целей, включая сравнение различных алгоритмов, [4] выбор параметров модели во время проектирования, [5] настройка оптимизации для улучшения сходимости и определение объема данных, используемых для обучения. [6]

Формальное определение [ править ]

Одна из моделей машинного обучения создает функцию , f(x) которая с учетом некоторой информации x предсказывает некоторую переменную y на основе обучающих данных. и . Она отличается от математической оптимизации, поскольку должен хорошо прогнозировать за пределами .

Мы часто ограничиваем возможные функции параметризованным семейством функций, , так что наша функция более обобщаема [7] или чтобы функция имела определенные свойства, например те, которые позволяют найти хорошее проще, или потому, что у нас есть некая априорная причина думать, что эти свойства верны. [7] : 172 

Учитывая, что невозможно создать функцию, которая идеально соответствует нашим данным, необходимо создать функцию потерь. чтобы измерить, насколько хорош наш прогноз. Затем мы определяем процесс оптимизации, который находит что сводит к минимуму упоминается как .

Кривая обучения количеству данных [ править ]

Тогда, если наши данные обучения и наши данные проверки кривая обучения — это график двух кривых

где

Кривая обучения для количества итераций [ править ]

Многие процессы оптимизации являются итеративными: один и тот же шаг повторяется до тех пор, пока процесс не дойдет до оптимального значения. Градиентный спуск — один из таких алгоритмов. Если вы определите как приближение к оптимальному после шагов, кривая обучения – это график

Выбор размера набора обучающих данных [ править ]

Это инструмент, позволяющий выяснить, насколько модель машины выигрывает от добавления дополнительных обучающих данных и страдает ли оценщик больше от ошибки дисперсии или ошибки смещения. Если и оценка проверки, и оценка обучения сходятся к слишком низкому значению при увеличении размера обучающего набора, увеличение количества обучающих данных не принесет особой пользы. [8]

В области машинного обучения существуют два значения кривых обучения, различающихся по оси X кривых: опыт модели отображается либо как количество обучающих примеров, использованных для обучения, либо как количество итераций, использованных при обучении модели. [9]

См. также [ править ]

Ссылки [ править ]

  1. ^ «Мор, Феликс и ван Рейн, Ян Н. «Кривые обучения для принятия решений в контролируемом машинном обучении — опрос». Препринт arXiv arXiv:2201.12150 (2022)». arXiv : 2201.12150 .
  2. ^ Виринг, Том; Луг, Марко (01 июня 2023 г.). «Форма кривых обучения: обзор» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 45 (6): 7799–7819. arXiv : 2103.10948 . дои : 10.1109/TPAMI.2022.3220744 . ISSN   0162-8828 . ПМИД   36350870 .
  3. ^ Перлич, Клаудия (2010), «Кривые обучения в машинном обучении» , Саммут, Клод; Уэбб, Джеффри И. (ред.), Энциклопедия машинного обучения , Бостон, Массачусетс: Springer US, стр. 577–580, doi : 10.1007/978-0-387-30164-8_452 , ISBN  978-0-387-30164-8 , получено 6 июля 2023 г.
  4. ^ Мадхаван, PG (1997). «Новый алгоритм обучения рекуррентной нейронной сети для прогнозирования временных рядов» (PDF) . Журнал интеллектуальных систем . п. 113 Рис. 3.
  5. ^ «Машинное обучение 102: Практические советы» . Учебное пособие: Машинное обучение в астрономии с помощью Scikit-learn .
  6. ^ Мик, Кристофер; Тиссон, Бо; Хеккерман, Дэвид (лето 2002 г.). «Метод выборки по кривой обучения, применяемый к кластеризации на основе моделей» . Журнал исследований машинного обучения . 2 (3): 397. Архивировано из оригинала 15 июля 2013 г.
  7. ^ Jump up to: Перейти обратно: а б Гудфеллоу, Ян; Бенджио, Йошуа; Курвиль, Аарон (18 ноября 2016 г.). Глубокое обучение . МТИ Пресс. п. 108. ИСБН  978-0-262-03561-3 .
  8. ^ разработчики scikit-learn. «Кривые проверки: построение оценок для оценки моделей — документация scikit-learn 0.20.2» . Проверено 15 февраля 2019 г.
  9. ^ Саммут, Клод; Уэбб, Джеффри И. (ред.) (28 марта 2011 г.). Энциклопедия машинного обучения (1-е изд.). Спрингер. п. 578. ИСБН  978-0-387-30768-8 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1921dea4fc9d54358e0864a8a2c2333d__1715616120
URL1:https://arc.ask3.ru/arc/aa/19/3d/1921dea4fc9d54358e0864a8a2c2333d.html
Заголовок, (Title) документа по адресу, URL1:
Learning curve (machine learning) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)