Маржа (машинное обучение)
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
В машинном обучении граница одной точки данных определяется как расстояние от точки данных до границы решения . Обратите внимание, что существует множество расстояний и границ принятия решений, которые могут подходить для определенных наборов данных и целей. Классификатор полей — это классификатор, который явно использует поля каждого примера при изучении классификатора. Существуют теоретические обоснования (основанные на измерении венчурного капитала ) того, почему максимизация маржи (при некоторых подходящих ограничениях) может быть полезна для алгоритмов машинного обучения и статистических выводов.
Существует множество гиперплоскостей, которые могут классифицировать данные. Разумным выбором в качестве лучшей гиперплоскости является та, которая представляет собой наибольшее расстояние или границу между двумя классами. Поэтому мы выбираем гиперплоскость так, чтобы расстояние от нее до ближайшей точки данных на каждой стороне было максимальным. Если такая гиперплоскость существует, она известна как гиперплоскость с максимальным запасом , а линейный классификатор, который она определяет, известен как классификатор с максимальным запасом ; или, что то же самое, перцептрон оптимальной стабильности. [ нужна ссылка ]