В статистической классификации классификатор Байеса — это классификатор, имеющий наименьшую вероятность неправильной классификации среди всех классификаторов, использующих один и тот же набор признаков. [1]
Предположим, пара принимает значения в , где — это метка класса элемента, функции которого определяются формулой . Предположим, что распределение X условное при условии, что метка Y принимает значение r, определяется выражением где " " означает "распространяется как", и где обозначает распределение вероятностей.
Классификатор — это правило, которое присваивает наблюдению X = x предположение или оценку того, чем на самом деле была ненаблюдаемая метка Y = r . Теоретически классификатор — это измеримая функция. , с интерпретацией, что C относит точку x к классу C ( x ). Вероятность неправильной классификации или риск классификатора C определяется как
Классификатор Байеса – это
На практике, как и в большей части статистики, трудности и тонкости связаны с эффективным моделированием распределений вероятностей — в данном случае . Классификатор Байеса является полезным ориентиром в статистической классификации .
Избыточный риск общего классификатора (возможно, в зависимости от некоторых обучающих данных) определяется как Таким образом, эта неотрицательная величина важна для оценки эффективности различных методов классификации. Классификатор считается непротиворечивым, если избыточный риск стремится к нулю, поскольку размер набора обучающих данных стремится к бесконечности. [2]
Учитывая компоненты из чтобы быть взаимно независимыми, мы получаем наивный классификатор Байеса , где
Доказательство того, что байесовский классификатор оптимален и коэффициент байесовских ошибок минимален, проводится следующим образом.
Определите переменные: Риск , Байесовский риск , все возможные классы, к которым можно отнести точки . Пусть апостериорная вероятность точки, принадлежащей классу 1, равна . Определить классификатор как
Тогда мы имеем следующие результаты:
- , то есть — классификатор Байеса,
- Для любого классификатора , избыточный риск удовлетворяет
Доказательство (а): Для любого классификатора , у нас есть где вторая строка была получена с помощью теоремы Фубини
Обратите внимание, что минимизируется за счет принятия ,
Следовательно, минимально возможным риском является байесовский риск: .
Доказательство (б):
Доказательство (с):
Доказательство (d):
Общий случай, когда классификатор Байеса минимизирует ошибку классификации, когда каждый элемент может принадлежать к любой из n категорий, обусловлен завышенными ожиданиями следующим образом.
Это минимизируется путем одновременной минимизации всех членов ожидания с помощью классификатора для каждого наблюдения x .