Jump to content

Классификатор Байеса

В статистической классификации классификатор Байеса — это классификатор, имеющий наименьшую вероятность неправильной классификации среди всех классификаторов, использующих один и тот же набор признаков. [1]

Определение

[ редактировать ]

Предположим, пара принимает значения в , где — это метка класса элемента, функции которого определяются формулой . Предположим, что распределение X условное при условии, что метка Y принимает значение r, определяется выражением где " " означает "распространяется как", и где обозначает распределение вероятностей.

Классификатор — это правило, которое присваивает наблюдению X = x предположение или оценку того, чем на самом деле была ненаблюдаемая метка Y = r . Теоретически классификатор — это измеримая функция. , с интерпретацией, что C относит точку x к классу C ( x ). Вероятность неправильной классификации или риск классификатора C определяется как

Классификатор Байеса – это

На практике, как и в большей части статистики, трудности и тонкости связаны с эффективным моделированием распределений вероятностей — в данном случае . Классификатор Байеса является полезным ориентиром в статистической классификации .

Избыточный риск общего классификатора (возможно, в зависимости от некоторых обучающих данных) определяется как Таким образом, эта неотрицательная величина важна для оценки эффективности различных методов классификации. Классификатор считается непротиворечивым, если избыточный риск стремится к нулю, поскольку размер набора обучающих данных стремится к бесконечности. [2]

Учитывая компоненты из чтобы быть взаимно независимыми, мы получаем наивный классификатор Байеса , где

Характеристики

[ редактировать ]

Доказательство того, что байесовский классификатор оптимален и коэффициент байесовских ошибок минимален, проводится следующим образом.

Определите переменные: Риск , Байесовский риск , все возможные классы, к которым можно отнести точки . Пусть апостериорная вероятность точки, принадлежащей классу 1, равна . Определить классификатор как

Тогда мы имеем следующие результаты:

  1. , то есть — классификатор Байеса,
  2. Для любого классификатора , избыточный риск удовлетворяет

Доказательство (а): Для любого классификатора , у нас есть где вторая строка была получена с помощью теоремы Фубини

Обратите внимание, что минимизируется за счет принятия ,

Следовательно, минимально возможным риском является байесовский риск: .

Доказательство (б):


Доказательство (с):

Доказательство (d):

Общий случай

[ редактировать ]

Общий случай, когда классификатор Байеса минимизирует ошибку классификации, когда каждый элемент может принадлежать к любой из n категорий, обусловлен завышенными ожиданиями следующим образом.

Это минимизируется путем одновременной минимизации всех членов ожидания с помощью классификатора для каждого наблюдения x .

См. также

[ редактировать ]
  1. ^ Деврой, Л.; Дьерфи Л. и Лугоши Г. (1996). Вероятностная теория распознавания образов . Спрингер. ISBN  0-3879-4618-7 .
  2. ^ Фараго, А.; Лугоши, Г. (1993). «Сильная универсальная согласованность классификаторов нейронных сетей» . Транзакции IEEE по теории информации . 39 (4): 1146–1151. дои : 10.1109/18.243433 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 3fdf3ee5e9b3a1bdbe54e3957a7d25be__1710627480
URL1:https://arc.ask3.ru/arc/aa/3f/be/3fdf3ee5e9b3a1bdbe54e3957a7d25be.html
Заголовок, (Title) документа по адресу, URL1:
Bayes classifier - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)