Классификатор ближайшего центроида

В машинном обучении классификатор ближайшего центроида или классификатор ближайшего прототипа — это модель классификации , которая присваивает наблюдениям метку класса обучающих выборок, среднее значение которых ( центроид ) ближе всего к наблюдению. Применительно к классификации текста с использованием векторов слов, содержащих веса tf*idf для представления документов, ближайший классификатор центроидов известен как классификатор Роккио из-за его сходства с алгоритмом Роккио для обратной связи по релевантности . [1]
Расширенная версия классификатора ближайшего центроида нашла применение в медицинской сфере, в частности для классификации опухолей . [2]
Алгоритм
[ редактировать ]Обучение
[ редактировать ]Учитывая помеченные обучающие образцы с метками классов , вычислите центроиды для каждого класса где – совокупность индексов образцов, принадлежащих классу .
Прогноз
[ редактировать ]Класс, присвоенный наблюдению является .
См. также
[ редактировать ]- Кластерная гипотеза
- k - означает кластеризацию
- k - алгоритм ближайшего соседа
- Линейный дискриминантный анализ
Ссылки
[ редактировать ]- ^ Мэннинг, Кристофер; Рагхаван, Прабхакар; Шютце, Хинрих (2008). «Векторная пространственная классификация». Введение в поиск информации . Издательство Кембриджского университета.
- ^ Тибширани, Роберт ; Хасти, Тревор ; Нарасимхан, Баласубраманян; Чу, Гилберт (2002). «Диагностика нескольких типов рака по уменьшению центроидов экспрессии генов» . Труды Национальной академии наук . 99 (10): 6567–6572. дои : 10.1073/pnas.082099299 . ПМК 124443 . ПМИД 12011421 .