Классификатор ближайшего центроида

В машинном обучении классификатор ближайшего центроида или классификатор ближайшего прототипа — это модель классификации , которая присваивает наблюдениям метку класса обучающих выборок, среднее значение которых ( центроид ) ближе всего к наблюдению. Применительно к классификации текста с использованием векторов слов, содержащих веса tf*idf для представления документов, ближайший классификатор центроидов известен как классификатор Роккио из-за его сходства с алгоритмом Роккио для обратной связи по релевантности . [1]
Расширенная версия классификатора ближайшего центроида нашла применение в медицинской сфере, в частности в классификации опухолей . [2]
Алгоритм [ править ]
Обучение [ править ]
Учитывая помеченные обучающие образцы с метками классов , вычислите центроиды для каждого класса где – совокупность индексов образцов, принадлежащих классу .
Прогноз [ править ]
Класс, присвоенный наблюдению является .
См. также [ править ]
- Кластерная гипотеза
- k - означает кластеризацию
- k - алгоритм ближайшего соседа
- Линейный дискриминантный анализ
Ссылки [ править ]
- ^ Мэннинг, Кристофер; Рагхаван, Прабхакар; Шютце, Хинрих (2008). «Векторная пространственная классификация». Введение в поиск информации . Издательство Кембриджского университета.
- ^ Тибширани, Роберт ; Хасти, Тревор ; Нарасимхан, Баласубраманян; Чу, Гилберт (2002). «Диагностика нескольких типов рака по уменьшению центроидов экспрессии генов» . Труды Национальной академии наук . 99 (10): 6567–6572. дои : 10.1073/pnas.082099299 . ПМК 124443 . ПМИД 12011421 .