Ограниченная кластеризация
В информатике . ограниченная кластеризация — это класс полуконтролируемого обучения алгоритмов Обычно ограниченная кластеризация включает в себя либо набор ограничений обязательной связи, либо ограничений невозможности связи, либо и то, и другое вместе с алгоритмом кластеризации данных . Кластер, в котором члены соответствуют всем ограничениям обязательного и невозможного связывания, называется чанклетом .
Типы ограничений
[ редактировать ]Ограничения «обязательное связывание» и «невозможное связывание» определяют связь между двумя экземплярами данных. Вместе наборы этих ограничений действуют как руководство, согласно которому алгоритм ограниченной кластеризации будет пытаться найти чанклеты (кластеры в наборе данных, которые удовлетворяют указанным ограничениям).
- Ограничение must-link используется для указания того, что два экземпляра в отношении must-link должны быть связаны с одним и тем же кластером.
- Ограничение невозможной связи используется для указания того, что два экземпляра в отношении невозможной связи не должны быть связаны с одним и тем же кластером.
Некоторые алгоритмы ограниченной кластеризации прерываются, если не существует такой кластеризации, удовлетворяющей указанным ограничениям. Другие попытаются свести к минимуму количество нарушений ограничений, если будет невозможно найти кластеризацию, удовлетворяющую ограничениям. Ограничения также можно использовать для выбора модели кластеризации среди нескольких возможных решений. [1]
Примеры
[ редактировать ]Примеры алгоритмов ограниченной кластеризации включают:
- COP K-средство [2]
- PCKmeans (K-средние с парными ограничениями) [3]
- CMWK-Means (ограниченное взвешенное K-среднее Минковского) [4]
Ссылки
[ редактировать ]- ^ Пурраджаби, М.; Мулави, Д.; Кампелло, RJGB; Зимек, А.; Сандер, Дж.; Гебель, Р. (2014). «Выбор модели для полуконтролируемой кластеризации». Материалы 17-й Международной конференции по расширению технологий баз данных (EDBT) . стр. 331–342. дои : 10.5441/002/edbt.2014.31 .
- ^ Вагстафф, К.; Карди, К. ; Роджерс, С.; Шредль, С. (2001). «Ограниченная кластеризация K-средних с фоновыми знаниями». Материалы восемнадцатой международной конференции по машинному обучению . стр. 577–584.
- ^ http://www.cs.utexas.edu/~ml/papers/semi-sdm-04.pdf [ пустой URL PDF ]
- ^ де Аморим, RC (2012). «Ограниченная кластеризация с использованием взвешенных K-средних Минковского». Материалы 13-го Международного симпозиума IEEE по вычислительному интеллекту и информатике . стр. 13–17. дои : 10.1109/CINTI.2012.6496753 .