ПЛАМЯ кластеризация
Судя по всему, основной автор этой статьи тесно связан с ее предметом. ( Август 2010 г. ) |
Нечеткая кластеризация посредством локальной аппроксимации членства (FLAME) — это алгоритм кластеризации данных , который определяет кластеры в плотных частях набора данных и выполняет назначение кластеров исключительно на основе отношений соседства между объектами. Ключевой особенностью этого алгоритма является то, что отношения соседства между соседними объектами в пространстве признаков используются для ограничения членства соседних объектов в нечетком пространстве членства.
Описание алгоритма FLAME
[ редактировать ]Алгоритм FLAME в основном разделен на три этапа:
- Извлечение информации о структуре из набора данных:
- Постройте граф окрестностей, чтобы соединить каждый объект с его K-ближайшими соседями (KNN);
- Оцените плотность каждого объекта на основе его близости к его KNN;
- Объекты делятся на 3 типа:
- Объект поддержки кластера (CSO): объект с плотностью выше, чем у всех его соседей;
- Кластерные выбросы: объект с плотностью ниже, чем у всех его соседей, и ниже заранее определенного порога;
- остальные.
- Локальное/соседнее приближение нечеткого членства :
- Инициализация нечеткого членства:
- Каждой ОГО присваивается фиксированное и полное членство, чтобы представлять один кластер;
- Всем выбросам присваивается фиксированное и полное членство в группе выбросов;
- Остальные распределяются с равным членством по всем кластерам и группе выбросов;
- Затем нечеткое членство всех объектов типа 3 обновляется с помощью сходящейся итеративной процедуры, называемой локальным/соседним приближением нечеткого членства , в которой нечеткое членство каждого объекта обновляется линейной комбинацией нечеткого членства его ближайших соседей.
- Инициализация нечеткого членства:
- Построение кластера из нечеткого членства двумя возможными способами:
- Назначение кластера объектов «один к одному» для назначения каждого объекта кластеру, в котором он имеет наивысшее членство;
- Назначение одного-множеству кластеров объектов, чтобы назначить каждый объект кластеру, в котором его членство превышает пороговое значение.
Проблема оптимизации в FLAME
[ редактировать ]Локальная/соседская аппроксимация нечетких членов — это процедура, позволяющая минимизировать ошибку локальной/соседской аппроксимации (LAE/NAE), определяемую следующим образом:
где представляет собой набор всех объектов типа 3, это нечеткий вектор принадлежности объекта , множество ближайших соседей , и с – коэффициенты, отражающие относительную близость ближайших соседей.
NAE можно минимизировать, решив следующие линейные уравнения с единственным решением, которое представляет собой уникальный глобальный минимум NAE со значением ноль:
где – это количество ОГО плюс одна (для группы выбросов). Для решения этих линейных уравнений можно использовать следующую итерационную процедуру: