Растущая самоорганизующаяся карта
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( сентябрь 2022 г. ) |
Растущая самоорганизующаяся карта (РСОМ) — это растущий вариант самоорганизующейся карты (СОМ). GSOM был разработан для решения проблемы определения подходящего размера карты в SOM . Он начинается с минимального количества узлов (обычно 4) и увеличивает новые узлы на границе на основе эвристики. Используя значение, называемое коэффициентом распространения (SF), аналитик данных имеет возможность контролировать рост GSOM.
Все стартовые узлы GSOM являются граничными узлами, т.е. каждый узел вначале имеет свободу расти в своем направлении. (Рис. 1) Новые узлы выращиваются из граничных узлов. Как только узел выбран для роста, все его свободные соседние позиции будут выращиваться новыми узлами. На рисунке показаны три возможных варианта роста узла для прямоугольной ГСОМ.
Алгоритм
[ редактировать ]Процесс ВШМ выглядит следующим образом:
- Фаза инициализации:
- Инициализируйте весовые векторы начальных узлов (обычно четырех) случайными числами от 0 до 1.
- Рассчитаем порог роста ( ) для данного набора данных размерности по коэффициенту разброса ( ) по формуле
- Фаза роста:
- Представить вход в сеть.
- Определите весовой вектор, который ближе всего к входному вектору, сопоставленному с текущей картой объектов (победитель), используя евклидово расстояние (аналогично SOM ) . Этот шаг можно резюмировать так: найти такой, что где , являются входными и весовыми векторами соответственно, вектор положения узлов и представляет собой набор натуральных чисел.
- Адаптация весового вектора применяется только к окрестности победителя и самому победителю. Окрестность представляет собой набор нейронов вокруг победителя, но в ВШОМ стартовое окружение, выбранное для весовой адаптации, меньше по сравнению с SOM (локализованной весовой адаптацией). Степень адаптации (скорость обучения) также экспоненциально снижается с течением итераций. Даже в пределах соседства веса, находящиеся ближе к победителю, адаптируются лучше, чем те, которые находятся дальше. Весовую адаптацию можно описать формулой где скорость обучения , представляет собой последовательность положительных параметров, стремящуюся к нулю при . , — весовые векторы узла до и после адаптации является окрестностью нейрона-победителя в итерация. Уменьшение стоимости в ВШМ зависит от количества узлов, существующих на карте в данный момент .
- Увеличьте значение ошибки победителя (значение ошибки — это разница между входным вектором и весовыми векторами).
- Когда (где это общая ошибка узла и – порог роста). Выращивайте узлы, если я являюсь граничным узлом. Распределите веса соседям, если является неграничным узлом.
- Инициализируйте новые векторы весов узлов, чтобы они соответствовали весам соседних узлов.
- Инициализируйте скорость обучения ( ) до начального значения.
- Повторяйте шаги 2–7 до тех пор, пока все входные данные не будут представлены и рост узлов не снизится до минимального уровня.
- Фаза сглаживания.
- Уменьшите скорость обучения и исправьте небольшое начальное окружение.
- Найдите победителя и адаптируйте веса победителя и соседей так же, как на этапе роста.
Приложения
[ редактировать ]GSOM можно использовать для многих задач предварительной обработки в интеллектуальном анализе данных , для нелинейного уменьшения размерности , для аппроксимации главных кривых и многообразий, для кластеризации и классификации . Часто он дает лучшее представление геометрии данных, чем SOM (см. классический эталон для основных кривых слева).
Ссылки
[ редактировать ]- ^ Иллюстрация подготовлена с использованием бесплатного программного обеспечения: Э. М. Миркес, Анализ главных компонентов и самоорганизующиеся карты: апплет . Университет Лестера, 2011 г.
Библиография
[ редактировать ]- Лю, Ю.; Вайсберг, Р.Х.; Он, Р. (2006). «Температура поверхности моря на шельфе Западной Флориды с использованием растущих иерархических самоорганизующихся карт». Журнал атмосферных и океанических технологий . 23 (2): 325–338. Бибкод : 2006JAtOT..23..325L . дои : 10.1175/JTECH1848.1 . hdl : 1912/4186 .
- Сюй, А.; Тан, С.; Хальгамуге, СК (2003). «Неконтролируемый иерархический динамический самоорганизующийся подход к открытию классов рака и идентификации маркерных генов в данных микрочипов» . Биоинформатика . 19 (16): 2131–2140. doi : 10.1093/биоинформатика/btg296 . ПМИД 14594719 .
- Алахакун, Д.; Хальгамуге, СК; Сиринивасан, Б. (2000). «Динамические самоорганизующиеся карты с контролируемым ростом для открытия знаний». Транзакции IEEE в нейронных сетях . 11 (3): 601–614. дои : 10.1109/72.846732 . ПМИД 18249788 .