Эластичная карта
Эластичные карты предоставляют инструмент для нелинейного уменьшения размерности . По своей конструкции они представляют собой систему упругих пружин, заложенных в данные космос. [1] Эта система аппроксимирует многообразие низкой размерности. Коэффициенты упругости этой системы позволяют перейти от полностью неструктурированной кластеризации k-средних (нулевая эластичность) к оценкам, расположенным близко к линейным многообразиям PCA (для модулей с высоким изгибом и низким растяжением). При некоторых промежуточных значениях коэффициентов упругости эта система эффективно аппроксимирует нелинейные главные многообразия. Этот подход основан на механической аналогии между основными коллекторами, проходящими через «середину» распределения данных, и эластичными мембранами и пластинами. Метод разработан А.Н. Горбань , А.Ю. Зиновьевым и А.А. Питенко в 1996–1998 гг.
Энергия упругой карты
[ редактировать ]Позволять быть набором данных в конечномерном евклидовом пространстве . Эластичная карта представлена набором узлов. в том же пространстве. Каждая точка данных имеет хост-узел , а именно ближайший узел (если ближайших узлов несколько, то берется узел с наименьшим номером). Набор данных делится на классы .
D Энергия аппроксимации – это искажение
- ,
это энергия пружин с единичной упругостью, которые соединяют каждую точку данных с ее главным узлом. К членам этой суммы можно применить весовые коэффициенты, например, чтобы отразить стандартное отклонение функции плотности вероятности любого подмножества точек данных. .
На множестве узлов определяется дополнительная структура. Некоторые пары узлов, , соединены упругими ребрами . Назовите этот набор пар . Некоторые тройки узлов, , образуют ребра изгиба . Назовите этот набор троек .
- Энергия растяжения – это ,
- Энергия изгиба ,
где и – модули растяжения и изгиба соответственно. Энергию растяжения иногда называют мембраной , а энергию изгиба называют термином тонкой пластины . [5]
Например, в двумерной прямоугольной сетке упругие ребра — это просто вертикальные и горизонтальные ребра (пары ближайших вершин), а ребра изгиба — это вертикальные или горизонтальные тройки последовательных (ближайших) вершин.
- Таким образом, полная энергия упругого отображения равна
Положение узлов определяется механическим равновесием упругой карты, т. е. ее расположение таково, что минимизирует полную энергию .
Алгоритм максимизации ожидания
[ редактировать ]Для данного разделения набора данных в классах , минимизация квадратичного функционала — линейная задача с разреженной матрицей коэффициентов. Поэтому, подобно анализу главных компонент или k-средним , используется метод разделения:
- Для данного находить ;
- Для данного минимизировать и найти ;
- Если изменений нет, прекратить.
Этот алгоритм максимизации ожидания гарантирует локальный минимум . Для улучшения аппроксимации предложены различные дополнительные методы. Например, смягчения используется стратегия . Эта стратегия начинается с жестких сеток (малая длина, малый изгиб и большие модули упругости и коэффициенты) и отделка мягкими сетками (мелкими и ). Обучение проходит в несколько эпох, каждая эпоха имеет свою жесткость сетки. Другая адаптивная стратегия — растущая сеть : начинается с небольшого количества узлов и постепенно добавляется новые узлы. Каждая эпоха идет со своим количеством узлов.
Приложения
[ редактировать ]Наиболее важные применения метода и бесплатное программное обеспечение [3] занимаются биоинформатикой [7] [8] для исследовательского анализа данных и визуализации многомерных данных, для визуализации данных в экономике, социальных и политических науках, [9] как вспомогательный инструмент для картографирования данных в геоинформационных системах и для визуализации данных различной природы.
Метод применяется в количественной биологии для реконструкции изогнутой поверхности листа дерева по стопке изображений световой микроскопии. [10] Эта реконструкция используется для количественной оценки геодезических расстояний между трихомами и их рисунка, который является маркером способности растения противостоять патогенам.
В последнее время метод адаптирован в качестве вспомогательного инструмента в процессе принятия решений, лежащего в основе выбора, оптимизации и управления финансовыми портфелями . [11]
Метод упругих карт систематически апробирован и сравнен с несколькими методами машинного обучения по прикладной задаче идентификации режима течения газожидкостного потока в трубе. [12] Существуют различные режимы: однофазный поток воды или воздуха, пузырьковый поток, пузырьково-снарядный поток, снарядный поток, снарядно-сливной поток, сливной поток, сливно-кольцевой поток и кольцевой поток. Самым простым и распространенным методом определения режима течения является визуальное наблюдение. Однако этот подход субъективен и непригоден для относительно высоких расходов газа и жидкости. Поэтому методы машинного обучения предлагаются многими авторами. Эти методы применяются к данным о перепаде давления, собранным в процессе калибровки. Метод эластичных карт позволил получить 2D-карту, на которой представлена территория каждого режима. Сравнение с некоторыми другими методами машинного обучения представлено в таблице 1 для различных диаметров труб и давления.
Калибровка | Тестирование | Больший диаметр | Более высокое давление | |
---|---|---|---|---|
Эластичная карта | 100 | 98.2 | 100 | 100 |
ИНС | 99.1 | 89.2 | 76.2 | 70.5 |
СВМ | 100 | 88.5 | 61.7 | 70.5 |
АС (маленький) | 94.9 | 94.2 | 83.6 | 88.6 |
АС (большой) | 100 | 94.6 | 82.1 | 84.1 |
Здесь ANN означает обратного распространения ошибки искусственные нейронные сети , SVM означает машину опорных векторов , SOM — самоорганизующиеся карты . Гибридная технология была разработана для инженерных приложений. [13] В этой технологии эластичные карты используются в сочетании с анализом главных компонентов (PCA), анализом независимых компонентов (ICA) и ИНС обратного распространения ошибки.
Учебник [14] обеспечивает систематическое сравнение эластичных карт и самоорганизующихся карт (SOM) в приложениях к принятию экономических и финансовых решений.
Ссылки
[ редактировать ]- ^ Jump up to: а б А. Н. Горбань, А. Ю. Зиновьев, Основные графы и многообразия , В кн.: Справочник по исследованиям приложений и тенденций машинного обучения: алгоритмы, методы и методы, Оливас Э.С. и др. Ред. Справочник по информатике, IGI Global: Херши, Пенсильвания, США, 2009. 28–59.
- ^ Ван, Ю., Клин, Дж. Г., Чжан, Ю., Сьювертс, А. М., Лук, М. П., Ян, Ф., Талантов, Д., Тиммерманс, М., Мейер-ван Гелдер, М. Е., Ю, Дж. и др. др.: Профили экспрессии генов для прогнозирования отдаленных метастазов первичного рака молочной железы с негативным поражением лимфатических узлов. Ланцет 365, 671–679 (2005); Онлайн-данные
- ^ Jump up to: а б Зиновьев А.В., ViDaExpert - Инструмент многомерной визуализации данных (бесплатно для некоммерческого использования). Институт Кюри , Париж.
- ^ А. Зиновьев, Обзор ViDaExpert , IHES ( Institut des Hautes Études Scientifiques ), Бюр-Сюр-Иветт, Иль-де-Франс.
- ^ Майкл Касс, Эндрю Уиткин, Деметри Терзопулос, Змеи: активные контурные модели, Int.J. Компьютерное зрение, 1988, том 1–4, стр. 321–331.
- ^ А. Н. Горбань, А. Зиновьев, Основные многообразия и графы на практике: от молекулярной биологии к динамическим системам , Международный журнал нейронных систем , Vol. 20, № 3 (2010) 219–232.
- ^ А. Н. Горбань, Б. Кегль, Д. Вунш, А. Зиновьев (ред.), Основные многообразия для визуализации данных и уменьшения размерности , LNCSE 58, Springer: Берлин – Гейдельберг – Нью-Йорк, 2007. ISBN 978-3-540-73749-0
- ^ М. Чакон, М. Левано, Х. Альенде, Х. Новак, Обнаружение экспрессии генов в микрочипах путем применения итеративно эластичной нейронной сети , В: Б. Беличински и др. (Ред.), Конспекты лекций по компьютерным наукам, Vol. 4432, Springer: Берлин – Гейдельберг 2007, 355–363.
- ^ А. Зиновьев, Визуализация данных в политических и социальных науках , В: SAGE «Международная энциклопедия политической науки» , Бади, Б., Берг-Шлоссер, Д., Морлино, Лос-Анджелес (ред.), 2011.
- ^ Х. Фаилмезгер, Б. Джегле, А. Шрейдер, М. Хюльскамп, А. Треш., Полуавтоматическая трехмерная реконструкция листьев и анализ структуры трихом на основе световых микроскопических изображений , PLoS Computational Biology, 2013, 9 (4): e1003029 .
- ^ М. Реста, Оптимизация портфеля с помощью эластичных карт: некоторые данные итальянской фондовой биржи , Интеллектуальные информационные и инженерные системы, основанные на знаниях, Б. Аполлони, Р. Дж. Хоулетт и Л. Джайн (ред.), Конспекты лекций по информатике, Том . 4693, Springer: Берлин – Гейдельберг, 2010, 635–641.
- ^ Х. Шабан, С. Тавуларис, Идентификация режима потока в вертикальном восходящем потоке воздух-вода с использованием сигналов перепада давления и карт упругости , International Journal of Multiphase Flow 61 (2014) 62-72.
- ^ Х. Шабан, С. Тавуларис, Измерение скорости потока газа и жидкости в двухфазных трубопроводных потоках путем применения методов машинного обучения к сигналам перепада давления , Международный журнал многофазного потока 67 (2014), 106-117
- ^ М. Реста, Парадигмы вычислительного интеллекта в принятии экономических и финансовых решений , Серия Справочная библиотека интеллектуальных систем, Том 99, Springer International Publishing, Швейцария, 2016.