Jump to content

Эластичная карта

(Перенаправлено с Elastic net )
Линейный PCA против нелинейных главных многообразий [1] для визуализации рака молочной железы данных микрочипа : а) Конфигурация узлов и 2D-главной поверхности в линейном коллекторе 3D PCA. Набор данных искривлен и не может быть адекватно отображен на основной двумерной плоскости; б) Распределение внутренних двумерных нелинейных координат главной поверхности (ELMap2D) вместе с оценкой плотности точек; в) То же, что б), но для линейного 2D-многообразия PCA (PCA2D). «Базальный» подтип рака молочной железы визуализируется более адекватно с помощью ELMap2D, и некоторые особенности распределения становятся лучше различимыми по сравнению с PCA2D. Главные многообразия создаются с помощью алгоритма упругого отображения . Данные доступны для публичного конкурса. [2] Программное обеспечение доступно для бесплатного некоммерческого использования. [3] [4]

Эластичные карты предоставляют инструмент для нелинейного уменьшения размерности . По своей конструкции они представляют собой систему упругих пружин, заложенных в данные космос. [1] Эта система аппроксимирует многообразие низкой размерности. Коэффициенты упругости этой системы позволяют перейти от полностью неструктурированной кластеризации k-средних (нулевая эластичность) к оценкам, расположенным близко к линейным многообразиям PCA (для модулей с высоким изгибом и низким растяжением). При некоторых промежуточных значениях коэффициентов упругости эта система эффективно аппроксимирует нелинейные главные многообразия. Этот подход основан на механической аналогии между основными коллекторами, проходящими через «середину» распределения данных, и эластичными мембранами и пластинами. Метод разработан А.Н. Горбань , А.Ю. Зиновьевым и А.А. Питенко в 1996–1998 гг.

Энергия упругой карты

[ редактировать ]

Позволять быть набором данных в конечномерном евклидовом пространстве . Эластичная карта представлена ​​набором узлов. в том же пространстве. Каждая точка данных имеет хост-узел , а именно ближайший узел (если ближайших узлов несколько, то берется узел с наименьшим номером). Набор данных делится на классы .

D Энергия аппроксимации – это искажение

,

это энергия пружин с единичной упругостью, которые соединяют каждую точку данных с ее главным узлом. К членам этой суммы можно применить весовые коэффициенты, например, чтобы отразить стандартное отклонение функции плотности вероятности любого подмножества точек данных. .

На множестве узлов определяется дополнительная структура. Некоторые пары узлов, , соединены упругими ребрами . Назовите этот набор пар . Некоторые тройки узлов, , образуют ребра изгиба . Назовите этот набор троек .

Энергия растяжения – это ,
Энергия изгиба ,

где и – модули растяжения и изгиба соответственно. Энергию растяжения иногда называют мембраной , а энергию изгиба называют термином тонкой пластины . [5]

Например, в двумерной прямоугольной сетке упругие ребра — это просто вертикальные и горизонтальные ребра (пары ближайших вершин), а ребра изгиба — это вертикальные или горизонтальные тройки последовательных (ближайших) вершин.

Таким образом, полная энергия упругого отображения равна

Положение узлов определяется механическим равновесием упругой карты, т. е. ее расположение таково, что минимизирует полную энергию .

Алгоритм максимизации ожидания

[ редактировать ]

Для данного разделения набора данных в классах , минимизация квадратичного функционала — линейная задача с разреженной матрицей коэффициентов. Поэтому, подобно анализу главных компонент или k-средним , используется метод разделения:

  • Для данного находить ;
  • Для данного минимизировать и найти ;
  • Если изменений нет, прекратить.

Этот алгоритм максимизации ожидания гарантирует локальный минимум . Для улучшения аппроксимации предложены различные дополнительные методы. Например, смягчения используется стратегия . Эта стратегия начинается с жестких сеток (малая длина, малый изгиб и большие модули упругости и коэффициенты) и отделка мягкими сетками (мелкими и ). Обучение проходит в несколько эпох, каждая эпоха имеет свою жесткость сетки. Другая адаптивная стратегия — растущая сеть : начинается с небольшого количества узлов и постепенно добавляется новые узлы. Каждая эпоха идет со своим количеством узлов.

Приложения

[ редактировать ]
Применение главных кривых, построенных методом эластичных карт: Нелинейный индекс качества жизни. [6] Точки представляют данные 171 страны ООН в 4-мерном пространстве, сформированном значениями 4 показателей: валовой продукт на душу населения , продолжительность жизни , детская смертность , заболеваемость туберкулезом . Разные формы и цвета соответствуют разным географическим местам и годам. Красная жирная линия представляет собой основную кривую , аппроксимирующую набор данных.

Наиболее важные применения метода и бесплатное программное обеспечение [3] занимаются биоинформатикой [7] [8] для исследовательского анализа данных и визуализации многомерных данных, для визуализации данных в экономике, социальных и политических науках, [9] как вспомогательный инструмент для картографирования данных в геоинформационных системах и для визуализации данных различной природы.

Метод применяется в количественной биологии для реконструкции изогнутой поверхности листа дерева по стопке изображений световой микроскопии. [10] Эта реконструкция используется для количественной оценки геодезических расстояний между трихомами и их рисунка, который является маркером способности растения противостоять патогенам.

В последнее время метод адаптирован в качестве вспомогательного инструмента в процессе принятия решений, лежащего в основе выбора, оптимизации и управления финансовыми портфелями . [11]

Метод упругих карт систематически апробирован и сравнен с несколькими методами машинного обучения по прикладной задаче идентификации режима течения газожидкостного потока в трубе. [12] Существуют различные режимы: однофазный поток воды или воздуха, пузырьковый поток, пузырьково-снарядный поток, снарядный поток, снарядно-сливной поток, сливной поток, сливно-кольцевой поток и кольцевой поток. Самым простым и распространенным методом определения режима течения является визуальное наблюдение. Однако этот подход субъективен и непригоден для относительно высоких расходов газа и жидкости. Поэтому методы машинного обучения предлагаются многими авторами. Эти методы применяются к данным о перепаде давления, собранным в процессе калибровки. Метод эластичных карт позволил получить 2D-карту, на которой представлена ​​территория каждого режима. Сравнение с некоторыми другими методами машинного обучения представлено в таблице 1 для различных диаметров труб и давления.

ТАБЛИЦА 1. Точность определения режима течения (%)
различных алгоритмов машинного обучения
Калибровка Тестирование Больший диаметр Более высокое давление
Эластичная карта 100 98.2 100 100
ИНС 99.1 89.2 76.2 70.5
СВМ 100 88.5 61.7 70.5
АС (маленький) 94.9 94.2 83.6 88.6
АС (большой) 100 94.6 82.1 84.1

Здесь ANN означает обратного распространения ошибки искусственные нейронные сети , SVM означает машину опорных векторов , SOM — самоорганизующиеся карты . Гибридная технология была разработана для инженерных приложений. [13] В этой технологии эластичные карты используются в сочетании с анализом главных компонентов (PCA), анализом независимых компонентов (ICA) и ИНС обратного распространения ошибки.

Учебник [14] обеспечивает систематическое сравнение эластичных карт и самоорганизующихся карт (SOM) в приложениях к принятию экономических и финансовых решений.

  1. ^ Jump up to: а б А. Н. Горбань, А. Ю. Зиновьев, Основные графы и многообразия , В кн.: Справочник по исследованиям приложений и тенденций машинного обучения: алгоритмы, методы и методы, Оливас Э.С. и др. Ред. Справочник по информатике, IGI Global: Херши, Пенсильвания, США, 2009. 28–59.
  2. ^ Ван, Ю., Клин, Дж. Г., Чжан, Ю., Сьювертс, А. М., Лук, М. П., Ян, Ф., Талантов, Д., Тиммерманс, М., Мейер-ван Гелдер, М. Е., Ю, Дж. и др. др.: Профили экспрессии генов для прогнозирования отдаленных метастазов первичного рака молочной железы с негативным поражением лимфатических узлов. Ланцет 365, 671–679 (2005); Онлайн-данные
  3. ^ Jump up to: а б Зиновьев А.В., ViDaExpert - Инструмент многомерной визуализации данных (бесплатно для некоммерческого использования). Институт Кюри , Париж.
  4. ^ А. Зиновьев, Обзор ViDaExpert , IHES ( Institut des Hautes Études Scientifiques ), Бюр-Сюр-Иветт, Иль-де-Франс.
  5. ^ Майкл Касс, Эндрю Уиткин, Деметри Терзопулос, Змеи: активные контурные модели, Int.J. Компьютерное зрение, 1988, том 1–4, стр. 321–331.
  6. ^ А. Н. Горбань, А. Зиновьев, Основные многообразия и графы на практике: от молекулярной биологии к динамическим системам , Международный журнал нейронных систем , Vol. 20, № 3 (2010) 219–232.
  7. ^ А. Н. Горбань, Б. Кегль, Д. Вунш, А. Зиновьев (ред.), Основные многообразия для визуализации данных и уменьшения размерности , LNCSE 58, Springer: Берлин – Гейдельберг – Нью-Йорк, 2007. ISBN   978-3-540-73749-0
  8. ^ М. Чакон, М. Левано, Х. Альенде, Х. Новак, Обнаружение экспрессии генов в микрочипах путем применения итеративно эластичной нейронной сети , В: Б. Беличински и др. (Ред.), Конспекты лекций по компьютерным наукам, Vol. 4432, Springer: Берлин – Гейдельберг 2007, 355–363.
  9. ^ А. Зиновьев, Визуализация данных в политических и социальных науках , В: SAGE «Международная энциклопедия политической науки» , Бади, Б., Берг-Шлоссер, Д., Морлино, Лос-Анджелес (ред.), 2011.
  10. ^ Х. Фаилмезгер, Б. Джегле, А. Шрейдер, М. Хюльскамп, А. Треш., Полуавтоматическая трехмерная реконструкция листьев и анализ структуры трихом на основе световых микроскопических изображений , PLoS Computational Biology, 2013, 9 (4): e1003029 .
  11. ^ М. Реста, Оптимизация портфеля с помощью эластичных карт: некоторые данные итальянской фондовой биржи , Интеллектуальные информационные и инженерные системы, основанные на знаниях, Б. Аполлони, Р. Дж. Хоулетт и Л. Джайн (ред.), Конспекты лекций по информатике, Том . 4693, Springer: Берлин – Гейдельберг, 2010, 635–641.
  12. ^ Х. Шабан, С. Тавуларис, Идентификация режима потока в вертикальном восходящем потоке воздух-вода с использованием сигналов перепада давления и карт упругости , International Journal of Multiphase Flow 61 (2014) 62-72.
  13. ^ Х. Шабан, С. Тавуларис, Измерение скорости потока газа и жидкости в двухфазных трубопроводных потоках путем применения методов машинного обучения к сигналам перепада давления , Международный журнал многофазного потока 67 (2014), 106-117
  14. ^ М. Реста, Парадигмы вычислительного интеллекта в принятии экономических и финансовых решений , Серия Справочная библиотека интеллектуальных систем, Том 99, Springer International Publishing, Швейцария, 2016.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: aeb624d09577e6def4045fd853a86ae0__1597521660
URL1:https://arc.ask3.ru/arc/aa/ae/e0/aeb624d09577e6def4045fd853a86ae0.html
Заголовок, (Title) документа по адресу, URL1:
Elastic map - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)