Jump to content

Изомап

Isomap на наборе данных «швейцарский рулет». (А) Две точки на швейцарском рулоне и их геодезическая кривая. (B) Граф KNN (с K = 7 и N = 2000) допускает граф геодезической (красный), который аппроксимирует гладкую геодезическую. (C) Швейцарский рулон «развернут», показывая графическую геодезическую (красный) и гладкую геодезическую (синий). Реплика рисунка 3 [1] .

Isomap — это метод нелинейного уменьшения размерности . Это один из нескольких широко используемых методов низкоразмерного встраивания. [1] Isomap используется для вычисления квазиизометрического низкоразмерного внедрения набора многомерных точек данных. Алгоритм предоставляет простой метод оценки внутренней геометрии многообразия данных на основе грубой оценки соседей каждой точки данных на многообразии. Isomap высокоэффективен и обычно применим к широкому спектру источников данных и размерностей.

Введение

[ редактировать ]

Isomap является одним из представителей методов изометрического картографирования и расширяет метрическое многомерное масштабирование (MDS) за счет включения геодезических расстояний, определяемых взвешенным графом. Точнее, классическое масштабирование метрического MDS выполняет низкоразмерное встраивание на основе попарного расстояния между точками данных, которое обычно измеряется с использованием прямолинейного евклидова расстояния . Isomap отличается использованием геодезического расстояния, индуцированного графом окрестностей, встроенным в классическое масштабирование. Это делается для включения структуры многообразия в полученное вложение. Isomap определяет геодезическое расстояние как сумму весов ребер вдоль кратчайшего пути между двумя узлами (вычисленного с использованием алгоритма Дейкстры , например, ). Верхние n собственных векторов матрицы геодезических расстояний представляют координаты в новом n -мерном евклидовом пространстве.

Алгоритм

[ редактировать ]

очень общее описание алгоритма Isomap Ниже приведено .

  • Определите соседей каждой точки.
    • Все точки в некотором фиксированном радиусе.
    • К ближайшие соседи.
  • Постройте граф окрестности.
    • Каждая точка связана с другой, если она является K ближайших соседей.
    • Длина ребра равна евклидову расстоянию.
  • Вычислить кратчайший путь между двумя узлами.
  • Вычислите вложение меньшей размерности.

Расширения ISOMAP

[ редактировать ]
  • LandMark ISOMAP (L-ISOMAP) : Landmark-Isomap — это вариант Isomap, который работает быстрее, чем Isomap. Однако точность многообразия снижается из-за предельного фактора. В этом алгоритме из общего количества N точек данных используются n << N точек ориентиров и вычисляется матрица nxN геодезического расстояния между каждой точкой данных до точек ориентиров. Затем Landmark-MDS (LMDS) применяется к матрице, чтобы найти евклидово вложение всех точек данных. [2]
  • C Isomap : C-Isomap включает увеличение областей с высокой плотностью и уменьшение областей с низкой плотностью точек данных в многообразии. Веса ребер, максимальные в многомерном масштабировании (MDS), изменяются, а все остальное остается неизменным. [2]
  • Развертывание параллельного переноса : заменяет оценки геодезического расстояния на основе пути Дейкстры приближениями на основе параллельного переноса , повышая устойчивость к неравномерностям и пустотам в выборке. [3]

Возможные проблемы

[ редактировать ]

Связность каждой точки данных в графе окрестностей определяется как ее ближайшие k евклидовых соседей в многомерном пространстве. Этот шаг уязвим для «ошибок короткого замыкания», если k слишком велико по отношению к структуре многообразия или если шум в данных немного смещает точки за пределы многообразия. [4] Даже одна ошибка короткого замыкания может изменить многие записи в матрице геодезических расстояний, что, в свою очередь, может привести к совершенно другому (и неправильному) низкоразмерному вложению. И наоборот, если k слишком мало, граф окрестностей может стать слишком разреженным, чтобы точно аппроксимировать геодезические пути. Но в этот алгоритм были внесены улучшения, чтобы он лучше работал с разреженными и зашумленными наборами данных. [5]

Связь с другими методами

[ редактировать ]

Следуя связи между классическим масштабированием и PCA , метрический MDS можно интерпретировать как ядро ​​PCA . Аналогичным образом матрицу геодезических расстояний в Isomap можно рассматривать как матрицу ядра . Дважды центрированная матрица геодезических расстояний K в Isomap имеет вид

где — поэлементный квадрат матрицы геодезических расстояний D = [ D ij ], H — центрирующая матрица, определяемая формулой

Однако ядро ​​матрицы K не всегда является положительно полуопределенным . Основная идея ядра Isomap состоит в том, чтобы сделать это K как матрицу ядра Мерсера (то есть положительно полуопределенную) с использованием метода постоянного сдвига, чтобы связать его с ядром PCA так, чтобы естественным образом возникло свойство обобщения. . [6]

См. также

[ редактировать ]
  1. ^ Jump up to: а б Тененбаум, Джошуа Б.; Сильва, Вин де; Лэнгфорд, Джон К. (22 декабря 2000 г.). «Глобальная геометрическая основа для нелинейного уменьшения размерности». Наука . 290 (5500): 2319–2323. дои : 10.1126/science.290.5500.2319 .
  2. ^ Jump up to: а б Сильва, Вин; Тененбаум, Джошуа (2002). «Глобальные и локальные методы нелинейного уменьшения размерности» . Достижения в области нейронных систем обработки информации . 15 . МТИ Пресс.
  3. ^ Буднинский, Макс; Инь, Глория; Фэн, Леман; Тонг, Иин; Дебрен, Матье (2019). «Развертывание параллельного транспорта: подход к обучению на основе соединений» . SIAM Journal по прикладной алгебре и геометрии . 3 (2): 266–291. arXiv : 1806.09039 . дои : 10.1137/18M1196133 . ISSN   2470-6566 .
  4. ^ М. Баласубраманян, Э. Л. Шварц, Алгоритм Isomap и топологическая устойчивость. Наука, 4 января 2002 г.: Том. 295 нет. 5552 р. 7
  5. ^ А. Саксена , А. Гупта и А. Мукерджи . Нелинейное уменьшение размерности с помощью локально линейных изомап, . Конспекты лекций по информатике , 3316:1038–1043, 2004.
  6. ^ Х. Чой, С. Чой, Надежная изомап ядра, Распознавание образов, Том. 40, № 3, стр. 853-862, 2007 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 7019d61b18feb569ed04ee789a8a0a4e__1704371160
URL1:https://arc.ask3.ru/arc/aa/70/4e/7019d61b18feb569ed04ee789a8a0a4e.html
Заголовок, (Title) документа по адресу, URL1:
Isomap - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)