Евклидова матрица расстояний
В математике евклидова матрица расстояний — это размера n × n матрица , представляющая расстояние между набором из n точек в евклидовом пространстве .За баллы в k -мерном пространстве ℝ к , элементы их евклидовой матрицы расстояний A представляют собой квадраты расстояний между ними.То есть
где обозначает евклидову норму на ℝ к .
В контексте (не обязательно евклидовых) матриц расстояний элементы обычно определяются непосредственно как расстояния, а не их квадраты.Однако в евклидовом случае квадраты расстояний используются, чтобы избежать вычисления квадратных корней и упростить соответствующие теоремы и алгоритмы.
Матрицы евклидовых расстояний тесно связаны с матрицами Грама (матрицами скалярных произведений , описывающими нормы векторов и углы между ними).Последние легко анализируются методами линейной алгебры .Это позволяет охарактеризовать матрицы евклидовых расстояний и восстановить точки. которые это осознают.Реализация, если она существует, уникальна с точностью до жестких преобразований , то есть сохраняющих расстояние преобразований евклидова пространства ( поворотов , отражений , перемещений ).
В практических приложениях расстояния представляют собой зашумленные измерения или получаются из произвольных оценок несходства (не обязательно метрических ).Целью может быть визуализация таких данных с помощью точек евклидова пространства, чья матрица расстояний максимально приближает заданную матрицу несходства — это известно как многомерное масштабирование .В качестве альтернативы, учитывая два набора данных, уже представленных точками в евклидовом пространстве, можно задаться вопросом, насколько они похожи по форме, то есть насколько тесно они могут быть связаны с помощью преобразования, сохраняющего расстояние — это анализ Прокруста .Некоторые расстояния также могут отсутствовать или быть немаркированными (в виде неупорядоченного набора или мультимножества вместо матрицы), что приводит к более сложным алгоритмическим задачам, таким как проблема реализации графа или проблема магистрали (для точек на линии). [1] [2]
Характеристики
[ редактировать ]Поскольку евклидово расстояние является метрикой , матрица A обладает следующими свойствами.
- Все элементы на диагонали A равны нулю (т.е. это пустая матрица ); следовательно, равен нулю след A .
- A симметричен т.е. ( ).
- (по неравенству треугольника )
В размерности k евклидова матрица расстояний имеет ранг меньше или равный k +2 . Если точки находятся в общем положении , ранг равен min( n , k + 2).
Расстояния можно уменьшить в любой степени, чтобы получить другую евклидову матрицу расстояний. То есть, если является евклидовой матрицей расстояний, тогда является евклидовой матрицей расстояний для каждого 0< s <1 . [3]
Связь с матрицей Грама
[ редактировать ]Матрица Грама последовательности точек в k -мерном пространстве ℝ к это размера n × n матрица их скалярных произведений (здесь точка рассматривается как вектор от 0 до этой точки):
- , где угол между вектором и .
В частности
- это квадрат расстояния от 0 .
Таким образом, матрица Грама описывает нормы и углы векторов (от 0 до) .
Позволять — матрица размера k × n, содержащая как столбцы.Затем
- , потому что (видя как вектор-столбец).
Матрицы, которые можно разложить как , то есть матрицы Грама некоторой последовательности векторов (столбцы ), хорошо понятны — это именно положительные полуопределенные матрицы .
Чтобы связать матрицу евклидовых расстояний с матрицей Грама, заметим, что
То есть нормы и углы определяют расстояния.Обратите внимание, что матрица Грамма содержит дополнительную информацию: расстояния от 0 .
И наоборот, расстояния между парами из n +1 точек определить скалярное произведение между n векторами ( 1≤ i ≤ n ):
(это известно как поляризационная идентичность ).
Характеристики
[ редактировать ]Для размера n × n матрицы A последовательность точек в k -мерном евклидовом пространстве ℝ к называется реализацией A в ℝ к если A — их евклидова матрица расстояний.Без ограничения общности можно предположить, что (поскольку перевод выполнен сохраняет дистанцию).
Теорема [4] ( критерий Шенберга , [5] независимо показано Young & Householder [6] ) — Симметричная полая размера n × n матрица A с вещественными элементами допускает реализацию в ℝ к тогда и только тогда, когда ( n -1)×( n -1) матрица определяется
положительно полуопределен и имеет ранг не выше k .
Это следует из предыдущего обсуждения, поскольку G положительно полуопределена ранга не выше k тогда и только тогда, когда ее можно разложить как где X — матрица размера k × n . [7] Более того, столбцы X дают реализацию в ℝ к .Следовательно, любой метод разложения G позволяет найти реализацию.Двумя основными подходами являются варианты разложения Холецкого или использование спектрального разложения для нахождения главного квадратного корня из G , см. Определенная матрица#Разложение .
В формулировке теоремы выделяется первый пункт . Более симметричный вариант той же теоремы следующий:
Следствие [8] — Симметричная полая размера n × n матрица A с вещественными элементами допускает реализацию тогда и только тогда, когда A отрицательно полуопределен на гиперплоскости , то есть
- для всех такой, что .
Другие характеристики включают определители Кэли-Менгера .В частности, это позволяет показать, что симметричная полая матрица размера n × n реализуема в ℝ к тогда и только тогда, когда каждая ( k +3) × ( k +3) главная подматрица является .Другими словами, полуметрика в конечном числе точек изометрически вкладывается в ℝ к тогда и только тогда, когда каждые k +3 точки есть. [9]
На практике условия определенности или ранга могут не выполняться из-за числовых ошибок, шума в измерениях или из-за того, что данные не получены с фактических евклидовых расстояний.Точки, которые реализуют оптимально одинаковые расстояния, затем могут быть найдены с помощью полуопределенной аппроксимации (и аппроксимации низкого ранга, если желательно) с использованием линейных алгебраических инструментов, таких как разложение по сингулярным значениям или полуопределенное программирование .Это известно как многомерное масштабирование .Варианты этих методов также могут работать с неполными данными о расстоянии.
Гораздо сложнее иметь дело с немаркированными данными, то есть набором или мультимножеством расстояний, не присвоенных конкретным парам.Такие данные возникают, например, при секвенировании ДНК (в частности, восстановлении генома из частичного переваривания ) или фазовом извлечении .Два набора точек называются гомометрическими, если они имеют одинаковый мультимножество расстояний (но не обязательно связаны жестким преобразованием).Решение о том, может ли данный мультинабор из n ( n -1)/2 расстояний быть реализован в данном измерении k, является сильно NP-трудным .В одном измерении это известно как проблема магистрали; остается открытым вопрос, можно ли ее решить за полиномиальное время.Когда мультинабор расстояний задается с погрешностями, даже одномерный случай является NP-трудным .Тем не менее, практические алгоритмы существуют для многих случаев, например, для случайных точек. [10] [11] [12]
Уникальность представлений
[ редактировать ]Учитывая евклидову матрицу расстояний, последовательность точек, реализующих ее, уникальна с точностью до жестких преобразований — это изометрии евклидова пространства: вращения , отражения , перемещения и их композиции. [1]
Теорема — Позволять и — две последовательности точек в k -мерном евклидовом пространстве ℝ к .Расстояния и равны (для всех 1≤ i , j ≤ n ) тогда и только тогда, когда существует жесткое преобразование ℝ к картографирование к (для всех 1≤ i ≤ n ).
Доказательство |
---|
В приложениях, когда расстояния не совпадают точно, анализ Прокруста направлен на то, чтобы связать два набора точек как можно ближе с помощью жестких преобразований, обычно с использованием разложения по сингулярным значениям .Обычный евклидов случай известен как ортогональная проблема Прокруста или проблема Вахбы (когда наблюдения взвешиваются для учета различных неопределенностей).Примеры приложений включают определение ориентации спутников, сравнение структуры молекул (в хеминформатике ), структуры белка ( структурное выравнивание в биоинформатике ) или структуры кости ( статистический анализ формы в биологии).
См. также
[ редактировать ]- Матрица смежности
- Компланарность
- Геометрия расстояния
- Полая матрица
- Матрица расстояний
- Евклидова случайная матрица
- Классическое многомерное масштабирование — метод визуализации, аппроксимирующий произвольную матрицу несходства евклидовой матрицей расстояний.
- Определитель Кэли – Менгера
- Полуопределенное вложение
Примечания
[ редактировать ]- ^ Jump up to: Перейти обратно: а б Докманич и др. (2015)
- ^ Итак (2007)
- ^ Маэхара, Хироши (2013). «Евклидовы вложения конечных метрических пространств» . Дискретная математика . 313 (23): 2848–2856. дои : 10.1016/j.disc.2013.08.029 . ISSN 0012-365X . Теорема 2.6
- ^ Итак (2007) , Теорема 3.3.1, с. 40
- ^ Шенберг, IJ (1935). «Замечания к статье Мориса Фреше «Об аксиоматическом определении класса пространств, векторно применимых к гильбертовому пространству» ». Анналы математики . 36 (3): 724–732. дои : 10.2307/1968654 . ISSN 0003-486X . JSTOR 1968654 .
- ^ Янг, Гейл; Хаусхолдер, А.С. (1 марта 1938 г.). «Обсуждение набора точек с точки зрения их взаимных расстояний». Психометрика . 3 (1): 19–22. дои : 10.1007/BF02287916 . ISSN 1860-0980 . S2CID 122400126 .
- ^ Итак (2007) , Теорема 2.2.1, с. 10
- ^ Итак (2007) , Следствие 3.3.3, с. 42
- ^ Менгер, Карл (1931). «Новое основание евклидовой геометрии». Американский журнал математики . 53 (4): 721–745. дои : 10.2307/2371222 . JSTOR 2371222 .
- ^ Лемке, Пол; Скиена, Стивен С.; Смит, Уоррен Д. (2003). «Реконструкция множеств по расстояниям между точками». В Аронов Борис; Басу, Саугата; Пах, Янош; Шарир, Миша (ред.). Дискретная и вычислительная геометрия . Том. 25. Берлин, Гейдельберг: Springer Berlin Heidelberg. стр. 597–631. дои : 10.1007/978-3-642-55566-4_27 . ISBN 978-3-642-62442-1 .
- ^ Хуан, Шуай; Докманич, Иван (2021). «Реконструкция наборов точек по распределениям расстояний». Транзакции IEEE по обработке сигналов . 69 : 1811–1827. arXiv : 1804.02465 . дои : 10.1109/TSP.2021.3063458 . S2CID 4746784 .
- ^ Джаганатан, Кишор; Хассиби, Бабак (2012). «Восстановление целых чисел по попарным расстояниям». arXiv : 1212.2386 [ cs.DM ].
Ссылки
[ редактировать ]- Докманич, Иван; Пархизкар, Реза; Раньери, Юри; Веттерли, Мартин (2015). «Евклидовы матрицы расстояний: основная теория, алгоритмы и приложения». Журнал обработки сигналов IEEE . 32 (6): 12–30. arXiv : 1502.07541 . дои : 10.1109/MSP.2015.2398954 . ISSN 1558-0792 . S2CID 8603398 .
- Джеймс Э. Джентл (2007). Матричная алгебра: теория, вычисления и приложения в статистике . Спрингер-Верлаг . п. 299. ИСБН 978-0-387-70872-0 .
- Итак, Энтони Ман-Чо (2007). Подход полуопределенного программирования к проблеме реализации графов: теория, приложения и расширения (PDF) (доктор философии).
- Либерти, Лео; Лавор, Карлайл; Макулан, Нельсон; Мучерино, Антонио (2014). «Евклидова дистанционная геометрия и приложения». Обзор СИАМ . 56 (1): 3–69. arXiv : 1205.0349 . дои : 10.1137/120875909 . ISSN 0036-1445 . S2CID 15472897 .
- Альфаких, Абдо Ю. (2018). Евклидовы матрицы расстояний и их приложения в теории жесткости . Чам: Международное издательство Springer. дои : 10.1007/978-3-319-97846-8 . ISBN 978-3-319-97845-1 .