Jump to content

Евклидова матрица расстояний

В математике евклидова матрица расстояний — это размера n × n матрица , представляющая расстояние между набором из n точек в евклидовом пространстве .За баллы в k -мерном пространстве к , элементы их евклидовой матрицы расстояний A представляют собой квадраты расстояний между ними.То есть

где обозначает евклидову норму на к .

В контексте (не обязательно евклидовых) матриц расстояний элементы обычно определяются непосредственно как расстояния, а не их квадраты.Однако в евклидовом случае квадраты расстояний используются, чтобы избежать вычисления квадратных корней и упростить соответствующие теоремы и алгоритмы.

Матрицы евклидовых расстояний тесно связаны с матрицами Грама (матрицами скалярных произведений , описывающими нормы векторов и углы между ними).Последние легко анализируются методами линейной алгебры .Это позволяет охарактеризовать матрицы евклидовых расстояний и восстановить точки. которые это осознают.Реализация, если она существует, уникальна с точностью до жестких преобразований , то есть сохраняющих расстояние преобразований евклидова пространства ( поворотов , отражений , перемещений ).

В практических приложениях расстояния представляют собой зашумленные измерения или получаются из произвольных оценок несходства (не обязательно метрических ).Целью может быть визуализация таких данных с помощью точек евклидова пространства, чья матрица расстояний максимально приближает заданную матрицу несходства — это известно как многомерное масштабирование .В качестве альтернативы, учитывая два набора данных, уже представленных точками в евклидовом пространстве, можно задаться вопросом, насколько они похожи по форме, то есть насколько тесно они могут быть связаны с помощью преобразования, сохраняющего расстояние — это анализ Прокруста .Некоторые расстояния также могут отсутствовать или быть немаркированными (в виде неупорядоченного набора или мультимножества вместо матрицы), что приводит к более сложным алгоритмическим задачам, таким как проблема реализации графа или проблема магистрали (для точек на линии). [1] [2]

Характеристики

[ редактировать ]

Поскольку евклидово расстояние является метрикой , матрица A обладает следующими свойствами.

В размерности k евклидова матрица расстояний имеет ранг меньше или равный k +2 . Если точки находятся в общем положении , ранг равен min( n , k + 2).

Расстояния можно уменьшить в любой степени, чтобы получить другую евклидову матрицу расстояний. То есть, если является евклидовой матрицей расстояний, тогда является евклидовой матрицей расстояний для каждого 0< s <1 . [3]

Связь с матрицей Грама

[ редактировать ]

Матрица Грама последовательности точек в k -мерном пространстве к это размера n × n матрица их скалярных произведений (здесь точка рассматривается как вектор от 0 до этой точки):

, где угол между вектором и .

В частности

это квадрат расстояния от 0 .

Таким образом, матрица Грама описывает нормы и углы векторов (от 0 до) .

Позволять матрица размера k × n, содержащая как столбцы.Затем

, потому что (видя как вектор-столбец).

Матрицы, которые можно разложить как , то есть матрицы Грама некоторой последовательности векторов (столбцы ), хорошо понятны — это именно положительные полуопределенные матрицы .


Чтобы связать матрицу евклидовых расстояний с матрицей Грама, заметим, что

То есть нормы и углы определяют расстояния.Обратите внимание, что матрица Грамма содержит дополнительную информацию: расстояния от 0 .

И наоборот, расстояния между парами из n +1 точек определить скалярное произведение между n векторами ( 1≤ i n ):

(это известно как поляризационная идентичность ).

Характеристики

[ редактировать ]

Для размера n × n матрицы A последовательность точек в k -мерном евклидовом пространстве к называется реализацией A в к если A — их евклидова матрица расстояний.Без ограничения общности можно предположить, что (поскольку перевод выполнен сохраняет дистанцию).

Теорема [4]  ( критерий Шенберга , [5] независимо показано Young & Householder [6] ) Симметричная полая размера n × n матрица A с вещественными элементами допускает реализацию в к тогда и только тогда, когда ( n -1)×( n -1) матрица определяется

положительно полуопределен и имеет ранг не выше k .

Это следует из предыдущего обсуждения, поскольку G положительно полуопределена ранга не выше k тогда и только тогда, когда ее можно разложить как где X матрица размера k × n . [7] Более того, столбцы X дают реализацию в к .Следовательно, любой метод разложения G позволяет найти реализацию.Двумя основными подходами являются варианты разложения Холецкого или использование спектрального разложения для нахождения главного квадратного корня из G , см. Определенная матрица#Разложение .

В формулировке теоремы выделяется первый пункт . Более симметричный вариант той же теоремы следующий:

Следствие [8] Симметричная полая размера n × n матрица A с вещественными элементами допускает реализацию тогда и только тогда, когда A отрицательно полуопределен на гиперплоскости , то есть

для всех такой, что .

Другие характеристики включают определители Кэли-Менгера .В частности, это позволяет показать, что симметричная полая матрица размера n × n реализуема в к тогда и только тогда, когда каждая ( k +3) × ( k +3) главная подматрица является .Другими словами, полуметрика в конечном числе точек изометрически вкладывается в к тогда и только тогда, когда каждые k +3 точки есть. [9]

На практике условия определенности или ранга могут не выполняться из-за числовых ошибок, шума в измерениях или из-за того, что данные не получены с фактических евклидовых расстояний.Точки, которые реализуют оптимально одинаковые расстояния, затем могут быть найдены с помощью полуопределенной аппроксимации (и аппроксимации низкого ранга, если желательно) с использованием линейных алгебраических инструментов, таких как разложение по сингулярным значениям или полуопределенное программирование .Это известно как многомерное масштабирование .Варианты этих методов также могут работать с неполными данными о расстоянии.

Гораздо сложнее иметь дело с немаркированными данными, то есть набором или мультимножеством расстояний, не присвоенных конкретным парам.Такие данные возникают, например, при секвенировании ДНК (в частности, восстановлении генома из частичного переваривания ) или фазовом извлечении .Два набора точек называются гомометрическими, если они имеют одинаковый мультимножество расстояний (но не обязательно связаны жестким преобразованием).Решение о том, может ли данный мультинабор из n ( n -1)/2 расстояний быть реализован в данном измерении k, является сильно NP-трудным .В одном измерении это известно как проблема магистрали; остается открытым вопрос, можно ли ее решить за полиномиальное время.Когда мультинабор расстояний задается с погрешностями, даже одномерный случай является NP-трудным .Тем не менее, практические алгоритмы существуют для многих случаев, например, для случайных точек. [10] [11] [12]

Уникальность представлений

[ редактировать ]

Учитывая евклидову матрицу расстояний, последовательность точек, реализующих ее, уникальна с точностью до жестких преобразований — это изометрии евклидова пространства: вращения , отражения , перемещения и их композиции. [1]

Теорема Позволять и — две последовательности точек в k -мерном евклидовом пространстве к .Расстояния и равны (для всех 1≤ i , j n ) тогда и только тогда, когда существует жесткое преобразование к картографирование к (для всех 1≤ i n ).

Доказательство

Rigid transformations preserve distances so one direction is clear.Suppose the distances and are equal.Without loss of generality we can assume by translating the points by and , respectively.Then the (n-1)×(n-1) Gram matrix of remaining vectors is identical to the Gram matrix of vectors (2≤in).That is, , where X and Y are the k×(n-1) matrices containing the respective vectors as columns.This implies there exists an orthogonal k×k matrix Q such that QX=Y, see Definite symmetric matrix#Uniqueness up to unitary transformations.Q describes an orthogonal transformation of k (a composition of rotations and reflections, without translations) which maps to (and 0 to 0).The final rigid transformation is described by .


В приложениях, когда расстояния не совпадают точно, анализ Прокруста направлен на то, чтобы связать два набора точек как можно ближе с помощью жестких преобразований, обычно с использованием разложения по сингулярным значениям .Обычный евклидов случай известен как ортогональная проблема Прокруста или проблема Вахбы (когда наблюдения взвешиваются для учета различных неопределенностей).Примеры приложений включают определение ориентации спутников, сравнение структуры молекул (в хеминформатике ), структуры белка ( структурное выравнивание в биоинформатике ) или структуры кости ( статистический анализ формы в биологии).

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Jump up to: Перейти обратно: а б Докманич и др. (2015)
  2. ^ Итак (2007)
  3. ^ Маэхара, Хироши (2013). «Евклидовы вложения конечных метрических пространств» . Дискретная математика . 313 (23): 2848–2856. дои : 10.1016/j.disc.2013.08.029 . ISSN   0012-365X . Теорема 2.6
  4. ^ Итак (2007) , Теорема 3.3.1, с. 40
  5. ^ Шенберг, IJ (1935). «Замечания к статье Мориса Фреше «Об аксиоматическом определении класса пространств, векторно применимых к гильбертовому пространству» ». Анналы математики . 36 (3): 724–732. дои : 10.2307/1968654 . ISSN   0003-486X . JSTOR   1968654 .
  6. ^ Янг, Гейл; Хаусхолдер, А.С. (1 марта 1938 г.). «Обсуждение набора точек с точки зрения их взаимных расстояний». Психометрика . 3 (1): 19–22. дои : 10.1007/BF02287916 . ISSN   1860-0980 . S2CID   122400126 .
  7. ^ Итак (2007) , Теорема 2.2.1, с. 10
  8. ^ Итак (2007) , Следствие 3.3.3, с. 42
  9. ^ Менгер, Карл (1931). «Новое основание евклидовой геометрии». Американский журнал математики . 53 (4): 721–745. дои : 10.2307/2371222 . JSTOR   2371222 .
  10. ^ Лемке, Пол; Скиена, Стивен С.; Смит, Уоррен Д. (2003). «Реконструкция множеств по расстояниям между точками». В Аронов Борис; Басу, Саугата; Пах, Янош; Шарир, Миша (ред.). Дискретная и вычислительная геометрия . Том. 25. Берлин, Гейдельберг: Springer Berlin Heidelberg. стр. 597–631. дои : 10.1007/978-3-642-55566-4_27 . ISBN  978-3-642-62442-1 .
  11. ^ Хуан, Шуай; Докманич, Иван (2021). «Реконструкция наборов точек по распределениям расстояний». Транзакции IEEE по обработке сигналов . 69 : 1811–1827. arXiv : 1804.02465 . дои : 10.1109/TSP.2021.3063458 . S2CID   4746784 .
  12. ^ Джаганатан, Кишор; Хассиби, Бабак (2012). «Восстановление целых чисел по попарным расстояниям». arXiv : 1212.2386 [ cs.DM ].
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 69e2134e9c674c81a02bdf6364264fb1__1704248520
URL1:https://arc.ask3.ru/arc/aa/69/b1/69e2134e9c674c81a02bdf6364264fb1.html
Заголовок, (Title) документа по адресу, URL1:
Euclidean distance matrix - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)