Прокрустов анализ
В статистике используемая анализ Прокруста — это форма статистического анализа форм, для анализа распределения набора фигур . Имя Прокруст ( греч . Προκρούστης ) относится к бандиту из греческой мифологии, который заставлял своих жертв помещаться на его кровати, либо вытягивая им конечности, либо отрезая их.
По математике:
- ортогональная задача Прокруста — это метод, который можно использовать для определения оптимального вращения и/или отражения (т. е. оптимального ортогонального линейного преобразования) для суперпозиции Прокруста (PS) объекта по отношению к другому.
- ортогональная задача Прокруста с ограничениями, при условии det ( R ) = 1 (где R — ортогональная матрица), представляет собой метод, который можно использовать для определения оптимального вращения PS объекта относительно другого (отражение не допускается). ). В некоторых контекстах этот метод называется алгоритмом Кабша .
Когда форму сравнивают с другой или набор форм сравнивают с произвольно выбранной эталонной формой, анализ Прокруста иногда дополнительно квалифицируется как классический или обычный , в отличие от обобщенного анализа Прокруста (GPA), который сравнивает три или более формы с оптимально определенная «средняя форма».
Введение
[ редактировать ]Чтобы сравнить формы двух или более объектов, объекты необходимо сначала оптимально «наложить друг на друга». Наложение Прокруста (PS) выполняется путем оптимального перемещения , вращения и равномерного масштабирования объектов. Другими словами, свободно регулируется как размещение в пространстве , так и размер объектов. Цель состоит в том, чтобы получить одинаковое расположение и размер за счет минимизации разницы в форме, называемой расстоянием Прокруста между объектами. Иногда это называют полным , в отличие от частичного PS, при котором масштабирование не производится (т.е. сохраняется размер объектов). Обратите внимание, что после полного PS объекты будут точно совпадать, если их форма идентична. Например, при полной ПС две сферы с разными радиусами всегда будут совпадать, потому что они имеют совершенно одинаковую форму. И наоборот, при частичном ПС они никогда не совпадут. Это означает, что, согласно строгому определению термина «форма» в геометрии , анализ формы должен выполняться с использованием полного PS. Статистический анализ, основанный на частичном PS, не является чистым анализом формы, поскольку он чувствителен не только к различиям в форме, но и к различиям в размерах. Как полная, так и частичная PS никогда не смогут идеально совместить два объекта разной формы, например куб и сферу или правую и левую руку.
В некоторых случаях как полная, так и частичная PS может также включать в себя отражение . Рефлексия позволяет, например, успешно (возможно, идеально) наложить правую руку на левую. Таким образом, частичная PS с включенным отражением сохраняет размер, но допускает перемещение, вращение и отражение, тогда как полная PS с включенным отражением допускает перемещение, вращение, масштабирование и отражение.
Оптимальный перевод и масштабирование определяются с помощью гораздо более простых операций (см. ниже).
Обычный прокрустов анализ
[ редактировать ]Здесь мы просто рассматриваем объекты, состоящие из конечного числа k точек в n измерениях. Часто эти точки выбирают на сплошной поверхности сложных объектов, например, человеческой кости, и в этом случае их называют точками-ориентирами .
Форму объекта можно рассматривать как члена класса эквивалентности, образованного путем удаления компонентов поступательного , вращательного и равномерного масштабирования .
Перевод
[ редактировать ]Например, поступательные компоненты можно удалить из объекта, переместив объект так, чтобы среднее значение всех точек объекта (т. е. его центроида ) лежало в начале координат.
Математически: возьмем точки в двух измерениях, скажем
- .
Среднее значение этих точек где
Теперь переведите эти точки так, чтобы их среднее значение было переведено в начало координат. , давая точку .
Равномерное масштабирование
[ редактировать ]Аналогично, компонент масштаба можно удалить, масштабируя объект так, чтобы среднеквадратичное расстояние ( RMSD объекта ) от точек до перемещенного начала координат было равно 1. Это RMSD является статистической мерой масштаба или размера :
Масштаб становится равным 1, когда координаты точки делятся на начальный масштаб объекта:
- .
Обратите внимание, что в литературе иногда используются и другие методы определения и удаления масштаба.
Вращение
[ редактировать ]Удаление компонента вращения является более сложным, поскольку стандартная справочная ориентация не всегда доступна. Рассмотрим два объекта, состоящие из одинакового количества точек, без масштаба и смещения. Пусть их точки будут , . Один из этих объектов можно использовать для обеспечения ссылочной ориентации. Зафиксируйте опорный объект и вращайте другой вокруг начала координат, пока не найдете оптимальный угол поворота. так, что сумма квадратов расстояний ( SSD ) между соответствующими точками минимальна (пример метода наименьших квадратов ).
Поворот на угол дает
- .
где (u,v) — координаты повернутой точки. Взяв производную от относительно и решение для когда производная равна нулю, дает
3х3 Когда объект трехмерный, оптимальное вращение представлено матрицей вращения R , а не простым углом, и в этом случае можно использовать разложение по сингулярным значениям для нахождения оптимального значения R (см. решение ортогональной проблемы Прокруста с ограничениями при условии det ( R ) = 1).
Сравнение форм
[ редактировать ]Разницу между формой двух объектов можно оценить только после «наложения» двух объектов путем их перемещения, масштабирования и оптимального вращения, как описано выше. Квадратный корень из вышеупомянутого SSD между соответствующими точками можно использовать как статистическую меру этой разницы в форме:
Эту меру часто называют расстоянием Прокруста . Обратите внимание, что в литературе иногда используются другие, более сложные определения расстояния Прокруста и других мер «разницы формы».
Наложение набора фигур
[ редактировать ]Мы показали, как накладывать две фигуры. Тот же метод можно применить для наложения набора из трех или более фигур, при условии, что для всех из них используется вышеупомянутая базовая ориентация. Однако обобщенный анализ Прокруста обеспечивает лучший метод достижения этой цели.
Обобщенный анализ Прокруста (GPA)
[ редактировать ]GPA применяет метод анализа Прокруста для оптимального наложения набора объектов вместо наложения их на произвольно выбранную форму.
Обобщенный и обычный прокрустов анализ различаются лишь определением ориентирной ориентации объектов, которая в первом методе определяется оптимально, а во втором - произвольно выбирается. Масштабирование и перевод выполняются обоими методами одинаково. Когда сравниваются только две формы, GPA эквивалентен обычному анализу Прокруста.
Схема алгоритма следующая:
- произвольно выбирать ссылочную форму (обычно выбирая ее среди доступных экземпляров)
- наложить все экземпляры на текущую ссылочную форму
- вычислить среднюю форму текущего набора наложенных фигур
- если расстояние Прокруста между средней и эталонной формой превышает пороговое значение, установите ссылку на среднюю форму и перейдите к шагу 2.
Вариации
[ редактировать ]Существует множество способов представления формы объекта.Форму объекта можно рассматривать как члена класса эквивалентности, сформированного путем взятия набора всех наборов из k точек в n измерениях, то есть R знать и выделение набора всех переводов, вращений и масштабирования. Конкретное представление формы находится путем выбора конкретного представления класса эквивалентности. Это даст многообразие размерности kn -4. Прокруст — один из методов сделать это, имеющий особое статистическое обоснование.
Букштейн получает представление формы, фиксируя положение двух точек.называется линией оснований. Одна точка будет зафиксирована в начале координат, а другая в (1,0).остальные точки образуют координаты Букштейна .
Также принято рассматривать форму и масштаб , в которых удалены поступательные и вращательные компоненты.
Примеры
[ редактировать ]Анализ формы используется в биологических данных для выявления вариаций анатомических особенностей, характеризуемых ориентировочными данными, например, при рассмотрении формы костей челюсти. [1]
В одном исследовании Дэвида Джорджа Кендалла изучались треугольники, образованные стоячими камнями , чтобы сделать вывод, часто ли они располагаются по прямым линиям. Форму треугольника можно представить как точку на сфере, а распределение всех фигур можно представить как распределение по сфере.Распределение образцов стоящих камней сравнивалось с теоретическим распределением, чтобы показать, что встречаемость прямых линий была не более чем средней. [2]
См. также
[ редактировать ]- Модель активной формы
- Выравнивание случайных точек
- Биометрия
- Обобщенный анализ Прокруста
- Регистрация изображения
- Распределение Кента
- Морфометрия
- Ортогональная задача Прокруста
- Прокруст
Ссылки
[ редактировать ]- ^ «Исследование формы пространства». Архивировано 1 сентября 2006 г. в Wayback Machine Нэнси Мари Браун, Research/Penn State, Vol. 15, нет. 1 марта 1994 г.
- ^ «Обзор статистической теории формы» , Дэвид Г. Кендалл, Статистическая наука, Vol. 4, № 2 (май 1989 г.), стр. 87–99.
- Ф. Л. Букштейн, Морфометрические инструменты для данных об ориентирах , издательство Кембриджского университета, (1991).
- Дж. К. Гауэр, Г. Б. Дейкстерхейс, Проблемы Прокруста , Oxford University Press (2004).
- И.Л.Драйден, К.В. Мардиа, Статистический анализ формы , Wiley, Чичестер, (1998).
Внешние ссылки
[ редактировать ]- Расширение континуума точек и распределений. Методы Прокруста, распознавание форм, сходство и стыковка, Мишель Петижан.