Модель распределения точек
Модель распределения точек — это модель для представления средней геометрии фигуры и некоторых статистических режимов геометрических вариаций, выведенных из обучающего набора фигур.
Фон
[ редактировать ]Концепция модели распределения точек была разработана Кутсом, [1] Тейлор и др. [2] и стал стандартом компьютерного зрения для статистического изучения формы. [3] и для сегментации медицинских изображений [2] где априоры формы действительно помогают интерпретировать шумные и малоконтрастные пиксели / воксели . Последний пункт приводит к активным моделям формы (ASM) и активным моделям внешнего вида (AAM).
Модели распределения точек основаны на ориентирах . Ориентир — это точка аннотации, заданная анатомом на заданном локусе для каждого экземпляра формы в популяции обучающего набора. Например, один и тот же ориентир будет обозначать кончик указательного пальца в обучающем наборе двухмерных контуров рук. анализ главных компонентов Например, (PCA) является подходящим инструментом для изучения корреляций движения между группами ориентиров среди обучающей выборки. Как правило, он может обнаружить, что все ориентиры, расположенные вдоль одного и того же пальца, движутся точно вместе в примерах обучающего набора, демонстрируя различное расстояние между пальцами для коллекции плоских рук.
Подробности
[ редактировать ]Во-первых, набор обучающих изображений вручную размечается достаточным количеством соответствующих ориентиров, чтобы в достаточной степени аппроксимировать геометрию исходных фигур. Эти ориентиры выравниваются с помощью обобщенного анализа Прокруста , который минимизирует ошибку наименьших квадратов между точками.
выровненные ориентиры в двух измерениях задаются как
- .
Важно отметить, что каждая достопримечательность должны представлять одно и то же анатомическое место. Например, ориентир №3, может представлять собой кончик безымянного пальца на всех обучающих изображениях.
Теперь контуры фигур сведены к последовательности ориентиры, так что данная обучающая форма определяется как вектор . Предполагая, что рассеяние в этом пространстве гауссово , PCA используется для вычисления нормализованных собственных векторов и собственных значений ковариационной матрицы для всех форм обучения. Матрица верха собственные векторы задаются как , и каждый собственный вектор описывает основной режим изменения вдоль множества.
Наконец, линейная комбинация собственных векторов используется для определения новой формы. , математически определяемый как:
где определяется как средняя форма для всех обучающих изображений, и представляет собой вектор значений масштабирования для каждого главного компонента. Поэтому, изменив переменную можно определить бесконечное количество форм. Чтобы гарантировать, что все новые фигуры находятся в пределах вариации, наблюдаемой в обучающем наборе, обычно разрешается использовать только каждый элемент быть внутри 3 стандартных отклонения, где стандартное отклонение данного главного компонента определяется как квадратный корень из его соответствующего собственного значения.
PDM можно расширить до любого произвольного числа измерений, но обычно они используются в приложениях для 2D-изображений и 3D-объемов (где каждая точка ориентира или ).
Обсуждение
[ редактировать ]Собственный вектор, интерпретируемый в евклидовом пространстве , можно рассматривать как последовательность евклидовы векторы, связанные с соответствующим ориентиром и обозначающие составное движение для всей фигуры. С глобальными нелинейными вариациями обычно хорошо справляются при условии, что нелинейные вариации поддерживаются на разумном уровне. в качестве примера используется извилистая нематода Обычно при обучении методам, основанным на ядре PCA, .
Благодаря свойствам PCA: собственные векторы взаимно ортогональны , составляют основу облака обучающего набора в пространстве фигур и пересекаются в точке 0 в этом пространстве, что представляет собой среднюю форму. Кроме того, PCA — это традиционный способ подгонки замкнутого эллипсоида к гауссову облаку точек (независимо от их размеров): это предполагает концепцию ограниченной вариации.
Идея, лежащая в основе PDM, заключается в том, что собственные векторы можно линейно комбинировать для создания бесконечного количества новых экземпляров фигур, которые будут «похожи» на ту, что в обучающем наборе. Коэффициенты ограничены так же, как значения соответствующих собственных значений, чтобы гарантировать, что сгенерированная 2n/3n-мерная точка останется в гиперэллипсоидальной разрешенной области — допустимой области формы (ASD). [2]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ TF Cootes (май 2004 г.), Статистические модели внешнего вида для компьютерного зрения (PDF)
- ^ Перейти обратно: а б с Д. Х. Купер; Т. Ф. Кутс; Си Джей Тейлор; Дж. Грэм (1995), «Модели активной формы — их обучение и применение», Компьютерное зрение и понимание изображений (61): 38–59.
- ^ Родри Х. Дэвис, Кэрол Дж. Твининг, П. Дэниел Аллен, Тим Ф. Кутс и Крис Дж. Тейлор (2003). Различение формы в гиппокампе с использованием модели MDL . ИМПИ. Архивировано из оригинала 8 октября 2008 г. Проверено 27 июля 2007 г.
Внешние ссылки
[ редактировать ]- Гибкие модели компьютерного зрения , Тим Кутс, Манчестерский университет.
- Практическое введение в PDM и ASM .