Обнаружение ориентиров
В информатике обнаружение ориентиров — это процесс поиска важных ориентиров на изображении. Первоначально это относилось к поиску ориентиров для навигационных целей — например, с помощью зрения роботов или создания карт на основе спутниковых изображений . Методы, используемые в навигации, были распространены на другие области, в частности на распознавание лиц , где оно используется для определения ключевых точек на лице. Он также имеет важное применение в медицине, определяя анатомические ориентиры на медицинских изображениях .
Приложения [ править ]
[ править ]
Ориентиры на лице [ править ]
Обнаружение лицевых ориентиров является важным шагом в идентификации лиц людей на изображении. Ориентиры на лице также можно использовать для получения информации о настроении и намерениях человека. [1] Используемые методы делятся на три категории: целостные методы, методы ограниченной локальной модели и регрессии . методы, основанные на [2]
Целостные методы предварительно запрограммированы статистической информацией о форме лица и коэффициентах расположения ориентиров. Классическим холистическим методом является модель активного внешнего вида (ААМ), представленная в 1998 году. [3] С тех пор этот метод претерпел ряд расширений и улучшений. В значительной степени это усовершенствования алгоритма подбора, которые можно разделить на две группы: аналитические методы подбора и методы подбора, основанные на обучении. [4] Аналитические методы применяют методы нелинейной оптимизации , такие как алгоритм Гаусса – Ньютона . Этот алгоритм очень медленный, но были предложены лучшие варианты, такие как алгоритм обратной композиционной обработки проекта (POIC) и алгоритм одновременной обратной композиционной обработки (SIC). [5] Методы подбора, основанные на обучении, используют методы машинного обучения для прогнозирования лицевых коэффициентов. Они могут использовать линейную регрессию , нелинейную регрессию и другие методы подбора. [6] В целом, аналитические методы аппроксимации более точны и не требуют обучения, тогда как методы аппроксимации, основанные на обучении, работают быстрее, но требуют обучения. [7] Другие расширения базового метода AAM анализируют вейвлеты изображения, а не интенсивность пикселей . Это помогает подогнать невидимые части лица, которые базовый AAM считает проблематичными. [8]
Медицинские изображения [ править ]
Цефалометрия [ править ]
Мода [ править ]
Целью обнаружения ориентиров на модных изображениях является классификация. Это помогает при поиске изображений с заданными характеристиками из базы данных или при общем поиске. Примером модного ориентира является расположение подола платья. Обнаружение модных ориентиров особенно сложно из-за сильной деформации одежды. [9]
некоторые классические методы обнаружения признаков, такие как масштабно-инвариантное преобразование признаков В прошлом использовались . Однако сейчас все чаще используются глубокого обучения методы . Этому во многом способствовала публикация ряда крупных наборов данных о моде, которые можно использовать для обучения. [10] Эти методы включают модели на основе регрессии, модели на основе ограничений и внимательности . модели [11] Особые проблемы обнаружения (деформации) ориентиров моды привели к созданию моделей оценки позы, которые обнаруживают и учитывают позу модели в одежде. [12]
Методы [ править ]
Существует несколько алгоритмов поиска ориентиров на изображениях. В настоящее время задача обычно решается с использованием искусственных нейронных сетей и особенно глубокого обучения алгоритмов эволюционные алгоритмы, такие как оптимизация роя частиц , но для выполнения этой задачи также могут быть полезны .
Глубокое обучение [ править ]
Глубокое обучение оказало значительное влияние на автономное обнаружение ориентиров на лице, позволив более точно и эффективно обнаруживать ориентиры на реальных фотографиях. [13] При использовании традиционных методов компьютерного зрения обнаружение ориентиров на лице может быть сложной задачей из-за различий в освещении, положении головы и окклюзии, но сверточные нейронные сети (CNN) произвели революцию в обнаружении ориентиров, позволив компьютерам изучать особенности на основе больших наборов данных изображений. Обучая CNN на наборе данных изображений с помеченными ориентирами лица, алгоритм может научиться обнаруживать эти ориентиры на новых изображениях с высокой точностью, даже когда они появляются в разных условиях освещения, под разными углами или в частично закрытых изображениях.
В частности, решения, основанные на этом подходе, достигли эффективности работы в реальном времени мобильных устройств на графических процессорах и нашли свое применение в дополненной реальности . приложениях [14]
Эволюционный алгоритм [ править ]
Эволюционные алгоритмы на этапе обучения пытаются освоить метод правильного определения ориентиров. Этот этап является итеративным процессом и, соответственно, выполняется в несколько итераций. В результате завершения последней итерации будет получена система, способная с определенной точностью правильно определить ориентир. В методе оптимизации роя частиц есть частицы, которые ищут ориентиры, и каждая из них использует определенную формулу на каждой итерации для оптимизации обнаружения ориентиров. [15]
Ссылки [ править ]
- ^ Ву и Цзи, с. 115.
- ^ Ву и Цзи, с. 116.
- ^ Ву и Цзи, с. 116.
- ^ Ву и Цзи, с. 117.
- ^ Ву и Цзи, с. 118.
- ^ Ву и Цзи, с. 118.
- ^ Ву и Цзи, с. 119.
- ^ Ву и Цзи, с. 119.
- ^ Чжан, Чжан и Ду, с. 1.
- ^ Чжан, Чжан и Ду, с. 1.
- ^ Чжан, Чжан и Ду, стр. 1–4.
- ^ Чжан, Чжан и Ду, с. 2.
- ^ Ву и Джи
- ^ Kartynnik, Yury; Ablavatski, Artsiom; Grishchenko, Ivan; Grundmann, Matthias (2019). "Real-time Facial Surface Geometry from Monocular Video on Mobile GPUs". arXiv : 1907.06724 [ cs.CV ].
- ^ ВИДЖЕСИНГЕ, ГАЯН (2005). Обнаружение ориентиров на цефалометрических рентгеновских лучах с использованием оптимизации роя частиц (Диссертация). Университет РМИТ. CiteSeerX 10.1.1.72.3218 .
Библиография [ править ]
- Швендике, Фальк; Чаурасия, Акхилананд; Арсивала, Любаина; Ли, Джэ-Хонг; Эльхеннави, Карим; Йост-Бринкманн, Пауль-Георг; Демарко, Флавио; Кройс, Иоахим (2021). «Глубокое обучение для обнаружения цефалометрических ориентиров: систематический обзор и метаанализ» . Клинические оральные исследования . 25 (7): 4299–4309. дои : 10.1007/s00784-021-03990-w . ПМК 8310492 . ПМИД 34046742 . S2CID 235232149 .
- Ву, Юэ; Цзи, Цян (2019). «Обнаружение ориентиров лица: литературный обзор». Международный журнал компьютерного зрения . 127 (2): 115–142. arXiv : 1805.05563 . дои : 10.1007/s11263-018-1097-z . S2CID 255101562 .
- Чжан, Юнган; Чжан, Цай; Ду, Фей (2019). «Краткий обзор последних успехов в обнаружении достопримечательностей моды». 2019 12-й Международный конгресс по обработке изображений и сигналов, биомедицинской инженерии и информатике (CISP-BMEI) . стр. 1–6. дои : 10.1109/CISP-BMEI48845.2019.8966051 . ISBN 978-1-7281-4852-6 . S2CID 210931275 .