Jump to content

Обнаружение ориентиров

В информатике обнаружение ориентиров — это процесс поиска важных ориентиров на изображении. Первоначально это относилось к поиску ориентиров для навигационных целей — например, в зрении роботов или создании карт на основе спутниковых изображений . Методы, используемые в навигации, были распространены на другие области, в частности на распознавание лиц , где оно используется для определения ключевых точек на лице. Он также имеет важное применение в медицине, определяя анатомические ориентиры на медицинских изображениях .

Приложения

[ редактировать ]
[ редактировать ]

Ориентиры на лице

[ редактировать ]

Обнаружение ориентиров лица — важный шаг в идентификации лиц людей на изображении. Ориентиры на лице также можно использовать для получения информации о настроении и намерениях человека. [ 1 ] Используемые методы делятся на три категории: целостные методы, методы ограниченной локальной модели и регрессии . методы, основанные на [ 2 ]

Целостные методы предварительно запрограммированы статистической информацией о форме лица и коэффициентах расположения ориентиров. Классическим холистическим методом является модель активного внешнего вида (ААМ), представленная в 1998 году. [ 3 ] С тех пор этот метод претерпел ряд расширений и улучшений. В значительной степени это усовершенствования алгоритма подбора, которые можно разделить на две группы: аналитические методы подбора и методы подбора, основанные на обучении. [ 4 ] Аналитические методы применяют методы нелинейной оптимизации , такие как алгоритм Гаусса – Ньютона . Этот алгоритм очень медленный, но были предложены лучшие варианты, такие как алгоритм обратной композиционной обработки проекта (POIC) и алгоритм одновременной обратной композиционной обработки (SIC). [ 5 ] Методы подбора, основанные на обучении, используют методы машинного обучения для прогнозирования лицевых коэффициентов. Они могут использовать линейную регрессию , нелинейную регрессию и другие методы подбора. [ 6 ] В целом, аналитические методы подбора более точны и не требуют обучения, тогда как методы подбора, основанные на обучении, работают быстрее, но требуют обучения. [ 7 ] Другие расширения базового метода AAM анализируют вейвлеты изображения, а не интенсивность пикселей . Это помогает подогнать невидимые части лица, которые базовый AAM считает проблематичными. [ 8 ]

Медицинские изображения

[ редактировать ]

Цефалометрия

[ редактировать ]

Целью обнаружения ориентиров на модных изображениях является классификация. Это помогает при поиске изображений с заданными характеристиками из базы данных или при общем поиске. Примером модного ориентира является расположение подола платья. Обнаружение модных ориентиров особенно сложно из-за сильной деформации одежды. [ 9 ]

некоторые классические методы обнаружения признаков, такие как масштабно-инвариантное преобразование признаков В прошлом использовались . Однако сейчас все чаще используются глубокого обучения методы . Этому во многом способствовала публикация ряда крупных наборов данных о моде, которые можно использовать для обучения. [ 10 ] Эти методы включают модели на основе регрессии, модели на основе ограничений и внимательности . модели [ 11 ] Особые проблемы обнаружения (деформации) ориентиров моды привели к созданию моделей оценки позы, которые обнаруживают и учитывают позу модели в одежде. [ 12 ]

Существует несколько алгоритмов поиска ориентиров на изображениях. В настоящее время задача обычно решается с использованием искусственных нейронных сетей и особенно глубокого обучения алгоритмов эволюционные алгоритмы, такие как оптимизация роя частиц , но для выполнения этой задачи также могут быть полезны .

Глубокое обучение

[ редактировать ]

Глубокое обучение оказало значительное влияние на автономное обнаружение ориентиров на лице, обеспечив более точное и эффективное обнаружение ориентиров на реальных фотографиях. [ 13 ] При использовании традиционных методов компьютерного зрения обнаружение ориентиров на лице может быть сложной задачей из-за различий в освещении, положении головы и окклюзии, но сверточные нейронные сети (CNN) произвели революцию в обнаружении ориентиров, позволив компьютерам изучать особенности на основе больших наборов данных изображений. Обучая CNN на наборе данных изображений с помеченными ориентирами лица, алгоритм может научиться обнаруживать эти ориентиры на новых изображениях с высокой точностью, даже когда они появляются в разных условиях освещения, под разными углами или в частично закрытых изображениях.

В частности, решения, основанные на этом подходе, достигли эффективности работы в реальном времени мобильных устройств на графических процессорах и нашли свое применение в дополненной реальности . приложениях [ 14 ]

Эволюционный алгоритм

[ редактировать ]

Эволюционные алгоритмы на этапе обучения пытаются освоить метод правильного определения ориентиров. Этот этап является итеративным процессом и, соответственно, выполняется в несколько итераций. В результате завершения последней итерации будет получена система, способная с определенной точностью правильно определить ориентир. В методе оптимизации роя частиц есть частицы, которые ищут ориентиры, и каждая из них использует определенную формулу на каждой итерации для оптимизации обнаружения ориентиров. [ 15 ]

  1. ^ Ву и Цзи, с. 115.
  2. ^ Ву и Цзи, с. 116.
  3. ^ Ву и Цзи, с. 116.
  4. ^ Ву и Цзи, с. 117.
  5. ^ Ву и Цзи, с. 118.
  6. ^ Ву и Цзи, с. 118.
  7. ^ Ву и Цзи, с. 119.
  8. ^ Ву и Цзи, с. 119.
  9. ^ Чжан, Чжан и Ду, стр. 1.
  10. ^ Чжан, Чжан и Ду, стр. 1.
  11. ^ Чжан, Чжан и Ду, стр. 1–4.
  12. ^ Чжан, Чжан и Ду, стр. 2.
  13. ^ Ву и Джи
  14. ^ Kartynnik, Yury; Ablavatski, Artsiom; Grishchenko, Ivan; Grundmann, Matthias (2019). "Real-time Facial Surface Geometry from Monocular Video on Mobile GPUs". arXiv : 1907.06724 [ cs.CV ].
  15. ^ ВИДЖЕСИНГЕ, ГАЯН (2005). Обнаружение ориентиров на цефалометрических рентгеновских лучах с использованием оптимизации роя частиц (Диссертация). Университет РМИТ. CiteSeerX   10.1.1.72.3218 .

Библиография

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 26d8c6a8d9fb9598b578d7a707803bb9__1708491420
URL1:https://arc.ask3.ru/arc/aa/26/b9/26d8c6a8d9fb9598b578d7a707803bb9.html
Заголовок, (Title) документа по адресу, URL1:
Landmark detection - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)