Jump to content

Обнаружение ориентиров

В информатике обнаружение ориентиров — это процесс поиска важных ориентиров на изображении. Первоначально это относилось к поиску ориентиров для навигационных целей — например, с помощью зрения роботов или создания карт на основе спутниковых изображений . Методы, используемые в навигации, были распространены на другие области, в частности на распознавание лиц , где оно используется для определения ключевых точек на лице. Он также имеет важное применение в медицине, определяя анатомические ориентиры на медицинских изображениях .

Приложения [ править ]

Навигация [ править ]

Ориентиры на лице [ править ]

Обнаружение лицевых ориентиров является важным шагом в идентификации лиц людей на изображении. Ориентиры на лице также можно использовать для получения информации о настроении и намерениях человека. [1] Используемые методы делятся на три категории: целостные методы, методы ограниченной локальной модели и регрессии . методы, основанные на [2]

Целостные методы предварительно запрограммированы статистической информацией о форме лица и коэффициентах расположения ориентиров. Классическим холистическим методом является модель активного внешнего вида (ААМ), представленная в 1998 году. [3] С тех пор этот метод претерпел ряд расширений и улучшений. В значительной степени это усовершенствования алгоритма подбора, которые можно разделить на две группы: аналитические методы подбора и методы подбора, основанные на обучении. [4] Аналитические методы применяют методы нелинейной оптимизации , такие как алгоритм Гаусса – Ньютона . Этот алгоритм очень медленный, но были предложены лучшие варианты, такие как алгоритм обратной композиционной обработки проекта (POIC) и алгоритм одновременной обратной композиционной обработки (SIC). [5] Методы подбора, основанные на обучении, используют методы машинного обучения для прогнозирования лицевых коэффициентов. Они могут использовать линейную регрессию , нелинейную регрессию и другие методы подбора. [6] В целом, аналитические методы аппроксимации более точны и не требуют обучения, тогда как методы аппроксимации, основанные на обучении, работают быстрее, но требуют обучения. [7] Другие расширения базового метода AAM анализируют вейвлеты изображения, а не интенсивность пикселей . Это помогает подогнать невидимые части лица, которые базовый AAM считает проблематичными. [8]

Медицинские изображения [ править ]

Цефалометрия [ править ]

Мода [ править ]

Целью обнаружения ориентиров на модных изображениях является классификация. Это помогает при поиске изображений с заданными характеристиками из базы данных или при общем поиске. Примером модного ориентира является расположение подола платья. Обнаружение модных ориентиров особенно сложно из-за сильной деформации одежды. [9]

некоторые классические методы обнаружения признаков, такие как масштабно-инвариантное преобразование признаков В прошлом использовались . Однако сейчас все чаще используются глубокого обучения методы . Этому во многом способствовала публикация ряда крупных наборов данных о моде, которые можно использовать для обучения. [10] Эти методы включают модели на основе регрессии, модели на основе ограничений и внимательности . модели [11] Особые проблемы обнаружения (деформации) ориентиров моды привели к созданию моделей оценки позы, которые обнаруживают и учитывают позу модели в одежде. [12]

Методы [ править ]

Существует несколько алгоритмов поиска ориентиров на изображениях. В настоящее время задача обычно решается с использованием искусственных нейронных сетей и особенно глубокого обучения алгоритмов эволюционные алгоритмы, такие как оптимизация роя частиц , но для выполнения этой задачи также могут быть полезны .

Глубокое обучение [ править ]

Глубокое обучение оказало значительное влияние на автономное обнаружение ориентиров на лице, позволив более точно и эффективно обнаруживать ориентиры на реальных фотографиях. [13] При использовании традиционных методов компьютерного зрения обнаружение ориентиров на лице может быть сложной задачей из-за различий в освещении, положении головы и окклюзии, но сверточные нейронные сети (CNN) произвели революцию в обнаружении ориентиров, позволив компьютерам изучать особенности на основе больших наборов данных изображений. Обучая CNN на наборе данных изображений с помеченными ориентирами лица, алгоритм может научиться обнаруживать эти ориентиры на новых изображениях с высокой точностью, даже когда они появляются в разных условиях освещения, под разными углами или в частично закрытых изображениях.

В частности, решения, основанные на этом подходе, достигли эффективности работы в реальном времени мобильных устройств на графических процессорах и нашли свое применение в дополненной реальности . приложениях [14]

Эволюционный алгоритм [ править ]

Эволюционные алгоритмы на этапе обучения пытаются освоить метод правильного определения ориентиров. Этот этап является итеративным процессом и, соответственно, выполняется в несколько итераций. В результате завершения последней итерации будет получена система, способная с определенной точностью правильно определить ориентир. В методе оптимизации роя частиц есть частицы, которые ищут ориентиры, и каждая из них использует определенную формулу на каждой итерации для оптимизации обнаружения ориентиров. [15]

Ссылки [ править ]

  1. ^ Ву и Цзи, с. 115.
  2. ^ Ву и Цзи, с. 116.
  3. ^ Ву и Цзи, с. 116.
  4. ^ Ву и Цзи, с. 117.
  5. ^ Ву и Цзи, с. 118.
  6. ^ Ву и Цзи, с. 118.
  7. ^ Ву и Цзи, с. 119.
  8. ^ Ву и Цзи, с. 119.
  9. ^ Чжан, Чжан и Ду, с. 1.
  10. ^ Чжан, Чжан и Ду, с. 1.
  11. ^ Чжан, Чжан и Ду, стр. 1–4.
  12. ^ Чжан, Чжан и Ду, с. 2.
  13. ^ Ву и Джи
  14. ^ Kartynnik, Yury; Ablavatski, Artsiom; Grishchenko, Ivan; Grundmann, Matthias (2019). "Real-time Facial Surface Geometry from Monocular Video on Mobile GPUs". arXiv : 1907.06724 [ cs.CV ].
  15. ^ ВИДЖЕСИНГЕ, ГАЯН (2005). Обнаружение ориентиров на цефалометрических рентгеновских лучах с использованием оптимизации роя частиц (Диссертация). Университет РМИТ. CiteSeerX   10.1.1.72.3218 .

Библиография [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 14d7ecd6680489bfa23aef6ae5d18af8__1708491420
URL1:https://arc.ask3.ru/arc/aa/14/f8/14d7ecd6680489bfa23aef6ae5d18af8.html
Заголовок, (Title) документа по адресу, URL1:
Landmark detection - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)