~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 5781BE8D96E06510E2024DC8927D22E2__1651533540 ✰
Заголовок документа оригинал.:
✰ 3D object recognition - Wikipedia ✰
Заголовок документа перевод.:
✰ Распознавание 3D-объектов — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/3D_object_recognition ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/57/e2/5781be8d96e06510e2024dc8927d22e2.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/57/e2/5781be8d96e06510e2024dc8927d22e2__translat.html ✰
Дата и время сохранения документа:
✰ 22.06.2024 22:58:46 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 3 May 2022, at 02:19 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Распознавание 3D-объектов — Википедия Jump to content

Распознавание 3D-объектов

Из Википедии, бесплатной энциклопедии

В зрении компьютерном распознавание трехмерных объектов включает в себя распознавание и определение трехмерной информации, такой как поза , объем или форма выбранных пользователем трехмерных объектов на фотографии или сканировании диапазона . Обычно пример распознаваемого объекта предоставляется системе технического зрения в контролируемой среде, а затем по произвольному входному сигналу, например видеопотоку , система находит ранее представленный объект. Это можно сделать как в автономном режиме, так и в режиме реального времени . Алгоритмы системы решения этой проблемы специализируются на обнаружении одного заранее идентифицированного объекта и могут быть противопоставлены алгоритмам, которые работают с общими классами объектов, такими как распознавания лиц или распознавание общих трехмерных объектов. Из-за низкой стоимости и простоты получения фотографий значительное количество исследований было посвящено распознаванию трехмерных объектов на фотографиях.

3D-распознавание отдельных объектов на фотографиях [ править ]

Способ распознавания 3D-объекта зависит от свойств объекта. Для простоты многие существующие алгоритмы ориентированы на распознавание жестких объектов, состоящих из одной части, то есть объектов, пространственная трансформация которых представляет собой евклидово движение . К этой проблеме были применены два общих подхода: подходы к распознаванию образов используют низкоуровневую информацию о внешнем виде изображения для определения местоположения объекта, в то время как геометрические подходы, основанные на признаках, создают модель распознаваемого объекта и сопоставляют модель с фотографией.

Подходы образов распознаванию к

Эти методы используют информацию о внешнем виде, собранную из предварительно захваченных или заранее рассчитанных проекций объекта, чтобы сопоставить объект с потенциально загроможденной сценой. Однако они не учитывают 3D-геометрические ограничения объекта во время сопоставления и обычно не обрабатывают окклюзию, а также подходы, основанные на признаках. См. [Мурасе и Наяр, 1995] и [Селинджер и Нельсон, 1999].

Геометрические подходы, основанные на элементах [ править ]

Пример обнаруженного объекта на изображении. Синий цвет указывает на центр объекта, красный эллипс указывает на характерный масштаб, определенный детектором объекта, а зеленый параллелограмм строится на основе координат эллипса согласно [Lowe 2004].

Подходы, основанные на признаках, хорошо работают для объектов, имеющих отличительные особенности . объекты с хорошими характеристиками краев или каплей До сих пор успешно распознавались ; например, алгоритмы обнаружения см. в разделе «Детектор аффинной области Харриса» и SIFT соответственно. Из-за отсутствия соответствующих детекторов признаков объекты без текстурированных и гладких поверхностей в настоящее время не могут быть обработаны этим подходом.

Распознаватели объектов на основе функций обычно работают путем предварительного захвата ряда фиксированных видов распознаваемого объекта, извлечения функций из этих представлений, а затем в процессе распознавания сопоставляя эти функции со сценой и обеспечивая соблюдение геометрических ограничений.

В качестве примера прототипной системы, использующей этот подход, мы представим краткое описание метода, использованного [Rothganger et al. 2004], некоторые подробности опущены. Метод начинается с предположения, что объекты подвергаются глобальным жестким преобразованиям. Поскольку гладкие поверхности локально плоские, аффинные инвариантные для сопоставления подходят признаки: в статье выявляются интересующие области в форме эллипса, используя как края, так и капли, и, согласно [Lowe 2004], находит доминирующее направление градиента ellipse, преобразует эллипс в параллелограмм и принимает дескриптор SIFT для полученного параллелограмма. Информация о цвете также используется для улучшения распознавания только по функциям SIFT.

Частичные модели объектов, проецированные в 3D, построенные на основе близлежащих изображений плюшевого мишки. Взято из [Rothganger et al. 2004].

Затем, учитывая несколько изображений объекта с камеры (24 в статье), метод создает трехмерную модель объекта, содержащую трехмерное пространственное положение и ориентацию каждого объекта. Поскольку количество видов объекта велико, обычно каждый объект присутствует в нескольких соседних представлениях. Центральные точки таких совпадающих объектов совпадают, а обнаруженные объекты выравниваются вдоль доминирующего направления градиента, поэтому точки (1, 0) в локальной системе координат параллелограмма объекта также совпадают, как и точки (0, 1). в локальных координатах параллелограмма. Таким образом, для каждой пары совпадающих объектов на соседних изображениях известны соответствия трех пар точек. При наличии как минимум двух совпадающих признаков многоракурсная аффинная структура из алгоритма движения (см. [Томази и Канаде, 1992]) может использоваться для построения оценки положения точек (с точностью до произвольного аффинного преобразования). Статья Ротгангера и др. поэтому выбирает два соседних представления, использует RANSAC -подобный метод для выбора двух соответствующих пар признаков и добавления новых признаков в частичную модель, построенную с помощью RANSAC, если они находятся в пределах ошибки. Таким образом, для любой пары соседних представлений алгоритм создает частичную модель всех объектов, видимых в обоих представлениях.

Окончательная объединенная модель плюшевого мишки после евклидового обновления. Для распознавания эта модель сопоставляется с фотографией места происшествия с помощью RANSAC. Взято из [Rothganger et al. 2004].

Чтобы создать единую модель, в статье берется самая большая частичная модель и постепенно выравниваются с ней все меньшие частичные модели. Глобальная минимизация используется для уменьшения ошибки, затем используется евклидово обновление для изменения положения элементов модели с 3D-координат, уникальных до аффинного преобразования, на 3D-координаты, уникальные с точностью до евклидова движения . В конце этого шага получается модель целевого объекта, состоящая из элементов, спроецированных в общее трехмерное пространство.

Чтобы распознать объект в произвольном входном изображении, статья обнаруживает особенности, а затем использует RANSAC для поиска матрицы аффинной проекции , которая лучше всего соответствует унифицированной объектной модели для 2D-сцены. Если этот подход RANSAC имеет достаточно низкую ошибку, то в случае успеха алгоритм распознает объект и определяет его положение с точки зрения аффинной проекции. В предполагаемых условиях метод обычно достигает уровня распознавания около 95%.

Ссылки [ править ]

  • Мурасе, Х. и С.К. Наяр: 1995, Визуальное обучение и распознавание трехмерных объектов по внешнему виду . Международный журнал компьютерного зрения 14, 5–24. [1]
  • Селинджер, А. и Р. Нельсон: 1999, Иерархия перцептивной группировки для распознавания трехмерных объектов на основе внешнего вида. Компьютерное зрение и понимание изображений 76 (1), 83–92. [2]
  • Ротгангер, Ф; С. Лазебник, К. Шмид и Дж. Понсе: 2004. Моделирование и распознавание трехмерных объектов с использованием локальных аффинно-инвариантных дескрипторов изображений и многовидовых пространственных ограничений , ICCV. [3]
  • Лоу, Д.: 2004, Отличительные особенности изображения по ключевым точкам, не зависящим от масштаба. Международный журнал компьютерного зрения. В прессе. [4]
  • Томази, К. и Т. Канаде: 1992, Форма и движение из потоков изображений: метод факторизации. Международный журнал компьютерного зрения 9 (2), 137–154. [5]

См. также [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 5781BE8D96E06510E2024DC8927D22E2__1651533540
URL1:https://en.wikipedia.org/wiki/3D_object_recognition
Заголовок, (Title) документа по адресу, URL1:
3D object recognition - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)