Трифокальный тензор
В компьютерном зрении трифокальный тензор (также тритензор ) представляет собой массив чисел 3×3×3 (т. е. тензор ), который включает в себя все проективные геометрические отношения между тремя видами. Он связывает координаты соответствующих точек или линий в трех видах, будучи независимым от структуры сцены и зависящим только от относительного движения (т. е. позы ) среди трех видов и их внутренних параметров калибровки. Следовательно, трифокальный тензор можно рассматривать как обобщение фундаментальной матрицы в трех представлениях. Отмечается, что несмотря на то, что тензор состоит из 27 элементов, на самом деле независимыми являются только 18 из них.
Существует также так называемый калиброванный трифокальный тензор , который связывает координаты точек и линий в трех видах с учетом их внутренних параметров и кодирует относительное положение камер в глобальном масштабе, всего 11 независимых элементов или степеней свободы. Уменьшение степеней свободы позволяет использовать меньшее количество соответствий для соответствия модели за счет увеличения нелинейности. [1]
Корреляционные срезы
[ редактировать ]Тензор также можно рассматривать как совокупность трех матриц 3х3 второго ранга. известный как его корреляционные срезы . Предполагая, что матрицы проекций трех представлений равны , и , корреляционные срезы соответствующего тензора можно выразить в замкнутой форме как , где соответственно, я й столбцы матриц камер. Однако на практике тензор оценивается на основе совпадений точек и линий в трех представлениях.
Трилинейные ограничения
[ редактировать ]Одним из наиболее важных свойств трифокального тензора является то, что он приводит к линейным отношениям между линиями и точками на трех изображениях. Точнее, для троек соответствующих точек и любые соответствующие строки через них выполняются следующие трилинейные ограничения :
где обозначает кососимметричную матрицу векторного произведения .
Передача
[ редактировать ]Учитывая трифокальный тензор трех изображений и пару совпадающих точек в двух изображениях, можно определить местоположение точки в третьем виде без какой-либо дополнительной информации. Это известно как перенос точки , и аналогичный результат справедлив для прямых и коник. Для общих кривых перенос может быть реализован через модель локальной дифференциальной кривой соприкасающихся окружностей (т. е. кривизны), которую затем можно передать в виде коник. [2] Изучен перенос моделей третьего порядка, отражающих кручение пространства, с помощью калиброванных трифокальных тензоров. [3] но остается открытой проблемой для некалиброванных трифокальных тензоров.
Оценка
[ редактировать ]Некалиброванный
[ редактировать ]Классический случай – 6-точечные соответствия. [4] [5] даю 3 решения.
Лишь недавно был решен случай оценки трифокального тензора по 9-строчным соответствиям. [6]
Калиброванный
[ редактировать ]Оценка калиброванного трифокального тензора считается чрезвычайно сложной и требует соответствия по 4 точкам. [7]
Недавно был решен случай использования только трехточечных соответствий, когда точкам приписываются касательные направления или инцидентные линии; только две точки имеют инцидентные линии, это минимальная проблема степени 312 (поэтому может быть не более 312 решений) и актуальна для случаев общих кривых (точки которых имеют касательные) или характерных точек с приписанными направлениями. (например, направления SIFT). [8] Тот же метод позволил решить смешанный случай трехточечных соответствий и одного линейного соответствия, который также оказался минимальным со степенью 216.
Ссылки
[ редактировать ]- ^ Мартюшев, Е.В. (2017). «О некоторых свойствах калиброванных трифокальных тензоров». Журнал математического изображения и видения . 58 (2): 321–332. arXiv : 1601.01467 . дои : 10.1007/s10851-017-0712-x . S2CID 1634602 .
- ^ Шмид, Корделия (2000). «Геометрия и сопоставление линий и кривых на нескольких изображениях» (PDF) . Международный журнал компьютерного зрения . 40 (3): 199–233. дои : 10.1023/А:1008135310502 . S2CID 11844321 .
- ^ Фаббри, Рикардо; Кимия, Бенджамин (2016). «Многовидовая дифференциальная геометрия кривых». Международный журнал компьютерного зрения . 120 (3): 324–346. arXiv : 1604.08256 . Бибкод : 2016arXiv160408256F . дои : 10.1007/s11263-016-0912-7 . S2CID 11908870 .
- ^ Ричард Хартли и Эндрю Зиссерман (2003). «Онлайн-глава: Трифокальный тензор» (PDF) . Множественная геометрия в компьютерном зрении . Издательство Кембриджского университета. ISBN 978-0-521-54051-3 .
- ^ Хейден, А. (1995). «Реконструкция последовательности изображений с помощью относительной глубины». Материалы международной конференции IEEE по компьютерному зрению . стр. 1058–1063. дои : 10.1109/ICCV.1995.466817 . ISBN 0-8186-7042-8 . S2CID 7789642 .
- ^ Ларссон, Виктор; Астром, Калле; Оскарссон, Магнус (2017). «Эффективные решения минимальных задач путем сокращения на основе сизигий» . Конференция IEEE 2017 по компьютерному зрению и распознаванию образов (CVPR) . стр. 2383–2392. дои : 10.1109/CVPR.2017.256 . ISBN 978-1-5386-0457-1 . S2CID 13069612 .
- ^ Нистер, Дэвид; Шаффалицкий, Фредерик (2006). «Четыре точки в двух или трех выверенных точках зрения: теория и практика». Международный журнал компьютерного зрения . 67 (2): 211–231. дои : 10.1007/s11263-005-4265-x . S2CID 10231211 .
- ^ Фаббри, Рикардо; Дафф, Тимоти; Фань, Хонги; Риган, Маргарет; де Пиньо, Дэвид; Цигаридас, Элиас; Вамплер, Чарльз; Хауэнштайн, Джонатан; Кимия, Бенджамин; Лейкин, Антон; Пайдла, Томас (23 марта 2019 г.). «Трехфокусная относительная поза по линиям в точках и ее эффективное решение». arXiv : 1903.09755 [ cs.CV ].
Дальнейшее чтение
[ редактировать ]- Хартли, Ричард И. (1997). «Линии и точки в трех ракурсах и трифокальный тензор». Международный журнал компьютерного зрения . 22 (2): 125–140. дои : 10.1023/A:1007936012022 . S2CID 8979544 .
- Торр, PHS; Зиссерман, А. (1997). «Надежная параметризация и вычисление трифокального тензора». Вычисление изображений и зрительных образов . 15 (8): 591–607. CiteSeerX 10.1.1.41.3172 . дои : 10.1016/S0262-8856(97)00010-3 .
Внешние ссылки
[ редактировать ]- Визуализация трифокальной геометрии (первоначально разработана Сильвеном Буньу из INRIA Robotvis, требуется Java )
Алгоритмы
[ редактировать ]- Реализация в Matlab оценки некалиброванного трифокального тензора и сравнения с парными фундаментальными матрицами
- Реализация C++ калиброванной оценки трифокального тензора с использованием оптимизированного кода продолжения гомотопии. В настоящее время включает случаи трех соответствующих точек с линиями в этих точках (например, в положениях и ориентациях объектов или точках кривой с касательными), а также для трех соответствующих точек и одного соответствия линии.