Jump to content

Компьютерное зрение

Задачи компьютерного зрения включают методы получения , обработки , анализа и понимания цифровых изображений , а также извлечение высокоразмерных данных из реального мира для получения численной или символической информации, например, в формах решений. [ 1 ] [ 2 ] [ 3 ] [ 4 ] Понимание в этом контексте означает преобразование визуальных изображений (ввод в сетчатку в человеческом аналоге) в описания мира, которые имеют смысл для продуманных процессов и могут вызвать соответствующие действия. Это понимание изображения можно рассматривать как отделение символической информации из данных изображений с использованием моделей, построенных с помощью геометрии, физики, статистики и теории обучения.

Научная дисциплина компьютерного видения связана с теорией, лежащей в основе искусственных систем, которые извлекают информацию из изображений. Данные изображения могут принимать множество форм, такие как последовательности видео, представления из нескольких камер, многомерные данные из 3D-сканера, 3D-точечные облака от датчиков LIDAR или медицинские сканирующие устройства. Технологическая дисциплина компьютерного зрения стремится применить свои теории и модели к построению систем компьютерного зрения.

Поддомены компьютерного зрения включают реконструкцию сцены , обнаружение объектов , обнаружение событий , распознавание деятельности , отслеживание видео , распознавание объектов , оценку трехмерной позы , обучение, индексирование, оценка движения , визуальное обслуживание , моделирование 3D сцены и восстановление изображения .

Внедрение технологий компьютерного зрения может быть кропотливой для организаций, поскольку для этого нет единого решения. Очень немногие компании предоставляют унифицированную и распределенную платформу или операционную систему, где приложения Computer Vision могут быть легко развернуты и управляются.

Определение

[ редактировать ]

Компьютерное зрение-это междисциплинарное поле , в котором можно сделать компьютеры, чтобы получить понимание высокого уровня от цифровых изображений или видео . С точки зрения инженерии , он стремится автоматизировать задачи, которые может сделать человеческая визуальная система . [ 5 ] [ 6 ] [ 7 ] «Компьютерное зрение связано с автоматической извлечением, анализом и пониманием полезной информации из одного изображения или последовательности изображений. Он включает в себя разработку теоретической и алгоритмической основы для достижения автоматического визуального понимания». [ 8 ] Как научная дисциплина , компьютерное зрение связано с теорией, лежащей в основе искусственных систем, которые извлекают информацию из изображений. Данные изображения могут принимать множество форм, такие как последовательности видео, представления из нескольких камер или многомерные данные из медицинского сканера . [ 9 ] Как технологическая дисциплина, компьютерное зрение стремится применить свои теории и модели для построения систем компьютерного зрения. Машино -видение относится к дисциплине системной инженерии, особенно в контексте автоматизации заводов. В более поздние времена термины Computer Vision и Machine Vision сходились в большей степени. [ 10 ] : 13 

ИИ и компьютерное зрение тесно связаны, а машины ИИ позволяют интерпретировать и понимать визуальные данные. Благодаря методам, таким как распознавание изображений и обнаружение объектов, ИИ поддерживает компьютерное зрение для автоматизации таких задач, как распознавание лиц, автономное вождение и анализ медицинской визуализации.

В конце 1960 -х годов началось компьютерное зрение в университетах, которые были новаторским искусственным интеллектом . Он должен был имитировать человеческую визуальную систему как ступеньку, чтобы доставить роботов интеллектуальным поведением. [ 11 ] В 1966 году считалось, что это может быть достигнуто с помощью летнего проекта бакалавриата, [ 12 ] Подкрепив камеру к компьютеру и, как она «опишите, что она увидела». [ 13 ] [ 14 ]

То, что отличило компьютерное зрение от распространенного поля цифровой обработки изображений в то время, было желанием извлечь трехмерную структуру из изображений с целью достижения полного понимания сцены. Исследования в 1970-х годах сформировали ранние основы для многих алгоритмов компьютерного зрения , которые существуют сегодня, включая извлечение ребра из изображений, маркировку линий, неполигэдрическое и многогранное моделирование , представление объектов как взаимосвязи меньших структур, оптического потока и и потока и потока и потока и потока и потока и Оценка движения . [ 11 ]

В следующем десятилетии были исследования, основанные на более строгих математическом анализе и количественных аспектах компьютерного зрения. К ним относятся концепция масштабного пространства , вывод формы из различных сигналов, таких как затенение , текстура и фокус, а также контурные модели, известные как змеи . Исследователи также поняли, что многие из этих математических концепций могут рассматриваться в одной и той же структуре оптимизации, что и регуляризация и случайные поля Маркова . [ 15 ] К 1990 -м годам некоторые предыдущие темы исследования стали более активными, чем другие. Исследования в области проективных трехмерных реконструкций привели к лучшему пониманию калибровки камеры . С появлением методов оптимизации для калибровки камеры было понято, что многие идеи уже были изучены в теории корректировки комплекта с поля фотограмметрии . Это привело к методам разреженных трехмерных реконструкций сцен из нескольких изображений . Прогресс был достигнут в области плотного стерео- переписки и дальнейших многопросмотров стерео методов. В то же время, вариации вырезания графика были использованы для решения сегментации изображения . Это десятилетие также отмечало первые статистические методы обучения, которые были использованы на практике для распознавания лиц на изображениях (см. Собственное место ). К концу 1990 -х годов значительное изменение произошло с повышенным взаимодействием между полями компьютерной графики и компьютерным зрением. Это включало рендеринг на основе изображений , морфинг изображений , интерполяция просмотра, панорамное строчки изображений и ранний рендеринг светового поля . [ 11 ]

Недавние работы показали возрождение методов, основанных на функциях , используемых в сочетании с методами машинного обучения и сложными структурами оптимизации. [ 16 ] [ 17 ] Содействие методам глубокого обучения привело к дальнейшей жизни в области компьютерного зрения. Точность алгоритмов глубокого обучения на нескольких эталонных наборах данных компьютерного зрения для задач, начиная от классификации, [ 18 ] Сегментация и оптический поток превзошли предыдущие методы. [ Цитация необходима ] [ 19 ]

[ редактировать ]
Обнаружение объекта на фотографии

Твердотельная физика

[ редактировать ]

Сплошная физика -это еще одно поле, которое тесно связано с компьютерным зрением. Большинство систем компьютерного зрения полагаются на датчики изображения , которые обнаруживают электромагнитное излучение , которое обычно в форме видимого , инфракрасного или ультрафиолетового света . Датчики разработаны с использованием квантовой физики . Процесс, с помощью которого свет взаимодействует с поверхностями, объясняется с использованием физики. Физика объясняет поведение оптики , которая является основной частью большинства систем визуализации. Сложные датчики изображения даже требуют квантовой механики , чтобы обеспечить полное понимание процесса формирования изображения. [ 11 ] Кроме того, различные задачи измерения в физике могут быть решены с использованием компьютерного зрения, например, движения в жидкостях.

Нейробиология

[ редактировать ]
Упрощенный пример обучения нейронной сети в обнаружении объектов: сеть обучается нескольким изображениям, которые, как известно, изображают звездные и морские ежи , которые коррелируют с «узлами», которые представляют визуальные особенности . Звезды сочетаются с кольцевой текстурой и звездным контуром, тогда как большинство морских ежей соответствуют полосатой текстуре и овальной форме. Тем не менее, экземпляр морского ежа, текстурированной кольцом, создает слабо взвешенную связь между ними.
Последующий запуск сети на входном изображении (слева): [ 20 ] Сеть правильно обнаруживает звезду. Однако слабо взвешенная связь между кольцевой текстурой и морским ежом также дает слабый сигнал последнему из одного из двух промежуточных узлов. Кроме того, оболочка, которая не была включена в тренировку, дает слабый сигнал для овальной формы, что также приводит к слабому сигналу для выхода морского ежа. Эти слабые сигналы могут привести к ложному положительному результату для морского ежа.
В действительности, текстуры и контуры будут представлены не отдельными узлами, а скорее связанные с ними весовые узоры нескольких узлов.

Нейробиология сильно повлияла на разработку алгоритмов компьютерного зрения. За прошедший век было проведено обширное изучение глаз, нейронов и структур мозга, посвященных обработке зрительных стимулов как у людей, так и у различных животных. Это привело к грубому, но запутанному описанию того, как работают системы естественного зрения, чтобы решить определенные задачи, связанные с зрением. Эти результаты привели к подполе в компьютерном зрении, где искусственные системы предназначены для имитации обработки и поведения биологических систем на разных уровнях сложности. Кроме того, некоторые из методов, основанных на обучении, разработанных в компьютерном зрении ( например, нейронная сеть и глубоком обучении анализ и классификацию и классификацию, основанные на ), имеют свой опыт в нейробиологии. Neocognitron Кунихико , нейронная сеть, разработанная в 1970 -х годах Фукусимой , является ранним примером компьютерного зрения, чередующегося вдохновения от нейробиологии, в частности, основной зрительной коры .

Некоторые нити исследований компьютерного зрения тесно связаны с изучением биологического видения - действительно, так же, как многие нити исследований ИИ тесно связаны с исследованиями человеческого интеллекта и использованием сохраненных знаний для интерпретации, интеграции и использования визуальной информации. Область изучения биологического зрения и моделирует физиологические процессы, лежащие в основе визуального восприятия у людей и других животных. Компьютерное зрение, с другой стороны, разрабатывает и описывает алгоритмы, реализованные в программном и аппаратном обеспечении, стоящих за системами искусственного зрения. Междисциплинарный обмен между биологическим и компьютерным зрением оказался плодотворным для обеих областей. [ 21 ]

Обработка сигнала

[ редактировать ]

Еще одним поле, связанным с компьютерным зрением, является обработка сигнала . Многие методы обработки однократных сигналов, обычно временных сигналов, могут быть естественным образом расширяться на обработку двух переменных сигналов или множественных сигналов в компьютерном зрении. Однако из-за конкретной природы изображений в компьютерном зрении разработано много методов, которые не имеют аналога при обработке сигналов с одной переменными. Вместе с мультимерностью сигнала это определяет под поле в обработке сигнала как часть компьютерного зрения.

Роботизированная навигация

[ редактировать ]

Навигация по роботам иногда имеет дело с автономным планированием пути или обсуждением для роботизированных систем для навигации по окружающей среде . [ 22 ] Для навигации по ними требуется подробное понимание этих сред. Информация об окружающей среде может быть предоставлена ​​система компьютерного зрения, выступая в качестве датчика зрения и предоставление информации высокого уровня об окружающей среде и роботе

Визуальные вычисления

[ редактировать ]
Визуальные вычисления - это общий термин для всех дисциплин информатики, связанных с изображениями и трехмерными моделями , такими как компьютерная графика , обработка изображений , визуализация , компьютерное зрение, вычислительная визуализация , виртуальная и дополненная реальность и обработка видео . Визуальные вычисления также включают аспекты распознавания моделей , взаимодействие человека с компьютером , машинное обучение и цифровые библиотеки. Основными проблемами являются приобретение, обработка, анализ и рендеринг визуальной информации (в основном изображения и видео). Области применения включают контроль промышленного качества, обработку и визуализацию медицинского изображения , съемки, робототехника, мультимедийные системы, виртуальное наследие, спецэффекты в фильмах и телевидении, а также компьютерные игры.

Другие поля

[ редактировать ]

Помимо вышеупомянутых взглядов на компьютерное зрение, многие из соответствующих тем исследований также могут быть изучены с чисто математической точки зрения. Например, многие методы в компьютерном зрении основаны на статистике , оптимизации или геометрии . Наконец, значительная часть поля посвящена аспекту реализации компьютерного зрения; Как существующие методы могут быть реализованы в различных комбинациях программного и аппаратного обеспечения, или как эти методы могут быть изменены, чтобы получить скорость обработки, не теряя слишком много производительности. Компьютерное зрение также используется в модной электронной коммерции, управлении запасами, поиском патента, мебели и индустрии красоты. [ 23 ]

Различия

[ редактировать ]

Поля, наиболее тесно связанные с компьютерным зрением, - это обработка изображений , анализ изображений и машинное зрение . Существует значительное совпадение в диапазоне методов и приложений, которые охватывают эти. Это подразумевает, что основные методы, которые используются и разрабатываются в этих областях, похожи, что можно интерпретировать, поскольку есть только одно поле с разными именами. С другой стороны, это, по -видимому, необходимо для исследовательских групп, научных журналов, конференций и компаний, чтобы представить или продавать себя как принадлежащие конкретно к одной из этих областей, и, следовательно, различные характеристики, которые отличают каждую из областей от других был представлен. При обработке изображений вход - это изображение, а вывод также является изображением, тогда как в компьютерном зрении изображение или видео снимаются в качестве входа, а вывод может быть улучшенным изображением, понимание содержания изображения или даже поведение компьютерной системы на основе такого понимания.

Компьютерная графика создает данные изображения из 3D -моделей, а компьютерное зрение часто производит 3D -модели из данных изображения. [ 24 ] Существует также тенденция к комбинации двух дисциплин, например , как изучено в дополненной реальности .

Следующие характеристики кажутся актуальными, но не должны восприниматься как общепринятые:

  • Обработка изображений и анализ изображений, как правило, фокусируются на двухмерных изображениях, как преобразовать одно изображение в другое, например , с помощью пиксельных операций, таких как улучшение контрастности, локальные операции, такие как извлечение краев или удаление шума, или геометрические преобразования, такие как вращение изображения Полем Эта характеристика подразумевает, что обработка/анализ изображений не требует допущений и не дает интерпретации о содержании изображения.
  • Компьютерное зрение включает в себя 3D -анализ из 2D -изображений. В этом анализируется 3D -сцена, проецируемой на одно или несколько изображений, например , как реконструировать структуру или другую информацию о трехмерной сцене с одного или нескольких изображений. Компьютерное зрение часто опирается на более или менее сложные предположения о сцене, изображенной на изображении.
  • Machine Vision -это процесс применения ряда технологий и методов для обеспечения автоматической проверки на основе изображений, управления процессами и руководства робота [ 25 ] в промышленных применениях. [ 21 ] Machine Vision имеет тенденцию сосредотачиваться на приложениях, главным образом на производстве, например , роботах и ​​системах на основе зрения для осмотра, измерения или сбора на основе зрений ( например [ 26 ] ) Это подразумевает, что технологии датчика изображения и теория управления часто интегрированы с обработкой данных изображения для управления роботом и что обработка в реальном времени подчеркивается с помощью эффективных реализаций в аппаратном и программном обеспечении. Это также подразумевает, что внешние условия, такие как освещение, могут быть и часто более контролируются в области машинного зрения, чем в общем компьютерном зрении, что может позволить использовать различные алгоритмы.
  • Существует также поле, называемое визуализацией , которая в основном фокусируется на процессе создания изображений, но иногда также имеет дело с обработкой и анализом изображений. Например, медицинская визуализация включает в себя существенную работу по анализу данных изображений в медицинских приложениях. Прогресс в сверточных нейронных сетях (CNNS) улучшил точное обнаружение заболевания в медицинских изображениях, особенно в кардиологии, патологии, дерматологии и радиологии. [ 27 ]
  • Наконец, распознавание шаблона - это поле, которое использует различные методы для извлечения информации из сигналов в целом, в основном на основе статистических подходов и искусственных нейронных сетей . [ 28 ] Значительная часть этого поля посвящена применению этих методов к данным изображения.

Фотограмметрия также перекрывается с компьютерным зрением, например, стереофотограмметрия против компьютерного стереозвука .

Приложения

[ редактировать ]

Приложения варьируются от таких задач, как системы промышленного машинного зрения , которые, скажем, осматривают ускорение бутылок на производственной линии, до исследований в области искусственного интеллекта и компьютеров или роботов, которые могут понять мир вокруг них. Поля компьютерного зрения и машинного зрения имеют значительное совпадение. Компьютерное зрение охватывает основную технологию автоматического анализа изображений, которая используется во многих областях. Machine Vision обычно относится к процессу объединения автоматизированного анализа изображений с другими методами и технологиями для обеспечения автоматической проверки и руководства робота в промышленных приложениях. Во многих приложениях компьютерного видения компьютеры предварительно запрограммированы для решения конкретной задачи, но методы, основанные на обучении, теперь становятся все более распространенными. Примеры приложений компьютерного зрения включают системы для:

Изучение 3D -форм было сложной задачей в компьютерном зрении. Недавние достижения в области глубокого обучения позволили исследователям создавать модели, которые способны создавать и реконструировать 3D-формы из однократных или многопроцентных карт глубины или силуэтов. [ 24 ]

Лекарство

[ редактировать ]
DARPA Визуальное медиа -мышление

Одним из наиболее заметных полей приложения является медицинское компьютерное зрение или медицинская обработка изображений, характеризующуюся извлечением информации из данных изображения для диагностики пациента . Примером этого является обнаружение опухолей , артериосклероза или других злокачественных изменений, а также различные патологии зубов; Измерения размеров органов, кровотока и т. Д. - еще один пример. Он также поддерживает медицинские исследования, предоставляя новую информацию: например , о структуре мозга или о качестве медицинских методов лечения. Приложения компьютерного зрения в медицинской области также включают в себя улучшение изображений, интерпретируемых людьми-например, образы или рентгеновских изображений-для уменьшения влияния шума.

Машинное зрение

[ редактировать ]

Вторая область применения в компьютерном зрении находится в промышленности, иногда называемой Machine Vision , где информация извлекается с целью поддержки производственного процесса. Одним из примеров является контроль качества, где детали или конечные продукты автоматически проверяются, чтобы найти дефекты. Одним из наиболее распространенных полей для такой проверки является пластинская отрасль, в которой каждая отдельная пластина измеряется и проверяется на наличие неточностей или дефектов, чтобы не допустить выхода компьютерного чипа непригодно. Другим примером является измерение позиции и ориентации деталей, которые будут подхвачены рукой робота. Машинное зрение также широко используется в сельскохозяйственных процессах для удаления нежелательных продуктов питания из объемного материала, процесса, называемого оптической сортировкой . [ 32 ]

Военные применения, вероятно, являются одной из крупнейших областей компьютерного зрения [ Цитация необходима ] Полем Очевидными примерами являются обнаружение вражеских солдат или транспортных средств и ракетные руководства . Более продвинутые системы для ракетных руководств Отправляют ракету в область, а не определенную цель, и выбор цели производится, когда ракета достигает области на основе локально полученных данных изображений. Современные военные концепции, такие как «осознание поля боя», подразумевают, что различные датчики, включая датчики изображения, предоставляют богатый набор информации о боевой сцене, которая может использоваться для поддержки стратегических решений. В этом случае автоматическая обработка данных используется для уменьшения сложности и для предоставления информации из нескольких датчиков для повышения надежности.

Автономные транспортные средства

[ редактировать ]
Концепция художника о любопытства , пример невозможного наземного автомобиля. Стерео камера установлена ​​на вершине ровера.

Одной из новых зон применения является автономные транспортные средства, которые включают погружения , наземные транспортные средства (небольшие роботы с колесами, автомобилями или грузовиками), воздушные транспортные средства и беспилотные воздушные транспортные средства ( БПЛА ). Уровень автономии варьируется от полностью автономных (беспилотных) транспортных средств до транспортных средств, где системы на основе компьютерного вида поддерживают водителя или пилота в различных ситуациях. Полностью автономные транспортные средства обычно используют компьютерное зрение для навигации, например, для знания, где они находятся или сопоставляют окружающую среду ( SLAM ), для обнаружения препятствий. Его также можно использовать для обнаружения определенных событий, конкретных, например , БПЛА, ищущего лесные пожары. Примерами вспомогательных систем являются системы предупреждения о препятствиях в автомобилях, камерах и датчиках лидара в транспортных средствах, а также системы для автономной посадки самолетов. Несколько производителей автомобилей продемонстрировали системы для автономного вождения автомобилей . Существуют достаточные примеры военных автономных транспортных средств, начиная от продвинутых ракет до беспилотных летательных аппаратов для разведывательных миссий или руководства по ракетам. Исследование космоса уже проводится с автономными транспортными средствами с использованием компьютерного зрения, Например , НАСА любопытство CNSA и 's Rover Yutu-2 .

Тактильная обратная связь

[ редактировать ]
Резиновый искусственный слой кожи с гибкой структурой для оценки формы поверхностей микро-сведения
Выше находится кремниевая форма с камерой, содержащей множество различных точечных маркеров. Когда этот датчик прижимается к поверхности, кремний деформируется, и положение точечных маркеров сдвигается. Затем компьютер может взять эти данные и определить, как именно нажимается плесень на поверхности. Это может быть использовано для калибровки роботизированных рук, чтобы убедиться, что они могут эффективно понять объекты.

Материалы, такие как резина и кремний, используются для создания датчиков, которые позволяют применять такие применения, как обнаружение микроульгаций и калибровка роботизированных рук. Резина можно использовать для создания формы, которая может быть помещена на пальце, внутри этой формы будут многократные датчики. Тогда плесень и датчики пальца могут быть помещены поверх небольшого листа резины, содержащего массив резиновых штифтов. Затем пользователь может носить плесень пальца и проследить поверхность. Затем компьютер может прочитать данные из датчиков деформации и измерить, если один или несколько контактов подталкиваются вверх. Если штифт толкается вверх, то компьютер может распознать это как несовершенство на поверхности. Такая технология полезна для получения точных данных о недостатках на очень большой поверхности. [ 33 ] Другим изменением этого датчика плесени являются датчики, которые содержат камеру, подвешенную в кремнии. Кремний образует купол вокруг камеры, а в кремниевом силиконе - точечные маркеры, которые одинаково расположены. Эти камеры могут затем быть размещены на таких устройствах, как роботизированные руки, чтобы компьютер мог получать очень точные тактильные данные. [ 34 ]

Другие области применения включают в себя:

Типичные задачи

[ редактировать ]

В каждой из областей применения, описанной выше, используется ряд задач компьютерного зрения; Более или менее четко определенные проблемы измерения или проблемы обработки, которые могут быть решены с использованием различных методов. Некоторые примеры типичных задач компьютерного зрения представлены ниже.

Задачи компьютерного зрения включают методы получения , обработки , анализа и понимания цифровых изображений, а также извлечение высокоразмерных данных из реального мира для получения численной или символической информации, например , в формах решений. [ 1 ] [ 2 ] [ 3 ] [ 4 ] Понимание в этом контексте означает преобразование визуальных изображений (ввод сетчатки) в описания мира, которые могут взаимодействовать с другими мыслительными процессами и вызывать соответствующие действия. Это понимание изображения можно рассматривать как отделение символической информации из данных изображений с использованием моделей, построенных с помощью геометрии, физики, статистики и теории обучения. [ 39 ]

Признание

[ редактировать ]

Классическая проблема в компьютерном зрения, обработке изображений и машинного зрения - это определение того, содержат ли данные изображения какой -то конкретный объект, функцию или деятельность. Различные разновидности проблемы распознавания описаны в литературе. [ 40 ]

  • Распознавание объектов (также называемая классификацией объектов )-могут быть распознаны один или несколько предварительно определенных или изученных объектов или классов объектов, обычно вместе с их 2D-позициями на изображении или 3D-позах в сцене. Blippar, Google Goggles и Likethat предоставляют отдельные программы, которые иллюстрируют эту функциональность.
  • Идентификация - распознается отдельный экземпляр объекта. Примеры включают в себя идентификацию лица или отпечатков пальцев конкретного человека, идентификацию рукописных цифр или идентификацию конкретного транспортного средства.
  • Обнаружение - данные изображения отсканируются для конкретных объектов вместе с их местоположениями. Примеры включают обнаружение препятствия в поле зрения автомобиля и возможных аномальных клеток или тканей в медицинских изображениях или обнаружение транспортного средства в автоматической системе дорожных платы. Обнаружение, основанное на относительно простых и быстрых вычислениях, иногда используется для поиска небольших областей интересных данных изображения, которые могут быть дополнительно проанализированы с помощью более требовательных вычислительных методов для создания правильной интерпретации.

В настоящее время лучшие алгоритмы для таких задач основаны на сверточных нейронных сетях . Иллюстрация их возможностей дается из -за крупномасштабной задачи визуального распознавания ImageNet ; Это эталон в классификации и обнаружении объектов, с миллионами изображений и 1000 классов объектов, используемых в конкурсе. [ 41 ] Производительность сверточных нейронных сетей в тестах ImageNet теперь близка к производительности людей. [ 41 ] Лучшие алгоритмы по -прежнему борются с маленькими или тонкими предметами, такими как маленький муравей на стебле цветка или человека, держащего перо в руке. У них также есть проблемы с изображениями, которые были искажены фильтрами (все более распространенное явление с современными цифровыми камерами). Напротив, такие изображения редко беспокоят людей. У людей, однако, есть проблемы с другими проблемами. Например, они не умеют классифицировать объекты на мелкозернистые классы, такие как конкретная порода собак или видов птиц, тогда как сверточные нейронные сети с легкостью обрабатывают это. [ Цитация необходима ]

Существует несколько специализированных задач, основанных на признании, таких как:

  • Поиск изображений на основе контента -поиск всех изображений в большем наборе изображений, которые имеют определенное содержание. Содержание может быть указано по-разному, например, с точки зрения сходства по сравнению с целевым изображением (дайте мне все изображения, аналогичные изображению x), используя методы обратного поиска изображения , или с точки зрения критериев поиска высокого уровня, приведенных в качестве текстового ввода (Дайте мне все изображения, которые содержат много домов, принимаются зимой и не имеют в них автомобилей).
Компьютерное зрение для людей противостоят целям в общественных местах, торговых центрах, торговых центрах

Анализ движения

[ редактировать ]

Несколько задач связаны с оценкой движения, где обрабатывается последовательность изображения для получения оценки скорости либо в каждой точках изображения, либо в 3D -сцене, либо даже камеры, которая производит изображения. Примеры таких задач:

  • Эгомирование - определение трехмерного жесткого движения (вращение и перевод) камеры из последовательности изображения, создаваемой камерой.
  • Отслеживание - следуя движениям (обычно) меньшего набора интересов или объектов ( например , транспортных средств, объектов, людей или других организмов [ 38 ] ) в последовательности изображения. Это имеет обширные отраслевые приложения, так как можно контролировать большинство высококачественных машин.
  • Оптический поток - чтобы определить, для каждой точки на изображении, как эта точка движется относительно плоскости изображения, то есть его очевидное движение. Это движение является результатом как того, как соответствующая трехмерная точка движется в сцене, так и как камера движется относительно сцены.

Реконструкция сцены

[ редактировать ]

Учитывая один или (обычно) больше изображений сцены или видео, реконструкция сцены направлена ​​на вычисление трехмерной модели сцены. В простейшем случае модель может быть набором 3D -точек. Более сложные методы создают полную трехмерную модель поверхности. Появление 3D -визуализации, не требующая движения или сканирования, и связанных с ними алгоритмов обработки обеспечивает быстрые достижения в этой области. Трехмерное зондирование на основе сетки можно использовать для получения трехмерных изображений с разных сторон. Алгоритмы теперь доступны для объединения нескольких трехмерных изображений в точечные облака и 3D -модели. [ 24 ]

Восстановление изображения

[ редактировать ]

Восстановление изображения входит в картинку, когда исходное изображение деградировано или повреждено из -за некоторых внешних факторов, таких как неправильное позиционирование объектива, помехи передачи, низкое освещение или пузырьки движения и т. Д., Которые называются шумом. Когда изображения разлагаются или повреждены, информация, которая будет извлечена из них, также повреждается. Поэтому нам нужно восстановить или восстановить изображение, как это было предназначено. Цель восстановления изображения - удаление шума (шум датчика, размытие движения и т. Д.) Из изображений. Самый простой возможный подход к удалению шума-это различные типы фильтров, такие как фильтры с низким частотой или медианные фильтры. Более сложные методы предполагают модель того, как локальные структуры изображения выглядят, чтобы отличить их от шума. Сначала анализируя данные изображения с точки зрения локальных структур изображения, таких как линии или ребра, а затем контролируя фильтрацию на основе локальной информации с шага анализа, обычно получается лучший уровень удаления шума по сравнению с более простыми подходами.

Примером в этом поле является Inpainting .

Системные методы

[ редактировать ]

Организация системы компьютерного зрения в зависимости от приложения зависит от приложения. Некоторые системы представляют собой автономные приложения, которые решают конкретную проблему измерения или обнаружения, в то время как другие представляют собой подсистему более крупной конструкции, которая, например, также содержит подсистемы для контроля механических приводов, планирования, информационных баз, управления машинные интерфейсы и т. Д. Конкретная реализация системы компьютерного зрения также зависит от того, является ли ее функциональность предварительно определенной или может быть изучена или изменена во время работы. Многие функции уникальны для приложения. Однако существуют типичные функции, которые встречаются во многих системах компьютерного зрения.

  • Получение изображений -цифровое изображение производится одним или несколькими датчиками изображения , которые, помимо различных типов светочувствительных камер, включают датчики диапазона , томографические устройства, радар, ультра-москольные камеры и т. Д. В зависимости от типа датчика, датчика, The The The Destury, The The The The The The The The The The Tomography Полученные данные изображения являются обычным 2D -изображением, трехмерным томом или последовательности изображения. Значения пикселя обычно соответствуют интенсивности света в одной или нескольких спектральных полосах (серые изображения или изображения цветов), но также могут быть связаны с различными физическими показателями, такими как глубина, поглощение или отражение звуковых или электромагнитных волн или магнитно -резонансная томография . [ 32 ]
  • Предварительная обработка -Перед тем, как метод компьютерного видения может быть применен к данным изображения, чтобы извлечь некоторую конкретную информацию, обычно необходимо обработать данные, чтобы убедиться, что они удовлетворяют определенным предположениям, подразумеваемым методом. Примеры:
    • Пересмотреть наборы, чтобы убедиться, что система координат изображения была правильной.
    • Шумоподавление, чтобы гарантировать, что шум датчика не вводит ложную информацию.
    • Улучшение контрастности, чтобы гарантировать, что соответствующая информация может быть обнаружена.
    • Масштабное представление пространства для улучшения структур изображений в локально соответствующих масштабах.
  • Извлечение функций - функции изображения на различных уровнях сложности извлекаются из данных изображения. [ 32 ] Типичные примеры таких функций:
Более сложные функции могут быть связаны с текстурой, формой или движением.
  • Обнаружение / сегментация - в какой -то момент обработки принимается решение о том, какие точки изображения или области изображения имеют отношение к дальнейшей обработке. [ 32 ] Примеры:
    • Выбор конкретного набора точек интереса.
    • Сегментация одной или нескольких областей изображения, которые содержат конкретный объект интереса.
    • Сегментация изображения в вложенную архитектуру сцены, включающую передний план, группы объектов, отдельные объекты или заметный объект [ 44 ] Части (также называемые иерархией сцены пространственной наводки), [ 45 ] в то время как визуальное значение часто реализуется как пространственное и временное внимание .
    • Сегментация или совместная сегментация одного или нескольких видеороликов в серию масок переднего плана на переднем плане, сохраняя при этом временную семантическую непрерывность. [ 46 ] [ 47 ]
  • Обработка высокого уровня -на этом этапе вход, как правило, является небольшим набором данных, например, набор точек или области изображения, который, как предполагается, содержит конкретный объект. [ 32 ] Остальная обработка связана, например:
    • Проверка, что данные удовлетворяют модельными и специфичными для приложения допущений.
    • Оценка специфических для приложения параметров, таких как поза объекта или размер объекта.
    • Распознавание изображений - классификация обнаруженного объекта в разные категории.
    • Регистрация изображения - сравнение и объединение двух разных представлений одного и того же объекта.
  • Принятие принятия окончательного решения, необходимого для заявки, [ 32 ] например:
    • Пропустить/сбой в приложениях автоматического проверки.
    • Match/No Match в приложениях распознавания.
    • Флаг для дальнейшего рассмотрения человека в области медицинских, военных, обеспечения безопасности и признания.

Системы понимания изображений

[ редактировать ]

Системы понимания изображений (IU) включают три уровня абстракции следующим образом: Низкий уровень включает примитивы изображения, такие как ребра, элементы текстуры или области; Промежуточный уровень включает границы, поверхности и объемы; и высокий уровень включает объекты, сцены или события. Многие из этих требований являются полностью темами для дальнейших исследований.

Репрезентативные требования в разработке IU для этих уровней: представление прототипических концепций, концептуальная организация, пространственные знания, временные знания, масштабирование и описание путем сравнения и дифференциации.

Хотя вывод относится к процессу получения новых, не явно представленных фактами из известных в настоящее время фактов, контроль относится к процессу, который выбирает, какой из многих методов вывода, поиска и сопоставления должен применяться на определенном этапе обработки. Требования к выводу и контролю для IU являются: активация поиска и гипотезы, сопоставление и тестирование гипотез, генерация и использование ожиданий, изменения и фокусировка внимания, уверенность и сила веры, вывод и удовлетворение целей. [ 48 ]

Аппаратное обеспечение

[ редактировать ]
Model Model IPad Pro с LIDAR 2020 года датчиком

Есть много видов систем компьютерного зрения; Тем не менее, все они содержат эти основные элементы: источник питания, по крайней мере одно устройство сбора изображения (камера, ПЗС и т. Д.), Процессор, а также кабели управления и связи или какой -то беспроводной механизм взаимосвязи. Кроме того, практическая система зрения содержит программное обеспечение, а также дисплей для мониторинга системы. Системы зрения для внутренних пространств, как и большинство промышленных, содержат систему освещения и могут быть размещены в контролируемой среде. Кроме того, заполненная система включает в себя множество аксессуаров, таких как поддержка камеры, кабели и разъемы.

Большинство систем компьютерного зрения используют камеры видимого света, пассивно просмотр сцены с частотой кадров не более 60 кадров в секунду (обычно намного медленнее).

Несколько систем компьютерного зрения используют аппаратное обеспечение с приобретением изображений с активным освещением или чем-то другим, кроме видимого света или оба, такого как 3D-сканеры структурированного света , термографические камеры , гиперспектральные изображения , радиолокационные визуализации , лидарные сканеры, магнитно-резонансные изображения , боковой сонар. , синтетическая апертурная сонар и т. Д. Такое оборудование фиксирует «изображения», которые затем обрабатываются часто с использованием тех же алгоритмов компьютерного зрения, используемых для обработки изображений видимого света.

В то время как традиционные трансляционные и потребительские видеосистемы работают со скоростью 30 кадров в секунду, достижения в области цифровой обработки сигналов и потребительской графики оборудование сделало высокоскоростное получение, обработка и отображение для систем в реальном времени по заказу сотен на тысячи кадров в секунду. Для приложений в робототехнике быстрые видеосистемы в реальном времени критически важны и часто могут упростить обработку, необходимую для определенных алгоритмов. В сочетании с высокоскоростным проектором, быстрое получение изображений позволяет реализовать 3D измерение и отслеживание функций. [ 49 ]

Системы эгоцентрического зрения состоят из носимой камеры, которая автоматически делает снимки с точки зрения от первого лица.

По состоянию на 2016 год подразделения по обработке зрения становятся новым классом процессоров для дополнения процессоров и единиц обработки графики (графические процессоры) в этой роли. [ 50 ]

Смотрите также

[ редактировать ]
  1. ^ Jump up to: а беременный Рейнхард Клетт (2014). Краткое компьютерное зрение . Спрингер. ISBN  978-1-4471-6320-6 .
  2. ^ Jump up to: а беременный Линда Г. Шапиро ; Джордж С. Стокман (2001). Компьютерное зрение . Прентис Холл. ISBN  978-0-13-030796-5 .
  3. ^ Jump up to: а беременный Тим Моррис (2004). Компьютерное зрение и обработка изображений . Palgrave Macmillan. ISBN  978-0-333-99451-1 .
  4. ^ Jump up to: а беременный Бернд Ян; Horst Hauтсекер (2000). Компьютерное зрение и приложения, руководство для студентов и практиков . Академическая пресса. ISBN  978-0-13-085198-7 .
  5. ^ Дана Х. Баллард; Кристофер М. Браун (1982). Компьютерное зрение . Прентис Холл. ISBN  978-0-13-165316-0 .
  6. ^ Хуан, Т. (1996-11-19). Вандони, Карло Е (ред.). Компьютерное зрение: эволюция и обещание (PDF) . 19 -я Школа компьютеров CERN . Женева: Церн. С. 21–25. doi : 10.5170/cern-1996-008.21 . ISBN  978-9290830955 Полем Архивировано (PDF) из оригинала 2018-02-07.
  7. ^ Милан Сонка; Валав хлавац; Роджер Бойл (2008). Обработка изображений, анализ и машинное зрение . Томсон. ISBN  978-0-495-08252-1 .
  8. ^ http://www.bmva.org/visionoverview Archived 2017-02-16 на машине Wayback Британская ассоциация машинного видения и Общество распознавания образцов, полученные 20 февраля 2017 г.
  9. ^ Мерфи, Майк (13 апреля 2017 года). «Tricorder» «Tricorder» «Star Trek» стал ближе к тому, чтобы стать реальностью » . Архивировано с оригинала 2 июля 2017 года . Получено 18 июля 2017 года .
  10. ^ Принципы компьютерного видения , алгоритмы, приложения, обучение 5-е издание ER Davies Academic Press, Elsevier 2018 ISBN 978-0-12-809284-2
  11. ^ Jump up to: а беременный в дюймовый Ричард Селиски (30 сентября 2010 г.). Компьютерное зрение: алгоритмы и приложения . Springer Science & Business Media. С. 10–16. ISBN  978-1-84882-935-0 .
  12. ^ Sejnowski, Terrence J. (2018). Глубокая революция . Кембридж, Массачусетс Лондон, Англия: издательство MIT. п. 28. ISBN  978-0-262-03803-4 .
  13. ^ Papert, Seymour (1966-07-01). «Проект Summer Vision». MIT AI Memos (1959 - 2004) . HDL : 1721.1/6125 .
  14. ^ Маргарет Энн Боден (2006). Разум как машина: история когнитивной науки . Кларендон Пресс. п. 781. ISBN  978-0-19-954316-8 .
  15. ^ Такео Канаде (6 декабря 2012 г.). Трехмерное машинное зрение . Springer Science & Business Media. ISBN  978-1-4613-1981-8 .
  16. ^ Nicu Sebe; Ира Коэн; Ашутош Гарг; Томас С. Хуан (3 июня 2005 г.). Машинное обучение в компьютерном зрении . Springer Science & Business Media. ISBN  978-1-4020-3274-5 .
  17. ^ Уильям Фриман; Пьетро Перона; Бернхард Шолкопф (2008). «Гостевая редакционная статья: машинное обучение для компьютерного зрения» . Международный журнал компьютерного видения . 77 (1): 1. DOI : 10.1007/S11263-008-0127-7 . HDL : 21.11116/0000-0003-30FB-C . ISSN   1573-1405 .
  18. ^ Лекун, Янн; Бенгио, Йошуа; Хинтон, Джеффри (2015). «Глубокое обучение» (PDF) . Природа . 521 (7553): 436–444. Bibcode : 2015natur.521..436L . doi : 10.1038/nature14539 . PMID   26017442 . S2CID   3074096 .
  19. ^ Цзяо, Личанг; Занг, фанат; Еда, клык; Это, syuyuan; Лин, пятый; Фед, Жикси; Ку, Ронг (2019). «Обследование глубокого обнаружения объектов на основе обучения». IEEE Acess . 7 : 1288837–128888. ARXV : 1907.09408 Победы : 2019ieea ... 7l837j . Неделя : 10.1109/Access.2019.2939201 . S2CID   198147317
  20. ^ Ferrie, C.; Кайзер С. (2019). Нейронные сети для детей . Сборники. ISBN  978-1492671206 .
  21. ^ Jump up to: а беременный Стегер, Карстен; Маркус Ульрих; Кристиан Видеманн (2018). Алгоритмы и приложение машинного зрения (2 -е изд.). Вейнхайм: Wiley-VCH . п. 1. ISBN  978-3-527-41365-2 Полем Архивировано из оригинала 2023-03-15 . Получено 2018-01-30 .
  22. ^ Мюррей, Дон и Каллен Дженнингс. « Основанное на стереообращении картирование и навигация для мобильных роботов архивировали 2020-10-31 на машине Wayback ». Материалы Международной конференции по робототехнике и автоматизации. Тол. 2. IEEE, 1997.
  23. ^ Андраде, Норберто Алмейда. «Вычислительное видение и бизнес -аналитика в сегменте красоты - анализ через Instagram» (PDF) . Журнал управления маркетингом . Американский исследовательский институт разработки политики . Получено 11 марта 2024 года .
  24. ^ Jump up to: а беременный в Soltani, AA; Huang, H.; Wu, J.; Kulkarni, TD; Tenenbaum, JB (2017). «Синтезирование 3D-форм с помощью моделирования карт глубины и силуэтов с глубокими сетями с глубокими генеративными сетями». 2017 IEEE Conference по компьютерному видению и распознаванию шаблонов (CVPR) . С. 1511–1519. doi : 10.1109/cvpr.2017.269 . HDL : 1721.1/126644 . ISBN  978-1-5386-0457-1 Полем S2CID   31373273 .
  25. ^ Турек, Фред (июнь 2011 г.). «Основы машинного видения, как заставить роботов увидеть». NASA Tech Briefs Magazine . 35 (6). Страницы 60–62
  26. ^ «Будущее автоматизированного случайного выбора мусорного ведра» . Архивировано с оригинала 2018-01-11 . Получено 2018-01-10 .
  27. ^ Эстева, Андре; Чоу, Кэтрин; Юнг, Серена; Найк, Нихил; Мадани, Али; Mottaghi, Ali; Лю, Юн; Топол, Эрик; Дин, Джефф; Сочер, Ричард (2021-01-08). «Медицинское компьютерное зрение с поддержкой глубокого обучения» . NPJ Цифровая медицина . 4 (1): 5. doi : 10.1038/s41746-020-00376-2 . ISSN   2398-6352 . PMC   7794558 . PMID   33420381 .
  28. ^ Chervyakov, Ni; Ляхов, Пенсильвания; Deryabin, MA; Нагорн, NN; Valueva, mv; Valuev, GV (2020). «Основанное на системном решение для снижения стоимости оборудования для сверточной нейронной сети». Нейрокомпьютинг . 407 : 439–453. doi : 10.1016/j.neucom.2020.04.018 . S2CID   219470398 . Свещательные нейронные сети (CNN) представляют архитектуры глубокого обучения, которые в настоящее время используются в широком спектре приложений, включая компьютерное зрение, распознавание речи, идентификацию альбудиновых последовательностей в биоинформатике, контроль производства, анализ временных рядов в финансах и многих других.
  29. ^ Wäldchen, Jana; Mäder, Patrick (2017-01-07). «Идентификация видов растений с использованием методов компьютерного зрения: систематический обзор литературы» . Архивы вычислительных методов в инженерии . 25 (2): 507–543. doi : 10.1007/s11831-016-9206-z . ISSN   1134-3060 . PMC   6003396 . PMID   29962832 .
  30. ^ Aghamohammadesmaeilkebforoosh, Kimia; Никан, Соудх; Антонини, Джорджо; Пирс, Джошуа М. (январь 2024 г.). «Оптимизация обнаружения клубники и качества с помощью трансформаторов зрения и основанных на внимании сверточных нейронных сетей» . Еда . 13 (12): 1869. doi : 10.3390/Foods13121869 . ISSN   2304-8158 . PMC   11202458 . PMID   38928810 .
  31. ^ «Новая модель искусственного интеллекта, разработанная на западе, обнаруживает клубничные заболевания, направлена ​​на отходы» . Лондон ​2024-09-13 . Получено 2024-09-19 .
  32. ^ Jump up to: а беременный в дюймовый и фон Э. Рой Дэвис (2005). Машинное зрение: теория, алгоритмы, практичность . Морган Кауфманн. ISBN  978-0-12-206093-9 .
  33. ^ Ando, ​​Mitsuhito; Takei, Toshinobu; Мочияма, Хироми (2020-03-03). «Резиновый искусственный слой кожи с гибкой структурой для оценки формы поверхностей микро-узадий» . Robomech Journal . 7 (1): 11. doi : 10.1186/s40648-020-00159-0 . ISSN   2197-4225 .
  34. ^ Чой, Сын-Хён; Тахара, Кенджи (2020-03-12). «Манипуляция с ловкими объектами с помощью многослойной роботизированной руки с визуальными датчиками кончика пальцев» . Robomech Journal . 7 (1): 14. doi : 10.1186/s40648-020-00162-5 . ISSN   2197-4225 .
  35. ^ Гарг, Хитендра (2020-02-29). «Обнаружение сонливости водителя с использованием обычного приложения компьютерного зрения» . 2020 Международная конференция по электронике и приложениям IoT в области возобновляемых источников энергии и ее контроля (PARC) . С. 50–53. doi : 10.1109/parc49193.2020.236556 . ISBN  978-1-7281-6575-2 Полем S2CID   218564267 . Архивировано из оригинала 2022-06-27 . Получено 2022-11-06 .
  36. ^ Хасан, Фудайл; Кашевник, Алексей (2021-05-14). «Современный анализ современных алгоритмов обнаружения сонливости на основе компьютерного зрения» . 2021 29 -я Конференция Ассоциации открытых инноваций (фрукция) . С. 141–149. doi : 10.23919/fruct52173.2021.9435480 . ISBN  978-952-69244-5-8 Полем S2CID   235207036 . Архивировано из оригинала 2022-06-27 . Получено 2022-11-06 .
  37. ^ Баласундарам, а; Ashokkumar, S; Kothanddaman, D; Кора, Storyaik; Sudarshan, E; Harshaverdhan, A (2020-12-01). «Обнаружение усталости на основе компьютерного зрения с использованием параметров лица » Серия конференций IOP: материаловая наука и инженерия 981 (2): 022005. BIBCODE : 2020MS & E..981B2005B Doi : 10.1088/1757-899x/981/2/ 022005 ISSN   1757-899x  230639179S2CID
  38. ^ Jump up to: а беременный Бруйнинг, Марджолейн; Visser, Marco D.; Hallmann, Caspar A.; Jongejans, Eelke; Голдинг, Ник (2018). «TrackDem: автоматизированное отслеживание частиц для получения количества популяции и распределений по размерам от видео в R» . Методы экологии и эволюции . 9 (4): 965–973. Bibcode : 2018mecev ... 9..965b . doi : 10.1111/2041-210x.12975 . HDL : 2066/184075 . ISSN   2041-210x .
  39. ^ Дэвид А. Форсайт; Жан Понсе (2003). Компьютерное зрение, современный подход . Прентис Холл. ISBN  978-0-13-085198-7 .
  40. ^ Форсайт, Дэвид; Понсе, Джин (2012). Компьютерное зрение: современный подход . Пирсон.
  41. ^ Jump up to: а беременный РУССАКОВСКИЙ, Ольга; Дэн, Цзя; Су, Хао; Краузе, Джонатан; Сатеш, Санджив; Ма, Шон; Хуан, Чжихенг; Карпати, Андрей; Хосла, Адитья; Бернштейн, Майкл; Берг, Александр С. (декабрь 2015 г.). «ImageNet крупномасштабная задача визуального распознавания» . Международный журнал компьютерного видения . 115 (3): 211–252. Arxiv : 1409.0575 . doi : 10.1007/s11263-015-0816-y . HDL : 1721.1/104944 . ISSN   0920-5691 . S2CID   2930547 . Архивировано из оригинала 2023-03-15 . Получено 2020-11-20 .
  42. ^ Куинн, Артур (2022-10-09). «Признание изображений ИИ: неизбежная тенденция современного образа жизни» . Tapten.ai . Архивировано из оригинала 2022-12-02 . Получено 2022-12-23 .
  43. ^ Барретт, Лиза Фельдман; Адольфы, Ральф; Марселла, Стейси; Martinez, Aleix M.; Поллак, Сет Д. (июль 2019 г.). «Эмоциональные выражения пересмотрены: проблемы с выводом эмоций из человеческих движений на лице» . Психологическая наука в общественных интересах . 20 (1): 1–68. doi : 10.1177/1529100619832930 . ISSN   1529-1006 . PMC   6640856 . PMID   31313636 .
  44. ^ А. Мейт (2015). «Импровизированное обнаружение и манипуляции объекта». Arxiv : 1511.02999 [ CS.CV ].
  45. ^ Barghout, Лорен. « Визуальный такметрический подход к сегментации изображений с использованием нечеткого пространственного таксона выпускает контекстуально релевантные регионы, архивные 2018-11-14 на машине Wayback ». Обработка информации и управление неопределенностью в системах, основанных на знаниях. Springer International Publishing, 2014.
  46. ^ Лю, Зийя; Ван, Ле; Хуа, банда; Чжан, Цилин; Niu, Zhenxing; Wu, ying; Zheng, Nanning (2018). «Обнаружение и сегментацию совместного видео объекта с помощью связанных динамических марковских сетей» (PDF) . IEEE транзакции по обработке изображений . 27 (12): 5840–5853. Bibcode : 2018itip ... 27.5840l . doi : 10.1109/tip.2018.2859622 . ISSN   1057-7149 . PMID   30059300 . S2CID   51867241 . Архивировано из оригинала (PDF) 2018-09-07 . Получено 2018-09-14 .
  47. ^ Ван, Ле; Дуан, Сюхуан; Чжан, Цилин; Niu, Zhenxing; Хуа, банда; Zheng, Nanning (2018-05-22). «Трубка сегмента: пространственно-временная локализация действий в невозможенных видео с сегментацией на кадре» (PDF) . Датчики . 18 (5): 1657. Bibcode : 2018senso..18.1657W . doi : 10.3390/s18051657 . ISSN   1424-8220 . PMC   5982167 . PMID   29789447 . Архивировано (PDF) из оригинала 2018-09-07.
  48. ^ Шапиро, Стюарт С. (1992). Энциклопедия искусственного интеллекта, том 1 . Нью -Йорк: John Wiley & Sons, Inc. с. 643–646. ISBN  978-0-471-50306-4 .
  49. ^ Kagami, Shingo (2010). «Высокоскоростные системы зрения и проекторы для восприятия мира в реальном времени». 2010 IEEE Computer Society Conference по компьютерному видению и распознаванию образцов - семинары . Тол. 2010. С. 100–107. doi : 10.1109/cvprw.2010.5543776 . ISBN  978-1-4244-7029-7 Полем S2CID   14111100 .
  50. ^ Сет Коланер (3 января 2016 г.). «Третий тип процессора для VR/AR: Movidius 'Myriad 2 VPU» . www.tomshardware.com . Архивировано из оригинала 15 марта 2023 года . Получено 3 мая 2016 года .

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8029299729713be8fbc47c3d4f893765__1726743360
URL1:https://arc.ask3.ru/arc/aa/80/65/8029299729713be8fbc47c3d4f893765.html
Заголовок, (Title) документа по адресу, URL1:
Computer vision - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)