Глоссарий машинного зрения
Эта статья нуждается в дополнительных цитатах для проверки . ( декабрь 2011 г. ) |
Ниже приведены общие определения, относящиеся к области машинного зрения .
Общие связанные поля
0-9 [ править ]
- 1394 . FireWire — Apple Inc. торговая марка для интерфейса IEEE 1394. Он также известен как i.Link ( название Sony ) или IEEE 1394 (хотя стандарт 1394 также определяет интерфейс объединительной платы). Это стандарт интерфейса последовательной шины персонального компьютера (и цифрового аудио/цифрового видео), предлагающий высокоскоростную связь и услуги изохронной передачи данных в реальном времени.
- 1Д . Одномерный.
- 2D компьютерная графика . Компьютерное создание цифровых изображений — в основном на основе двумерных моделей (таких как двумерные геометрические модели, текст и цифровые изображения) и с помощью специфичных для них методов.
- 3D компьютерная графика . 3D-компьютерная графика отличается от 2D-компьютерной графики тем, что трехмерное представление геометрических данных хранится в компьютере для выполнения вычислений и рендеринга 2D-изображений. Такие изображения могут быть предназначены для последующего отображения или для просмотра в реальном времени. Несмотря на эти различия, компьютерная 3D-графика опирается на многие из тех же алгоритмов , что и 2D-компьютерная векторная графика в каркасной модели и 2D-компьютерная растровая графика в окончательном визуализированном отображении. В программном обеспечении компьютерной графики различие между 2D и 3D иногда стирается; 2D-приложения могут использовать методы 3D для достижения таких эффектов, как освещение, и в первую очередь 3D могут использовать методы 2D-рендеринга.
- 3D сканер . Это устройство, которое анализирует реальный объект или окружающую среду для сбора данных о его форме и, возможно, цвете. Собранные данные затем можно использовать для построения цифровых трехмерных моделей, полезных для самых разных приложений.
А [ править ]
- Аберрация . Оптически дефокусировка означает перемещение вдоль оптической оси от плоскости или поверхности наилучшего фокуса. В целом расфокусировка снижает резкость и контрастность изображения. То, что должно быть резким, высококонтрастным краем сцены, становится постепенным переходом.
- Алгебраическое расстояние или алгебраическая ошибка . Алгебраическое расстояние от точки x i до кривой или поверхности, определяемое формулой это ценность , то есть остаток в задаче наименьших квадратов с точкой данных ( x i , 0) и модельной функцией f . Этот термин в основном используется в компьютерном зрении. [1] [1] [2]
- Диафрагма . В контексте фотографии или машинного зрения под диафрагмой понимается диаметр диафрагмы фотографического объектива. Ограничитель диафрагмы можно регулировать, чтобы контролировать количество света, попадающего на пленку или датчик изображения.
- соотношение сторон (изображение) . Соотношение сторон изображения — это его отображаемая ширина, деленная на его высоту (обычно выражается как « x : y »).
- Угловое разрешение . Описывает разрешающую способность любого устройства формирования изображения, такого как оптический или радиотелескоп, микроскоп, камера или глаз.
- Автоматизированный оптический контроль .
Б [ править ]
- Штрих-код . Штрих-код (также штрих-код) — это машиночитаемое представление информации в визуальном формате на поверхности.
- Открытие блоба . Проверка изображения на наличие дискретных капель связанных пикселей (например, черной дыры в сером объекте) в качестве ориентиров изображения. Эти капли часто представляют собой оптические мишени для механической обработки, роботизированного захвата или производственного сбоя.
- Растровое изображение . Растровое графическое изображение, цифровое изображение или растровое изображение — это файл или структура данных, представляющая обычно прямоугольную сетку пикселей или цветовых точек на мониторе компьютера, бумаге или другом устройстве отображения.
С [ править ]
- Камера . Камера — это устройство, используемое для съемки изображений по отдельности или последовательно. Камеру, которая делает снимки по отдельности, иногда называют фотокамерой, чтобы отличить ее от видеокамеры.
- Ссылка на камеру . Camera Link — это протокол последовательной связи, разработанный для приложений компьютерного зрения на основе интерфейса Channel-link компании National Semiconductor . Он был разработан с целью стандартизации научной и промышленной видеопродукции, включая камеры, кабели и устройства захвата кадров. Стандарт поддерживается и администрируется Ассоциацией автоматизированной обработки изображений (AIA), глобальной торговой группой индустрии машинного зрения.
- Устройство с зарядовой связью . Устройство с зарядовой связью (CCD) — это датчик для записи изображений, состоящий из интегральной схемы, содержащей массив связанных или связанных конденсаторов. Датчики и камеры CCD, как правило, более чувствительны, менее шумны и дороже, чем датчики и камеры CMOS.
- Цветовое пространство CIE 1931 . В исследовании восприятия цвета одним из первых математически определенных цветовых пространств было цветовое пространство CIE XYZ (также известное как цветовое пространство CIE 1931 ), созданное Международной комиссией по освещению (CIE) в 1931 году.
- КМОП . КМОП («см. мох») означает дополнительный металлооксидный полупроводник и представляет собой основной класс интегральных схем. Датчики изображения CMOS для машинного зрения дешевле, чем датчики CCD, но более шумны.
- КоаXPress . CoaXPress (CXP) — это стандарт асимметричной высокоскоростной последовательной связи по коаксиальному кабелю. CoaXPress сочетает в себе высокоскоростную передачу данных изображения, низкоскоростное управление камерой и питание по одному коаксиальному кабелю. Стандарт поддерживается JIIA, Японской ассоциацией промышленной визуализации.
- Цвет . Восприятие частоты (или длины волны) света можно сравнить с тем, как высота звука (или музыкальная нота) является восприятием частоты или длины волны звука.
- Цветовая слепота . Также известный как дефицит цветового зрения, у людей это неспособность воспринимать различия между некоторыми или всеми цветами, которые могут различать другие люди.
- Цветовая температура . «Белый свет» обычно описывают по его цветовой температуре. Цветовая температура традиционной лампы накаливания определяется путем сравнения ее оттенка с теоретическим нагретым излучателем черного тела. Цветовая температура лампы — это температура в Кельвинах, при которой нагретый радиатор черного тела соответствует оттенку лампы.
- Цветовое зрение . CV — это способность организма или машины различать объекты на основе длин волн (или частот ) света , который они отражают или излучают.
- компьютерное зрение . Изучение и применение методов, которые позволяют компьютерам «понимать» содержимое изображений.
- Контраст . В зрительном восприятии контраст — это различие визуальных свойств, которое делает объект (или его представление на изображении) отличимым от других объектов и фона.
- C-крепление . Стандартизированный адаптер для оптических объективов на CCD – фотоаппаратах. Объективы с байонетом C имеют заднее фокусное расстояние 17,5 мм против 12,5 мм у объективов с байонетом CS. Объектив C-Mount можно использовать с камерой CS-Mount с помощью удлинительного адаптера 5 мм. Крепление C представляет собой монтажную резьбу диаметром 1 дюйм и резьбой 32 витка на дюйм (1 дюйм-32UN-2A).
- CS-крепление . То же, что и C-Mount , но фокусная точка на 5 мм короче. Объектив с байонетом CS не будет работать с камерой с байонетом C. Крепление CS представляет собой монтажную резьбу диаметром 1 дюйм и плотностью резьбы 32 витка на дюйм.
Д [ править ]
- Матрица данных . Двумерный штрих-код .
- Глубина резкости . В оптике, особенно в фотографии и машинном зрении, глубина резкости (ГРИП) — это расстояние перед и позади объекта, который кажется в фокусе.
- Восприятие глубины . ДП — зрительная способность воспринимать мир в трех измерениях . Это черта, общая для многих высших животных . Восприятие глубины позволяет смотрящему точно измерить расстояние до объекта.
- Диафрагма . В оптике диафрагма представляет собой тонкую непрозрачную структуру с отверстием (апертурой) в центре. Роль диафрагмы состоит в том, чтобы остановить прохождение света, за исключением света, проходящего через апертуру.
Э [ править ]
- Обнаружение края . ED отмечает точки цифрового изображения, в которых интенсивность света резко меняется. Он также отмечает точки изменения силы света объекта или пространственно-таксонного силуэта.
- Электромагнитные помехи . Радиочастотные помехи (RFI) — это электромагнитное излучение, которое излучается электрическими цепями, передающими быстро меняющиеся сигналы, как побочный продукт их нормальной работы и которое вызывает появление нежелательных сигналов (помех или шума) в других цепях.
Ф [ править ]
- FireWire . FireWire (также известный как i. Link или IEEE 1394) — это стандарт интерфейса последовательной шины персонального компьютера (и цифрового аудио/видео), обеспечивающий высокоскоростную связь. Его часто используют в качестве интерфейса для промышленных камер.
- Шум с фиксированной структурой .
- Коррекция плоского поля .
- Захват кадров . Электронное устройство, которое захватывает отдельные цифровые стоп-кадры из аналогового видеосигнала или цифрового видеопотока.
- Техника проекции бахромы . Метод сбора трехмерных данных, в котором используется проектор, отображающий рисунок полос на поверхности измеряемого объекта, и одна или несколько камер, записывающих изображения.
- Поле зрения . Поле зрения (FOV) — это часть, которую система машинного зрения может видеть в определенный момент. Поле зрения зависит от объектива системы и от рабочего расстояния между объектом и камерой.
- Фокус . Говорят, что изображение, точка или область изображения находится в фокусе, если свет от точек объекта максимально хорошо сходится на изображении; и наоборот, он не в фокусе, если свет не сходится хорошо. Границу между этими состояниями иногда определяют по критерию круга нерезкости.
Г [ править ]
- Гамма . В цветопередаче, включая компьютерную графику и фотографию , гамма , или цветовой охват / ˈ ɡ æ m ə t / некое полное подмножество цветов , представляет собой .
- Оттенки серого . Цифровое изображение в оттенках серого — это изображение, в котором значение каждого пикселя представляет собой одну выборку. Отображаемые изображения такого типа обычно состоят из оттенков серого, варьирующихся от черного при самой слабой интенсивности до белого при самой сильной, хотя в принципе образцы могут отображаться как оттенки любого цвета или даже закодироваться различными цветами для различной интенсивности.
- Графический интерфейс . Графический пользовательский интерфейс (или GUI, иногда произносится как «липкий») — это метод взаимодействия с компьютером посредством метафоры прямого манипулирования графическими изображениями и виджетами в дополнение к тексту.
Х [ править ]
- Гистограмма . В статистике гистограмма графическое представляет собой отображение табличных частот . Гистограмма — это графическая версия таблицы, показывающая, какая доля случаев попадает в каждую из нескольких или многих указанных категорий . Гистограмма отличается от гистограммы тем, что значение обозначает площадь столбца, а не высота, что является решающим отличием, когда категории не имеют одинаковой ширины (Ланкастер, 1974). Категории обычно задаются как непересекающиеся интервалы некоторой переменной. Категории (бары) должны быть смежными.
- Гистограмма (Цвет) . В компьютерной графике и фотографии цветовая гистограмма представляет собой представление распределения цветов в изображении, полученное путем подсчета количества пикселей каждого из заданных наборов цветовых диапазонов обычно в двухмерном (2D) или трехмерном ( 3D) цветовое пространство . Гистограмма точки зрения — это стандартное статистическое описание распределения с частоты появления различных классов событий; для цвета классы событий представляют собой области цветового пространства.
- Цветовое пространство HSV . Модель HSV (оттенок, насыщенность, значение), также называемая HSB (оттенок, насыщенность, яркость), определяет цветовое пространство с точки зрения трех составляющих компонентов:
- Оттенок, тип цвета (например, красный, синий или желтый).
- Насыщенность, «вибрация» цвета и колориметрическая чистота.
- Стоимость, яркость цвета
Я [ править ]
- Форматы файлов изображений . Форматы файлов изображений предоставляют стандартизированный метод организации и хранения данных изображений. В этой статье рассматриваются форматы цифровых изображений, используемые для хранения фотографической и другой информации об изображениях. Файлы изображений состоят из пиксельных или векторных (геометрических) данных, которые в процессе отображения растеризуются в пиксели, за некоторыми исключениями при отображении векторной графики. Пиксели, составляющие изображение, имеют форму сетки столбцов и строк. Каждый пиксель изображения хранит цифровые числа, представляющие яркость и цвет.
- Сегментация изображения .
- Инфракрасное изображение . См. Термографическая камера .
- Лампа накаливания . Лампа накаливания генерирует свет с помощью светящейся нити накаливания, нагретой добела электрическим током.
Дж [ править ]
- JPEG . JPEG (произносится как jay-peg) — наиболее часто используемый стандартный метод сжатия с потерями для фотографических изображений.
К [ править ]
- Фактор Келла . Это параметр, используемый для определения эффективного разрешения дискретного устройства отображения.
Л [ править ]
- Лазер . В физике лазер — это устройство, излучающее свет посредством особого механизма, для которого термин «лазер» является аббревиатурой: усиление света за счет вынужденного излучения.
- Объектив . Линза — это устройство, которое заставляет свет сходиться и концентрироваться или рассеиваться, обычно оно изготовлено из куска фигурного стекла. Линзы можно комбинировать для формирования более сложных оптических систем, таких как обычный объектив или телеобъектив .
- Контроллер объектива . Контроллер объектива — это устройство, используемое для управления объективом с электроприводом (ZFI). Контроллеры объектива могут быть встроенными в камеру, набором переключателей, используемых вручную, или сложным устройством, позволяющим управлять объективом с помощью компьютера.
- Освещение . Под освещением понимаются либо искусственные источники света, такие как лампы, либо естественное освещение.
М [ править ]
- Метрология . Метрология – это наука об измерениях. Существует множество применений машинного зрения в метрологии.
- машинное зрение . MV — это применение компьютерного зрения в промышленности и производстве.
- Восприятие движения . MP — это процесс определения скорости и направления объектов и поверхностей, которые движутся в визуальной сцене, с учетом некоторых визуальных данных.
Н [ править ]
- Нейронная сеть . NN — это взаимосвязанная группа искусственных нейронов, которая использует математическую или вычислительную модель для обработки информации, основанную на коннекционистском подходе к вычислениям. В большинстве случаев ИНС представляет собой адаптивную систему, меняющую свою структуру на основе внешней или внутренней информации, проходящей через сеть.
- Нормальный объектив . В машинном зрении нормальная или энтроцентрическая линза — это линза, которая генерирует изображения, которые обычно считаются имеющими «естественную» перспективу по сравнению с линзами с более длинным или коротким фокусным расстоянием. Объективы с более коротким фокусным расстоянием называются широкоугольными, а с более длинным фокусным расстоянием — телеобъективами.
О [ править ]
- Оптическое распознавание символов . Обычно сокращенно OCR, это компьютерное программное обеспечение, предназначенное для перевода изображений машинописного текста (обычно снятого сканером) в текст, редактируемый машиной, или для перевода изображений символов в стандартную схему кодирования, представляющую их в (ASCII или Unicode).
- Оптическое разрешение . Описывает способность системы различать, обнаруживать и/или записывать физические детали с помощью электромагнитных средств. Система может быть отображающей (например, камера) или не отображающей (например, четырехъячеечный лазерный детектор).
- Оптическая передаточная функция .
П [ править ]
- Распознавание образов . Это область машинного обучения. В качестве альтернативы его можно определить как получение необработанных данных и выполнение действий в зависимости от категории данных. Это набор методов контролируемого обучения.
- Пиксель . Пиксель — это одна из многих крошечных точек, которые составляют представление изображения в памяти или на экране компьютера.
- Пикселизация . В компьютерной графике пикселизация — это эффект, вызванный отображением растрового изображения или части растрового изображения такого большого размера, что видны отдельные пиксели, небольшие одноцветные квадратные элементы отображения, составляющие растровое изображение.
- Праймовый объектив . Механическая сборка объективов с фиксированным фокусным расстоянием в отличие от зум-объектива с переменным фокусным расстоянием.
Вопрос [ править ]
- Q-фактор (оптика) . В оптике добротность выражением резонатора резонансного определяется
- ,
где резонансная частота, – запасенная энергия в полости, а рассеивается ли мощность. Оптическая добротность равна отношению резонансной частоты к полосе пропускания резонанса резонатора. Среднее время жизни резонансного фотона в резонаторе пропорционально Q резонатора . Если добротность резонатора лазера света, который намного более интенсивен , резко изменить с низкого значения на высокое, лазер будет излучать импульс чем обычный непрерывный выходной сигнал лазера. Этот метод известен как Q-переключение .
Р [ править ]
- Регион интереса . Область интереса, часто сокращенно называемая ROI, представляет собой выбранное подмножество образцов в наборе данных, предназначенное для определенной цели.
- РГБ . Цветовая модель RGB использует аддитивную модель, в которой красный, зеленый и синий свет комбинируются различными способами для создания других цветов.
- РОИ . См. Область интереса.
- Передний план, фигура и объекты . См. также пространственный таксон.
С [ править ]
- S-видео . Отдельное видео , сокращенно S-Video , также известное как Y/C (или S ошибочно -VHS и «супервидео»), представляет собой аналоговый видеосигнал, который передает видеоданные как два отдельных сигнала (яркость и цвет), в отличие от композитного видео. который передает весь набор сигналов в одной сигнальной линии. S-Video, как это наиболее часто реализуется, передает 480i или 576i видео с высокой пропускной способностью и разрешением , то есть видео стандартной четкости . Он не передает звук по одному и тому же кабелю.
- Принцип Шаймпфлюга .
- Затвор . Затвор — это устройство, которое пропускает свет в течение определенного периода времени с целью воздействия на датчик изображения нужного количества света для создания постоянного изображения вида.
- Скорость затвора . В машинном зрении выдержка — это время, в течение которого затвор остается открытым во время съемки изображения, чтобы свет мог достичь датчика изображения. В сочетании с изменением апертуры объектива это регулирует количество света, которое будет получать датчик изображения цифровой камеры.
- Умная камера . Интеллектуальная камера — это интегрированная система машинного зрения, которая, помимо схемы захвата изображений, включает в себя процессор, который может извлекать информацию из изображений без необходимости использования внешнего процессора, и интерфейсные устройства, используемые для предоставления результатов другим устройствам.
- Пространственный-таксон . Пространственные таксоны — это информационные гранулы, состоящие из неисключающих друг друга областей пикселей в архитектуре сцены. Они подобны гештальт-психологическому обозначению фона фигуры, но расширены и включают передний план, группы объектов, объекты и заметные части объекта.
- 3D-сканер со структурированным светом . Процесс проецирования известного рисунка освещения (часто сеток или горизонтальных полос) на сцену. То, как эти узоры деформируются при ударе о поверхности, позволяет системам машинного зрения рассчитывать информацию о глубине и поверхности объектов на сцене.
- СВГА . Super Video Graphics Array, почти всегда сокращенно Super VGA или просто SVGA, представляет собой широкий термин, охватывающий широкий спектр компьютерных стандартов отображения.
Т [ править ]
- Телецентрическая линза . Сложная линза с необычным свойством геометрии лучей, формирующих изображение. В системах машинного зрения телецентрические линзы обычно используются для достижения размерной и геометрической неизменности изображений в диапазоне различных расстояний от линзы и по всему полю зрения.
- Телеобъектив . Объектив, фокусное расстояние которого значительно больше фокусного расстояния обычного объектива.
- Термография . Тепловидение, разновидность инфракрасного изображения .
- ТИФФ . Формат файла изображения с тегами (сокращенно TIFF) — это формат файла, в основном предназначенный для хранения изображений, включая фотографии и штриховые рисунки.
У [ править ]
- USB . Универсальная последовательная шина (USB) обеспечивает стандарт последовательной шины для подключения устройств, обычно к компьютерам, например ПК, но также становится обычным явлением для камер.
V [ edit ]
- ВЕСА . Ассоциация по стандартизации видеоэлектроники (VESA) — это международная организация, основанная в конце 1980-х годов компанией NEC Home Electronics и восемью другими производителями видеоадаптеров. Первоначальной целью было создание стандарта SVGA видеодисплеев с разрешением 800×600. С тех пор VESA выпустила ряд стандартов, в основном касающихся функций видеопериферийных устройств в IBM PC совместимых с компьютерах, .
- ВГА . Video Graphics Array (VGA) — это стандарт компьютерного дисплея, впервые представленный на рынке компанией IBM в 1987 году .
- Блок обработки изображений . Класс микропроцессоров, предназначенный для ускорения задач машинного зрения.
В [ править ]
- Широкоугольный объектив . В фотографии и кинематографии широкоугольным объективом называют объектив, фокусное расстояние которого короче фокусного расстояния обычного объектива.
Х [ править ]
- Рентгеновские снимки . Форма электромагнитного излучения с длиной волны от 10 до 0,01 нанометра, соответствующая частотам от 30 до 3000 ФГц (10 15 герц). Рентгеновские лучи в основном используются для диагностической медицинской и промышленной визуализации, а также для кристаллографии. Рентгеновские лучи являются формой ионизирующего излучения и поэтому могут быть опасными.
Ю [ править ]
- Y-кабель . или Y-кабель Y -кабель — это электрический кабель, содержащий три конца, один из которых является общим концом, что, в свою очередь, приводит к расщеплению на два оставшихся конца, напоминающие букву « Y ». Y-образные кабели обычно, но не обязательно, короткие (менее 12 дюймов), и их концы часто подключаются к другим кабелям. Использование может быть как простым, например, разделение одного аудио- или видеоканала на два, так и более сложным, например, соединение сигналов от компьютерного разъема высокой плотности с соответствующим периферийным устройством .
З [ править ]
- Зум-объектив . Механическая сборка линз, фокусное расстояние которых можно изменять, в отличие от объектива с фиксированным фокусным расстоянием. См. анимацию принципа масштабирования ниже.
См. также [ править ]
- Глоссарий искусственного интеллекта
- Захват кадров
- Google очки
- Глоссарий машинного зрения
- Морфологическая обработка изображений
- OpenCV
- Умная камера
Ссылки [ править ]
- ^ Хартли, Ричард И. (15 мая 1998 г.). «Минимизация алгебраической ошибки» (PDF) . Философские труды Лондонского королевского общества. Серия А: Математические, физические и технические науки . 356 (1740): 1175–1192. Бибкод : 1998RSPTA.356.1175H . дои : 10.1098/rsta.1998.0216 . S2CID 2842771 .