Цифровая обработка изображений

Из Википедии, бесплатной энциклопедии
(Перенаправлено из Обработка изображений )

Цифровая обработка изображений — это использование цифрового компьютера для обработки цифровых изображений с помощью алгоритма . [1] [2] Как подкатегория или область цифровой обработки сигналов , цифровая обработка изображений имеет много преимуществ по сравнению с аналоговой обработкой изображений . Это позволяет применять гораздо более широкий диапазон алгоритмов к входным данным и позволяет избежать таких проблем, как накопление шума и искажений во время обработки. Поскольку изображения определяются в двух измерениях (возможно, и в большем количестве), цифровая обработка изображений может быть смоделирована в виде многомерных систем . На создание и развитие цифровой обработки изображений в основном влияют три фактора: во-первых, развитие компьютеров; [3] во-вторых, развитие математики (особенно создание и совершенствование теории дискретной математики); [4] в-третьих, увеличился спрос на широкий спектр применений в окружающей среде, сельском хозяйстве, военной промышленности, промышленности и медицине. [5]

История [ править ]

Многие методы цифровой обработки изображений , или цифровой обработки изображений, как ее часто называли, были разработаны в 1960-х годах в Bell Laboratories , Лаборатории реактивного движения , Массачусетском технологическом институте , Университете Мэриленда и нескольких других исследовательских центрах. с применением к спутниковым изображениям , проводной фотографии преобразованию стандартов , медицинской визуализации , видеофону , распознаванию символов и улучшению фотографий. [6] Целью ранней обработки изображений было улучшение качества изображения. Он был нацелен на людей, чтобы улучшить визуальный эффект людей. При обработке изображений входными данными являются изображения низкого качества, а выходными — изображения улучшенного качества. Обычная обработка изображений включает в себя улучшение, восстановление, кодирование и сжатие изображений. Первой успешной заявкой стала Американская лаборатория реактивного движения (JPL). Они использовали такие методы обработки изображений, как геометрическая коррекция, преобразование градаций, удаление шума и т. д., на тысячах лунных фотографий, отправленных космическим детектором Ranger 7 в 1964 году, принимая во внимание положение Солнца и окружающую среду Луны. Результативность успешного картирования карты поверхности Луны с помощью компьютера оказалась успешной. Позже была проведена более сложная обработка изображений почти 100 000 фотографий, отправленных космическим кораблем, в результате чего были получены топографическая карта, цветная карта и панорамная мозаика Луны, что позволило добиться выдающихся результатов и заложило прочную основу для высадки человека на Землю. Луна. [7]

Однако стоимость обработки была довольно высокой для вычислительного оборудования той эпохи. Ситуация изменилась в 1970-х годах, когда цифровая обработка изображений получила распространение, поскольку стали доступны более дешевые компьютеры и специализированное оборудование. Это привело к тому, что изображения обрабатывались в режиме реального времени для решения некоторых специализированных задач, таких как преобразование телевизионных стандартов . По мере того, как компьютеры общего назначения становились быстрее, они начали брать на себя роль специализированного оборудования для всех операций, кроме самых специализированных и ресурсоемких. С появлением в 2000-х годах быстрых компьютеров и процессоров обработки сигналов цифровая обработка изображений стала наиболее распространенной формой обработки изображений и широко используется, поскольку это не только самый универсальный, но и самый дешевый метод.

Датчики изображения [ править ]

В основе современных датчиков изображения лежит технология металл-оксид-полупроводник (МОП). [8] который берет свое начало с изобретения МОП-транзистора (МОП-полевого транзистора) Мохамедом М. Аталлой и Давоном Кангом в Bell Labs в 1959 году. [9] Это привело к разработке цифровых полупроводниковых датчиков изображения, в том числе устройств с зарядовой связью (CCD), а затем и CMOS-датчика . [8]

Устройство с зарядовой связью было изобретено Уиллардом С. Бойлом и Джорджем Э. Смитом в Bell Labs в 1969 году. [10] Исследуя технологию МОП, они поняли, что электрический заряд аналогичен магнитному пузырю и что его можно хранить в крошечном МОП-конденсаторе . было довольно просто , к ним подавали подходящее напряжение, чтобы можно было поэтапно перемещать заряд от одного к другому. Поскольку изготовить серию МОП-конденсаторов подряд [8] ПЗС — полупроводниковая схема, которая позже использовалась в первых цифровых видеокамерах для телевизионного вещания . [11]

NMOS в Датчик активных пикселей (APS) был изобретен компанией Olympus Японии в середине 1980-х годов. Это стало возможным благодаря достижениям в производстве полупроводниковых МОП-приборов , когда масштабирование МОП-транзисторов достигло меньших микронных, а затем и субмикронных уровней. [12] [13] NMOS APS был изготовлен командой Цутому Накамуры на Олимпе в 1985 году. [14] Датчик CMOS с активными пикселями (CMOS-сенсор) был позже разработан Эрика Фоссума командой НАСА в Лаборатории реактивного движения в 1993 году. [15] К 2007 году продажи датчиков CMOS превысили продажи датчиков CCD. [16]

МОП-датчики изображения широко используются в технологии оптических мышей . Первая оптическая мышь, изобретенная Ричардом Ф. Лайоном из Xerox в 1980 году, использовала с размером 5   мкм чип NMOS сенсорный . [17] [18] Начиная с первой коммерческой оптической мыши IntelliMouse , представленной в 1999 году, в большинстве оптических мышей используются датчики CMOS. [19] [20]

Сжатие изображения [ править ]

Важным достижением в технологии сжатия цифровых изображений стало дискретное косинусное преобразование (DCT), метод сжатия с потерями, впервые предложенный Насиром Ахмедом в 1972 году. [21] Сжатие DCT стало основой формата JPEG , который был представлен Объединенной группой экспертов по фотографии в 1992 году. [22] JPEG сжимает изображения до файлов гораздо меньшего размера и стал наиболее широко используемым форматом файлов изображений в Интернете . [23] Его высокоэффективный алгоритм сжатия DCT во многом способствовал широкому распространению цифровых изображений и цифровых фотографий . [24] с несколькими миллиардами изображений JPEG, создаваемыми каждый день по состоянию на 2015 год. . [25]

Методы медицинской визуализации позволяют получить очень большие объемы данных, особенно с помощью КТ, МРТ и ПЭТ. В результате хранение и передача данных электронного изображения без использования сжатия становятся невозможными. [26] [27] Сжатие изображений JPEG 2000 используется стандартом DICOM для хранения и передачи медицинских изображений. Стоимость и возможность доступа к большим наборам данных изображений по низкой или различной полосе пропускания дополнительно решаются за счет использования другого стандарта DICOM, называемого JPIP , для обеспечения эффективной потоковой передачи сжатых данных изображения JPEG 2000 . [28]

Цифровой сигнальный процессор (DSP) [ править ]

Электронная обработка сигналов произвела революцию благодаря широкому распространению МОП-технологии в 1970-х годах. [29] Технология интегральных схем МОП легла в основу первых однокристальных микропроцессоров и микроконтроллеров в начале 1970-х годов. [30] а затем первые однокристальные процессоры цифровых сигналов (DSP) в конце 1970-х годов. [31] [32] Чипы DSP с тех пор широко используются в цифровой обработке изображений. [31]

Алгоритм с дискретным косинусным преобразованием (DCT) сжатия изображений широко реализован в чипах DSP, при этом многие компании разрабатывают чипы DSP на основе технологии DCT. DCT широко используются для кодирования , декодирования, видеокодирования , аудиокодирования , мультиплексирования , сигналов управления, сигнализации , аналого-цифрового преобразования , форматирования яркости и цветовых различий, а также цветовых форматов, таких как YUV444 и YUV411 . DCT также используются для операций кодирования, таких как оценка движения , компенсация движения , межкадровое предсказание, квантование , перцепционное взвешивание, энтропийное кодирование , переменное кодирование и векторы движения , а также операций декодирования, таких как обратная операция между различными цветовыми форматами ( YIQ , YUV и RGB ) для отображения. DCT также широко используются в телевидения высокой четкости (HDTV). чипах кодеров/декодеров [33]

Медицинская визуализация

В 1972 году инженер британской компании EMI Housfield изобрел рентгеновский компьютерный томограф для диагностики головы, который обычно называют КТ (компьютерная томография). Метод ядра КТ основан на проекции сечения головы человека и обрабатывается компьютером для реконструкции изображения поперечного сечения, что называется реконструкцией изображения. В 1975 году компания EMI успешно разработала компьютерную томографию всего тела, которая позволила получить четкое томографическое изображение различных частей человеческого тела. В 1979 году этот метод диагностики получил Нобелевскую премию. [7] Технология цифровой обработки изображений для медицинских применений была введена в Космического фонда в 1994 году. Зал славы космических технологий [34]

По состоянию на 2010 год во всем мире было проведено 5 миллиардов медицинских визуализационных исследований. [35] [36] Радиационное облучение от медицинской визуализации в 2006 году составило около 50% от общего воздействия ионизирующего излучения в Соединенных Штатах. [37] Медицинское оборудование для визуализации производится с использованием технологий полупроводниковой промышленности , включая микросхемы КМОП интегральные , силовые полупроводниковые устройства , датчики , такие как датчики изображения (особенно датчики КМОП ) и биосенсоры , а также процессоры, такие как микроконтроллеры , микропроцессоры , процессоры цифровых сигналов , медиапроцессоры и устройства системы-на-кристалле . По состоянию на 2015 год Годовые поставки чипов для медицинской визуализации составляют 46   миллионов единиц и 1,1 миллиарда долларов . [38] [39]

Задачи [ править ]

Цифровая обработка изображений позволяет использовать гораздо более сложные алгоритмы и, следовательно, может обеспечить как более высокую производительность при решении простых задач, так и реализацию методов, которые были бы невозможны с помощью аналоговых средств.

В частности, цифровая обработка изображений представляет собой конкретное применение и практическую технологию, основанную на:

Некоторые методы, используемые при цифровой обработке изображений, включают:

цифровых Преобразования изображений

Фильтрация [ править ]

Цифровые фильтры используются для размытия и повышения резкости цифровых изображений. Фильтрация может осуществляться:

  • свертка со специально разработанными ядрами (массивом фильтров) в пространственной области [40]
  • маскирование определенных частотных областей в частотной (Фурье) области

В следующих примерах показаны оба метода: [41]

Тип фильтра Ядро или маска Пример
Исходное изображение
Пространственный фильтр нижних частот
Пространственный фильтр высоких частот
Представление Фурье Псевдокод:

изображение = шахматная доска

F = преобразование Фурье изображения

Показать изображение: log(1+абсолютное значение(F))

Фурье нижних частот
Фурье Highpass

Заполнение изображений при фильтрации домена Фурье [ править ]

Изображения обычно дополняются перед преобразованием в пространство Фурье. Изображения с фильтром верхних частот ниже иллюстрируют последствия различных методов заполнения:

Нулевой дополненный Повторный край с мягкой подкладкой

Обратите внимание, что фильтр верхних частот показывает дополнительные края при дополнении нулями по сравнению с повторным заполнением краев.

Примеры кода фильтрации [ править ]

Пример MATLAB для фильтрации верхних частот пространственной области.

img  =  шахматная доска  (  20  );                              % генерировать шахматную доску 
 % **************************** ПРОСТРАНСТВЕННЫЙ ДОМЕН ****************** ********* 
 klaplace  =[  0   -  1   0  ;    -  1   5   -  1  ;     0   -  1   0  ];                % Ядро фильтра Лапласа 
 X  =  conv2  (  img  ,  klaplace  );                             % тест свертки изображения с 
                                                 % 3x3 
 фигурой  ядра Лапласа () 
 imshow  (  X  ,[])                                      % показать 
 заголовок,  отфильтрованный по Лапласу (  'Обнаружение края Лапласа'  ) 

Аффинные преобразования [ править ]

Аффинные преобразования позволяют выполнять базовые преобразования изображений, включая масштабирование, поворот, перемещение, зеркальное отображение и сдвиг, как показано в следующих примерах: [41]

Имя преобразования Аффинная матрица Пример
Личность
Отражение
Шкала
Поворот где θ = π / 6 =30°
сдвиг

Чтобы применить аффинную матрицу к изображению, изображение преобразуется в матрицу, в которой каждая запись соответствует интенсивности пикселей в этом месте. Тогда местоположение каждого пикселя можно представить в виде вектора, указывающего координаты этого пикселя на изображении [x, y], где x и y — это строка и столбец пикселя в матрице изображения. Это позволяет умножить координату на матрицу аффинного преобразования, которая дает позицию, в которую значение пикселя будет скопировано в выходном изображении.

трехмерные однородные координаты Однако для осуществления преобразований, требующих преобразований перемещения, необходимы . Третьему измерению обычно присваивается ненулевая константа, обычно 1, так что новая координата равна [x, y, 1]. Это позволяет умножить вектор координат на матрицу 3 на 3, что обеспечивает сдвиг поступательного движения. Таким образом, третье измерение, константа 1, допускает перевод.

Поскольку умножение матриц является ассоциативным, несколько аффинных преобразований можно объединить в одно аффинное преобразование путем умножения матрицы каждого отдельного преобразования в том порядке, в котором они выполняются. В результате получается одна матрица, которая при применении к точечному вектору дает тот же результат, что и все отдельные преобразования, выполняемые над вектором [x, y, 1] последовательно. Таким образом, последовательность матриц аффинного преобразования можно свести к одной матрице аффинного преобразования.

Например, двумерные координаты допускают вращение только вокруг начала координат (0, 0). Но трехмерные однородные координаты можно использовать для того, чтобы сначала перевести любую точку в (0, 0), затем выполнить поворот и, наконец, перевести начало координат (0, 0) обратно в исходную точку (противоположно первому перемещению). Эти три аффинных преобразования можно объединить в одну матрицу, что позволит осуществлять вращение вокруг любой точки изображения. [42]

шума изображения с помощью Удаление морфологии

Математическая морфология подходит для шумоподавления изображений. Структурирующие элементы важны в математической морфологии .

Следующие примеры посвящены элементам структурирования. Функция шумоподавления, изображение как I и элемент структурирования как B показаны ниже и в таблице.

например

Определим Dilation(I, B)(i,j) = . Пусть Расширение(I,B) = D(I,B)

D(I', B)(1,1) =

Определим Erosion(I, B)(i,j) = . Пусть Эрозия(I,B) = E(I,B)

Е(I', B)(1,1) =

После расширения После эрозии

Метод открытия — это просто сначала эрозия, а затем расширение, а метод закрытия — наоборот. В действительности D(I,B) и E(I,B) могут быть реализованы с помощью Convolution.

Структурирующий элемент Маска Код Пример
Исходное изображение Никто Используйте Matlab для чтения исходного изображения
оригинал   =   imread  (  'scene.jpg'  ); 
  изображение   =   rgb2gray  (  оригинал  ); 
  [  r  ,   c  ,   канал  ]   =   размер  (  изображение  ); 
  se   =   логический  ([  1   1   1   ;   1   1   1   ;   1   1   1])  ; 
  [  п  ,   q  ]   =   размер  (  SE  ); 
  halfH   =   пол  (  п  /  2  ); 
  halfW   =   пол  (  q  /  2  ); 
  время   =   3  ;              % шумоподавления 3 раза всеми методами 
Оригинальный лотос
Расширение Используйте Matlab для расширения
imwrite  (  image  ,   "scene_dil.jpg"  ) 
 extractmax   =   нули  (  размер  (  изображение  ),   класс  (  изображение  )); 
  для   i   =   1   :   время 
     dil_image   =   imread  (  'scene_dil.jpg'  ); 
      для   col   =   (  halfW   +   1  ):   (  c   -   halfW  ) 
         для   строки   =   (  halfH   +   1  )   :   (  r   -   halfH  ) 
             dpointD   =   row   -   halfH  ; 
              dpointU   =   строка   +   halfH  ; 
              dpointL   =   col   -   halfW  ; 
              dpointR   =   col   +   halfW  ; 
              dneighbor   =   dil_image  (  dpointD  :  dpointU  ,   dpointL  :  dpointR  ); 
              фильтр   =   сосед  (  SE  ); 
              экстрактмакс  (  строка  ,   столбец  )   =   макс  (  фильтр  ); 
          конец 
     конец 
     imwrite  (  extractmax  ,   "scene_dil.jpg"  ); 
  конец 
Шумоподавление изображения методом расширения
Эрозия Используйте Matlab для эрозии
imwrite  (  изображение  ,   'scene_ero.jpg'  ); 
  Extractmin   =   нули  (  размер  (  изображение  ),   класс  (  изображение  )); 
  для   i   =   1  :   время 
     ero_image   =   imread  (  'scene_ero.jpg'  ); 
      для   col   =   (  halfW   +   1  ):   (  c   -   halfW  ) 
         для   строки   =   (  halfH   +  1  ):   (  r   -  halfH  ) 
             pointDown   =   row  -  halfH  ; 
              pointUp   =   строка  +  halfH  ; 
              pointLeft   =   col  -  halfW  ; 
              pointRight   =   col  +  halfW  ; 
              сосед   =   ero_image  (  pointDown  :  pointUp  ,  pointLeft  :  pointRight  ); 
              фильтр   =   сосед  (  se  ); 
              экстрактмин  (  строка  ,   столбец  )   =   мин  (  фильтр  ); 
          конец 
     конец 
     imwrite  (  extractmin  ,   «scene_ero.jpg»  ); 
  конец 
Открытие Используйте Matlab для открытия
imwrite  (  extractmin  ,   «scene_opening.jpg»  ) 
 extractopen   =   нули  (  размер  (  изображение  ),   класс  (  изображение  )); 
  для   i   =   1   :   время 
     dil_image   =   imread  (  'scene_opening.jpg'  ); 
      для   col   =   (  halfW   +   1  ):   (  c   -   halfW  ) 
         для   строки   =   (  halfH   +   1  )   :   (  r   -   halfH  ) 
             dpointD   =   row   -   halfH  ; 
              dpointU   =   строка   +   halfH  ; 
              dpointL   =   col   -   halfW  ; 
              dpointR   =   col   +   halfW  ; 
              dneighbor   =   dil_image  (  dpointD  :  dpointU  ,   dpointL  :  dpointR  ); 
              фильтр   =   сосед  (  SE  ); 
              ExtractOpen  (  строка  ,   столбец  )   =   Макс  (  фильтр  ); 
          конец 
     конца 
     imwrite  (  extractopen  ,   «scene_opening.jpg»  ); 
  конец 
Закрытие Используйте Matlab для закрытия
imwrite  (  extractmax  ,   "scene_closing.jpg"  ) 
 extractclose   =   нули  (  размер  (  изображение  ),   класс  (  изображение  )); 
  для   i   =   1   :   время 
     ero_image   =   imread  (  'scene_closing.jpg'  ); 
      для   col   =   (  halfW   +   1  ):   (  c   -   halfW  ) 
         для   строки   =   (  halfH   +   1  )   :   (  r   -   halfH  ) 
             dpointD   =   row   -   halfH  ; 
              dpointU   =   строка   +   halfH  ; 
              dpointL   =   col   -   halfW  ; 
              dpointR   =   col   +   halfW  ; 
              dneighbor   =   ero_image  (  dpointD  :  dpointU  ,   dpointL  :  dpointR  ); 
              фильтр   =   сосед  (  SE  ); 
              ExtractClose  (  строка  ,   столбец  )   =   мин  (  фильтр  ); 
          конец 
     конца 
     imwrite  (  extractclose  ,   "scene_closing.jpg"  ); 
  конец 
Шумоподавление изображения методом закрытия

Приложения [ править ]

Изображения цифровой камеры [ править ]

Цифровые камеры обычно включают в себя специализированное оборудование для обработки цифровых изображений — либо специальные чипы, либо дополнительные схемы на других чипах — для преобразования необработанных данных с датчика изображения в изображение с цветокоррекцией в стандартном формате файла изображения . Дополнительные методы постобработки повышают резкость краев или насыщенность цвета, что позволяет создавать изображения более естественного вида.

Фильм [ править ]

«Мир Дикого Запада» (1973) был первым художественным фильмом, в котором цифровая обработка изображений использовалась для пикселизации фотографии, чтобы имитировать точку зрения андроида. [43] Обработка изображений также широко используется для создания эффекта хромакей , который заменяет фон актеров естественными или художественными декорациями.

Распознавание лиц [ править ]

Процесс обнаружения лиц

Обнаружение лиц может быть реализовано с помощью математической морфологии , дискретного косинусного преобразования , которое обычно называется DCT, и горизонтальной проекции (математика) .

Общий метод с методом, основанным на признаках

Метод распознавания лиц на основе функций использует тон кожи, определение краев, форму лица и особенности лица (например, глаза, рот и т. д.) для обнаружения лица. Тон кожи, форма лица и все уникальные элементы, которыми обладает только человеческое лицо, можно назвать чертами.

Объяснение процесса

  1. Учитывая набор изображений лиц, сначала извлеките диапазон оттенков кожи, выбрав изображения лиц. Диапазон тона кожи — это всего лишь скин-фильтр.
    1. Мера индекса структурного сходства (SSIM) может применяться для сравнения изображений с точки зрения выделения тона кожи.
    2. Обычно для скин-фильтра подходят цветовые пространства HSV или RGB. Например, в режиме HSV диапазон оттенков кожи составляет [0,48,50] ~ [20,255,255]
  2. После фильтрации изображений по тону кожи, чтобы получить края лица, используются морфология и DCT для удаления шума и заполнения недостающих участков кожи.
    1. Для заполнения недостающей кожи можно использовать метод открытия или метод закрытия.
    2. DCT заключается в том, чтобы избегать объектов с кожей тона. Так как человеческие лица всегда имеют более высокую фактуру.
    3. Для обнаружения края грани можно применять оператор Собеля или другие операторы.
  3. Чтобы расположить человеческие черты, такие как глаза, с помощью проекции и найти пик гистограммы проекции, можно получить такие детализированные детали, как рот, волосы и губы.
    1. Проекция — это просто проецирование изображения, чтобы увидеть высокую частоту, которая обычно является положением объекта.

Метод улучшения качества изображения [ править ]

На качество изображения могут влиять вибрация камеры, передержка, слишком централизованное распределение уровней серого, шум и т. д. Например, проблему шума можно решить с помощью метода сглаживания , а проблему распределения уровней серого можно улучшить с помощью выравнивания гистограммы .

сглаживания Метод

В рисовании, если есть какой-то неудовлетворительный цвет, нужно взять немного цвета вокруг неудовлетворительного цвета и усреднить их. Это простой способ думать о методе сглаживания.

Метод сглаживания можно реализовать с помощью маски и свертки . Возьмите маленькое изображение и маску, например, как показано ниже.

изображение

маска

После свертки и сглаживания изображение

Просмотр изображения [1, 1], изображения [1, 2], изображения [2, 1] и изображения [2, 2].

Исходный пиксель изображения имеет номера 1, 4, 28, 30. После маски сглаживания пиксель становится 9, 10, 9, 9 соответственно.

новое изображение[1, 1] = * (изображение[0,0]+изображение[0,1]+изображение[0,2]+изображение[1,0]+изображение[1,1]+изображение[1,2]+изображение[2,0] +изображение[2,1]+изображение[2,2])

новое изображение[1, 1] = пол( * (2+5+6+3+1+4+1+28+30)) = 9

новое изображение[1, 2] = пол({ * (5+6+5+1+4+6+28+30+2)) = 10

новое изображение[2, 1] = пол( * (3+1+4+1+28+30+7+3+2)) = 9

новое изображение[2, 2] = пол( * (1+4+6+28+30+2+3+2+2)) = 9

Метод гистограммы уровней серого

Как правило, приведена гистограмма уровней серого на изображении, как показано ниже. Изменение гистограммы на равномерное распределение изображения обычно называется тем, что мы называем выравниванием гистограммы .

Рисунок 1
фигура 2

В дискретное время площадь гистограммы уровней серого равна (см. рисунок 1), а область равномерного распределения равна (см. рисунок 2). Понятно, что площадь не изменится, поэтому .

Из равномерного распределения вероятность является в то время

В непрерывном времени уравнение имеет вид .

Более того, исходя из определения функции, метод гистограммы уровня серого подобен поиску функции которое удовлетворяет условию f(p)=q.

Метод улучшения Проблема До улучшения Процесс После улучшения
Метод сглаживания шум

с Matlab добавлена ​​соль и перец с параметром 0,01
к исходному изображению, чтобы создать зашумленное изображение.

  1. прочитать изображение и преобразовать изображение в оттенки серого
  2. свертка серого изображения с маской
  3. Изображение с шумоподавлением будет результатом шага 2.
Выравнивание гистограммы Распределение уровней серого слишком централизовано
См. выравнивание гистограммы.

Проблемы [ править ]

  1. Шумы и искажения . Несовершенства изображений из-за плохого освещения, ограниченных сенсоров и сжатия файлов могут привести к нечеткости изображений, что повлияет на точность преобразования изображений.
  2. Непостоянство качества изображения . Различия в качестве и разрешении изображения, в том числе размытые изображения и неполные детали, могут препятствовать единообразной обработке в базе данных.
  3. объектов Обнаружение и распознавание . Идентификация и распознавание объектов на изображениях, особенно в сложных сценариях с несколькими объектами и окклюзиями, представляет собой серьезную проблему.
  4. Аннотации и маркировка данных . Маркировка разнообразных и множественных изображений для машинного распознавания имеет решающее значение для дальнейшей точности обработки, поскольку неправильная идентификация может привести к нереалистичным результатам.
  5. Интенсивность вычислительных ресурсов . Доступ к адекватным вычислительным ресурсам для обработки изображений может быть сложным и дорогостоящим, что препятствует прогрессу без достаточных ресурсов.

См. также [ править ]

Ссылки [ править ]

  1. ^ Чакраворти, Прагнан (2018). «Что такое сигнал? [Конспект лекций]». Журнал обработки сигналов IEEE . 35 (5): 175–177. Бибкод : 2018ISPM...35e.175C . дои : 10.1109/MSP.2018.2832195 . S2CID   52164353 .
  2. ^ Гонсалес, Рафаэль (2018). Цифровая обработка изображений . Нью-Йорк, штат Нью-Йорк: Пирсон. ISBN  978-0-13-335672-4 . OCLC   966609831 .
  3. ^ Нагорнов Николай Н.; Ляхов Павел А.; Бергерман, Максим В.; Калита, Диана И. (2024). «Современные тенденции улучшения технических характеристик устройств и систем цифровой обработки изображений» . Доступ IEEE . 12 : 44659–44681. дои : 10.1109/ACCESS.2024.3381493 . ISSN   2169-3536 .
  4. ^ Ямни, Мохамед; Дауи, Ахраф; Абд Эль-Латиф, Ахмед А. (февраль 2024 г.). «Эффективная стеганография цветных изображений на основе новой адаптированной хаотической динамической системы с дискретными ортогональными преобразованиями моментов» . Математика и компьютеры в моделировании . дои : 10.1016/j.matcom.2024.01.023 .
  5. ^ Хун, Че-Лунь (28 мая 2020 г.). «Вычислительные алгоритмы обработки медицинских изображений» . Текущая медицинская визуализация Ранее текущие обзоры медицинской визуализации . 16 (5): 467–468. дои : 10.2174/157340561605200410144743 .
  6. ^ Азриэль Розенфельд, Обработка изображений с помощью компьютера , Нью-Йорк: Academic Press, 1969.
  7. ^ Перейти обратно: а б Гонсалес, Рафаэль К. (2008). Цифровая обработка изображений . Вудс, Ричард Э. (Ричард Юджин), 1954– (3-е изд.). Река Аппер-Седл, Нью-Джерси: Прентис-Холл. стр. 23–28. ISBN  978-0-13-168728-8 . OCLC   137312858 .
  8. ^ Перейти обратно: а б с Уильямс, Дж. Б. (2017). Электронная революция: изобретая будущее . Спрингер. стр. 245–8. ISBN  978-3-319-49088-5 .
  9. ^ «1960: Демонстрация металлооксидно-полупроводникового (МОП) транзистора» . Кремниевый двигатель . Музей истории компьютеров . Архивировано из оригинала 3 октября 2019 года . Проверено 31 августа 2019 г.
  10. ^ Джеймс Р. Джейнесик (2001). Научные устройства с зарядовой связью . СПАЙ Пресс. стр. 3–4. ISBN  978-0-8194-3698-6 .
  11. ^ Бойл, Уильям С; Смит, Джордж Э. (1970). «Полупроводниковые приборы с зарядовой связью». Белл Сист. Тех. Дж . 49 (4): 587–593. Бибкод : 1970BSTJ...49..587B . дои : 10.1002/j.1538-7305.1970.tb01790.x .
  12. ^ Фоссум, Эрик Р. (12 июля 1993 г.). «Активные пиксельные датчики: CCDS — динозавры?». В Блоуке, Морли М. (ред.). Приборы с зарядовой связью и твердотельные оптические датчики III . Труды SPIE. Том. 1900. стр. 2–14. Бибкод : 1993SPIE.1900....2F . CiteSeerX   10.1.1.408.6558 . дои : 10.1117/12.148585 . S2CID   10556755 .
  13. ^ Фоссум, Эрик Р. (2007). «Активные пиксельные датчики» (PDF) . Эрик Фоссум . S2CID   18831792 . Архивировано (PDF) из оригинала 29 августа 2019 года.
  14. ^ Мацумото, Казуя; и другие. (1985). «Новый МОП-фототранзистор, работающий в режиме неразрушающего считывания». Японский журнал прикладной физики . 24 (5А): Л323. Бибкод : 1985JaJAP..24L.323M . дои : 10.1143/JJAP.24.L323 . S2CID   108450116 .
  15. ^ Фоссум, Эрик Р .; Хондонгва, Д.Б. (2014). «Обзор закрепленного фотодиода для датчиков изображения CCD и CMOS» . Журнал IEEE Общества электронных устройств . 2 (3): 33–43. дои : 10.1109/JEDS.2014.2306412 .
  16. ^ «Продажи CMOS-датчиков изображения остаются рекордными» . IC-инсайты . 8 мая 2018 года. Архивировано из оригинала 21 июня 2019 года . Проверено 6 октября 2019 г.
  17. ^ Лион, Ричард Ф. (2014). «Оптическая мышь: раннее биомиметическое встроенное зрение» . Достижения в области встроенного компьютерного зрения . Спрингер. стр. 3–22 (3). ISBN  9783319093871 .
  18. ^ Лион, Ричард Ф. (август 1981 г.). «Оптическая мышь и архитектурная методология интеллектуальных цифровых датчиков» (PDF) . В ХТ Кунг; Роберт Ф. Спроулл; Гай Л. Стил (ред.). Системы СБИС и вычисления . Пресса по информатике. стр. 1–19. дои : 10.1007/978-3-642-68402-9_1 . ISBN  978-3-642-68404-3 . S2CID   60722329 . Архивировано (PDF) из оригинала 26 февраля 2014 года.
  19. ^ Брэйн, Маршалл; Кармак, Кармен (24 апреля 2000 г.). «Как работают компьютерные мыши» . Как это работает . Проверено 9 октября 2019 г.
  20. ^ Бенчофф, Брайан (17 апреля 2016 г.). «Создание первой цифровой камеры» . Хакадей . Проверено 30 апреля 2016 г. Циклоп был первым цифровым фотоаппаратом
  21. ^ Ахмед, Насир (январь 1991 г.). «Как я придумал дискретное косинусное преобразование» . Цифровая обработка сигналов . 1 (1): 4–5. Бибкод : 1991DSP.....1....4A . дои : 10.1016/1051-2004(91)90086-Z . Архивировано из оригинала 10 июня 2016 года . Проверено 10 октября 2019 г.
  22. ^ «T.81 – Цифровое сжатие и кодирование неподвижных изображений с непрерывным тоном – требования и рекомендации» (PDF) . ССИТТ . Сентябрь 1992 г. Архивировано (PDF) из оригинала 17 июля 2019 г. Проверено 12 июля 2019 г.
  23. ^ Светлик, Джо (31 мая 2018 г.). «Описание формата изображения JPEG» . Группа БТ . Архивировано из оригинала 5 августа 2019 года . Проверено 5 августа 2019 г.
  24. ^ Каплан, Пол (24 сентября 2013 г.). «Что такое JPEG? Невидимый объект, который вы видите каждый день» . Атлантический океан . Архивировано из оригинала 9 октября 2019 года . Проверено 13 сентября 2019 г.
  25. ^ Баранюк, Крис (15 октября 2015 г.). «Изоляция JPeg: варианты ограничения, предложенные комитетом» . Новости BBC . Архивировано из оригинала 9 октября 2019 года . Проверено 13 сентября 2019 г.
  26. ^ Нагорнов Николай Н.; Ляхов Павел А.; Валуева Мария Владимировна; Бергерман, Максим В. (2022). «Ускорители FPGA на основе RNS для высококачественной вейвлет-обработки 3D медицинских изображений с использованием масштабированных коэффициентов фильтра» . Доступ IEEE . 10 : 19215–19231. Бибкод : 2022IEEEA..1019215N . дои : 10.1109/ACCESS.2022.3151361 . ISSN   2169-3536 . S2CID   246895876 . Системы медицинской визуализации создают все более точные изображения улучшенного качества, используя более высокое пространственное разрешение и битовую глубину цвета. Такие улучшения увеличивают объем информации, которую необходимо хранить, обрабатывать и передавать.
  27. ^ Дуиб, Д.; Наит-Али, А.; Оливье, К.; Насер, штат Массачусетс (июнь 2021 г.). «Стратегия сжатия на основе рентабельности инвестиций наборов данных 3D-МРТ головного мозга для беспроводной связи» . ИРБМ . 42 (3): 146–153. дои : 10.1016/j.irbm.2020.05.001 . S2CID   219437400 . Из-за большого объема данных медицинских изображений процесс передачи в телемедицинских приложениях усложняется. Таким образом, чтобы адаптировать потоки битов данных к ограничениям, связанным с ограничением полосы пропускания, необходимо уменьшение размера данных путем сжатия изображений.
  28. ^ Синь, Гантао; Фань, Пиньи (11 июня 2021 г.). «Метод сжатия без потерь многокомпонентных медицинских изображений на основе анализа больших данных» . Научные отчеты . 11 (1): 12372. doi : 10.1038/s41598-021-91920-x . ISSN   2045-2322 . ПМК   8196061 . ПМИД   34117350 .
  29. ^ Грант, Дункан Эндрю; Говар, Джон (1989). Силовые МОП-транзисторы: теория и приложения . Уайли . п. 1. ISBN  978-0-471-82867-9 . Полевой транзистор металл-оксид-полупроводник (MOSFET) является наиболее часто используемым активным устройством в очень крупномасштабной интеграции цифровых интегральных схем (СБИС). В 1970-е годы эти компоненты произвели революцию в электронной обработке сигналов, системах управления и компьютерах.
  30. ^ Ширрифф, Кен (30 августа 2016 г.). «Удивительная история первых микропроцессоров» . IEEE-спектр . 53 (9). Институт инженеров по электротехнике и электронике : 48–54. дои : 10.1109/MSPEC.2016.7551353 . S2CID   32003640 . Архивировано из оригинала 13 октября 2019 года . Проверено 13 октября 2019 г.
  31. ^ Перейти обратно: а б «1979: Представлен однокристальный процессор цифровых сигналов» . Кремниевый двигатель . Музей истории компьютеров . Архивировано из оригинала 3 октября 2019 года . Проверено 14 октября 2019 г.
  32. ^ Таранович, Стив (27 августа 2012 г.). «30 лет DSP: от детской игрушки к 4G и дальше» . ЭДН . Архивировано из оригинала 14 октября 2019 года . Проверено 14 октября 2019 г.
  33. ^ Станкович, Радомир С.; Астола, Яакко Т. (2012). «Воспоминания о ранней работе в DCT: интервью с К.Р. Рао» (PDF) . Отпечатки первых дней информационных наук . 60 . Архивировано (PDF) из оригинала 13 октября 2019 г. Проверено 13 октября 2019 г.
  34. ^ «Зал славы космических технологий: индукционные технологии / 1994» . Космический фонд. 1994. Архивировано из оригинала 4 июля 2011 года . Проверено 7 января 2010 г.
  35. ^ Руботтом Калифорния, Митчелл Дж., Морган-Хьюз Дж. (ноябрь 2010 г.). «Стратегии снижения радиации в компьютерной томографической ангиографии сердца» . Клиническая радиология . 65 (11): 859–67. дои : 10.1016/j.crad.2010.04.021 . ПМИД   20933639 .
  36. ^ Скиалпи М., Реджинелли А., Д'Андреа А., Граванте С., Фальконе Дж., Баккари П., Манганаро Л., Палумбо Б., Каппабьянка С. (апрель 2016 г.). «Визуализация опухолей поджелудочной железы: обновленная информация» (PDF) . Международный журнал хирургии . 28 (Приложение 1): С142-55. дои : 10.1016/j.ijsu.2015.12.053 . hdl : 11573/908479 . ПМИД   26777740 . Архивировано (PDF) из оригинала 24 августа 2019 г.
  37. ^ Рахбар Х., Партридж СК (февраль 2016 г.). «Мультипараметрическая магнитно-резонансная томография рака молочной железы» . Клиники магнитно-резонансной томографии Северной Америки . 24 (1): 223–238. дои : 10.1016/j.mric.2015.08.012 . ПМЦ   4672390 . ПМИД   26613883 .
  38. ^ «Объем производства чипов для медицинской визуализации в ближайшие пять лет резко возрастет» . Кремниевый полупроводник . 8 сентября 2016 года . Проверено 25 октября 2019 г.
  39. ^ Банерджи Р., Павлидес М., Танниклифф Э.М., Пехник С.К., Сарания Н., Филипс Р., Кольер Дж.Д., Бут Дж.К., Шнайдер Дж.Э., Ван Л.М., Делани Д.В., Флеминг К.А., Робсон М.Д., Барнс Э., Нойбауэр С. (январь 2014 г.). «Многопараметрический магнитный резонанс для неинвазивной диагностики заболеваний печени» . Журнал гепатологии . 60 (1): 69–77. дои : 10.1016/j.jhep.2013.09.002 . ПМЦ   3865797 . ПМИД   24036007 .
  40. ^ Чжан, МЗ; Ливингстон, Арканзас; Асари, В.К. (2008). «Высокопроизводительная архитектура для реализации двумерной свертки с квадрантными симметричными ядрами». Международный журнал компьютеров и приложений . 30 (4): 298–308. дои : 10.1080/1206212x.2008.11441909 . S2CID   57289814 .
  41. ^ Перейти обратно: а б Гонсалес, Рафаэль (2008). Цифровая обработка изображений, 3-е место . Пирсон Холл. ISBN  978-0-13-168728-8 .
  42. ^ Хаус, Кейзер (6 декабря 2016 г.). Аффинные преобразования (PDF) . Основы физического моделирования и анимации. АК Петерс/CRC Press. ISBN  978-1-4822-3460-2 . Архивировано (PDF) из оригинала 30 августа 2017 года . Проверено 26 марта 2019 г. {{cite book}}: |website= игнорируется ( помогите )
  43. ^ Краткая ранняя история компьютерной графики в кино. Архивировано 17 июля 2012 года в Wayback Machine , Ларри Йегер , 16 августа 2002 года (последнее обновление), получено 24 марта 2010 года.

Дальнейшее чтение [ править ]

  • Соломон, CJ; Брекон, ТП (2010). Основы цифровой обработки изображений: практический подход с примерами в Matlab . Уайли-Блэквелл. дои : 10.1002/9780470689776 . ISBN  978-0-470-84473-1 .
  • Вильгельм Бургер; Марк Дж. Бердж (2007). Цифровая обработка изображений: алгоритмический подход с использованием Java . Спрингер . ISBN  978-1-84628-379-6 .
  • Р. Фишер; К. Доусон-Хау; А. Фитцгиббон; К. Робертсон; Э. Трукко (2005). Словарь компьютерного зрения и обработки изображений . Джон Уайли. ISBN  978-0-470-01526-1 .
  • Рафаэль К. Гонсалес; Ричард Э. Вудс; Стивен Л. Эддинс (2004). Цифровая обработка изображений с использованием MATLAB . Пирсон Образование. ISBN  978-81-7758-898-9 .
  • Тим Моррис (2004). Компьютерное зрение и обработка изображений . Пэлгрейв Макмиллан. ISBN  978-0-333-99451-1 .
  • Випин Тьяги (2018). Понимание цифровой обработки изображений . Тейлор и Фрэнсис CRC Press. ISBN  978-11-3856-6842 .
  • Милан Сонка; Вацлав Главац; Роджер Бойл (1999). Обработка изображений, анализ и машинное зрение . Издательство ПВС. ISBN  978-0-534-95393-5 .
  • Гонсалес, Рафаэль С.; Вудс, Ричард Э. (2008). Цифровая обработка изображений . Река Аппер-Седл, Нью-Джерси: Прентис-Холл. ISBN  978-0-13-168728-8 . OCLC   137312858 .
  • Ковалевский, Владимир (2019). Современные алгоритмы обработки изображений: компьютерные изображения на примере использования C# . [Нью Йорк, Нью Йорк]. ISBN  978-1-4842-4237-7 . OCLC   1080084533 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )

Внешние ссылки [ править ]