Автоматическое распознавание целей
Автоматическое распознавание целей ( ATR ) — это способность алгоритма или устройства распознавать цели или другие объекты на основе данных, полученных от датчиков .
Распознавание цели первоначально осуществлялось с использованием звукового представления полученного сигнала, где обученный оператор расшифровывал этот звук, чтобы классифицировать цель, освещенную радаром . Хотя эти обученные операторы добились успеха, были разработаны и продолжают разрабатываться автоматизированные методы, которые обеспечивают большую точность и скорость классификации. ATR может использоваться для идентификации искусственных объектов, таких как наземные и воздушные транспортные средства, а также биологических целей, таких как животные, люди и растительный мусор. Это может быть полезно для всего: от распознавания объекта на поле боя до фильтрации помех, создаваемых большими стаями птиц на доплеровском метеорадиолокаторе.
Возможные военные применения включают простую систему идентификации, такую как транспондер IFF , и используются в других приложениях, таких как беспилотные летательные аппараты и крылатые ракеты . Все больший интерес проявляется к использованию ATR и для внутренних целей. Были проведены исследования по использованию ATR для охраны границ, систем безопасности для идентификации объектов или людей на путях метро, автоматизированных транспортных средств и многих других.
Концепция [ править ]
История [ править ]
Распознавание целей существует почти столько же, сколько и радар . Операторы радаров идентифицировали бомбардировщики и истребители противника по звуковому изображению, принимаемому отраженным сигналом (см. «Радар во Второй мировой войне »).
Распознавание целей в течение многих лет осуществлялось путем воспроизведения группового оператору сигнала. Прослушивая этот сигнал, обученные операторы радаров могут идентифицировать различную информацию об освещенной цели, например, тип транспортного средства, размер цели, и потенциально могут даже различать биологические цели. Однако у этого подхода есть много ограничений. Оператор должен быть обучен тому, как будет звучать каждая цель. Если цель движется с высокой скоростью, ее может быть не слышно, а человеческий компонент принятия решений увеличивает вероятность ошибки. Однако идея звукового представления сигнала послужила основой для автоматической классификации целей. Несколько разработанных схем классификации используют особенности группового сигнала, которые использовались в других аудиоприложениях, таких как распознавание речи .
Обзор [ править ]
Эффект микродоплера [ править ]
Радар определяет расстояние до объекта, рассчитывая, сколько времени потребуется переданному сигналу, чтобы вернуться от цели, освещенной этим сигналом. Когда этот объект не является стационарным, он вызывает сдвиг частоты, известный как эффект Доплера . Помимо поступательного движения всего объекта, дополнительный сдвиг частоты может быть вызван вибрацией или вращением объекта. Когда это произойдет, сигнал с доплеровским сдвигом станет модулированным. Этот дополнительный эффект Доплера, вызывающий модуляцию сигнала, известен как эффект микродоплера. Эта модуляция может иметь определенный шаблон или подпись, которая позволит разрабатывать алгоритмы для ATR. Эффект микродоплера будет меняться со временем в зависимости от движения цели, вызывая изменение сигнала во времени и частоте. [1]
- временной анализ Частотно
Анализа этого сигнала с помощью преобразования Фурье недостаточно, поскольку преобразование Фурье не может учитывать изменяющуюся во времени составляющую. Самый простой способ получить функцию частоты и времени — использовать кратковременное преобразование Фурье (STFT). более надежные методы, такие как преобразование Габора или функция распределения Вигнера Однако для обеспечения одновременного представления частотной и временной области можно использовать (WVD). Однако во всех этих методах будет компромисс между разрешением по частоте и разрешением по времени. [2]
Обнаружение [ править ]
После извлечения этой спектральной информации ее можно сравнить с существующей базой данных, содержащей информацию о целях, которые система будет идентифицировать, и принять решение относительно того, что представляет собой освещенная цель. Это делается путем моделирования полученного сигнала, а затем с использованием метода статистической оценки, такого как максимальное правдоподобие (ML), большинство голосов (MV) или максимальное апостериорное значение (MAP), чтобы принять решение о том, какая цель в библиотеке лучше всего соответствует модели, построенной с использованием полученный сигнал.
Подход [ править ]
Извлечение функций [ править ]
Были проведены исследования, в которых звуковые функции, используемые при распознавании речи, используются для создания автоматизированных систем распознавания целей, которые будут идентифицировать цели на основе этих аудиокоэффициентов. Эти коэффициенты включают в себя
- Коэффициенты линейного прогнозирующего кодирования (LPC)
- кепстрального линейного прогнозирующего кодирования (LPCC) Коэффициенты
- Мел-частотные кепстральные коэффициенты (MFCC).
Базовый . сигнал обрабатывается для получения этих коэффициентов, затем используется статистический процесс, чтобы решить, какая цель в базе данных наиболее похожа на полученные коэффициенты Выбор того, какие функции и какую схему принятия решения использовать, зависит от системы и приложения.
Функции, используемые для классификации цели, не ограничиваются речевыми коэффициентами. Для выполнения ATR можно использовать широкий спектр функций и алгоритмов обнаружения.
Алгоритмы обнаружения [ править ]
Для обнаружения автоматизации целей необходимо создать обучающую базу данных. Обычно это делается с использованием экспериментальных данных, собранных, когда цель известна, а затем сохраняется для использования алгоритмом ATR.

Пример алгоритма обнаружения показан на блок-схеме. Этот метод использует M блоков данных, извлекает из каждого желаемые характеристики (например, коэффициенты LPC, MFCC), а затем моделирует их с использованием модели смеси Гаусса (GMM). После получения модели с использованием собранных данных формируется условная вероятность для каждой цели, содержащейся в обучающей базе данных. В этом примере имеется M блоков данных. В результате будет получен набор из M вероятностей для каждой цели в базе данных. Эти вероятности используются для определения цели с использованием решения максимального правдоподобия . Было показано, что этот метод позволяет различать типы транспортных средств (например, колесные и гусеничные машины) и даже определять количество присутствующих людей (до трех человек) с высокой вероятностью успеха. [3]
Распознавание целей на основе CNN
Распознавание целей на основе сверточной нейронной сети (CNN) способно превзойти традиционные методы. [4] [5] Было доказано, что он полезен при распознавании целей (например, боевых танков) на инфракрасных изображениях реальных сцен после обучения синтетическим изображениям, поскольку реальных изображений этих целей мало. Из-за ограничений обучающего набора, реалистичность синтетических изображений имеет большое значение, когда дело доходит до распознавания реального тестового набора сцен.
Общая структура сетей CNN содержит 7 слоев свертки, 3 максимальных слоя пула и слой Softmax в качестве выходных данных. Максимальное количество слоев пула расположено после второго, четвертого и пятого слоев свертки. Перед выводом также применяется объединение глобальных средних значений. Все слои свертки используют функцию активации нелинейности Leaky ReLU. [6]
См. также [ править ]
- Приложения искусственного интеллекта
- Опознание друг или враг
- Распознавание объектов
- Очерк искусственного интеллекта
- Очерк робототехники
- Распознавание образов
- Привязка радара
Ссылки [ править ]
- ^ Чен, В. (февраль 2011 г.). Эффект микродоплера в радаре . Норвуд, Массачусетс: Artec House. стр. 18–21. ISBN 9781608070589 .
- ^ Чен, В. (февраль 2011 г.). Эффект микродоплера в радаре . Норвуд, Массачусетс: Artec House. стр. 21–28. ISBN 9781608070589 .
- ^ Билик И.; Табрикян, Дж. (январь 2006 г.). «Классификация целей на основе GMM для доплеровского радара наземного наблюдения». Транзакции IEEE по аэрокосмическим и электронным системам . 42 (1): 267–277. Бибкод : 2006ITAES..42..267B . дои : 10.1109/TAES.2006.1603422 . S2CID 10841797 .
- ^ Юн, Сок Пиль; Сон, Тэк Люл; Ким, Тэ Хан (01 февраля 2013 г.). «Автоматическое распознавание и отслеживание целей на перспективных последовательностях инфракрасных изображений со сложным фоном». Международный журнал управления, автоматизации и систем . 11 (1): 21–32. дои : 10.1007/s12555-011-0226-z . ISSN 2005-4092 . S2CID 120650459 .
- ^ Венкатараман, Виджай; Фань, Голян; Ю, Лянцзян; Чжан, Синь; Лю, Вэйгуан; Гавличек, Джозеф П. (07 декабря 2011 г.). «Автоматическое отслеживание и распознавание целей с использованием связанных изображений и идентификационных коллекторов для представления формы» . Журнал EURASIP о достижениях в области обработки сигналов . 2011 (1): 124. Бибкод : 2011EJASP2011..124V . дои : 10.1186/1687-6180-2011-124 . ISSN 1687-6180 .
- ^ д'Акремон, Антуан; Фаблет, Ронан; Бауссар, Александр; Куин, Гийом (январь 2019 г.). «Распознавание и идентификация целей на основе CNN для инфракрасных изображений в оборонных системах» . Датчики . 19 (9): 2040. Бибкод : 2019Senso..19.2040D . дои : 10.3390/s19092040 . ПМК 6539764 . ПМИД 31052320 .