FERET (технология распознавания лиц)
Программа технологии распознавания лиц ( FERET ) была спонсируемым правительством проектом, целью которого было создание крупной автоматической системы распознавания лиц для целей разведки, безопасности и правоохранительных органов. [1] Программа началась в 1993 году под совместным руководством доктора Гарри Векслера из Университета Джорджа Мейсона (GMU) и доктора Джонатона Филлипса из Армейской исследовательской лаборатории (ARL) в Адельфи, штат Мэриленд, и привела к разработке технологии распознавания лиц (FERET). ) база данных . [2] Цель программы FERET заключалась в продвижении области технологий распознавания лиц путем создания общей базы данных изображений лиц для использования исследователями и установления базового уровня производительности для алгоритмов распознавания лиц. [3]
Потенциальные области применения этой технологии распознавания лиц включают в себя: [1]
- Автоматизированный поиск книг с кружками по фотографиям с камер наблюдения
- Контроль доступа к объектам или оборудованию с ограниченным доступом
- Проверка полномочий персонала на предмет биографических данных и допуска к секретной информации
- Мониторинг аэропортов, пограничных переходов и безопасных производственных объектов для отдельных лиц
- Обнаружение и регистрация множественных появлений людей на видео наблюдениях с течением времени.
- Проверка личности в банкоматах
- Поиск записей удостоверений личности с фотографией для обнаружения мошенничества
База данных FERET используется более чем 460 исследовательскими группами и в настоящее время управляется Национальным институтом стандартов и технологий (NIST) . [2] [4] К 2017 году база данных FERET использовалась для обучения программ искусственного интеллекта и алгоритмов компьютерного зрения распознаванию и сортировке лиц. [5]
История
[ редактировать ]Возникновение технологии распознавания лиц во многом приписывают Вудро Вильсону Бледсо и его работе в 1960-х годах, когда он разработал систему для идентификации лиц по базе данных из тысяч фотографий. [6] Программа FERET изначально задумывалась как способ объединить большой объем исследований в области технологий распознавания лиц в рамках стандартной базы данных. До запуска программы большинство исследователей создали собственную базу данных изображений лиц, адаптированную к их конкретной области исследований. Эти персональные базы данных были небольшими и обычно состояли из изображений менее чем 50 человек. Единственными заметными исключениями были следующие: [7]
- База данных Алекса Пентланда , содержащая около 7500 изображений лиц в Массачусетском технологическом институте (MIT).
- База данных Джозефа Уайлдера, включающая около 250 человек из Университета Рутгерса.
- Кристофа фон дер Мальсбурга База данных , содержащая около 100 изображений лиц, в Университете Южной Калифорнии (USC)
Отсутствие общей базы данных затрудняло сравнение результатов исследований по распознаванию лиц в научной литературе, поскольку каждый отчет включал разные предположения, методы оценки и изображения. [2] В большинстве опубликованных статей не использовались изображения из общей базы данных и не следовали стандартному протоколу тестирования. В результате исследователи не смогли провести обоснованное сравнение производительности различных алгоритмов распознавания лиц. [8]
В сентябре 1993 года программу FERET возглавили доктор Гарри Векслер и доктор Джонатон Филлипс при спонсорской поддержке Программы развития технологий борьбы с наркотиками Министерства обороны США. [4] [8] через DARPA , где ARL выступал в качестве технического агента. [7] [9]
Фаза I
[ редактировать ]Первые изображения лиц для базы данных FERET были собраны с августа 1993 года по декабрь 1994 года, в период, известный как Фаза I. Первоначально изображения были сделаны с помощью 35-мм камеры на объектах GMU и ARL, и использовалась одна и та же физическая установка. в каждой фотосессии, чтобы изображения были последовательными. Для каждой особи снимки делались наборами, включая два вида спереди, правый и левый профиль, правый и левый четверть профиля, правый и левый полупрофиль, а иногда и в пяти дополнительных местах. [7] Таким образом, набор изображений состоял из 5–11 изображений на человека. [3] К концу этапа I в базе данных FERET было собрано 673 набора изображений, в результате чего общее количество изображений составило более 5000. [7]
В конце этапа I пяти организациям была предоставлена возможность протестировать свой алгоритм распознавания лиц в недавно созданной базе данных FERET, чтобы сравнить их эффективность друг с другом. Пять главных исследователей были: [7]
- Массачусетский технологический институт под руководством Алекса Пентленда
- Университет Рутгерса под руководством Джозефа Уайлдера
- Аналитическая научная компания (TASC), возглавляемая Гейлом Гордоном
- Университет Иллинойса в Чикаго (UIC) и Университет Иллинойса в Урбана-Шампейн под руководством Льюиса Сэдлера и Томаса Хуанга.
- USC под руководством Кристофа фон дер Мальсбурга
В ходе этой оценки главным исследователям были предоставлены три различных автоматических теста без вмешательства человека:
- Тест большой галереи, который служил для определения того, как алгоритмы работают с базой данных, когда она не была должным образом настроена.
- Тест на ложную тревогу, в ходе которого проверялось, насколько хорошо алгоритм отслеживает аэропорт на предмет подозреваемых террористов.
- Тест вращения, который измерял, насколько хорошо работал алгоритм, когда изображения человека в галерее имели разные позы по сравнению с изображениями в наборе зондов.
В большинстве тестовых испытаний алгоритмам, разработанным USC и MIT, удалось превзойти три других алгоритма оценки фазы I. [7]
Фаза II
[ редактировать ]Фаза II началась после фазы I, и за это время в базе данных FERET появилось больше наборов изображений лиц. К началу фазы II оценки в марте 1995 года база данных содержала 1109 наборов изображений, что в общей сложности составляло 8525 изображений 884 человек. [7] Во время второй оценки те же алгоритмы, что и на этапе I, были подвергнуты одному тесту. Однако теперь база данных содержала значительно больше повторяющихся изображений (463 по сравнению с предыдущими 60), что усложнило тест. [8]
Этап III
[ редактировать ]После этого программа FERET вступила в фазу III, где в базу данных было добавлено еще 456 наборов изображений лиц. Оценка фазы III, которая состоялась в сентябре 1996 года, была направлена не только на оценку прогресса алгоритмов со времени оценки фазы I, но также на выявление сильных и слабых сторон каждого алгоритма и определение будущих целей исследования. [8] К концу 1996 года в базе данных FERET накопилось в общей сложности 14 126 изображений лиц, принадлежащих 1199 различным людям, а также 365 повторяющихся наборов изображений. [3]
В результате программы FERET исследователи смогли установить общую основу для сравнения различных алгоритмов распознавания лиц и создать большую стандартную базу данных изображений лиц, открытую для исследований. [1]
В 2003 году DARPA выпустило 24-битную цветную версию изображений в высоком разрешении из базы данных FERET (существующая ссылка).
Ссылки
[ редактировать ]- ^ Jump up to: а б с Раусс, Патрик; Филипс, П. Джонатон; Гамильтон, Марк; ДеПерсия, Трент (26 февраля 1997 г.). Программа FERET (Технология распознавания лиц) . 25-й семинар AIPR: Новые применения компьютерного зрения. Том. 2962. стр. 253–263. Бибкод : 1997SPIE.2962..253R . дои : 10.1117/12.267831 .
- ^ Jump up to: а б с Фланаган, Патрисия А. (25 января 2011 г.). «Технология распознавания лиц (FERET)» . НИСТ . Проверено 11 июля 2018 г.
- ^ Jump up to: а б с П. Дж. Филлипс, Х. Мун, С. А. Ризви и П. Дж. Раусс (7 января 1999 г.). « Методология оценки FERET для алгоритмов распознавания лиц ». NISTIR 6264 и IEEE Trans. Анализ шаблонов и машинный интеллект , 22 (10), октябрь 2000 г.
- ^ Jump up to: а б Ли, Стэн; Джайн, Анил, ред. (2011). Справочник по распознаванию лиц . Спрингер-Верлаг Лондон. стр. 310–312. ISBN 9780857299314 .
- ^ Ху, Кейтлин (22 октября 2017 г.). «Гений» Макартура раскопал секретные изображения, которые ИИ использует, чтобы понять нас» . Кварц . Проверено 11 июля 2018 г.
- ^ Либби, Кристофер; Эренфельд, Джесси (18 февраля 2021 г.). «Технология распознавания лиц в 2021 году: маски, предвзятость и будущее здравоохранения» . Журнал медицинских систем . 45 (4): 39. дои : 10.1007/s10916-021-01723-w . ПМЦ 7891114 . ПМИД 33604732 .
- ^ Jump up to: а б с д и ж г Филлипс, П. Джонатон; Раусс, Патрик; Дер, Шандор (октябрь 1996 г.). «Разработка алгоритма распознавания FERET (технология распознавания лиц) и результаты испытаний» (PDF) . Исследовательская лаборатория армии США . Архивировано из оригинала (PDF) 10 июня 2017 г. Проверено 11 июля 2018 г. - через NIST.
- ^ Jump up to: а б с д Филлипс, П. Джонатон; Мун, Хёнджун; Раусс, Патрик; Ризви, С.А. (июнь 1997 г.). «Методология оценки FERET для алгоритмов распознавания лиц». Материалы конференции IEEE Computer Society по компьютерному зрению и распознаванию образов . IEEE. стр. 137–143. дои : 10.1109/CVPR.1997.609311 . ISBN 978-0-8186-7822-6 . S2CID 497801 .
- ^ Джонс, Хесси. «D-ID: этот стартап делает ставку на синтетические медиа, которые могут демократизировать создание контента в эпоху конфиденциальности» . Форбс . Проверено 28 февраля 2024 г.