FERET (технология распознавания лиц)

Программа технологии распознавания лиц ( FERET ) была спонсируемым правительством проектом, целью которого было создание крупной автоматической системы распознавания лиц для целей разведки, безопасности и правоохранительных органов. ^[1] Программа началась в 1993 году под совместным руководством доктора Гарри Векслера из Университета Джорджа Мейсона (GMU) и доктора Джонатона Филлипса из Армейской исследовательской лаборатории (ARL) в Адельфи, штат Мэриленд, и привела к разработке технологии распознавания лиц (FERET). ) база данных . ^[2] Цель программы FERET заключалась в продвижении области технологий распознавания лиц путем создания общей базы данных изображений лиц для использования исследователями и установления базового уровня производительности для алгоритмов распознавания лиц. ^[3]

Потенциальные области применения этой технологии распознавания лиц включают в себя: ^[1]

Автоматизированный поиск книг с кружками по фотографиям с камер наблюдения
Контроль доступа к объектам или оборудованию с ограниченным доступом
Проверка полномочий персонала на предмет биографических данных и допуска к секретной информации
Мониторинг аэропортов, пограничных переходов и безопасных производственных объектов для отдельных лиц
Обнаружение и регистрация множественных появлений людей на видео наблюдениях с течением времени.
Проверка личности в банкоматах
Поиск записей удостоверений личности с фотографией для обнаружения мошенничества

База данных FERET используется более чем 460 исследовательскими группами и в настоящее время управляется Национальным институтом стандартов и технологий (NIST) . ^[2]^[4] К 2017 году база данных FERET использовалась для обучения программ искусственного интеллекта и алгоритмов компьютерного зрения распознаванию и сортировке лиц. ^[5]

История

Возникновение технологии распознавания лиц во многом приписывают Вудро Вильсону Бледсо и его работе в 1960-х годах, когда он разработал систему для идентификации лиц по базе данных из тысяч фотографий. ^[6] Программа FERET изначально задумывалась как способ объединить большой объем исследований в области технологий распознавания лиц в рамках стандартной базы данных. До запуска программы большинство исследователей создали собственную базу данных изображений лиц, адаптированную к их конкретной области исследований. Эти персональные базы данных были небольшими и обычно состояли из изображений менее чем 50 человек. Единственными заметными исключениями были следующие: ^[7]

База данных Алекса Пентланда , содержащая около 7500 изображений лиц в Массачусетском технологическом институте (MIT).
База данных Джозефа Уайлдера, включающая около 250 человек из Университета Рутгерса.
Кристофа фон дер Мальсбурга База данных , содержащая около 100 изображений лиц, в Университете Южной Калифорнии (USC)

Отсутствие общей базы данных затрудняло сравнение результатов исследований по распознаванию лиц в научной литературе, поскольку каждый отчет включал разные предположения, методы оценки и изображения. ^[2] В большинстве опубликованных статей не использовались изображения из общей базы данных и не следовали стандартному протоколу тестирования. В результате исследователи не смогли провести обоснованное сравнение производительности различных алгоритмов распознавания лиц. ^[8]

В сентябре 1993 года программу FERET возглавили доктор Гарри Векслер и доктор Джонатон Филлипс при спонсорской поддержке Программы развития технологий борьбы с наркотиками Министерства обороны США. ^[4]^[8] через DARPA , где ARL выступал в качестве технического агента. ^[7]^[9]

Фаза I

Первые изображения лиц для базы данных FERET были собраны с августа 1993 года по декабрь 1994 года, в период, известный как Фаза I. Первоначально изображения были сделаны с помощью 35-мм камеры на объектах GMU и ARL, и использовалась одна и та же физическая установка. в каждой фотосессии, чтобы изображения были последовательными. Для каждой особи снимки делались наборами, включая два вида спереди, правый и левый профиль, правый и левый четверть профиля, правый и левый полупрофиль, а иногда и в пяти дополнительных местах. ^[7] Таким образом, набор изображений состоял из 5–11 изображений на человека. ^[3] К концу этапа I в базе данных FERET было собрано 673 набора изображений, в результате чего общее количество изображений составило более 5000. ^[7]

В конце этапа I пяти организациям была предоставлена возможность протестировать свой алгоритм распознавания лиц в недавно созданной базе данных FERET, чтобы сравнить их эффективность друг с другом. Пять главных исследователей были: ^[7]

Массачусетский технологический институт под руководством Алекса Пентленда
Университет Рутгерса под руководством Джозефа Уайлдера
Аналитическая научная компания (TASC), возглавляемая Гейлом Гордоном
Университет Иллинойса в Чикаго (UIC) и Университет Иллинойса в Урбана-Шампейн под руководством Льюиса Сэдлера и Томаса Хуанга.
USC под руководством Кристофа фон дер Мальсбурга

В ходе этой оценки главным исследователям были предоставлены три различных автоматических теста без вмешательства человека:

Тест большой галереи, который служил для определения того, как алгоритмы работают с базой данных, когда она не была должным образом настроена.
Тест на ложную тревогу, в ходе которого проверялось, насколько хорошо алгоритм отслеживает аэропорт на предмет подозреваемых террористов.
Тест вращения, который измерял, насколько хорошо работал алгоритм, когда изображения человека в галерее имели разные позы по сравнению с изображениями в наборе зондов.

В большинстве тестовых испытаний алгоритмам, разработанным USC и MIT, удалось превзойти три других алгоритма оценки фазы I. ^[7]

Фаза II

Фаза II началась после фазы I, и за это время в базе данных FERET появилось больше наборов изображений лиц. К началу фазы II оценки в марте 1995 года база данных содержала 1109 наборов изображений, что в общей сложности составляло 8525 изображений 884 человек. ^[7] Во время второй оценки те же алгоритмы, что и на этапе I, были подвергнуты одному тесту. Однако теперь база данных содержала значительно больше повторяющихся изображений (463 по сравнению с предыдущими 60), что усложнило тест. ^[8]

Этап III

После этого программа FERET вступила в фазу III, где в базу данных было добавлено еще 456 наборов изображений лиц. Оценка фазы III, которая состоялась в сентябре 1996 года, была направлена не только на оценку прогресса алгоритмов со времени оценки фазы I, но также на выявление сильных и слабых сторон каждого алгоритма и определение будущих целей исследования. ^[8] К концу 1996 года в базе данных FERET накопилось в общей сложности 14 126 изображений лиц, принадлежащих 1199 различным людям, а также 365 повторяющихся наборов изображений. ^[3]

В результате программы FERET исследователи смогли установить общую основу для сравнения различных алгоритмов распознавания лиц и создать большую стандартную базу данных изображений лиц, открытую для исследований. ^[1]

В 2003 году DARPA выпустило 24-битную цветную версию изображений в высоком разрешении из базы данных FERET (существующая ссылка).

Ссылки

^ Jump up to: ^а ^б ^с Раусс, Патрик; Филипс, П. Джонатон; Гамильтон, Марк; ДеПерсия, Трент (26 февраля 1997 г.). Программа FERET (Технология распознавания лиц) . 25-й семинар AIPR: Новые применения компьютерного зрения. Том. 2962. стр. 253–263. Бибкод : 1997SPIE.2962..253R . дои : 10.1117/12.267831 .
^ Jump up to: ^а ^б ^с Фланаган, Патрисия А. (25 января 2011 г.). «Технология распознавания лиц (FERET)» . НИСТ . Проверено 11 июля 2018 г.
^ Jump up to: ^а ^б ^с П. Дж. Филлипс, Х. Мун, С. А. Ризви и П. Дж. Раусс (7 января 1999 г.). « Методология оценки FERET для алгоритмов распознавания лиц ». NISTIR 6264 и IEEE Trans. Анализ шаблонов и машинный интеллект , 22 (10), октябрь 2000 г.
^ Jump up to: ^а ^б Ли, Стэн; Джайн, Анил, ред. (2011). Справочник по распознаванию лиц . Спрингер-Верлаг Лондон. стр. 310–312. ISBN 9780857299314 .
^ Ху, Кейтлин (22 октября 2017 г.). «Гений» Макартура раскопал секретные изображения, которые ИИ использует, чтобы понять нас» . Кварц . Проверено 11 июля 2018 г.
^ Либби, Кристофер; Эренфельд, Джесси (18 февраля 2021 г.). «Технология распознавания лиц в 2021 году: маски, предвзятость и будущее здравоохранения» . Журнал медицинских систем . 45 (4): 39. дои : 10.1007/s10916-021-01723-w . ПМЦ 7891114 . ПМИД 33604732 .
^ Jump up to: ^а ^б ^с ^д ^и ^ж ^г Филлипс, П. Джонатон; Раусс, Патрик; Дер, Шандор (октябрь 1996 г.). «Разработка алгоритма распознавания FERET (технология распознавания лиц) и результаты испытаний» (PDF) . Исследовательская лаборатория армии США . Архивировано из оригинала (PDF) 10 июня 2017 г. Проверено 11 июля 2018 г. - через NIST.
^ Jump up to: ^а ^б ^с ^д Филлипс, П. Джонатон; Мун, Хёнджун; Раусс, Патрик; Ризви, С.А. (июнь 1997 г.). «Методология оценки FERET для алгоритмов распознавания лиц». Материалы конференции IEEE Computer Society по компьютерному зрению и распознаванию образов . IEEE. стр. 137–143. дои : 10.1109/CVPR.1997.609311 . ISBN 978-0-8186-7822-6 . S2CID 497801 .
^ Джонс, Хесси. «D-ID: этот стартап делает ставку на синтетические медиа, которые могут демократизировать создание контента в эпоху конфиденциальности» . Форбс . Проверено 28 февраля 2024 г.

Внешние ссылки

[:0-1] Jump up to: ^а ^б ^с Раусс, Патрик; Филипс, П. Джонатон; Гамильтон, Марк; ДеПерсия, Трент (26 февраля 1997 г.). Программа FERET (Технология распознавания лиц) . 25-й семинар AIPR: Новые применения компьютерного зрения. Том. 2962. стр. 253–263. Бибкод : 1997SPIE.2962..253R . дои : 10.1117/12.267831 .

[:1-2] Jump up to: ^а ^б ^с Фланаган, Патрисия А. (25 января 2011 г.). «Технология распознавания лиц (FERET)» . НИСТ . Проверено 11 июля 2018 г.

[:2-3] Jump up to: ^а ^б ^с П. Дж. Филлипс, Х. Мун, С. А. Ризви и П. Дж. Раусс (7 января 1999 г.). « Методология оценки FERET для алгоритмов распознавания лиц ». NISTIR 6264 и IEEE Trans. Анализ шаблонов и машинный интеллект , 22 (10), октябрь 2000 г.

[:3-4] Jump up to: ^а ^б Ли, Стэн; Джайн, Анил, ред. (2011). Справочник по распознаванию лиц . Спрингер-Верлаг Лондон. стр. 310–312. ISBN 9780857299314 .

[5] Ху, Кейтлин (22 октября 2017 г.). «Гений» Макартура раскопал секретные изображения, которые ИИ использует, чтобы понять нас» . Кварц . Проверено 11 июля 2018 г.

[6] Либби, Кристофер; Эренфельд, Джесси (18 февраля 2021 г.). «Технология распознавания лиц в 2021 году: маски, предвзятость и будущее здравоохранения» . Журнал медицинских систем . 45 (4): 39. дои : 10.1007/s10916-021-01723-w . ПМЦ 7891114 . ПМИД 33604732 .

[:4-7] Jump up to: ^а ^б ^с ^д ^и ^ж ^г Филлипс, П. Джонатон; Раусс, Патрик; Дер, Шандор (октябрь 1996 г.). «Разработка алгоритма распознавания FERET (технология распознавания лиц) и результаты испытаний» (PDF) . Исследовательская лаборатория армии США . Архивировано из оригинала (PDF) 10 июня 2017 г. Проверено 11 июля 2018 г. - через NIST.

[:5-8] Jump up to: ^а ^б ^с ^д Филлипс, П. Джонатон; Мун, Хёнджун; Раусс, Патрик; Ризви, С.А. (июнь 1997 г.). «Методология оценки FERET для алгоритмов распознавания лиц». Материалы конференции IEEE Computer Society по компьютерному зрению и распознаванию образов . IEEE. стр. 137–143. дои : 10.1109/CVPR.1997.609311 . ISBN 978-0-8186-7822-6 . S2CID 497801 .

[9] Джонс, Хесси. «D-ID: этот стартап делает ставку на синтетические медиа, которые могут демократизировать создание контента в эпоху конфиденциальности» . Форбс . Проверено 28 февраля 2024 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]