Программа DARPA TIDES
Эта статья нуждается в дополнительных цитатах для проверки . ( ноябрь 2020 г. ) |
Транслингвальное обнаружение, извлечение и обобщение информации (TIDES) — это программа развития технологий, финансируемая Агентством перспективных исследовательских проектов Министерства обороны США ( DARPA ), ориентированная на автоматизированную обработку и понимание языковых данных. Основная цель программы — дать возможность носителям английского языка быстро и эффективно находить и интерпретировать необходимую информацию независимо от языка оригинала.
Компоненты
[ редактировать ]Четыре компонента технологии, разрабатываемые TIDES, включают в себя:
- Обнаружение – поиск необходимой информации.
- Извлечение – извлечение ключевых фактов.
- Резюмирование – сокращение информации до читаемой длины.
- Перевод – преобразование текста с другого языка на английский.
Инструменты обнаружения, извлечения и обобщения должны работать на одном языке (одноязычно) и между языками (транслингвально), чтобы их могли использовать люди, говорящие только на английском языке. Помимо разработки технологий, TIDES также исследует методы их быстрой и дешевой адаптации к другим языкам, включая языки с ограниченными лингвистическими ресурсами. TIDES стремится объединить возможности компонентов вместе с другими технологиями для создания инструментов для реальных приложений.
Хранилище данных расследований
[ редактировать ]содержит библиотеку новостей с открытым исходным кодом, содержащую новости , ФБР Хранилище данных расследований собранные программой TIDES. Информация собирается с общедоступных веб-сайтов по всему миру, включая «Гаарец» , «Правду» , « Jordan Times» , «People's Daily» , «The Washington Post » и других. [1] Он использует систему обработки текста и звука Mitre ( MiTAP ). [2]
См. также
[ редактировать ]Примечания и библиография
[ редактировать ]- ^ ФБР, План безопасности системы IDW-S , 3 декабря 2003 г. , страницы 58-69 связанного PDF-файла.
- ^ ФБР, Концепция безопасности операций IDW, 2004 11 29 , страницы 50, 51 связанного PDF-файла.
- Отдел информационных ресурсов ФБР (IRD) (3 декабря 2003 г.). «План безопасности системы Хранилища данных расследований-СЕКРЕТНО (IDW-S)» (PDF) . Фонд электронных границ. п. 58.
- Управление ФБР по управлению программой (29 ноября 2004 г.). «Концепция безопасности операций (S-CONOPS), программа хранилища данных расследований (IDW)» (PDF) . Фонд электронных границ. п. 50.