Вавилонская программа
Программа IARPA Babel разработала технологию распознавания речи для шумных телефонных разговоров. Основная цель программы заключалась в повышении эффективности поиска по ключевым словам на языках с очень небольшим количеством транскрибируемых данных, то есть на языках с низким уровнем ресурсов. Были собраны данные по 26 языкам, причем некоторые языки были названы «неожиданными» языками, чтобы проверить способность команд быстро построить систему для нового языка. [1]
Начиная с 2012 года в проекте участвовали две отраслевые команды ( IBM и BBN ) и две команды университетов ( ICSI во главе с Нельсоном Морганом и CMU ). [2] В команду IBM входили Кембриджский университет и RWTH Ахенский университет , а в команду BBN входили Технологический университет Брно , Университет Джонса Хопкинса , MIT и LIMSI . Только ББН [3] и IBM [4] [5] [6] дошел до финальной оценочной кампании в 2016 году, в которой BBN победил, добившись высочайшей точности поиска по ключевым словам на языке оценки.
Часть финансирования Babel была использована для дальнейшей разработки набора инструментов Kaldi . [7] Речевые данные позже были доступны через Консорциум лингвистических данных по символической цене 25 долларов США за языковой пакет.
Ссылки
[ редактировать ]- ^ Харпер, Мэри. «Ресурсы данных для поддержки деятельности проектов перспективных исследований в рамках программы Babel» (PDF) . Проверено 26 июля 2017 г.
- ^ «Вавилон» . ИАРПА . Проверено 26 июля 2017 г.
- ^ Т. Алумяэ и др., «Система определения ключевых слов в грузинской телефонной речи BBN 2016», Международная конференция IEEE по акустике, речи и обработке сигналов (ICASSP), 2017 г., Новый Орлеан, Луизиана, 2017, стр. 5755-5759, doi: 10.1109/ICASSP.2017.7953259.
- ^ Дж. Куи и др., «Обработка знаний в ансамблях многоязычных моделей для языков с ограниченными ресурсами», Международная конференция IEEE по акустике, речи и обработке сигналов (ICASSP), 2017 г., Новый Орлеан, Луизиана, 2017 г., стр. 4825-4829. , номер документа: 10.1109/ICASSP.2017.7953073.
- ^ Гейлс MJF, Нилл К.М., Рагни А. (2017) Распознавание речи с низким уровнем ресурсов и обнаружение ключевых слов. В: Карпов А., Потапова Р., Мпорас И. (ред.) Речь и компьютер. SPECOM 2017. Конспекты лекций по информатике, том 10458. Springer, Cham. https://doi.org/10.1007/978-3-319-66429-3_1
- ^ П. Голик, З. Тюске, К. Ири, Э. Бек, Р. Шлютер и Х. Ней. Система поиска ключевых слов RWTH 2016 года для малоресурсных языков. Международная конференция «Речь и компьютер» (SPECOM), Конспекты лекций по информатике, Подсерия «Конспекты лекций по искусственному интеллекту», том 10458, страницы 719–730, Хэтфилд, Великобритания, сентябрь 2017 г.
- ^ «История проекта Калди» . Проверено 26 июля 2017 г.