Тони Робинсон (распознавание речи)
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Тони Робинсон — исследователь применения рекуррентных нейронных сетей для распознавания речи . [1] [2] [3] будучи одним из первых, кто открыл практические возможности глубоких нейронных сетей и их применения для распознавания речи. [4]
Образование и ранняя карьера
[ редактировать ]Робинсон изучал естественные науки в Кембриджском университете с 1981 по 1984 год, где специализировался на физике. В 1985 году он получил степень магистра в области компьютерной речи и языковой обработки, а в 1989 году продолжил работу над докторской диссертацией в той же области, оба в Кембридже. Впервые он опубликовал статью на тему распознавания речи во время защиты докторской диссертации. [5] и с тех пор опубликовал более ста широко цитируемых исследовательских работ по автоматическому распознаванию речи (ASR). [6]
Предпринимательская карьера
[ редактировать ]В 1995 году Робинсон основал SoftSound Ltd, компанию, занимающуюся речевыми технологиями, которая была приобретена Autonomy с целью использования этой технологии для облегчения поиска неструктурированных видео и голосовых данных. Робинсон помог создать самую быструю систему распознавания речи с большим словарным запасом, доступную в то время и работающую на большем количестве языков, чем любая другая модель, основанная на рекуррентных нейронных сетях. [7]
С 2008 по 2010 год Робинсон был директором группы Advanced Speech в компании SpinVox , поставщике услуг преобразования речи в текст для рынков операторов связи, включая беспроводную связь, VoIP и кабельное телевидение. Их система автоматического распознавания речи (ASR) какое-то время использовалась более миллиона раз в день, а SpinVox впоследствии была приобретена глобальной компанией по производству речевых технологий Nuance . [8]
Робинсон также был основателем компании Speechmatics , которая запустила свои облачные службы распознавания речи в 2012 году. Впоследствии в конце 2017 года Speechmatics анонсировала новую технологию ускоренного моделирования нового языка. [9] Робинсон продолжает публиковать статьи по технологиям распознавания речи, особенно в области статистического моделирования языка. [10]
Ссылки
[ редактировать ]- ^ Робинсон, Тони; Фоллсайд, Фрэнк (июль 1991 г.). «Система распознавания речи в сети распространения повторяющихся ошибок». Компьютерная речь и язык . 5 (3): 259–274. дои : 10.1016/0885-2308(91)90010-N .
- ^ Робинсон, Тони (1996). «Использование рекуррентных нейронных сетей в непрерывном распознавании речи». Автоматическое распознавание речи и говорящего . Международная серия Kluwer по инженерным наукам и информатике. Том. 355. стр. 233–258. CiteSeerX 10.1.1.364.7237 . дои : 10.1007/978-1-4613-1367-0_10 . ISBN 978-1-4612-8590-8 .
- ^ Уэйкфилд, Джейн (14 марта 2008 г.). «Распознавание речи переходит в текст» . Новости Би-би-си . Проверено 24 августа 2020 г.
- ^ Робинсон, Тони (сентябрь 1993 г.). «Система распознавания непрерывной речи с большим словарным запасом, независимая от говорящего, на основе нейронной сети: проект WERNICKE» . Третья Европейская конференция по речевой коммуникации и технологиям . 1 : 1941–1944 . Проверено 17 мая 2018 г.
- ^ Робинсон, Энтони Джон (июнь 1989 г.). «Динамические сети распространения ошибок» . Кандидатская диссертация . Проверено 17 мая 2018 г.
- ^ Робинсон, Тони. «Тони Робинсон — Профиль» . Исследовательские ворота . Проверено 17 мая 2018 г.
- ^ Робинсон, Тони; Хохберг, Майк; Реналс, Стив (1996). «Использование рекуррентных нейронных сетей в непрерывном распознавании речи». Автоматическое распознавание речи и говорящего . Международная серия Kluwer по инженерным наукам и информатике. Том. 355. стр. 233–258. CiteSeerX 10.1.1.364.7237 . дои : 10.1007/978-1-4613-1367-0_10 . ISBN 978-1-4612-8590-8 .
- ^ «Нюанс приобретает SpinVox» . Инновации в здравоохранении . 24 июня 2011 г. Проверено 9 сентября 2023 г.
- ^ Орловский, Андрей. «Британский пионер нейронных сетей только что произвел революцию в распознавании речи» . Регистр . Ситуация Публикация . Проверено 17 мая 2018 г.
- ^ Чельба, Киприан; Миколов, Томас; Шустер, Майк (2013). Контрольный показатель в один миллиард слов для измерения прогресса в статистическом языковом моделировании (отчет). Библиотека Корнеллского университета. arXiv : 1312.3005 .