Jump to content

Тони Робинсон (распознавание речи)

Тони Робинсон — исследователь применения рекуррентных нейронных сетей для распознавания речи . [1] [2] [3] будучи одним из первых, кто открыл практические возможности глубоких нейронных сетей и их применения для распознавания речи. [4]

Образование и ранняя карьера

[ редактировать ]

Робинсон изучал естественные науки в Кембриджском университете с 1981 по 1984 год, где специализировался на физике. В 1985 году он получил степень магистра в области компьютерной речи и языковой обработки, а в 1989 году продолжил работу над докторской диссертацией в той же области, оба в Кембридже. Впервые он опубликовал статью на тему распознавания речи во время защиты докторской диссертации. [5] и с тех пор опубликовал более ста широко цитируемых исследовательских работ по автоматическому распознаванию речи (ASR). [6]

Предпринимательская карьера

[ редактировать ]

В 1995 году Робинсон основал SoftSound Ltd, компанию, занимающуюся речевыми технологиями, которая была приобретена Autonomy с целью использования этой технологии для облегчения поиска неструктурированных видео и голосовых данных. Робинсон помог создать самую быструю систему распознавания речи с большим словарным запасом, доступную в то время и работающую на большем количестве языков, чем любая другая модель, основанная на рекуррентных нейронных сетях. [7]

С 2008 по 2010 год Робинсон был директором группы Advanced Speech в компании SpinVox , поставщике услуг преобразования речи в текст для рынков операторов связи, включая беспроводную связь, VoIP и кабельное телевидение. Их система автоматического распознавания речи (ASR) какое-то время использовалась более миллиона раз в день, а SpinVox впоследствии была приобретена глобальной компанией по производству речевых технологий Nuance . [8]

Робинсон также был основателем компании Speechmatics , которая запустила свои облачные службы распознавания речи в 2012 году. Впоследствии в конце 2017 года Speechmatics анонсировала новую технологию ускоренного моделирования нового языка. [9] Робинсон продолжает публиковать статьи по технологиям распознавания речи, особенно в области статистического моделирования языка. [10]

  1. ^ Робинсон, Тони; Фоллсайд, Фрэнк (июль 1991 г.). «Система распознавания речи в сети распространения повторяющихся ошибок». Компьютерная речь и язык . 5 (3): 259–274. дои : 10.1016/0885-2308(91)90010-N .
  2. ^ Робинсон, Тони (1996). «Использование рекуррентных нейронных сетей в непрерывном распознавании речи». Автоматическое распознавание речи и говорящего . Международная серия Kluwer по инженерным наукам и информатике. Том. 355. стр. 233–258. CiteSeerX   10.1.1.364.7237 . дои : 10.1007/978-1-4613-1367-0_10 . ISBN  978-1-4612-8590-8 .
  3. ^ Уэйкфилд, Джейн (14 марта 2008 г.). «Распознавание речи переходит в текст» . Новости Би-би-си . Проверено 24 августа 2020 г.
  4. ^ Робинсон, Тони (сентябрь 1993 г.). «Система распознавания непрерывной речи с большим словарным запасом, независимая от говорящего, на основе нейронной сети: проект WERNICKE» . Третья Европейская конференция по речевой коммуникации и технологиям . 1 : 1941–1944 . Проверено 17 мая 2018 г.
  5. ^ Робинсон, Энтони Джон (июнь 1989 г.). «Динамические сети распространения ошибок» . Кандидатская диссертация . Проверено 17 мая 2018 г.
  6. ^ Робинсон, Тони. «Тони Робинсон — Профиль» . Исследовательские ворота . Проверено 17 мая 2018 г.
  7. ^ Робинсон, Тони; Хохберг, Майк; Реналс, Стив (1996). «Использование рекуррентных нейронных сетей в непрерывном распознавании речи». Автоматическое распознавание речи и говорящего . Международная серия Kluwer по инженерным наукам и информатике. Том. 355. стр. 233–258. CiteSeerX   10.1.1.364.7237 . дои : 10.1007/978-1-4613-1367-0_10 . ISBN  978-1-4612-8590-8 .
  8. ^ «Нюанс приобретает SpinVox» . Инновации в здравоохранении . 24 июня 2011 г. Проверено 9 сентября 2023 г.
  9. ^ Орловский, Андрей. «Британский пионер нейронных сетей только что произвел революцию в распознавании речи» . Регистр . Ситуация Публикация . Проверено 17 мая 2018 г.
  10. ^ Чельба, Киприан; Миколов, Томас; Шустер, Майк (2013). Контрольный показатель в один миллиард слов для измерения прогресса в статистическом языковом моделировании (отчет). Библиотека Корнеллского университета. arXiv : 1312.3005 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d41d7e1877613b8b8d0c636bb8f4ad4e__1719756660
URL1:https://arc.ask3.ru/arc/aa/d4/4e/d41d7e1877613b8b8d0c636bb8f4ad4e.html
Заголовок, (Title) документа по адресу, URL1:
Tony Robinson (speech recognition) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)