Стив Янг (инженер-программист)
Стив Янг | |
---|---|
Рожденный | Стивен Джон Янг 1951 (72–73 года) |
Альма-матер | Кембриджский университет |
Известный | |
Научная карьера | |
Поля | |
Учреждения | |
Диссертация | Синтез речи от концепции с приложениями до вывода речи из систем (1978) |
Докторантура | Фрэнк Фоллсайд |
Веб-сайт | мне |
Стивен Джон Янг CBE FRS FREng (1951 г.р.) — британский исследователь, [1] Профессор информационной инженерии Кембриджского университета и предприниматель. Он один из пионеров автоматического распознавания речи. [2] и статистические системы устного диалога. [3] [4] С 2009 по 2015 год он занимал должность старшего проректора Кембриджского университета, отвечая за планирование и ресурсы. С 2015 по 2019 год он занимал совместную должность профессора в Кембридже и Apple , где был старшим членом команды разработчиков Siri . [5]
Ранняя жизнь и образование
[ редактировать ]Янг родился в Ливерпуле 23 января 1951 года. Он учился в Кембриджском университете , получив степень бакалавра электротехники в 1973 году и докторскую степень по распознаванию речи в 1978 году под руководством профессора Фрэнка Фоллсайда на инженерном факультете. Он читал лекции в Манчестере и Кембридже, прежде чем был избран на кафедру информационной инженерии в Кембриджском университете в 1994 году. [6]
Исследовательская и академическая карьера
[ редактировать ]Он наиболее известен как ведущий автор инструментария HTK. [2] пакет программного обеспечения для использования скрытых моделей Маркова для моделирования временных рядов, в основном используемый для распознавания речи. Его первая версия была первоначально разработана Янгом в Лаборатории машинного интеллекта Инженерного факультета Кембриджского университета (CUED) в 1989 году. В связи с растущей популярностью набора инструментов во всем мире Microsoft решила снова сделать базовый набор инструментов HTK доступным и вернула лицензию на программное обеспечение. в CUED после приобретения Entropic, стартапа, который Стив соучредил в 1993 году для распространения и поддержки набора инструментов HTK. Книга ХТК, [7] учебное пособие по набору инструментов HTK получило более 7000 цитирований. [8]
В конце девяностых исследовательские интересы Янга сместились в сторону разработки статистических систем устного диалога. Его наиболее заметным вкладом в эту область является структура управления диалогом на основе частично наблюдаемого марковского процесса принятия решений (POMDP). [3] [9] [10] который включает в себя диалоговую модель Hidden Information State (HIS), [11] первая практическая модель управления диалогом, основанная на структуре POMDP. Его исследования сосредоточены на разработке систем разговорного диалога, которые устойчивы к шуму, создаваемому шумными распознавателями речи, а также адаптируются и масштабируются в режиме онлайн при взаимодействии с реальными пользователями. Одним из ярких примеров этого подхода является применение гауссовского процесса на основе обучения с подкреплением для быстрой оптимизации политики. [12] [13] В последние годы исследовательская группа Янга успешно применила методы глубокого обучения к различным подмодулям статистических диалоговых систем. [14] [15] [16] [17] неоднократно получал награды за лучшие доклады на престижных конференциях по выступлениям и НЛП.
Предпринимательство
[ редактировать ]Помимо академического и научного вклада, Янг также является успешным предпринимателем и сыграл ведущую роль в приобретении трех компаний:
- Entropic, компания-разработчик программного обеспечения для распознавания речи, которая разработала приложения для голосового доступа в Интернет через операторов мобильной связи. Компания была приобретена Microsoft в 1999 году. [18]
- Phonetic Arts, компания по синтезу речи, которая представила технологию создания естественной выразительной речи. Технология, разработанная компанией, позволила компьютерным играм произносить различные предложения разными голосами. Phonetic Arts была приобретена Google в 2010 году. [18]
- VocalIQ, компания, занимающаяся технологиями диалога, которая создала первый в мире интерфейс прикладного программирования диалоговой системы. Технология компании предоставила платформу для голосовых интерфейсов, позволяющую предприятиям использовать голосовую поддержку мобильных устройств и собственных приложений. VocalIQ была приобретена Apple в 2015 году. [18]
Награды и почести
[ редактировать ]Янг является членом Королевской инженерной академии . [19] Институт инженерии и технологий (IET), Институт инженеров по электротехнике и электронике (IEEE), RSA и Международная ассоциация речевой коммуникации (ISCA). [5]
Он получил Премию Общества обработки сигналов IEEE за технические достижения в 2004 году и Медаль ISCA за научные достижения в 2010 году. Он также получил Премию Европейского общества обработки сигналов за индивидуальные технические достижения в 2013 году и Премию IEEE Джеймса Л. Фланагана в области обработки речи и звука в 2013 году. 2015. [5]
В 2020 году он был избран членом Королевского общества (FRS). [20]
Янг был назначен кавалером Ордена Британской Империи (CBE) в честь Дня Рождения 2022 года за заслуги в разработке программного обеспечения. [21]
Ссылки
[ редактировать ]- ^ «Стив Янг – Цитаты из Google Scholar» . Google Академик . Проверено 2 мая 2017 г.
- ^ Jump up to: а б «Набор инструментов для распознавания речи HTK» . Кембриджский университет.
- ^ Jump up to: а б Уильямс, Джейсон; Янг, Стив (2007). «Частично наблюдаемые марковские процессы принятия решений для систем разговорного диалога» (PDF) . Компьютерная речь и язык . 21 (2): 393–422. дои : 10.1016/j.csl.2006.06.008 . S2CID 13903063 .
- ^ Янг, Стив; и др. «Модель состояния скрытой информации: практическая основа управления устным диалогом на основе POMDP» (PDF) . Компьютерная речь и язык .
- ^ Jump up to: а б с «Профессор Стив Янг, профессор информационной инженерии» . Кембриджский университет.
- ^ «Стивен Янг, научный сотрудник Эммануэля» .
- ^ Молодой, Стив. «Книга ХТК» (PDF) . Инженерный факультет Кембриджского университета .
- ^ «Гугл Академика» . Проверено 23 декабря 2020 г.
- ^ Блейз Томпсон и Стив Янг (2010). «Байесовское обновление состояния диалога: структура POMDP для систем разговорного диалога» (PDF) . Компьютерная речь и язык.
- ^ Янг, Стив (2013). «Статистические системы разговорного диалога на основе POMDP: обзор» (PDF) . Проц IEEE.
- ^ Стив Янг; и др. (2010). «Модель состояния скрытой информации: практическая основа для управления устным диалогом на основе POMDP» (PDF) . Компьютерная речь и язык.
- ^ Милица Гасич и Стив Янг (2014). «Гауссовы процессы для оптимизации диалогового менеджера на основе POMDP» (Документ). IEEE Транс. Обработка звука, речи и языка.
- ^ Пей-Хао Су; и др. (2016). «Онлайн-обучение с активным вознаграждением для оптимизации политики в системах разговорного диалога» (PDF) . Проц ACL. arXiv : 1605.07669 .
- ^ Лина Рохас-Бараона; и др. (2016). «Использование представлений предложений и контекста в моделях глубокой нейронной связи для понимания разговорной речи» . Прок Колинг. стр. 258–267.
- ^ Никола Мркшич; и др. (2017). «Нейронный трекер убеждений: отслеживание состояния диалога на основе данных» (PDF) . Проц ACL.
- ^ Цунг-Сянь Вэнь; и др. (2015). «Семантически обусловленная генерация естественного языка на основе LSTM для систем разговорного диалога» (PDF) . Процесс ЭМНЛП. arXiv : 1508.01745 .
- ^ Цунг-Сянь Вен эль аль (2017). «Сетевая сквозная обучаемая, ориентированная на задачи диалоговая система». arXiv : 1604.04562 [ cs.CL ].
- ^ Jump up to: а б с «Стив Янг: профиль и биография руководителя» . Блумберг ЛП
- ^ «Стивен Янг» . Королевская инженерная академия . Проверено 23 декабря 2020 г.
- ^ «Стивен Янг» . Королевское общество . Проверено 20 сентября 2020 г.
- ^ «№63714» . Лондонская газета (Приложение). 1 июня 2022 г. с. Б11.