Jump to content

Стив Янг (инженер-программист)

Стив Янг
Рожденный
Стивен Джон Янг

1951 (72–73 года)
Альма-матер Кембриджский университет
Известный
Научная карьера
Поля
Учреждения
Диссертация Синтез речи от концепции с приложениями до вывода речи из систем   (1978)
Докторантура Фрэнк Фоллсайд
Веб-сайт мне .камера .uk /~ ты

Стивен Джон Янг CBE FRS FREng (1951 г.р.) — британский исследователь, [1] Профессор информационной инженерии Кембриджского университета и предприниматель. Он один из пионеров автоматического распознавания речи. [2] и статистические системы устного диалога. [3] [4] С 2009 по 2015 год он занимал должность старшего проректора Кембриджского университета, отвечая за планирование и ресурсы. С 2015 по 2019 год он занимал совместную должность профессора в Кембридже и Apple , где был старшим членом команды разработчиков Siri . [5]

Ранняя жизнь и образование

[ редактировать ]

Янг родился в Ливерпуле 23 января 1951 года. Он учился в Кембриджском университете , получив степень бакалавра электротехники в 1973 году и докторскую степень по распознаванию речи в 1978 году под руководством профессора Фрэнка Фоллсайда на инженерном факультете. Он читал лекции в Манчестере и Кембридже, прежде чем был избран на кафедру информационной инженерии в Кембриджском университете в 1994 году. [6]

Исследовательская и академическая карьера

[ редактировать ]

Он наиболее известен как ведущий автор инструментария HTK. [2] пакет программного обеспечения для использования скрытых моделей Маркова для моделирования временных рядов, в основном используемый для распознавания речи. Его первая версия была первоначально разработана Янгом в Лаборатории машинного интеллекта Инженерного факультета Кембриджского университета (CUED) в 1989 году. В связи с растущей популярностью набора инструментов во всем мире Microsoft решила снова сделать базовый набор инструментов HTK доступным и вернула лицензию на программное обеспечение. в CUED после приобретения Entropic, стартапа, который Стив соучредил в 1993 году для распространения и поддержки набора инструментов HTK. Книга ХТК, [7] учебное пособие по набору инструментов HTK получило более 7000 цитирований. [8]

В конце девяностых исследовательские интересы Янга сместились в сторону разработки статистических систем устного диалога. Его наиболее заметным вкладом в эту область является структура управления диалогом на основе частично наблюдаемого марковского процесса принятия решений (POMDP). [3] [9] [10] который включает в себя диалоговую модель Hidden Information State (HIS), [11] первая практическая модель управления диалогом, основанная на структуре POMDP. Его исследования сосредоточены на разработке систем разговорного диалога, которые устойчивы к шуму, создаваемому шумными распознавателями речи, а также адаптируются и масштабируются в режиме онлайн при взаимодействии с реальными пользователями. Одним из ярких примеров этого подхода является применение гауссовского процесса на основе обучения с подкреплением для быстрой оптимизации политики. [12] [13] В последние годы исследовательская группа Янга успешно применила методы глубокого обучения к различным подмодулям статистических диалоговых систем. [14] [15] [16] [17] неоднократно получал награды за лучшие доклады на престижных конференциях по выступлениям и НЛП.

Предпринимательство

[ редактировать ]

Помимо академического и научного вклада, Янг также является успешным предпринимателем и сыграл ведущую роль в приобретении трех компаний:

  • Entropic, компания-разработчик программного обеспечения для распознавания речи, которая разработала приложения для голосового доступа в Интернет через операторов мобильной связи. Компания была приобретена Microsoft в 1999 году. [18]
  • Phonetic Arts, компания по синтезу речи, которая представила технологию создания естественной выразительной речи. Технология, разработанная компанией, позволила компьютерным играм произносить различные предложения разными голосами. Phonetic Arts была приобретена Google в 2010 году. [18]
  • VocalIQ, компания, занимающаяся технологиями диалога, которая создала первый в мире интерфейс прикладного программирования диалоговой системы. Технология компании предоставила платформу для голосовых интерфейсов, позволяющую предприятиям использовать голосовую поддержку мобильных устройств и собственных приложений. VocalIQ была приобретена Apple в 2015 году. [18]

Награды и почести

[ редактировать ]

Янг является членом Королевской инженерной академии . [19] Институт инженерии и технологий (IET), Институт инженеров по электротехнике и электронике (IEEE), RSA и Международная ассоциация речевой коммуникации (ISCA). [5]

Он получил Премию Общества обработки сигналов IEEE за технические достижения в 2004 году и Медаль ISCA за научные достижения в 2010 году. Он также получил Премию Европейского общества обработки сигналов за индивидуальные технические достижения в 2013 году и Премию IEEE Джеймса Л. Фланагана в области обработки речи и звука в 2013 году. 2015. [5]

В 2020 году он был избран членом Королевского общества (FRS). [20]

Янг был назначен кавалером Ордена Британской Империи (CBE) в честь Дня Рождения 2022 года за заслуги в разработке программного обеспечения. [21]

  1. ^ «Стив Янг – Цитаты из Google Scholar» . Google Академик . Проверено 2 мая 2017 г.
  2. ^ Jump up to: а б «Набор инструментов для распознавания речи HTK» . Кембриджский университет.
  3. ^ Jump up to: а б Уильямс, Джейсон; Янг, Стив (2007). «Частично наблюдаемые марковские процессы принятия решений для систем разговорного диалога» (PDF) . Компьютерная речь и язык . 21 (2): 393–422. дои : 10.1016/j.csl.2006.06.008 . S2CID   13903063 .
  4. ^ Янг, Стив; и др. «Модель состояния скрытой информации: практическая основа управления устным диалогом на основе POMDP» (PDF) . Компьютерная речь и язык .
  5. ^ Jump up to: а б с «Профессор Стив Янг, профессор информационной инженерии» . Кембриджский университет.
  6. ^ «Стивен Янг, научный сотрудник Эммануэля» .
  7. ^ Молодой, Стив. «Книга ХТК» (PDF) . Инженерный факультет Кембриджского университета .
  8. ^ «Гугл Академика» . Проверено 23 декабря 2020 г.
  9. ^ Блейз Томпсон и Стив Янг (2010). «Байесовское обновление состояния диалога: структура POMDP для систем разговорного диалога» (PDF) . Компьютерная речь и язык.
  10. ^ Янг, Стив (2013). «Статистические системы разговорного диалога на основе POMDP: обзор» (PDF) . Проц IEEE.
  11. ^ Стив Янг; и др. (2010). «Модель состояния скрытой информации: практическая основа для управления устным диалогом на основе POMDP» (PDF) . Компьютерная речь и язык.
  12. ^ Милица Гасич и Стив Янг (2014). «Гауссовы процессы для оптимизации диалогового менеджера на основе POMDP» (Документ). IEEE Транс. Обработка звука, речи и языка.
  13. ^ Пей-Хао Су; и др. (2016). «Онлайн-обучение с активным вознаграждением для оптимизации политики в системах разговорного диалога» (PDF) . Проц ACL. arXiv : 1605.07669 .
  14. ^ Лина Рохас-Бараона; и др. (2016). «Использование представлений предложений и контекста в моделях глубокой нейронной связи для понимания разговорной речи» . Прок Колинг. стр. 258–267.
  15. ^ Никола Мркшич; и др. (2017). «Нейронный трекер убеждений: отслеживание состояния диалога на основе данных» (PDF) . Проц ACL.
  16. ^ Цунг-Сянь Вэнь; и др. (2015). «Семантически обусловленная генерация естественного языка на основе LSTM для систем разговорного диалога» (PDF) . Процесс ЭМНЛП. arXiv : 1508.01745 .
  17. ^ Цунг-Сянь Вен эль аль (2017). «Сетевая сквозная обучаемая, ориентированная на задачи диалоговая система». arXiv : 1604.04562 [ cs.CL ].
  18. ^ Jump up to: а б с «Стив Янг: профиль и биография руководителя» . Блумберг ЛП
  19. ^ «Стивен Янг» . Королевская инженерная академия . Проверено 23 декабря 2020 г.
  20. ^ «Стивен Янг» . Королевское общество . Проверено 20 сентября 2020 г.
  21. ^ «№63714» . Лондонская газета (Приложение). 1 июня 2022 г. с. Б11.


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e9afa6c700f3d2e56b5c55c4d0d52089__1715315880
URL1:https://arc.ask3.ru/arc/aa/e9/89/e9afa6c700f3d2e56b5c55c4d0d52089.html
Заголовок, (Title) документа по адресу, URL1:
Steve Young (software engineer) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)