Филипп Коэн
Филипп Коэн | |
---|---|
Рожденный | |
Гражданство | Германия |
Альма-матер | Средняя школа Альберта Швейцера (Эрланген) , Университет Эрланген-Нюрнберг , Университет Теннесси , Университет Южной Калифорнии |
Известный | Корпус Европарла , Моисей |
Награды | Финалист – Европейская премия изобретателя ЕПВ 2013 г. |
Научная карьера | |
Поля | информатика , обработка естественного языка , машинный перевод , межъязыковый поиск информации |
Учреждения | Эдинбургский университет , Университет Джонса Хопкинса |
Докторантура | Кевин Найт |
Филипп Кён (родился 1 августа 1971 года в Эрлангене , Западная Германия ) — учёный-компьютерщик и исследователь в области машинного перевода . [1] [2] Его основной исследовательский интерес — статистический машинный перевод , и он является одним из изобретателей метода, называемого машинным переводом на основе фраз. Это подобласть статистических методов перевода, в которой в качестве основы перевода используются последовательности слов (или так называемые «фразы»), расширяющие предыдущие подходы, основанные на словах. Статья 2003 года, которую он написал вместе с Францем Йозефом Охом и Даниэлем Марку, под названием «Статистический фразовый перевод», привлекла широкое внимание в сообществе машинного перевода и была процитирована более тысячи раз. [3] Фразовые методы широко используются в приложениях машинного перевода в промышленности.
Филипп Кён получил степень доктора компьютерных наук в 2003 году в Университете Южной Калифорнии , где он работал в Институте информационных наук под руководством Кевина Найта. Проработав год в качестве постдокторанта под руководством Майкла Коллинза в Массачусетском технологическом институте , он присоединился к Эдинбургскому университету преподавателем в Школе информатики. в качестве лектора на факультете информатики в 2005 году. В 2010 году он был назначен читателем , а в 2012 году — профессором. В 2014 году он был назначен назначен профессором факультета информатики Университета Джонса Хопкинса , где он является филиалом Центра обработки языка и речи .
Декодер статистического машинного перевода Моисея
[ редактировать ]Декодер машинного перевода Моисея — это проект с открытым исходным кодом, созданный и поддерживаемый под руководством Филиппа Кена. [4] Декодер Моисея — это платформа для разработки систем статистического машинного перевода с параллельным корпусом для любой языковой пары. [5] Декодер был в основном разработан Хьеу Хоангом и Филиппом Кеном в Эдинбургском университете, расширен во время летнего семинара Университета Джонса Хопкинса и доработан в рамках Euromatrix проектов и GALE. Декодер (который является частью полного набора инструментов для статистического машинного перевода) де-факто является эталоном для исследований в этой области.
Хотя Кён продолжает играть важную роль в разработке Моисея, декодер Моисея был поддержан европейскими проектами Framework 6 Euromatrix , TC-Star, европейскими проектами Framework 7 EuroMatrixPlus , Let's MT, META-NET и MosesCore, а также DARPA GALE. проект, а также несколько университетов, таких как Эдинбургский университет , Университет Мэриленда , ITC-irst, Массачусетский технологический институт и другие. В число существенных дополнительных участников декодера Моисея входят Хьеу Хоанг, Крис Дайер, Джош Шредер, Марчелло Федерико, Ричард Зенс и Уэйд Шен.
Корпус Европарламента
[ редактировать ]Корпус Европарламента представляет собой набор документов, включающий в себя протоколы работы Европейского парламента с 1996 года по настоящее время. Корпус был составлен и расширен группой исследователей под руководством Филиппа Кена из Эдинбургского университета . Данные, составляющие корпус, были извлечены с сайта Европейского парламента, а затем подготовлены для лингвистического исследования. Последний выпуск (2012 г.) содержал до 60 миллионов слов на каждом языке. [6] представлен 21 европейский язык: романский (французский, итальянский, испанский, португальский, румынский), германский (английский, голландский, немецкий, датский, шведский), славянский (болгарский, чешский, польский, словацкий, словенский), финно-угорский (финский). , венгерский, эстонский), балтийский (латышский, литовский) и греческий.
Другие интересы и деятельность в хронологическом порядке
[ редактировать ]- Кён — профессор Университета Джонса Хопкинса , где он продолжает свои исследования в области машинного перевода в Центре обработки языка и речи.
- Кён является профессором и заведующим кафедрой машинного перевода в Школе информатики Эдинбургского университета и участвует в работе группы статистического машинного перевода, которая организует мастер-классы, семинары и проекты, связанные с этим предметом. [7]
- Кён периодически консультировал SYSTRAN в период с 2006 по 2011 год. [8] SYSTRAN была приобретена CLSI, [9] корейская компания по машинному переводу в апреле 2014 г. [10]
- Кён работал в Facebook/META AI Research с 2018 по 2022 год.
- Кён также является главным научным сотрудником Omniscien Technologies. [11] и акционер Omniscien Technologies с 2007 года. Omniscien Technologies — частная компания, разрабатывающая и коммерциализирующая технологии машинного перевода. [12]
- В 2009 году Кён написал книгу «Статистический машинный перевод». [13] [14] [15] и книга под названием «Нейронный машинный перевод» в 2020 году. [16]
Награды и признание
[ редактировать ]- в категории «Исследования» 2013: Один из трех финалистов премии Европейского патентного ведомства (ЕПВ) 2013 . [17] Кён получил патент EP 1488338 B «Фразовая совместная вероятностная модель для статистических машинных переводов», модель перевода, которая использует математические вероятности для определения наиболее вероятной интерпретации фрагментов текста между иностранными языками.
- 2015: Кён получил Почетную награду Международной ассоциации машинного перевода. [18]
Ссылки
[ редактировать ]- ^ Интервью с Филиппом Кеном | Технология | TAUS – Обеспечение лучшего перевода
- ^ Консультации по технологиям
- ^ "Филипп Кен" - Google Akademik
- ^ Руководство Моисея
- ^ Млосс | Проекты автора Филиппа Кена
- ^ Домашняя страница Европарла
- ^ SMT Group Эдинбург - Главная/Домашняя страница
- ^ Интернет-резюме Филиппа Кена
- ^ Пресс-релиз - CLSI приобретает контрольный пакет акций SYSTRAN.
- ^ «Сайт CLSI» . Архивировано из оригинала 4 февраля 2015 года . Проверено 6 мая 2020 г.
- ^ Интернет-резюме Филиппа Кена
- ^ Omniscien Technologies - О нас/Компания
- ^ Филипп Кён: Статистический машинный перевод
- ^ Санчес-Мартинес, Фелипе; Перес-Ортис, Хуан Антонио (2010). «Филипп Кён, Статистический машинный перевод» . Машинный перевод . 24 (3–4): 273–278. дои : 10.1007/s10590-010-9083-4 .
- ^ Статистический машинный перевод - содержание
- ^ Филипп Кён: Нейронный машинный перевод
- ^ EPO: Найдено в переводе: современный Розеттский камень.
- ^ «Международная ассоциация машинного перевода» . Архивировано из оригинала 24 июня 2010 года . Проверено 8 сентября 2016 г.