Jump to content

Филипп Коэн

Филипп Коэн
Рожденный ( 1971-08-01 ) 1 августа 1971 г. (53 года)
Гражданство Германия
Альма-матер Средняя школа Альберта Швейцера (Эрланген) , Университет Эрланген-Нюрнберг , Университет Теннесси , Университет Южной Калифорнии
Известный Корпус Европарла , Моисей
Награды Финалист – Европейская премия изобретателя ЕПВ 2013 г.
Научная карьера
Поля информатика , обработка естественного языка , машинный перевод , межъязыковый поиск информации
Учреждения Эдинбургский университет , Университет Джонса Хопкинса
Докторантура Кевин Найт

Филипп Кён (родился 1 августа 1971 года в Эрлангене , Западная Германия ) — учёный-компьютерщик и исследователь в области машинного перевода . [1] [2] Его основной исследовательский интерес — статистический машинный перевод , и он является одним из изобретателей метода, называемого машинным переводом на основе фраз. Это подобласть статистических методов перевода, в которой в качестве основы перевода используются последовательности слов (или так называемые «фразы»), расширяющие предыдущие подходы, основанные на словах. Статья 2003 года, которую он написал вместе с Францем Йозефом Охом и Даниэлем Марку, под названием «Статистический фразовый перевод», привлекла широкое внимание в сообществе машинного перевода и была процитирована более тысячи раз. [3] Фразовые методы широко используются в приложениях машинного перевода в промышленности.

Филипп Кён получил степень доктора компьютерных наук в 2003 году в Университете Южной Калифорнии , где он работал в Институте информационных наук под руководством Кевина Найта. Проработав год в качестве постдокторанта под руководством Майкла Коллинза в Массачусетском технологическом институте , он присоединился к Эдинбургскому университету преподавателем в Школе информатики. в качестве лектора на факультете информатики в 2005 году. В 2010 году он был назначен читателем , а в 2012 году — профессором. В 2014 году он был назначен назначен профессором факультета информатики Университета Джонса Хопкинса , где он является филиалом Центра обработки языка и речи .

Декодер статистического машинного перевода Моисея

[ редактировать ]

Декодер машинного перевода Моисея — это проект с открытым исходным кодом, созданный и поддерживаемый под руководством Филиппа Кена. [4] Декодер Моисея — это платформа для разработки систем статистического машинного перевода с параллельным корпусом для любой языковой пары. [5] Декодер был в основном разработан Хьеу Хоангом и Филиппом Кеном в Эдинбургском университете, расширен во время летнего семинара Университета Джонса Хопкинса и доработан в рамках Euromatrix проектов и GALE. Декодер (который является частью полного набора инструментов для статистического машинного перевода) де-факто является эталоном для исследований в этой области.

Хотя Кён продолжает играть важную роль в разработке Моисея, декодер Моисея был поддержан европейскими проектами Framework 6 Euromatrix , TC-Star, европейскими проектами Framework 7 EuroMatrixPlus , Let's MT, META-NET и MosesCore, а также DARPA GALE. проект, а также несколько университетов, таких как Эдинбургский университет , Университет Мэриленда , ITC-irst, Массачусетский технологический институт и другие. В число существенных дополнительных участников декодера Моисея входят Хьеу Хоанг, Крис Дайер, Джош Шредер, Марчелло Федерико, Ричард Зенс и Уэйд Шен.

Корпус Европарламента

[ редактировать ]

Корпус Европарламента представляет собой набор документов, включающий в себя протоколы работы Европейского парламента с 1996 года по настоящее время. Корпус был составлен и расширен группой исследователей под руководством Филиппа Кена из Эдинбургского университета . Данные, составляющие корпус, были извлечены с сайта Европейского парламента, а затем подготовлены для лингвистического исследования. Последний выпуск (2012 г.) содержал до 60 миллионов слов на каждом языке. [6] представлен 21 европейский язык: романский (французский, итальянский, испанский, португальский, румынский), германский (английский, голландский, немецкий, датский, шведский), славянский (болгарский, чешский, польский, словацкий, словенский), финно-угорский (финский). , венгерский, эстонский), балтийский (латышский, литовский) и греческий.

Другие интересы и деятельность в хронологическом порядке

[ редактировать ]
  • Кён — профессор Университета Джонса Хопкинса , где он продолжает свои исследования в области машинного перевода в Центре обработки языка и речи.
  • Кён является профессором и заведующим кафедрой машинного перевода в Школе информатики Эдинбургского университета и участвует в работе группы статистического машинного перевода, которая организует мастер-классы, семинары и проекты, связанные с этим предметом. [7]
  • Кён периодически консультировал SYSTRAN в период с 2006 по 2011 год. [8]  SYSTRAN была приобретена CLSI, [9] корейская компания по машинному переводу в апреле 2014 г. [10]
  • Кён работал в Facebook/META AI Research с 2018 по 2022 год.
  • Кён также является главным научным сотрудником Omniscien Technologies. [11] и акционер Omniscien Technologies с 2007 года. Omniscien Technologies — частная компания, разрабатывающая и коммерциализирующая технологии машинного перевода. [12]
  • В 2009 году Кён написал книгу «Статистический машинный перевод». [13] [14] [15] и книга под названием «Нейронный машинный перевод» в 2020 году. [16]

Награды и признание

[ редактировать ]
  • в категории «Исследования» 2013: Один из трех финалистов премии Европейского патентного ведомства (ЕПВ) 2013 . [17] Кён получил патент EP 1488338 B «Фразовая совместная вероятностная модель для статистических машинных переводов», модель перевода, которая использует математические вероятности для определения наиболее вероятной интерпретации фрагментов текста между иностранными языками.
  • 2015: Кён получил Почетную награду Международной ассоциации машинного перевода. [18]
  1. ^ Интервью с Филиппом Кеном | Технология | TAUS – Обеспечение лучшего перевода
  2. ^ Консультации по технологиям
  3. ^ "Филипп Кен" - Google Akademik
  4. ^ Руководство Моисея
  5. ^ Млосс | Проекты автора Филиппа Кена
  6. ^ Домашняя страница Европарла
  7. ^ SMT Group Эдинбург - Главная/Домашняя страница
  8. ^ Интернет-резюме Филиппа Кена
  9. ^ Пресс-релиз - CLSI приобретает контрольный пакет акций SYSTRAN.
  10. ^ «Сайт CLSI» . Архивировано из оригинала 4 февраля 2015 года . Проверено 6 мая 2020 г.
  11. ^ Интернет-резюме Филиппа Кена
  12. ^ Omniscien Technologies - О нас/Компания
  13. ^ Филипп Кён: Статистический машинный перевод
  14. ^ Санчес-Мартинес, Фелипе; Перес-Ортис, Хуан Антонио (2010). «Филипп Кён, Статистический машинный перевод» . Машинный перевод . 24 (3–4): 273–278. дои : 10.1007/s10590-010-9083-4 .
  15. ^ Статистический машинный перевод - содержание
  16. ^ Филипп Кён: Нейронный машинный перевод
  17. ^ EPO: Найдено в переводе: современный Розеттский камень.
  18. ^ «Международная ассоциация машинного перевода» . Архивировано из оригинала 24 июня 2010 года . Проверено 8 сентября 2016 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 4852a5acc22ed244501859fa34571a53__1718542800
URL1:https://arc.ask3.ru/arc/aa/48/53/4852a5acc22ed244501859fa34571a53.html
Заголовок, (Title) документа по адресу, URL1:
Philipp Koehn - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)