Jump to content

Фредерик Елинек

Фредерик Елинек
Рожденный
Бедржих Елинек

( 1932-11-18 ) 18 ноября 1932 г.
Умер 14 сентября 2010 г. (14 сентября 2010 г.) (77 лет)
Гражданство Американский
Альма-матер Массачусетский технологический институт
Известный Развитие методов обработки естественного языка
Супруг Милена Елинек
Награды
Научная карьера
Поля Теория информации , обработка естественного языка
Учреждения Корнеллский университет , IBM Research , Университет Джонса Хопкинса
Докторантура Роберт Фано
Известные студенты Нил Слоан

Фредерик Елинек (18 ноября 1932 — 14 сентября 2010) был чешско-американским исследователем в области теории информации , автоматического распознавания речи и обработки естественного языка . Он хорошо известен своим часто цитируемым заявлением: «Каждый раз, когда я увольняю лингвиста, производительность распознавателя речи повышается». [примечание 1]

Елинек родился в Чехословакии перед Второй мировой войной и эмигрировал с семьей в Соединенные Штаты в первые годы коммунистического режима. Он изучал инженерное дело в Массачусетском технологическом институте и в течение 10 лет преподавал в Корнелльском университете, прежде чем устроился на работу в IBM Research . В 1961 году он женился на чешской сценаристке Милене Елинек . В IBM его команда продвигала подходы к компьютерному распознаванию речи и машинному переводу. После IBM он на 17 лет возглавил Центр обработки языка и речи при Университете Джонса Хопкинса , где и работал в день своей смерти.

Личная жизнь [ править ]

Елинек родился 18 ноября 1932 года, как Бедржих Елинек. [6] в Кладно Вилему и Труде Елинек. [7] Его отец был евреем; его мать родилась в Швейцарии в семье чешских католиков и приняла иудаизм. [8] [9] Елинек-старший, дантист, заранее планировал бежать из нацистской оккупации и бежать в Англию; он организовал паспорт, визу и доставку своих стоматологических материалов. Пара планировала отдать сына в английскую частную школу . Однако Вилем в последнюю минуту решил остаться и в конце концов был отправлен в концентрационный лагерь Терезиенштадт . [10] где он умер в 1945 году. [7] [9] Семья была вынуждена переехать в Прагу в 1941 году, но Фредерик, его сестра и мать — благодаря прошлому последнего — избежали концентрационных лагерей. [9]

Принято считать, что научный талант проявляется в ранней юности. ... Это был, конечно, не мой случай. Каким-то образом я вошел в свою научную профессию. Моя мать хотела, чтобы я стал врачом, как и мой отец. ... Я сам хотел быть адвокатом, защитником несправедливо обвиненных. Но моя карьера — результат политических обстоятельств, академических возможностей и счастливых случайностей.

—Говоря о своей жизни в речи 2001 года. [10]

После войны Елинек поступил в гимназию , несмотря на то, что пропустил несколько лет обучения, поскольку образование еврейских детей было запрещено с 1942 года. Его мать, заботясь о том, чтобы ее сын получил хорошее образование, приложила большие усилия для их эмиграции. [примечание 2] особенно когда стало ясно, что ему не разрешат даже попытаться сдать выпускной экзамен. Его мать надеялась, что ее сын станет врачом, но Елинек мечтал стать юристом. Он изучал инженерное дело на вечерних курсах в Городском колледже Нью-Йорка и получал стипендию Национального комитета за свободную Европу , которая позволила ему учиться в Массачусетском технологическом институте . О своем выборе специальности он сказал: «К счастью, к электротехнике принадлежала дисциплина, целью которой не было построение физических систем: теория информации». [10] Он получил докторскую степень. в 1962 году с Робертом Фано в качестве его советника. [11] [12]

В 1957 году Елинек неожиданно посетил Прагу. Он был в Вене и подал заявление на визу, надеясь снова увидеть своих бывших знакомых. Он встретился со своим старым другом Милошем Форманом , который познакомил его со студенткой киноискусства Миленой Тоболовой , сценарий которой лег в основу фильма « Легкая жизнь » ( Snadný život ). [13] [14] Его обратный рейс в США имел остановку в Мюнхене, во время которой он позвонил ей, чтобы сделать предложение. [9] Тоболову считали диссиденткой, и власти были недовольны ее фильмом. [14] Елинек обратился за помощью к Джерому Визнеру и Сайрусу Итону , последнему, который лоббировал Никиту Хрущева . [13] После инаугурации Джона Ф. Кеннеди в январе 1961 года группе чешских диссидентов было разрешено эмигрировать. Благодаря лоббированию в их число попала будущая Милена Елинек. [9] [13]

После завершения аспирантуры Елинек, у которого появился интерес к лингвистике , планировал работать с Чарльзом Ф. Хокеттом в Корнелльском университете . Однако это провалилось, и в течение следующих десяти лет он продолжал изучать теорию информации. [10] Ранее он работал в IBM во время творческого отпуска, а в 1972 году начал работать там полный рабочий день — сначала в отпуске в Корнелл, а с 1974 года — на постоянной основе. Он оставался там более двадцати лет. Хотя сначала ему предложили постоянную исследовательскую работу, по прибытии он узнал, что Йозеф Равив недавно был назначен главой недавно открытой исследовательской лаборатории IBM в Хайфе и возглавил группу непрерывного распознавания речи в Институте Томаса Дж. Уотсона. Исследовательский центр . [10] [12] Несмотря на успехи его команды в этой области, работы Елинека оставались малоизвестными в его родной стране, поскольку чешским ученым не разрешалось участвовать в ключевых конференциях. [13]

После падения коммунизма в 1989 году Елинек помог установить научные связи, регулярно посещая лекции и помогая убедить IBM создать вычислительный центр в Карловом университете . [8] [10] [15] В 1993 году он ушел из IBM и поступил в Центр языковой и речевой обработки Университета Джонса Хопкинса , где он был директором и профессором электротехники и вычислительной техники Джулиана Синклера Смита. [11] [16] На момент своей смерти он все еще работал там; Елинек умерла от сердечного приступа в конце обычного рабочего дня в середине сентября 2010 года. [9] [16] У него остались жена, дочь и сын, сестра, сводная сестра и трое внуков, включая Софи Голд Елинек.

и Исследования наследие

Теория информации была модным научным подходом в середине 50-х годов. [12] Однако пионер Клод Шеннон писал в 1956 году, что такая модность опасна. Он сказал: «Наши коллеги-ученые во многих различных областях, привлеченные фанфарами и новыми возможностями, открытыми для научного анализа, используют эти идеи в своих собственных проблемах... Наше несколько искусственное процветание будет слишком легко рухнуть». в мгновение ока, когда становится понятно, что использование нескольких захватывающих слов, таких как информация, энтропия, избыточность, не решает всех наших проблем». [17] В течение следующего десятилетия сочетание факторов остановило применение теории информации к проблемам обработки естественного языка (НЛП), в частности машинного перевода . Одним из факторов стала публикация в 1957 году книги Ноама Хомского « Синтаксические структуры » , в которой говорилось: «Вероятностные модели не дают понимания основных проблем синтаксической структуры». [18] Это хорошо соответствовало философии исследований искусственного интеллекта того времени, которые продвигали подходы, основанные на правилах. Другим фактором стал отчет ALPAC 1966 года , в котором правительству рекомендовалось прекратить финансирование исследований в области машинного перевода. Председатель ALPAC Джон Пирс позже сказал, что эта область заполнена «безумными изобретателями или ненадежными инженерами». Он сказал, что основные лингвистические проблемы должны быть решены, прежде чем можно будет разумно предпринять попытки НЛП. Эти элементы по существу остановили исследования в этой области. [5] [19]

Интерес к лингвистике у Елинека начал проявляться после иммиграции его жены, которая первоначально поступила на лингвистическую программу Массачусетского технологического института с помощью Романа Якобсона . Елинек часто сопровождал ее на лекции Хомского и даже обсуждал со своим научным руководителем возможность смены ориентации. Фано был «действительно расстроен», и после провала его проекта с Хокеттом в Корнелле он не возвращался в эту область исследований, пока не начал работать в IBM. [12] Объем исследований в IBM значительно отличался от исследований большинства других команд. По словам Марка Либермана , «пока [Елинек] руководил усилиями IBM по решению общей проблемы диктовки в течение примерно десяти лет после 1972 года, большинство других американских компаний и академических исследователей работали над очень ограниченными проблемами… или оставались в стороне от этой проблемы». поле целиком». [19]

Он не был пионером распознавания речи, он был пионером распознавания речи.

—Стив Янг (2010) [5]

Елинек рассматривал распознавание речи как проблему теории информации ( зашумленный канал , в данном случае акустический сигнал), что некоторые наблюдатели считали смелым подходом. [5] [16] [19] Понятие недоумения было введено в их первой модели, [12] Новая грамматика Рэли, которая была опубликована в 1976 году как статья «Непрерывное распознавание речи статистическими методами» в журнале Proceedings of the IEEE . [5] По словам Янга, базовый подход с шумным каналом «свел проблему распознавания речи к созданию двух статистических моделей». [5] В то время как «Новая грамматика Рэли» была скрытой марковской моделью , их следующая модель, названная «Тангора», была более широкой и включала в себя n-граммы , в частности триграммы. Хотя «всем было очевидно, что эта модель безнадежно обеднела», она не была улучшена до тех пор, пока Елинек не представил еще одну статью в 1999 году. [5] Тот же триграммный подход был применен к телефонам, состоящим из отдельных слов. Хотя идентификация частей речи оказалась не очень полезной для распознавания речи, методы маркировки, разработанные в ходе этих проектов, теперь используются в различных приложениях НЛП. [12]

Методы дополнительных исследований, разработанные в IBM, в конечном итоге стали доминирующими в этой области после того , как DARPA в середине 80-х годов вернулось к исследованиям НЛП и навязало эту методологию участвующим командам, разделявшим общие цели, данные и точные показатели оценки. [19] Исследования Continuous Speech Recognition Group, потребовавшие больших объемов данных для обучения алгоритмов, в конечном итоге привели к созданию Linguistic Data Consortium . В 1980-х годах, хотя более широкая проблема распознавания речи оставалась нерешенной, они стремились применить разработанные методы к другим проблемам; Машинный перевод и прогнозирование стоимости акций рассматривались как варианты. Группа исследователей IBM перешла на работу в Renaissance Technologies . Елинек писал: «Работа фонда «Возрождение» легендарна, но я понятия не имею, использовались ли когда-либо какие-либо методы, которые мы разработали в IBM. Мои бывшие коллеги не скажут мне: их операция очень секретная!» [12] Методы, очень похожие на те, что разработаны для распознавания речи, лежат в основе большинства используемых сегодня систем машинного перевода. Наблюдатели заявили, что парадигма Пирса, согласно которой инженерные достижения в этой области должны основываться на научном прогрессе, перевернута: достижения инженерной мысли лежат в основе ряда научных открытий. [5] [19]

Работы Елинека несколько раз получали награды «Лучшая статья», а во время работы в IBM он получил ряд наград компании. [5] [11] Он получил Премию Общества за «выдающийся технический вклад и лидерство» от Общества обработки сигналов IEEE за 1997 год. [20] и медаль ESCA за научные достижения в 1999 году. [21] Он был награжден медалью третьего тысячелетия IEEE в 2000 году, первой премией Антонио Замполли Европейской ассоциации языковых ресурсов в 2004 году. [22] Премия Джеймса Л. Фланагана 2005 года за обработку речи и звука , [23] и Премию за выдающиеся достижения в 2009 году от Ассоциации компьютерной лингвистики . [11] [12] Он получил почетную степень доктора философии. из Карлова университета в 2001 году, [24] был избран членом Национальной инженерной академии в 2006 году и стал одним из двенадцати первых членов Международной ассоциации речевой коммуникации в 2008 году. [5]

Избранные публикации [ править ]

  • Елинек, Фредерик (1968). Вероятностная теория информации: дискретные модели и модели без памяти . Серия МакГроу-Хилла по системным наукам. Нью-Йорк: МакГроу-Хилл. 689 стр. ЛЦН   68-11611 [1] (обзор)
  • ———————- (1969). «Алгоритм быстрого последовательного декодирования с использованием стека». Журнал исследований и разработок IBM 13 (6): 675–685. два : 10.1147/rd.136.0675 .
  • ———————- (1969). «Древовидное кодирование дискретных по времени источников без памяти с критерием точности». Транзакции IEEE по теории информации 15 (5): 584–590. дои : 10.1109/TIT.1969.1054355 . (получил награду «Лучшая статья 1971 г.»)
  • Бахл, Лалит Р.; Джон Кок , Фредерик Елинек, Йозеф Равив (1974). «Оптимальное декодирование линейных кодов для минимизации частоты ошибок символов». Транзакции IEEE по теории информации 20 (2): 284–287. дои : 10.1109/TIT.1974.1055186 . (получил премию Золотого юбилея Общества теории информации)
  • ———————- (1976). «Распознавание непрерывной речи статистическими методами». Труды IEEE 64 (4): 532–556. два : 10.1109/PROC.1976.10159 .
  • Браун, П.; Дж. Кок, С. Делла Пьетра, В. Делла Пьетра, Ф. Елинек, Р. Мерсер и П. Руссин (1988). «Статистический подход к языковому переводу». Архивировано 7 августа 2011 года в Wayback Machine . В Денеше Варге, изд. Колинг 88: Материалы 12-й конференции по компьютерной лингвистике, том 1 . Будапешт: Общество вычислительных наук Джона фон Неймана. стр. 71–76. дои : 10.3115/991635.991651 . ISBN   963-8431-56-3 .
  • ———————- (1990). «Самоорганизующееся языковое моделирование для распознавания речи». В Алексе Вайбеле и Кай-Фу Ли, ред. Чтения в распознавании речи . Сан-Матео: Морган Кауфманн. 629 стр. ISBN   1-55860-124-4 .
  • ———————-; Джон Д. Лафферти и Роберт Л. Мерсер. (1990) «Основные методы вероятностных контекстно-свободных грамматик». Технический отчет RC 16374 (72684), IBM.
    • Перепечатано в Лафасе, Пьетро; Ренато Де Мори (1992). Распознавание и понимание речи: последние достижения, тенденции и приложения . Серия НАТО ASI. Серия F, Компьютерные и системные науки, 75 . Нью-Йорк: Springer-Verlag. стр. 345–360. ISBN   0-387-54032-6 .
  • ———————- (1997). Статистические методы распознавания речи . Кембридж, Массачусетс: MIT Press. 283с. ISBN   0-262-10066-5 . (обзор) (обзор 2)
  • Чельба, Киприан; Фредерик Елинек (2000). «Структурированное языковое моделирование». Компьютерная речь и язык 14 (4): 283–332. doi : 10.1006/csla.2000.0147 (получил награду «Лучшая статья 2002 г.»).
    • Расширенная версия презентации на НЛДБ'99. Клагенфурт, Австрия, 17–19 июня 1999 г. ( arXiv : cs/0001023 ).
  • Сюй, Пэн; Ахмад Эмами и Фредерик Елинек (2003). « Обучение коннекционистских моделей для модели структурированного языка ». В книге Майкла Коллинза и Марка Стидмана, ред. EMNLP '03 Материалы конференции 2003 года по эмпирическим методам обработки естественного языка . Ист Страудсбург, Пенсильвания: Ассоциация компьютерной лингвистики. стр. 160–167. ISBN   1-932432-13-2 . дои : 10.3115/1119355.1119376 . (выиграл приз «Лучшая статья»)

Ссылки [ править ]

Примечания
  1. Хотя его известность и культовый статус неоспоримы (например, оно было использовано в качестве названия речи Джулии Хиршберг в 1998 году ), [1] его контекст неизвестен, а конкретная формулировка и датировка неясны. По словам Дэниела Джурафски и Джеймса Х. Мартина, сам Елинек вспоминал эту цитату как «Каждый раз, когда лингвист покидает группу, уровень узнаваемости возрастает» и датировал ее декабрем 1988 года (Уэйн, Пенсильвания), далее отмечая, что цитата не появлялась в опубликованное судебное разбирательство, [2] [3] тогда как Роджер К. Мур дал формулировку: «Каждый раз, когда мы увольняем фонетиста/лингвиста, производительность нашей системы повышается» и приурочил ее к семинару IEEE по автоматическому распознаванию и пониманию речи, состоявшемуся в 1985 году. [4] По словам Стива Янга, «история гласит, что однажды один из его лингвистов подал в отставку, и Фред решил заменить его не другим лингвистом, а инженером. Некоторое время спустя Фред заметил, что производительность его системы значительно улучшилась. Так что он посоветовал другому лингвисту найти альтернативную работу, и, конечно же, его успеваемость снова улучшилась». [5]
  2. По его словам, «она не хотела повторять большую ошибку моего отца».
Ссылки
  1. ^ Хиршберг, Джулия (29 июля 1998 г.). «Каждый раз, когда я увольняю лингвиста, моя производительность повышается» и другие мифы о революции статистической обработки естественного языка (Речь). 15-я Национальная конференция по искусственному интеллекту, Мэдисон, Висконсин. {{cite speech}}:CS1 maint: локация ( ссылка ) Приглашенная речь.
  2. ^ Юрафский, Дэниел; Джеймс Х. Мартин (2009). Обработка речи и языка: введение в обработку естественного языка, компьютерную лингвистику и распознавание речи . Серия Прентис Холл по искусственному интеллекту (2-е изд.). Аппер-Седл, Нью-Джерси: Прентис-Холл. п. 83 . ISBN  978-0-13-187321-6 .
  3. ^ Палмер, Марта; Тим Финин (1990). «Отчет о семинаре по оценке систем обработки естественного языка» (PDF) . Компьютерная лингвистика . 16 (1): 171–185.
  4. ^ Мур, Роджер К. (2005). Результаты опроса участников ASRU в 1997 и 2003 годах (PDF) . ИНТЕРСПИЧ-2005. Лиссабон, 4–8 сентября 2005 г. Архивировано из оригинала (PDF) 20 июля 2011 г. {{cite conference}}: CS1 maint: местоположение ( ссылка )
  5. ^ Jump up to: Перейти обратно: а б с д и ж г час я дж Янг, Стив (ноябрь 2010 г.). «Фредерик Елинек 1932–2010: пионер технологий распознавания речи» . Информационный бюллетень Технического комитета по обработке речи и языка . Общество обработки сигналов IEEE . Архивировано из оригинала 28 июля 2011 года . Проверено 16 декабря 2010 г. Адаптировано из речи, произнесенной в 2006 году.
  6. ^ Рейзек, Ян (17 сентября 2010 г.). «Некролог» . Народная газета . Проверено 17 декабря 2010 г.
  7. ^ Jump up to: Перейти обратно: а б Елинек, Фредерик (1997). Статистические методы распознавания речи . Кембридж, Массачусетс: MIT Press. п. ISBN против  0-262-10066-5 .
  8. ^ Jump up to: Перейти обратно: а б Хаджич, Ян (ноябрь 2010 г.). «Профессор Фредерик Елинек, 1932–2010» . Информационный бюллетень EACL . Том. 12 . Проверено 19 декабря 2010 г.
  9. ^ Jump up to: Перейти обратно: а б с д и ж Лор, Стив (24 сентября 2010 г.). «Фредерик Елинек, давший машинам ключ к человеческой речи, умер в возрасте 77 лет» . Нью-Йорк Таймс . п. Б10 . Проверено 16 декабря 2010 г.
  10. ^ Jump up to: Перейти обратно: а б с д и ж Елинек, Фредерик (22 ноября 2001 г.). Как я сюда попал (Речь). Карлов университет, Прага, Чехословакия. Архивировано из оригинала 16 марта 2008 года . Проверено 17 декабря 2010 г. Речь о вручении степени Honoris causa.
  11. ^ Jump up to: Перейти обратно: а б с д Ян, Елинек (13 июня 2006 г.). "Резюме" . Архивировано из оригинала 3 сентября 2006 года . Проверено 17 декабря 2010 г.
  12. ^ Jump up to: Перейти обратно: а б с д и ж г час Елинек, Фред (декабрь 2009 г.). «Рассвет статистического ASR и MT» . Компьютерная лингвистика . 35 (4): 483–494. дои : 10.1162/coli.2009.35.4.35401 . S2CID   1486422 .
  13. ^ Jump up to: Перейти обратно: а б с д Хершенсон, Роберта (31 декабря 1989 г.). «Чешская пара следит за Родиной» . Нью-Йорк Таймс . Проверено 17 декабря 2010 г.
  14. ^ Jump up to: Перейти обратно: а б Уиллоуби, Ян (9 июня 2008 г.). «Милена Елинек – представительница золотого поколения чешских кинематографистов, сейчас преподает сценарное мастерство в Колумбийском университете» . Один на Один . Радио Прага . Проверено 1 февраля 2014 г.
  15. ^ Дрессер, Майкл (19 сентября 2010 г.). «Умер Фредерик Елинек, пионер распознавания речи» . Балтимор Сан . Проверено 16 декабря 2010 г.
  16. ^ Jump up to: Перейти обратно: а б с Снейдерман, Фил (20 сентября 2010 г.). «Фредерик Елинек, 77 лет, пионер в области технологий понимания речи и текста» . Газета JHU . Университет Джонса Хопкинса . Проверено 16 декабря 2010 г.
  17. ^ Цитируется по Либерману (2010).
  18. ^ Цитируется по книге Янга (2010).
  19. ^ Jump up to: Перейти обратно: а б с д и Либерман, Марк (декабрь 2010 г.). «Некролог: Фред Джелинек» . Компьютерная лингвистика . 36 (4): 595–599. дои : 10.1162/coli_a_00032 .
  20. ^ «Премия общества» . Общество обработки сигналов IEEE . Проверено 21 декабря 2010 г.
  21. ^ «Медаль ESCA 1999 года за научные достижения» . Международная ассоциация речевой коммуникации. 1999. Архивировано из оригинала 2 августа 2009 года . Проверено 21 декабря 2010 г.
  22. ^ «В честь профессора Антонио Замполли» . Европейская ассоциация языковых ресурсов. Архивировано из оригинала 21 июля 2011 года . Проверено 21 декабря 2010 г.
  23. ^ «Обладатели премии IEEE Джеймса Л. Фланагана в области речи и обработки звука» . ИИЭЭ . Проверено 21 декабря 2010 г.
  24. ^ «Доктор медицинских наук, профессор Ф. Елинек» (Пресс-релиз). Карлов университет в Праге. 22 ноября 2001 года . Проверено 17 декабря 2010 г.

Внешние ссылки [ править ]

Предшественник Общества обработки сигналов IEEE Премия
1997
Преемник
Предшественник
Марио Росси
Медаль ISCA за научные достижения
1999
Преемник
Луи Польс
Предшественник IEEE Джеймс Л. Фланаган
Премия за обработку речи и звука

2005
Преемник
Предшественник ACL за выслугу лет Премия
2009
Преемник
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c5d175931892b9707fc185fc0b6de42b__1699465680
URL1:https://arc.ask3.ru/arc/aa/c5/2b/c5d175931892b9707fc185fc0b6de42b.html
Заголовок, (Title) документа по адресу, URL1:
Frederick Jelinek - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)