Мартин Кей

Мартин Кей (1935 — 8 августа 2021) — учёный-компьютерщик , особенно известный своими работами в области компьютерной лингвистики .

Он родился и вырос в Соединенном Королевстве, получил степень магистра в Тринити-колледже в Кембридже в 1961 году. В 1958 году он начал работать в Кембриджском отделе языковых исследований , одном из первых центров исследований в области, известной сейчас как компьютерная лингвистика. В 1961 году он перешёл в корпорацию Rand в Санта-Монике, штат Калифорния , США, где в конечном итоге стал главой исследования в области лингвистики и машинного перевода. Он покинул Рэнд в 1972 году, чтобы стать заведующим кафедрой компьютерных наук Калифорнийского университета в Ирвайне . В 1974 году он перешел в исследовательский центр Xerox в Пало-Альто в качестве научного сотрудника. В 1985 году, сохранив свою должность в Xerox PARC, он поступил на факультет Стэнфордского университета на полставки . В последнее время он был профессором лингвистики в Стэнфордском университете и почетным профессором компьютерной лингвистики в Саарском университете .

Жизнь

Он родился в Эджвере (Миддлсекс, Великобритания) в 1935 году и изучал лингвистику и компьютерную лингвистику в Тринити-колледже в Кембридже.

Его основными интересами были переводы, выполняемые как людьми, так и машинами, а также вычислительные лингвистические алгоритмы, особенно в области морфологии и синтаксиса.

Работа

Кей начал свою карьеру в Кембриджском языковом исследовательском отделе в Кембридже, Англия, под руководством Маргарет Мастерман . В 1961 году Дэвид Г. Хейс нанял его для работы в корпорации RAND ; впоследствии он работал в Калифорнийском университете в Ирвайне и в Xerox PARC . Кей — один из пионеров компьютерной лингвистики и машинного перевода. Он был ответственным за введение понятия анализа диаграмм в вычислительную технику.лингвистике и понятию унификации в лингвистике вообще.

Вместе с Роном Капланом он стал пионером в исследованиях и разработке приложений в области морфологии конечных состояний. Он долгое время участвовал и критиковал работу по машинному переводу. В своей основополагающей статье «Правильное место людей и машин в языковом переводе» ^[1] Кей выступал за системы машинного перевода, которые были тесно интегрированы в процесс человеческого перевода. Он был рецензентом и критиком EUROTRA, Verbmobil и многих других проектов MT.

Кей был бывшим председателем Ассоциации компьютерной лингвистики и президентом Международного комитета по компьютерной лингвистике . он был научным сотрудником в Xerox PARC. До 2002 года почетный доктор Гетеборгского университета . Кей получил Премию Ассоциации компьютерной лингвистики за выдающиеся достижения за свою устойчивую роль интеллектуального лидера в исследованиях НЛП в 2005 году.

Достижения и награды

Его достижения включали разработку грамматики синтаксического анализа диаграмм и функционального объединения , а также большой вклад в применение автоматов с конечным состоянием в вычислительной фонологии и морфологии. Он также считался ведущим специалистом в области машинного перевода .
Среди его наград - почетный доктор философии Гетеборгского университета и премия Ассоциации компьютерной лингвистики за выдающиеся достижения в 2005 году . Он был постоянным председателем Международного комитета по компьютерной лингвистике .

Взносы

1. «Правильная» статья Мартина Кея [1]После отчета ALPAC в 1966 году был сделан вывод: «Не существует непосредственной или предсказуемой перспективы использования MT в качестве полезного перевода общенаучных текстов». [2] Из-за этого результата в сфере машинного перевода наступил темный период. С 1966 по 1976 год, почти десять лет, исследований было проведено мало. Однако в 1980-е годы наступил период Возрождения. [3] «Правильное место людей и машин в языковом переводе» привлекло больше внимания к машинному переводу. В этой статье были высказаны новые мысли о взаимосвязи между машинным переводом и человеческим переводом. В то время, с появлением более дешевых компьютеров и широким использованием доменов в машинном переводе, была острая необходимость в высококачественных результатах. А теория полностью автоматического высококачественного перевода была просто идеальным уровнем для машинного перевода после критики Бар-Хиллеля в его обзоре прогресса машинного перевода в 1960-х годах: «Целью машинного перевода не должен быть полностью автоматический высококачественный перевод (FAHQT), который могут заменить переводчиков-людей. Вместо этого MT должен ставить перед собой менее амбициозные цели, например, более экономически эффективное взаимодействие человека и машины и стремиться к повышению производительности человеческого перевода». [4] Полезность человеческого перевода вышла на новый, более высокий уровень. Согласно этой мысли, Мартин Кей предложил более практичную идею взаимоотношений между человеком и машиной в процессе машинного перевода, названную «секретарь переводчика».

1.1 Два аргумента против пользы машинного переводаПоскольку эта идея включает в себя одновременно человека и машину, то и ученые-компьютерщики, и лингвисты несут ответственность перед МП. Но «от них никогда не следует просить предоставить инженерное решение проблемы, которую они лишь смутно понимают». Им просто нужно добиться, «делая только то, что можно сделать с абсолютной уверенностью и надежностью… что может быть практически гарантировано всем заинтересованным сторонам». Что касается основных частей перевода, то есть два взаимосвязанных аргумента против правдоподобия машинного перевода как промышленного предприятия с точки зрения лингвистики и информатики.В пользу специальных решений проблем машинного перевода обычно выдвигают два аргумента. Согласно первому аргументу, «специальные решения, как правило, основаны на индивидуальном анализе того, что лингвисты называют поверхностными явлениями, по сути, цепочками слов, а также на реальных или воображаемых статистических свойствах определенных стилей письма и областей дискурса». Это простое статистическое утверждение, от которого можно отказаться. Во втором аргументе специальные решения упоминаются только в понимании второго языка посредством чтения текста и называются учеником чародея, потому что «этот тип аргумента заключается в том, что неполная теория, которую имеют лингвисты и ученые-компьютерщики, которую удалось предоставить, часто является худшей основой для построения практических устройств, чем полное отсутствие теории, потому что теория не знает, когда остановиться». «Основная проблема с аргументом ученика чародея заключается в том, что решение о том, что предложение можно перевести без анализа, может быть принято только постфактум. Пример предложения показывает, что на определенном уровне существует более одной интерпретации предложения, и дальнейший анализ показывает, что Короче говоря, алгоритм, необходимый для принятия решения о необходимости анализа, должен будет использовать результаты того самого анализа, которого он призван избежать».

1.2. Апись переводчика и память переводов.Это основная часть статьи, и для иллюстрации того, что такое рукопись переводчика, автор показал три аспекта: редактирование текста, средства перевода и машинный перевод.«Предположим, что переводчикам предоставлен терминал, состоящий из клавиатуры,экран и какой-то способ указать на отдельные слова и буквы. Изображение на экране разделено на два окна. Текст, который нужно перевести, появляется в верхнем окне, а перевод будет составлен в нижнем. Это форма личного письма переводчика, которая не является реальным устройством и никогда не будет. «Оба окна ведут себя одинаково. Используя указательное устройство, переводчик может выбрать букву, слово, предложение, строку или абзац и, нажав соответствующую клавишу, вызвать выполнение над ней какой-либо операции».

Эти два рисунка показывают процесс перевода от первоначального отображения к выбору.Это устройство не простое, как эти две фигуры, с его помощью переводчику можно оказать более специальную услугу. В пособиях по переводу автор показал третий рисунок:

«Относительно тривиальным дополнением был бы словарь. Переводчик выбирает слово или последовательность слов и дает команду для их поиска… Это новое окно дает эффект наложения некоторой части уже имеющихся окон. В этом случае , новое окно содержит обманчиво простую словарную статью для выбранного слова». Более того, устройство имеет множество других функций. Например, простота словарной статьи, слова Синтаксис и Семантика будут включены при указании на символы, изменяемые словарные статьи и временные поправки делают это устройство более практичным. Затем будет объяснен машинный перевод. «Одним из вариантов, который должен быть предложен пользователю гипотетической системы, которую я описываю, на довольно раннем этапе, будет команда, которая будет указывать программе на перевод выбранной в данный момент единицы. Что произойдет, когда будет дана эта команда будут разными на разных этапах развития системы, но пользователь системы всегда будет иметь право вмешиваться в процесс перевода в той мере, в какой он сам укажет, если он решит вообще не вмешиваться, подразумевая фрагмент текста. перевод текущего модуля будет отображаться в нижнем окне его экрана. Он сможет редактировать его любым удобным для него способом, как это делали постредакторы в прошлом. Альтернативно, он может попросить его проконсультироваться при каждом запуске программы. сталкивается с решением определенного типа, когда обнаруживаются определенные виды двусмысленности или что-то еще. В таких случаях система задает вопрос переводчику-человеку. Он может, например, попросить проконсультироваться по вопросам местоимений. ссылка."В этой части была показана идея памяти переводов как словарной операции. «Предположим, например, что слово помещено в локальное хранилище – ту часть словаря, которая сохраняется только до тех пор, пока этот документ обрабатывается – если оно встречается в тексте значительно чаще, чем статистика, хранящаяся в основном словаре. Фраза будет отмечена, если она встречается два или три раза, но не распознается словарем как идиома или устойчивая фраза. Изучая содержимое этого хранилища перед тем, как приступить к переводу, пользователь может надеяться получить предварительный просмотр. предстоящие трудности и заранее принять некоторые решения о том, как с ними справиться. Эти решения, конечно же, будут зафиксированы в самом магазине. В ходе этого или по какой-либо причине переводчик может вызвать. отображение всех единиц текста, содержащих определенное слово, фразу, строку символов или что-то еще. В конце концов, самая важная ссылка, которую необходимо иметь при переводе текста, — это сам текст, который нужно перевести. next — это совсем не просто, транслятор может начать с подачи команды, заставляющей систему отображать в хранилище все, что может иметь к ней отношение. Это привлечет его внимание к решениям, которые он принял до начала фактического перевода, к статистически значимым словам и фразам, а также к записи всего, что привлекло внимание, когда это произошло раньше. Прежде чем продолжить, он может изучить прошлые и будущие фрагменты текста, содержащие аналогичный материал».

1.3 Ожидание более качественной работы письменного переводчикаВ конце статьи Кей упомянул некоторые причины ожидать более высокой производительности этого устройства. Во-первых, система в состоянии привлечь внимание своего сотрудника-человека к вопросам, которые, скорее всего, в этом нуждаются, во-вторых, решения, которые приходится принимать в ходе перевода отрывка, редко бывают независимыми, в-третьих, одно из наиболее важных Объектом системы является тот, который отслеживает слова и фразы, которые каким-то особым образом используются в текущем тексте.

«Жизнь в языке». Речь, произнесенная в знак признания Премии за заслуги перед жизнью на 43-м ежегодном собрании Ассоциации компьютерной лингвистики, Анн-Арбор, Мичиган, 27 июня 2005 г. http://www.stanford.edu/~mjkay/LifeOfLanguage.pdf
Выравнивание строк с использованием суффиксных деревьев. Статья о возможном использовании суффиксных деревьев для выравнивания текстов и их переводов. http://www.stanford.edu/~mjkay/CYCLING.pdf
Некоторые незаконченные размышления о природе перевода. Вот несколько незаконченных размышлений о природе перевода. http://www.stanford.edu/~mjkay/CurrentState.pdf
Некоторые недоработанные мысли о языковых моделях в статистическом НЛП, с которыми мне нужна помощь. http://www.stanford.edu/~mjkay/language_models.pdf
Его статья 1994 года « Регулярные модели систем фонологических правил ». Компьютерная лингвистика 20(3):331–378» с Рональдом Капланом. http://www.stanford.edu/~mjkay/Kaplan%26Kay.pdf

Книги

Лингвистика и информатика (с Карен Сперк Джонс ), Academic Press , 1973.
Естественный язык в информатике (под редакцией Д.Е. Уокера и Ханса Карлгрена), Skriptor, Стокгольм, 1977 г.
Verbmobil: система перевода для личного диалога (совместно с Жаном Марком Гауроном и Питером Норвигом ), CSLI, Стэнфорд, Калифорния, 1994.
Введение в машинный перевод . В. Джон Хатчинс и Гарольд Л. Сомерс. Лондон: Академик Пресс, 1992.
Справочник по компьютерной лингвистике . Руслан Митков (ред.). Oxford University Press , 2003. (Введение).

Избранные статьи

« Правила интерпретации — подход к проблеме вычислений в семантике естественного языка », в материалах Второго международного конгресса Международной федерации обработки информации, 1962 г.
«Процедура синтаксического анализа» Труды Второго международного конгресса Международной федерации обработки информации, 1962 г.
«Общая процедура перезаписи строк», документ, представленный на ежегодном собрании Ассоциации машинного перевода и компьютерной лингвистики, Блумингтон, Индиана, 1964 г.
Логика распознавания родственных слов в исторической лингвистике, RM-4224-PR, Санта-Моника, Корпорация RAND, июль 1964 г.
Программа синтаксического анализа категориальных грамматик, RM-4283-PR, Санта-Моника, корпорация RAND, август 1964 г.
Табличный анализатор: программа анализа фразовой структуры и зависимости, RM-4933-PR, Санта-Моника, The RAND Corporation, июль 1966 г.
Компьютерная система в помощь лингвисту на местах, P-4095, Санта-Моника, корпорация RAND, май 1969 г.
Система MIND: Программа морфологического анализа, RM-6265/2-PR, Санта-Моника, Корпорация RAND, апрель 1970 г. (совместно с Гэри Р. Мартинсом).
«Автоматический перевод естественных языков» в книге «Язык как человеческая проблема: Дедал», 1973.
« Грамматика функциональной унификации: формализм для машинного перевода » в материалах Международной конференции по компьютерной лингвистике (COLING 84), Ассоциация компьютерной лингвистики, 1984.
«Разбор языков со свободным порядком слов» (совместно с Лаури Карттунен), в книге Даути, Дэвида Р., Лаури Карттунен и Арнольда М. Цвикки, «Разбор естественного языка», Cambridge University Press, 1985.
«Унификация в грамматике», Даль В. и П. Сен-Дизье, «Понимание естественного языка и логическое программирование», Северная Голландия, 1985.
«Теоретические проблемы проектирования рабочего места переводчика», Материалы семинара IBM по компьютерам и переводу, Копенгаген.
«Регулярные модели систем фонологических правил» (совместно с Р.М. Капланом), Компьютерная лингвистика 20:3 (сентябрь 1994 г. Совместно с Р.М. Капланом).
«Выравнивание подстроки с использованием суффиксных деревьев». Компьютерная лингвистика и интеллектуальная обработка текста , Springer, Конспекты лекций по информатике, 2004.

Чтения курса

Дизъюнктивная унификация http://www.stanford.edu/~mjkay/DisjunctiveUnification.pdf
Функциональная неопределенность http://www.stanford.edu/~mjkay/FunctionalUncertainty.pdf
HPSG1 http://www.stanford.edu/~mjkay/pollard-foundations.pdf
HPSG2 http://www.stanford.edu/~mjkay/levine03.pdf
Генерация HPSG http://www.stanford.edu/~mjkay/Shieber.pdf
CCG http://www.stanford.edu/~mjkay/Steedman%26Baldridge.pdf
Типизированные функции http://www.stanford.edu/~mjkay/Copestake.pdf
Зависимость http://www.stanford.edu/~mjkay/covington.pdf

Награды

Он имеет звание почетного профессора Саарского университета и почетных докторских степеней университетов Гетеборга и Женевы.
Он также выиграл премию ACL за заслуги перед жанром в 2005 году. Его вступительная речь называлась «Жизнь языка». ^[2]

Ссылки

^ Кей, Мартин. « Должное место людей и машин в языковом переводе ^{[ мертвая ссылка ]}.. машинный перевод 12.1-2 (1997): 3-23.
^ «Получатели премии ACL за выдающиеся достижения» . ACL вики . ACL . Проверено 24 августа 2017 г.

Внешние ссылки

Домашняя страница Стэнфорда
Домашняя страница Саарского университета
Цитирование премии ACL за выслугу лет
«Жизнь языка» - речь на вручении премии ACL Lifetime Award - Мартин Кей рассказывает о своей работе в области компьютерной лингвистики (13 страниц)
Анонс лекции с биографической справкой
Интервью (видео и аудио) с Мартином Кеем в Оксфордском институте Интернета, 18 июня 2009 г.

Предшественник Карен Сперк Джонс	Премия ACL за выслугу лет 2005	Преемник Ева Гаичова

[1] Кей, Мартин. « Должное место людей и машин в языковом переводе ^{[ мертвая ссылка ]}.. машинный перевод 12.1-2 (1997): 3-23.

[2] «Получатели премии ACL за выдающиеся достижения» . ACL вики . ACL . Проверено 24 августа 2017 г.

[1]

[2]

Базы данных авторитетного контроля
International	ISNI VIAF WorldCat
National	Norway France BnF data Germany Israel United States Czech Republic Australia Greece Netherlands Poland
Academics	Association for Computing Machinery CiNii 2 DBLP Google Scholar MathSciNet Mathematics Genealogy Project zbMATH
Other	SNAC IdRef