Автоматический языковой переводчик

представлял IBM Автоматический языковой переводчик собой систему машинного перевода , которая преобразовывала русские документы в английский . Он использовал оптический диск , на котором хранилось 170 000 дословных и пословных переводов, и специальный компьютер для их быстрого поиска. Созданный для Отдела иностранных технологий ВВС США, самолет AN/GSQ-16 (или XW-2 ), как его называли в ВВС, в основном использовался для преобразования советской технической документации для распространения среди западных ученых. Транслятор был установлен в 1959 году, радикально модернизирован в 1964 году и в конечном итоге заменен мэйнфреймом с SYSTRAN в 1970 году.

История

Фотоскопический магазин

Переводчик начал работу по контракту ВМС США с Международной телеметрической корпорацией (ITC) в Лос-Анджелесе в июне 1953 года. Это была не система перевода, а чистый контракт на исследование и разработку высокопроизводительного онлайн-носителя фотографий, состоящего из маленьких черных прямоугольников, встроенных в пластиковый диск. Когда первоначальный контракт истек, Римский центр развития авиации (RADC) взял на себя дальнейшее финансирование в 1954 году и далее. ^[1]

Система была разработана Гилбертом Кингом, техническим директором ITC, вместе с командой, в которую входил Луи Риденур . Он превратился в 16-дюймовый пластиковый диск, на котором данные записывались в виде серии микроскопических черных прямоугольников или чистых пятен. Для хранения использовались только самые внешние 4 дюйма диска, что увеличивало линейную скорость доступа к той части, к которой осуществляется доступ. Когда диск вращался со скоростью 2400 об/мин, его скорость доступа составляла около 1 Мбит/сек. В общей сложности система хранила 30 Мбит, что делало ее онлайн-системой с самой высокой плотностью трафика своего времени. ^[1]^[а]

Марк I

В 1954 году IBM провела влиятельную демонстрацию машинного перевода, известную сегодня как « эксперимент Джорджтауна-IBM ». Запущенная на IBM 704 мэйнфрейме система перевода знала всего 250 слов русского языка, ограниченных областью органической химии, и только 6 грамматических правил для их объединения. Тем не менее результаты оказались чрезвычайно многообещающими и широко освещались в прессе. ^[2]

В то время большинство исследователей в зарождающейся области машинного перевода считали, что основной проблемой обеспечения качественных переводов было создание большой библиотеки, поскольку устройства хранения данных той эпохи были слишком маленькими и слишком медленными, чтобы их можно было использовать в этой роли. ^[3] Кинг посчитал, что фотохранилище является естественным решением проблемы, и предложил ВВС идею автоматизированной системы перевода на основе фотохранилища. RADC проявил интерес и предоставил исследовательский грант в мае 1956 года. В то время ВВС также предоставили грант исследователям Вашингтонского университета , которые работали над проблемой создания оптимального словаря перевода для проекта.

Кинг выступал за простой дословный подход к переводу. Он считал, что естественная избыточность языка позволит понять даже плохой перевод и что одного местного контекста достаточно, чтобы дать разумные догадки при столкновении с двусмысленными терминами. Он заявил, что «успех человека в достижении вероятности 0,50 в предугадывании слов в предложении во многом обусловлен его опытом и реальным значением уже открытых слов». ^[4] Другими словами, простой перевод только слов позволит человеку эффективно читать документ, поскольку он сможет определить правильное значение из контекста, предоставленного предыдущими словами.

В 1958 году Кинг перешел в исследовательский центр Томаса Дж. Уотсона компании IBM и продолжил разработку переводчика на базе фотомагазина. Со временем Кинг изменил подход с чистого дословного переводчика на переводчик, сохраняющий «основы и окончания», который разбивал слова на части, которые можно было снова объединить, чтобы снова сформировать полные слова. ^[4]

Первая машина, «Марк I», была продемонстрирована в июле 1959 года и состояла из словаря на 65 000 слов и специального лампового компьютера для поиска. ^[3] Тексты вручную копировались на перфокарты с помощью специальных кириллических терминалов, а затем вводились в машину для перевода. Результаты были менее чем впечатляющими, но их было достаточно, чтобы предположить, что создание более крупной и быстрой машины было бы разумным шагом. Тем временем Знак I был нанесен на переводы советской газеты « Правда» . Результаты по-прежнему оставались сомнительными, но Кинг объявил их успешными, заявив в журнале Scientific American , что система «...по результатам оперативной оценки оказалась весьма полезной для правительства». ^[3]

Марк II

4 октября 1957 года СССР запустил «Спутник-1» — первый искусственный спутник Земли. Это вызвало волну беспокойства в США, чей собственный проект «Авангард» был застигнут врасплох, а затем неоднократно демонстрировал впечатляющие провалы. Этот смущающий поворот событий привел к огромным инвестициям в американскую науку и технологии, включая создание DARPA , НАСА и различных разведывательных усилий, которые попытались бы избежать повторных подобных неожиданностей.

Через непродолжительный период разведывательные усилия были сосредоточены на базе ВВС Райт-Паттерсон в качестве Отдела иностранных технологий (FTD, теперь известного как Национальный центр воздушной и космической разведки ), которым управляют ВВС при участии DIA и других организаций. . FTD было поручено переводить советские и другие технические и научные журналы Варшавского блока , чтобы исследователи на «западе» могли быть в курсе событий за железным занавесом . Большинство этих документов были в открытом доступе, но ФТД также сделала ряд разовых переводов других материалов по запросу.

Предполагая, что квалифицированных переводчиков не хватает, FTD чрезвычайно заинтересовался усилиями Кинга в IBM. Вскоре поступило финансирование на модернизированную машину, и началась работа над системой «Mark II», основанной на транзисторном компьютере с более быстрым и емким 10-дюймовым оптическим диском на стеклянной основе, вращающимся со скоростью 2400 об / мин. Еще одним дополнением стал оптический считыватель символов, предоставленный третьей стороной, который, как они надеялись, устранит трудоемкий процесс копирования русского текста на машиночитаемые карты. ^[3]

В 1960 году вашингтонская команда также присоединилась к IBM, привнеся с собой свои усилия по созданию словаря. Словарь продолжал расширяться по мере появления дополнительного хранилища, достигнув к моменту установки в FTD 170 000 слов и терминов. В Mark II также было включено крупное обновление программного обеспечения, которое Кинг назвал «начинкой словаря». Наполнение было попыткой решить проблемы неоднозначных слов путем «набивки» к ним префиксов из более ранних слов в тексте. ^[3] Эти измененные слова будут соответствовать аналогичным словам в словаре, что уменьшит количество ложных срабатываний.

В 1962 году Кинг покинул IBM и перешёл в компанию Itek , военного подрядчика, быстро осваивавшего новые технологии. Разработка в IBM продолжалась, и система была полностью введена в эксплуатацию на выставке FTD в феврале 1964 года. Система была продемонстрирована на Всемирной выставке в Нью-Йорке в 1964 году . Версия, представленная на ярмарке, включала словарь на 150 000 слов, из которых около 1/3 слов было фразами. Около 3500 из них были сохранены в основной памяти для повышения производительности, а заявленная средняя скорость составляла 20 слов в минуту. Результаты тщательно отобранного входного текста оказались весьма впечатляющими. ^[5] После возвращения в FTD он использовался постоянно до 1970 года, когда его заменила машина, работающая под управлением SYSTRAN . ^[6]

Отчет АЛПАК

В 1964 году Министерство обороны США США поручило Национальной академии наук (NAS) подготовить отчет о состоянии машинного перевода. NAS сформировал «Консультативный комитет по автоматической обработке языка», или ALPAC , и опубликовал свои выводы в 1966 году. Отчет « Язык и машины: компьютеры в переводе и лингвистике » резко критиковал существующие усилия, демонстрируя, что системы не работают быстрее. чем человеческий перевод, а также продемонстрировал, что предполагаемая нехватка переводчиков на самом деле была избытком, а из-за проблем со спросом и предложением человеческий перевод был относительно недорогим — около 6 долларов за 1000 слов. Хуже того, FTD также работал медленнее; тесты с использованием статей по физике в качестве входных данных показали, что переводчик был «на 10 процентов менее точным, на 21 процент медленнее и имел уровень понимания на 29 процентов ниже, чем когда он использовал человеческий перевод». ^[7]

Отчет ALPAC имел такое же влияние, как и Джорджтаунский эксперимент десятилетием ранее; Сразу после публикации правительство США приостановило почти все финансирование исследований в области машинного перевода. ^[8] Текущая работа в IBM и Itek завершилась к 1966 году, оставив эту область деятельности европейцам, которые продолжили разработку таких систем, как SYSTRAN и Logos.

Примечания

^ Эти цифры для ранних дисковых систем кажутся неточными - другой документ того же автора предполагает, что эти цифры на самом деле относятся к более поздней версии, используемой в переводчике Mark II.

Ссылки

Цитаты

^ Jump up to: ^а ^б Хатчинс, с. 171
^ Джон Хатчинс, «Первая публичная демонстрация машинного перевода: система Джорджтауна-IBM, 7 января 1954 г.». Архивировано 3 марта 2016 г. в Wayback Machine.
^ Jump up to: ^а ^б ^с ^д ^и Хатчинс, с. 172
^ Jump up to: ^а ^б Кинг, 1956 год.
^ Хатчинс, стр. 174
^ Хатчинс, стр. 175
^ АЛЬПАК, стр. 20
↑ Джон Хатчинс, «ALPAC: (печально) знаменитый отчет». Архивировано 6 октября 2007 г. в Wayback Machine.

Библиография

Г. В. Кинг, Г. В. Браун и Л. Н. Риденур, «Фотографические методы хранения информации», Труды IRE , том 41, выпуск 10 (октябрь 1953 г.), стр. 1421–1428.
Г. В. Кинг, «Стохастические методы механического перевода», «Механический перевод» , том 3, выпуск 2 (1956), стр. 38–39.
Дж. Л. Крафт, Э. Х. Голдман, В. Б. Стром, «Машина поиска по таблицам для обработки естественных языков» , IBM Journal , июль 1961 г., стр. 192–203.
Консультативный комитет по языковой обработке, «Язык и машины: компьютеры в переводе и лингвистике» , Национальный исследовательский совет , 1966 г. (широко известный как «Отчет ALPAC»).
Джон Хатчинс (редактор), «Гилберт В. Кинг и переводчик IBM-USAF» , Ранние годы машинного перевода , Джо Бенджаминс, 2000 г., ISBN 90-272-4586-X (RADC-TDR-62-105)
Чарльз Борн и Труди Беллардо Хан, «История информационных онлайн-услуг, 1963–1976» , MIT Press, 2003, ISBN 0-262-02538-8

См. также

Список военной электроники США

[2] Эти цифры для ранних дисковых систем кажутся неточными - другой документ того же автора предполагает, что эти цифры на самом деле относятся к более поздней версии, используемой в переводчике Mark II.

[hutch171-1] Jump up to: ^а ^б Хатчинс, с. 171

[3] Джон Хатчинс, «Первая публичная демонстрация машинного перевода: система Джорджтауна-IBM, 7 января 1954 г.». Архивировано 3 марта 2016 г. в Wayback Machine.

[hutch172-4] Jump up to: ^а ^б ^с ^д ^и Хатчинс, с. 172

[King,_1956-5] Jump up to: ^а ^б Кинг, 1956 год.

[6] Хатчинс, стр. 174

[7] Хатчинс, стр. 175

[8] АЛЬПАК, стр. 20

[9] Джон Хатчинс, «ALPAC: (печально) знаменитый отчет». Архивировано 6 октября 2007 г. в Wayback Machine.

[1]

[а]

[2]

[3]

[4]

[5]

[6]

[7]

[8]