Автоматический языковой переводчик
представлял IBM Автоматический языковой переводчик собой систему машинного перевода , которая преобразовывала русские документы в английский . Он использовал оптический диск , на котором хранилось 170 000 дословных и пословных переводов, и специальный компьютер для их быстрого поиска. Созданный для Отдела иностранных технологий ВВС США, самолет AN/GSQ-16 (или XW-2 ), как его называли в ВВС, в основном использовался для преобразования советской технической документации для распространения среди западных ученых. Транслятор был установлен в 1959 году, радикально модернизирован в 1964 году и в конечном итоге заменен мэйнфреймом с SYSTRAN в 1970 году.
История
[ редактировать ]Фотоскопический магазин
[ редактировать ]Переводчик начал работу по контракту ВМС США с Международной телеметрической корпорацией (ITC) в Лос-Анджелесе в июне 1953 года. Это была не система перевода, а чистый контракт на исследование и разработку высокопроизводительного онлайн-носителя фотографий, состоящего из маленьких черных прямоугольников, встроенных в пластиковый диск. Когда первоначальный контракт истек, Римский центр развития авиации (RADC) взял на себя дальнейшее финансирование в 1954 году и далее. [1]
Система была разработана Гилбертом Кингом, техническим директором ITC, вместе с командой, в которую входил Луи Риденур . Он превратился в 16-дюймовый пластиковый диск, на котором данные записывались в виде серии микроскопических черных прямоугольников или чистых пятен. Для хранения использовались только самые внешние 4 дюйма диска, что увеличивало линейную скорость доступа к той части, к которой осуществляется доступ. Когда диск вращался со скоростью 2400 об/мин, его скорость доступа составляла около 1 Мбит/сек. В общей сложности система хранила 30 Мбит, что делало ее онлайн-системой с самой высокой плотностью трафика своего времени. [1] [а]
Марк I
[ редактировать ]В 1954 году IBM провела влиятельную демонстрацию машинного перевода, известную сегодня как « эксперимент Джорджтауна-IBM ». Запущенная на IBM 704 мэйнфрейме система перевода знала всего 250 слов русского языка, ограниченных областью органической химии, и только 6 грамматических правил для их объединения. Тем не менее результаты оказались чрезвычайно многообещающими и широко освещались в прессе. [2]
В то время большинство исследователей в зарождающейся области машинного перевода считали, что основной проблемой обеспечения качественных переводов было создание большой библиотеки, поскольку устройства хранения данных той эпохи были слишком маленькими и слишком медленными, чтобы их можно было использовать в этой роли. [3] Кинг посчитал, что фотохранилище является естественным решением проблемы, и предложил ВВС идею автоматизированной системы перевода на основе фотохранилища. RADC проявил интерес и предоставил исследовательский грант в мае 1956 года. В то время ВВС также предоставили грант исследователям Вашингтонского университета , которые работали над проблемой создания оптимального словаря перевода для проекта.
Кинг выступал за простой дословный подход к переводу. Он считал, что естественная избыточность языка позволит понять даже плохой перевод и что одного местного контекста достаточно, чтобы дать разумные догадки при столкновении с двусмысленными терминами. Он заявил, что «успех человека в достижении вероятности 0,50 в предугадывании слов в предложении во многом обусловлен его опытом и реальным значением уже открытых слов». [4] Другими словами, простой перевод только слов позволит человеку эффективно читать документ, поскольку он сможет определить правильное значение из контекста, предоставленного предыдущими словами.
В 1958 году Кинг перешел в исследовательский центр Томаса Дж. Уотсона компании IBM и продолжил разработку переводчика на базе фотомагазина. Со временем Кинг изменил подход с чистого дословного переводчика на переводчик, сохраняющий «основы и окончания», который разбивал слова на части, которые можно было снова объединить, чтобы снова сформировать полные слова. [4]
Первая машина, «Марк I», была продемонстрирована в июле 1959 года и состояла из словаря на 65 000 слов и специального лампового компьютера для поиска. [3] Тексты вручную копировались на перфокарты с помощью специальных кириллических терминалов, а затем вводились в машину для перевода. Результаты были менее чем впечатляющими, но их было достаточно, чтобы предположить, что создание более крупной и быстрой машины было бы разумным шагом. Тем временем Знак I был нанесен на переводы советской газеты « Правда» . Результаты по-прежнему оставались сомнительными, но Кинг объявил их успешными, заявив в журнале Scientific American , что система «...по результатам оперативной оценки оказалась весьма полезной для правительства». [3]
Марк II
[ редактировать ]4 октября 1957 года СССР запустил «Спутник-1» — первый искусственный спутник Земли. Это вызвало волну беспокойства в США, чей собственный проект «Авангард» был застигнут врасплох, а затем неоднократно демонстрировал впечатляющие провалы. Этот смущающий поворот событий привел к огромным инвестициям в американскую науку и технологии, включая создание DARPA , НАСА и различных разведывательных усилий, которые попытались бы избежать повторных подобных неожиданностей.
Через непродолжительный период разведывательные усилия были сосредоточены на базе ВВС Райт-Паттерсон в качестве Отдела иностранных технологий (FTD, теперь известного как Национальный центр воздушной и космической разведки ), которым управляют ВВС при участии DIA и других организаций. . FTD было поручено переводить советские и другие технические и научные журналы Варшавского блока , чтобы исследователи на «западе» могли быть в курсе событий за железным занавесом . Большинство этих документов были в открытом доступе, но ФТД также сделала ряд разовых переводов других материалов по запросу.
Предполагая, что квалифицированных переводчиков не хватает, FTD чрезвычайно заинтересовался усилиями Кинга в IBM. Вскоре поступило финансирование на модернизированную машину, и началась работа над системой «Mark II», основанной на транзисторном компьютере с более быстрым и емким 10-дюймовым оптическим диском на стеклянной основе, вращающимся со скоростью 2400 об / мин. Еще одним дополнением стал оптический считыватель символов, предоставленный третьей стороной, который, как они надеялись, устранит трудоемкий процесс копирования русского текста на машиночитаемые карты. [3]
В 1960 году вашингтонская команда также присоединилась к IBM, привнеся с собой свои усилия по созданию словаря. Словарь продолжал расширяться по мере появления дополнительного хранилища, достигнув к моменту установки в FTD 170 000 слов и терминов. В Mark II также было включено крупное обновление программного обеспечения, которое Кинг назвал «начинкой словаря». Наполнение было попыткой решить проблемы неоднозначных слов путем «набивки» к ним префиксов из более ранних слов в тексте. [3] Эти измененные слова будут соответствовать аналогичным словам в словаре, что уменьшит количество ложных срабатываний.
В 1962 году Кинг покинул IBM и перешёл в компанию Itek , военного подрядчика, быстро осваивавшего новые технологии. Разработка в IBM продолжалась, и система была полностью введена в эксплуатацию на выставке FTD в феврале 1964 года. Система была продемонстрирована на Всемирной выставке в Нью-Йорке в 1964 году . Версия, представленная на ярмарке, включала словарь на 150 000 слов, из которых около 1/3 слов было фразами. Около 3500 из них были сохранены в основной памяти для повышения производительности, а заявленная средняя скорость составляла 20 слов в минуту. Результаты тщательно отобранного входного текста оказались весьма впечатляющими. [5] После возвращения в FTD он использовался постоянно до 1970 года, когда его заменила машина, работающая под управлением SYSTRAN . [6]
Отчет АЛПАК
[ редактировать ]В 1964 году Министерство обороны США США поручило Национальной академии наук (NAS) подготовить отчет о состоянии машинного перевода. NAS сформировал «Консультативный комитет по автоматической обработке языка», или ALPAC , и опубликовал свои выводы в 1966 году. Отчет « Язык и машины: компьютеры в переводе и лингвистике » резко критиковал существующие усилия, демонстрируя, что системы не работают быстрее. чем человеческий перевод, а также продемонстрировал, что предполагаемая нехватка переводчиков на самом деле была избытком, а из-за проблем со спросом и предложением человеческий перевод был относительно недорогим — около 6 долларов за 1000 слов. Хуже того, FTD также работал медленнее; тесты с использованием статей по физике в качестве входных данных показали, что переводчик был «на 10 процентов менее точным, на 21 процент медленнее и имел уровень понимания на 29 процентов ниже, чем когда он использовал человеческий перевод». [7]
Отчет ALPAC имел такое же влияние, как и Джорджтаунский эксперимент десятилетием ранее; Сразу после публикации правительство США приостановило почти все финансирование исследований в области машинного перевода. [8] Текущая работа в IBM и Itek завершилась к 1966 году, оставив эту область деятельности европейцам, которые продолжили разработку таких систем, как SYSTRAN и Logos.
Примечания
[ редактировать ]- ^ Эти цифры для ранних дисковых систем кажутся неточными - другой документ того же автора предполагает, что эти цифры на самом деле относятся к более поздней версии, используемой в переводчике Mark II.
Ссылки
[ редактировать ]Цитаты
[ редактировать ]- ^ Jump up to: а б Хатчинс, с. 171
- ^ Джон Хатчинс, «Первая публичная демонстрация машинного перевода: система Джорджтауна-IBM, 7 января 1954 г.». Архивировано 3 марта 2016 г. в Wayback Machine.
- ^ Jump up to: а б с д и Хатчинс, с. 172
- ^ Jump up to: а б Кинг, 1956 год.
- ^ Хатчинс, стр. 174
- ^ Хатчинс, стр. 175
- ^ АЛЬПАК, стр. 20
- ↑ Джон Хатчинс, «ALPAC: (печально) знаменитый отчет». Архивировано 6 октября 2007 г. в Wayback Machine.
Библиография
[ редактировать ]- Г. В. Кинг, Г. В. Браун и Л. Н. Риденур, «Фотографические методы хранения информации», Труды IRE , том 41, выпуск 10 (октябрь 1953 г.), стр. 1421–1428.
- Г. В. Кинг, «Стохастические методы механического перевода», «Механический перевод» , том 3, выпуск 2 (1956), стр. 38–39.
- Дж. Л. Крафт, Э. Х. Голдман, В. Б. Стром, «Машина поиска по таблицам для обработки естественных языков» , IBM Journal , июль 1961 г., стр. 192–203.
- Консультативный комитет по языковой обработке, «Язык и машины: компьютеры в переводе и лингвистике» , Национальный исследовательский совет , 1966 г. (широко известный как «Отчет ALPAC»).
- Джон Хатчинс (редактор), «Гилберт В. Кинг и переводчик IBM-USAF» , Ранние годы машинного перевода , Джо Бенджаминс, 2000 г., ISBN 90-272-4586-X (RADC-TDR-62-105)
- Чарльз Борн и Труди Беллардо Хан, «История информационных онлайн-услуг, 1963–1976» , MIT Press, 2003, ISBN 0-262-02538-8