Jump to content

Автоматический языковой переводчик

(Перенаправлено с AN/GSQ-16 )

представлял IBM Автоматический языковой переводчик собой систему машинного перевода , которая преобразовывала русские документы в английский . Он использовал оптический диск , на котором хранилось 170 000 дословных и пословных переводов, и специальный компьютер для их быстрого поиска. Созданный для Отдела иностранных технологий ВВС США, самолет AN/GSQ-16 (или XW-2 ), как его называли в ВВС, в основном использовался для преобразования советской технической документации для распространения среди западных ученых. Транслятор был установлен в 1959 году, радикально модернизирован в 1964 году и в конечном итоге заменен мэйнфреймом с SYSTRAN в 1970 году.

Фотоскопический магазин

[ редактировать ]

Переводчик начал работу по контракту ВМС США с Международной телеметрической корпорацией (ITC) в Лос-Анджелесе в июне 1953 года. Это была не система перевода, а чистый контракт на исследование и разработку высокопроизводительного онлайн-носителя фотографий, состоящего из маленьких черных прямоугольников, встроенных в пластиковый диск. Когда первоначальный контракт истек, Римский центр развития авиации (RADC) взял на себя дальнейшее финансирование в 1954 году и далее. [1]

Система была разработана Гилбертом Кингом, техническим директором ITC, вместе с командой, в которую входил Луи Риденур . Он превратился в 16-дюймовый пластиковый диск, на котором данные записывались в виде серии микроскопических черных прямоугольников или чистых пятен. Для хранения использовались только самые внешние 4 дюйма диска, что увеличивало линейную скорость доступа к той части, к которой осуществляется доступ. Когда диск вращался со скоростью 2400 об/мин, его скорость доступа составляла около 1 Мбит/сек. В общей сложности система хранила 30 Мбит, что делало ее онлайн-системой с самой высокой плотностью трафика своего времени. [1] [а]

В 1954 году IBM провела влиятельную демонстрацию машинного перевода, известную сегодня как « эксперимент Джорджтауна-IBM ». Запущенная на IBM 704 мэйнфрейме система перевода знала всего 250 слов русского языка, ограниченных областью органической химии, и только 6 грамматических правил для их объединения. Тем не менее результаты оказались чрезвычайно многообещающими и широко освещались в прессе. [2]

В то время большинство исследователей в зарождающейся области машинного перевода считали, что основной проблемой обеспечения качественных переводов было создание большой библиотеки, поскольку устройства хранения данных той эпохи были слишком маленькими и слишком медленными, чтобы их можно было использовать в этой роли. [3] Кинг посчитал, что фотохранилище является естественным решением проблемы, и предложил ВВС идею автоматизированной системы перевода на основе фотохранилища. RADC проявил интерес и предоставил исследовательский грант в мае 1956 года. В то время ВВС также предоставили грант исследователям Вашингтонского университета , которые работали над проблемой создания оптимального словаря перевода для проекта.

Кинг выступал за простой дословный подход к переводу. Он считал, что естественная избыточность языка позволит понять даже плохой перевод и что одного местного контекста достаточно, чтобы дать разумные догадки при столкновении с двусмысленными терминами. Он заявил, что «успех человека в достижении вероятности 0,50 в предугадывании слов в предложении во многом обусловлен его опытом и реальным значением уже открытых слов». [4] Другими словами, простой перевод только слов позволит человеку эффективно читать документ, поскольку он сможет определить правильное значение из контекста, предоставленного предыдущими словами.

В 1958 году Кинг перешел в исследовательский центр Томаса Дж. Уотсона компании IBM и продолжил разработку переводчика на базе фотомагазина. Со временем Кинг изменил подход с чистого дословного переводчика на переводчик, сохраняющий «основы и окончания», который разбивал слова на части, которые можно было снова объединить, чтобы снова сформировать полные слова. [4]

Первая машина, «Марк I», была продемонстрирована в июле 1959 года и состояла из словаря на 65 000 слов и специального лампового компьютера для поиска. [3] Тексты вручную копировались на перфокарты с помощью специальных кириллических терминалов, а затем вводились в машину для перевода. Результаты были менее чем впечатляющими, но их было достаточно, чтобы предположить, что создание более крупной и быстрой машины было бы разумным шагом. Тем временем Знак I был нанесен на переводы советской газеты « Правда» . Результаты по-прежнему оставались сомнительными, но Кинг объявил их успешными, заявив в журнале Scientific American , что система «...по результатам оперативной оценки оказалась весьма полезной для правительства». [3]

4 октября 1957 года СССР запустил «Спутник-1» — первый искусственный спутник Земли. Это вызвало волну беспокойства в США, чей собственный проект «Авангард» был застигнут врасплох, а затем неоднократно демонстрировал впечатляющие провалы. Этот смущающий поворот событий привел к огромным инвестициям в американскую науку и технологии, включая создание DARPA , НАСА и различных разведывательных усилий, которые попытались бы избежать повторных подобных неожиданностей.

Через непродолжительный период разведывательные усилия были сосредоточены на базе ВВС Райт-Паттерсон в качестве Отдела иностранных технологий (FTD, теперь известного как Национальный центр воздушной и космической разведки ), которым управляют ВВС при участии DIA и других организаций. . FTD было поручено переводить советские и другие технические и научные журналы Варшавского блока , чтобы исследователи на «западе» могли быть в курсе событий за железным занавесом . Большинство этих документов были в открытом доступе, но ФТД также сделала ряд разовых переводов других материалов по запросу.

Предполагая, что квалифицированных переводчиков не хватает, FTD чрезвычайно заинтересовался усилиями Кинга в IBM. Вскоре поступило финансирование на модернизированную машину, и началась работа над системой «Mark II», основанной на транзисторном компьютере с более быстрым и емким 10-дюймовым оптическим диском на стеклянной основе, вращающимся со скоростью 2400 об / мин. Еще одним дополнением стал оптический считыватель символов, предоставленный третьей стороной, который, как они надеялись, устранит трудоемкий процесс копирования русского текста на машиночитаемые карты. [3]

В 1960 году вашингтонская команда также присоединилась к IBM, привнеся с собой свои усилия по созданию словаря. Словарь продолжал расширяться по мере появления дополнительного хранилища, достигнув к моменту установки в FTD 170 000 слов и терминов. В Mark II также было включено крупное обновление программного обеспечения, которое Кинг назвал «начинкой словаря». Наполнение было попыткой решить проблемы неоднозначных слов путем «набивки» к ним префиксов из более ранних слов в тексте. [3] Эти измененные слова будут соответствовать аналогичным словам в словаре, что уменьшит количество ложных срабатываний.

В 1962 году Кинг покинул IBM и перешёл в компанию Itek , военного подрядчика, быстро осваивавшего новые технологии. Разработка в IBM продолжалась, и система была полностью введена в эксплуатацию на выставке FTD в феврале 1964 года. Система была продемонстрирована на Всемирной выставке в Нью-Йорке в 1964 году . Версия, представленная на ярмарке, включала словарь на 150 000 слов, из которых около 1/3 слов было фразами. Около 3500 из них были сохранены в основной памяти для повышения производительности, а заявленная средняя скорость составляла 20 слов в минуту. Результаты тщательно отобранного входного текста оказались весьма впечатляющими. [5] После возвращения в FTD он использовался постоянно до 1970 года, когда его заменила машина, работающая под управлением SYSTRAN . [6]

Отчет АЛПАК

[ редактировать ]

В 1964 году Министерство обороны США США поручило Национальной академии наук (NAS) подготовить отчет о состоянии машинного перевода. NAS сформировал «Консультативный комитет по автоматической обработке языка», или ALPAC , и опубликовал свои выводы в 1966 году. Отчет « Язык и машины: компьютеры в переводе и лингвистике » резко критиковал существующие усилия, демонстрируя, что системы не работают быстрее. чем человеческий перевод, а также продемонстрировал, что предполагаемая нехватка переводчиков на самом деле была избытком, а из-за проблем со спросом и предложением человеческий перевод был относительно недорогим — около 6 долларов за 1000 слов. Хуже того, FTD также работал медленнее; тесты с использованием статей по физике в качестве входных данных показали, что переводчик был «на 10 процентов менее точным, на 21 процент медленнее и имел уровень понимания на 29 процентов ниже, чем когда он использовал человеческий перевод». [7]

Отчет ALPAC имел такое же влияние, как и Джорджтаунский эксперимент десятилетием ранее; Сразу после публикации правительство США приостановило почти все финансирование исследований в области машинного перевода. [8] Текущая работа в IBM и Itek завершилась к 1966 году, оставив эту область деятельности европейцам, которые продолжили разработку таких систем, как SYSTRAN и Logos.

Примечания

[ редактировать ]
  1. ^ Эти цифры для ранних дисковых систем кажутся неточными - другой документ того же автора предполагает, что эти цифры на самом деле относятся к более поздней версии, используемой в переводчике Mark II.

Библиография

[ редактировать ]
  • Г. В. Кинг, Г. В. Браун и Л. Н. Риденур, «Фотографические методы хранения информации», Труды IRE , том 41, выпуск 10 (октябрь 1953 г.), стр. 1421–1428.
  • Г. В. Кинг, «Стохастические методы механического перевода», «Механический перевод» , том 3, выпуск 2 (1956), стр. 38–39.
  • Дж. Л. Крафт, Э. Х. Голдман, В. Б. Стром, «Машина поиска по таблицам для обработки естественных языков» , IBM Journal , июль 1961 г., стр. 192–203.
  • Консультативный комитет по языковой обработке, «Язык и машины: компьютеры в переводе и лингвистике» , Национальный исследовательский совет , 1966 г. (широко известный как «Отчет ALPAC»).
  • Джон Хатчинс (редактор), «Гилберт В. Кинг и переводчик IBM-USAF» , Ранние годы машинного перевода , Джо Бенджаминс, 2000 г., ISBN   90-272-4586-X (RADC-TDR-62-105)
  • Чарльз Борн и Труди Беллардо Хан, «История информационных онлайн-услуг, 1963–1976» , MIT Press, 2003, ISBN   0-262-02538-8

См. также

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5194605b118dfae66cfc3cc8a6cb5802__1721780580
URL1:https://arc.ask3.ru/arc/aa/51/02/5194605b118dfae66cfc3cc8a6cb5802.html
Заголовок, (Title) документа по адресу, URL1:
Automatic Language Translator - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)