Перевод речи
Часть серии о |
Перевод |
---|
![]() |
Типы |
Теория |
Технологии |
Локализация |
Институциональный |
Связанные темы |
|
![]() | Эту статью необходимо отредактировать, чтобы Википедии она соответствовала Руководству по стилю . ( Август 2013 г. ) |
![]() | Было предложено объединить эту статью с разделом «Машинный перевод» . ( Обсудить ) Предлагается с октября 2023 г. |
Перевод речи — это процесс, при котором разговорные фразы мгновенно переводятся и произносятся вслух на втором языке. Это отличается от перевода фраз , при котором система переводит только фиксированный и конечный набор фраз, введенных в систему вручную. Технология перевода речи позволяет общаться носителям разных языков. Таким образом, оно имеет огромную ценность для человечества с точки зрения науки, межкультурного обмена и глобального бизнеса.
Как это работает
[ редактировать ]Система перевода речи обычно объединяет следующие три программные технологии: автоматическое распознавание речи (ASR), машинный перевод (MT) и синтез голоса (TTS).
Носитель языка А говорит в микрофон, и модуль распознавания речи распознает высказывание. Он сравнивает входные данные с фонологической моделью, состоящей из большого массива речевых данных от нескольких говорящих.Затем входные данные преобразуются в строку слов с использованием словаря и грамматики языка А на основе огромного массива текста на языке А.
Затем модуль машинного перевода переводит эту строку. Ранние системы заменяли каждое слово соответствующим словом на языке B. Современные системы не используют дословный перевод, а скорее учитывают весь контекст ввода для создания соответствующего перевода. Сгенерированный перевод высказывания отправляется в модуль синтеза речи , который оценивает соответствие произношения и интонации строке слов на основе корпуса речевых данных на языке B. Из этой базы данных выбираются формы сигналов, соответствующие тексту, а синтезатор речи подключает и выводит их. [1]
История
[ редактировать ]В 1983 году корпорация NEC продемонстрировала перевод речи в качестве концептуальной выставки на выставке ITU Telecom World (Telecom '83). [2]
В 1999 году консорциум C-Star-2 продемонстрировал ораторский перевод на 5 языков, включая английский, японский, итальянский, корейский и немецкий. [3] [4]
Функции
[ редактировать ]Помимо проблем, связанных с переводом текста, ему также приходится иметь дело с особыми проблемами, возникающими при речевом переводе, включая бессвязность разговорной речи, меньшее количество грамматических ограничений разговорной речи, нечеткие границы слов в разговорной речи, исправление ошибки распознавания речи и несколько дополнительных входов. Кроме того, речевой перевод также имеет свои преимущества по сравнению с переводом текста, включая менее сложную структуру разговорной речи и меньший словарный запас в разговорной речи. [ нужна ссылка ]
Исследования и разработки
[ редактировать ]Исследования и разработки постепенно перешли от относительно простого к более сложному переводу. Были организованы международные оценочные семинары для поддержки развития технологий перевода речи. Они позволяют исследовательским институтам одновременно сотрудничать и конкурировать друг с другом. Концепция этих семинаров представляет собой своего рода конкурс: организаторы предоставляют общий набор данных, а участвующие исследовательские институты создают системы, которые оцениваются. Таким образом, продвигаются эффективные исследования.
Международный ключевым семинар по переводу разговорной речи ( IWSLT ), организованный C-STAR, международным консорциумом исследований в области перевода речи, проводится с 2004 года. «С каждым годом число участвующих институтов увеличивается, и он стал мероприятие по исследованию перевода речи». [1]
Стандарты
[ редактировать ]Когда многие страны начнут исследовать и разрабатывать перевод речи, потребуется стандартизировать интерфейсы и форматы данных, чтобы гарантировать взаимную совместимость систем. Международным совместным исследованиям способствуют консорциумы по переводу речи (например, международный консорциум C-STAR для совместных исследований перевода речи и A-STAR для Азиатско-Тихоокеанского региона). Они были основаны как «международные совместные исследовательские организации для разработки форматов двуязычных корпусов, которые необходимы для продвижения исследований и разработок этой технологии ... и для стандартизации интерфейсов и форматов данных для подключения модулей перевода речи на международном уровне». [1]
Приложения
[ редактировать ]Сегодня системы перевода речи используются во всем мире. Примеры включают медицинские учреждения, школы, полицию, гостиницы, розничные магазины и фабрики. Эти системы применимы везде, где для общения используется разговорный язык. Популярное приложение — Jibbigo , работающее в автономном режиме.
Проблемы и перспективы на будущее
[ редактировать ]В настоящее время технология перевода речи доступна как продукт, который мгновенно переводит многоязычные разговоры в свободной форме. Эти системы мгновенно переводят непрерывную речь. Проблемы в достижении этого включают преодоление зависящих от говорящего различий в стиле речи или произношении — проблемы, которые необходимо решить, чтобы обеспечить высококачественный перевод для всех пользователей. Более того, системы распознавания речи должны быть способны устранять внешние факторы, такие как акустический шум или речь других говорящих, при реальном использовании систем перевода речи.
По той причине, что пользователь не понимает целевой язык при использовании перевода речи, «должен быть предусмотрен метод, позволяющий пользователю проверить правильность перевода, например, путем его повторного перевода на язык пользователя». [1] Чтобы достичь цели по устранению языкового барьера во всем мире, необходимо поддерживать несколько языков. Для этого потребуются речевые корпуса, двуязычные корпуса и корпуса текстов для каждого из примерно 6000 языков, которые , как утверждается, существуют сегодня на нашей планете.
Поскольку сбор корпусов чрезвычайно дорог, сбор данных из Интернета может стать альтернативой традиционным методам. «Вторичное использование новостей или других средств массовой информации, опубликованных на нескольких языках, могло бы стать эффективным способом улучшить качество перевода речи». Однако «действующий закон об авторском праве не принимает во внимание вторичное использование, такое как эти типы корпусов», и поэтому «необходимо будет пересмотреть его, чтобы он стал более гибким». [1]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д и «Преодоление языкового барьера с помощью технологии перевода речи» , Сатоши, Накамура, «Тенденции в науке и технологиях» - ежеквартальный обзор № 31, апрель 2009 г.
- ^ НЭК/021219-1. «NEC Global – Пресс-релиз» . www.nec.co.jp. Проверено 23 сентября 2017 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ «С-Стар» . ЭНЕРГЕТИЧЕСКИЙ ЯДЕРНЫЙ РЕАКТОР .
- ^ «Система перевода речи с японского на английский: ATR-MATRIX» Такезавы, Моримото, Сагисаки, Кэмпбелла, Ииды, Сугая, Ёко, Ямамото в материалах Международной конференции по обработке разговорной речи 1998 г.