CMUdict обеспечивает сопоставление орфографии и фонетики английских слов в их североамериканском произношении. Он обычно используется для создания представлений для распознавания речи (ASR), например, система CMU Sphinx , и синтеза речи (TTS), например, система Festival . CMUdict можно использовать в качестве обучающего корпуса для построения статистических моделей графемы-фонемы (g2p). [1] который будет генерировать произношение слов, еще не включенных в словарь.
Самая последняя версия — 0.7b; он содержит более 134 000 записей. Доступна интерактивная версия поиска. [2]
База данных распространяется в виде обычного текстового файла с одной записью в строке в формате " WORD <pronunciation>" с разделителем в два пробела между частями. Если для слова доступно несколько вариантов произношения, варианты идентифицируются с использованием пронумерованных версий (например, WORD(1)). Произношение кодируется с помощью модифицированной формы системы ARPABET с добавлением знаков ударения на гласных уровней 0, 1 и 2. Строка-начальная буква ;;; токен указывает на комментарий. Производный формат, непосредственно подходящий для механизмов распознавания речи, также доступен как часть дистрибутива; в этом формате стираются различия между ударениями (обычно не используются в ASR).
Ниже приводится таблица фонем, используемых Словарем произношения CMU. [2]
Карнеги-Меллон Логос [5] Инструмент включает словарь произношения CMU.
PronunDict , словарь произношения американского английского языка, использует словарь произношения CMU в качестве источника данных. Произношение транскрибируется символами IPA . Этот словарь также поддерживает поиск по произношению .
Некоторые программы синтезатора певческого голоса, такие как CeVIO Creative Studio и Synthesizer V, используют модифицированную версию словаря произношения CMU для синтеза английских певческих голосов.
Transcriber , инструмент для полнотекстовой фонетической транскрипции, использует словарь произношения CMU.
15.ai , инструмент преобразования текста в речь в реальном времени с использованием искусственного интеллекта, использует словарь произношения CMU.
Arc.Ask3.Ru Номер скриншота №: e2157e19103c8d1da6f7317d436d86ec__1718870580 URL1:https://arc.ask3.ru/arc/aa/e2/ec/e2157e19103c8d1da6f7317d436d86ec.html Заголовок, (Title) документа по адресу, URL1: CMU Pronouncing Dictionary - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)