Jump to content

Словарь произношения CMU

Словарь произношения CMU
Разработчик(и) Университет Карнеги-Меллон
Стабильная версия
0,7б / 19 ноября 2014 г .; 9 лет назад ( 19.11.2014 )
Доступно в Английский
Лицензия БСД
Веб-сайт www .речь .cs .cmu .edu /cgi-bin /cmudict

Словарь произношения CMU (также известный как CMUdict ) — это с открытым исходным кодом, произношения словарь первоначально созданный группой речи в Университете Карнеги-Меллона (CMU) для использования в исследованиях по распознаванию речи .

CMUdict обеспечивает сопоставление орфографии и фонетики английских слов в их североамериканском произношении. Он обычно используется для создания представлений для распознавания речи (ASR), например, система CMU Sphinx , и синтеза речи (TTS), например, система Festival . CMUdict можно использовать в качестве обучающего корпуса для построения статистических моделей графемы-фонемы (g2p). [1] который будет генерировать произношение слов, еще не включенных в словарь.

Самая последняя версия — 0.7b; он содержит более 134 000 записей. Доступна интерактивная версия поиска. [2]

Формат базы данных

[ редактировать ]

База данных распространяется в виде обычного текстового файла с одной записью в строке в формате " WORD  <pronunciation>" с разделителем в два пробела между частями. Если для слова доступно несколько вариантов произношения, варианты идентифицируются с использованием пронумерованных версий (например, WORD(1)). Произношение кодируется с помощью модифицированной формы системы ARPABET с добавлением знаков ударения на гласных уровней 0, 1 и 2. Строка-начальная буква ;;; токен указывает на комментарий. Производный формат, непосредственно подходящий для механизмов распознавания речи, также доступен как часть дистрибутива; в этом формате стираются различия между ударениями (обычно не используются в ASR).

Ниже приводится таблица фонем, используемых Словарем произношения CMU. [2]

гласные
АРПАБЕТ руп. НАСИЛИЕ Пример
AAах ɑ странный
AEа ой в
AH0а а о
AHЭм-м-м ʌ хижина
AOхорошо ɔ да , история
AWой а' корова
AYглаз аа скрывать
EHага е Э д
гласные
АРПАБЕТ руп. НАСИЛИЕ Пример
ERударь , муж ɝ , ɚ повредить
EYявляется еɪ ел
IHя , я ɪ это
IYда я есть
OWой о'' оа т
OYООО ɔɪ Той ой
UHон ʊ капюшон
UWи в два
Стресс
АБ Описание
0 Никакого стресса
1 Первичный стресс
2 Вторичный стресс
Согласные
АРПАБЕТ руп. НАСИЛИЕ Пример
Bб б быть
CHч , чч тʃ сыр
Dд д д э
DHд д ты
Fж ж платеж
Gг ɡ зеленый
HHчас час он
JHдж дʒ ну и дела ee
Согласные
АРПАБЕТ руп. НАСИЛИЕ Пример
Kк к ключ
Lл л я да
Mм м мне
Nн н колено
NGиз ŋ пи нг
Pп п пи пи
Rр р читать
Sс , сс с море
Согласные
АРПАБЕТ руп. НАСИЛИЕ Пример
SHш ʃ она
Tт т чай
THй я эта эта
Vv v ви
Wш , что В мы
Yи дж урожай
ZС С з ее
ZHzh ʒ захват
Версия Дата выпуска [3] Лицензия
0.1 16 сентября 1993 г. Общественное достояние
0.2 10 марта 1994 г. Общественное достояние
0.3 28 сентября 1994 г. Общественное достояние
0.4 8 ноября 1995 г. Общественное достояние
0.5 Нет публичного релиза Общественное достояние
0.6 11 августа 1998 г. Общественное достояние
0.7 Нет публичного релиза Общественное достояние
0,7а 18 февраля 2008 г. 2-пунктовый BSD
0,7б 19 ноября 2014 г. [4] 2-пунктовый BSD
GitHub (без версии) 26 мая 2021 г. 2-пунктовый BSD

Приложения

[ редактировать ]
  • Конвертер Unifon основан на словаре произношения CMU.
  • Набор инструментов для естественного языка содержит интерфейс к словарю произношения CMU.
  • Карнеги-Меллон Логос [5] Инструмент включает словарь произношения CMU.
  • PronunDict , словарь произношения американского английского языка, использует словарь произношения CMU в качестве источника данных. Произношение транскрибируется символами IPA . Этот словарь также поддерживает поиск по произношению .
  • Некоторые программы синтезатора певческого голоса, такие как CeVIO Creative Studio и Synthesizer V, используют модифицированную версию словаря произношения CMU для синтеза английских певческих голосов.
  • Transcriber , инструмент для полнотекстовой фонетической транскрипции, использует словарь произношения CMU.
  • 15.ai , инструмент преобразования текста в речь в реальном времени с использованием искусственного интеллекта, использует словарь произношения CMU.

См. также

[ редактировать ]
  1. ^ «Sequitur G2P — обучаемый преобразователь графем в фонемы» .
  2. ^ Перейти обратно: а б «Произносящий словарь КМУ» . Произносящий словарь КМУ . 16 июля 2015 г. Архивировано из оригинала 3 июня 2022 г. Проверено 4 июня 2022 г.
  3. ^ ftp://ftp.cs.cmu.edu/project/speech/dict/ [ постоянная мертвая ссылка ]
  4. ^ «КМУдикт» . svn.code.sf.net .
  5. ^ «Cmusphinx — Редакция 10973: /Trunk/Logios» . Архивировано из оригинала 20 мая 2011 г. Проверено 19 декабря 2009 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e2157e19103c8d1da6f7317d436d86ec__1718870580
URL1:https://arc.ask3.ru/arc/aa/e2/ec/e2157e19103c8d1da6f7317d436d86ec.html
Заголовок, (Title) документа по адресу, URL1:
CMU Pronouncing Dictionary - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)