Персидский речевой корпус
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Корпус персидской речи — это современный персидский речевой корпус для синтеза речи . Корпус содержит фонетические и орфографические транскрипции около 2,5 часов персидской речи, согласованные с записанной речью на уровне фонем , включая аннотации границ слов . [1] Предыдущие корпуса разговорного персидского языка включают FARSDAT, который состоит из чтения вслух газетных текстов от 100 носителей персидского языка, и базу данных телефонной разговорной речи FARsi (TFARSDAT), которая включает семь часов чтения и спонтанной речи, произносимой 60 носителями персидского языка из десяти регионов. Ирана . [2]
Корпус персидской речи был построен с использованием тех же методологий, изложенных в докторском проекте по современному стандартному арабскому языку Навара Халаби в Университете Саутгемптона . Работа финансировалась MicroLinkPC, владеющей эксклюзивной лицензией на коммерциализацию корпуса, хотя корпус доступен для некоммерческого использования через веб-сайт корпуса. Он распространяется по международной лицензии Creative Commons Attribution-NonCommercial-ShareAlike 4.0.
Корпус был создан для целей синтеза речи, но использовался для создания HMM голосов на основе на персидском языке. Его также можно использовать для автоматического согласования других речевых корпусов с их фонетической транскрипцией и как часть более крупного корпуса для обучения распознавания речи . систем [1]
Содержание
[ редактировать ]Корпус можно загрузить с веб-сайта и он содержит следующее:
- 396 файлов .wav, содержащих устные высказывания.
- 396 файлов .lab, содержащих текстовые высказывания
- 396 Файлы .TextGrid, содержащие метки фонем с отметками времени границ, где они встречаются в файлах .wav.
- фонетический-transcript.txt, который имеет форму «[wav_filename]» «[Последовательность фонем]» в каждой строке
- orthographic-transcript.txt, который имеет форму «[wav_filename]», «[Orthographic Transcript]» в каждой строке
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б Халаби, Навар (2016). Современная стандартная персидская фонетика для синтеза речи (PDF) (докторская диссертация). Университет Саутгемптона , Школа электроники и информатики.
- ^ Биджанхан, Махмуд, Джавад Шейхзадеган, Мохаммад Бахрани, Масуд Гаюми, 2011. «Уроки создания персидского письменного корпуса: Пейкаре» Языковые ресурсы и оценка 45.2: 143–164