БРАТ
Оригинальный автор(ы) | Тьерри Дютуа |
---|---|
Разработчик(и) | Винсент Пейджел |
Первоначальный выпуск | 1995 год |
Стабильная версия | 3.3 / 17 декабря 2019 г |
Репозиторий | github |
Написано в | С |
Операционная система | Линукс Окна FreeBSD |
Тип | Синтезатор речи |
Лицензия | Я приношу Стандартную общественную лицензию GNU. |
Веб-сайт | github |
MBROLA — это для синтеза речи программное обеспечение , созданное в рамках совместного проекта по всему миру. На веб-странице проекта MBROLA представлены базы данных дифонов для многих [1] разговорные языки .
Программное обеспечение MBROLA не является полной системой синтеза речи для всех этих языков; текст отдельное программное обеспечение (например , сначала должен быть преобразован в фонему и просодическую информацию в формате MBROLA, для этого eSpeakNG необходимо ).
История
[ редактировать ]Проект MBROLA стартовал в 1995 году в лаборатории TCTS Политехнического факультета Монса (Бельгия) как научный проект по получению набора синтезаторов речи для максимально возможного количества языков. Первый выпуск программного обеспечения MBROLA состоялся в 1996 году и предоставлялся как бесплатное программное обеспечение для некоммерческого и невоенного применения. Лицензии на создаваемые голосовые базы различаются, но также в основном предназначены для некоммерческого и невоенного использования.
Из-за бесплатного использования только для некоммерческих приложений MBROLA была альтернативой для частных/домашних пользователей де-факто синтеза речи механизму eSpeakNG на рабочих станциях Linux , но в основном не использовалась для коммерческих решений (например, для часов разговора, уведомлений о посадке). для портов и терминалов и т. д.) После первоначальной разработки обновлений голосовых баз данных и поддержки программного обеспечения MBROLA прекратились, и постепенно двоичные файлы с закрытым исходным кодом отстали от разработки последнего аппаратного обеспечения и операционных систем. [2] Чтобы справиться с этим, команда разработчиков MBROLA решила выпустить MBROLA как программное обеспечение с открытым исходным кодом , и 24 октября 2018 года исходный код был опубликован на GitHub с лицензией GNU Affero General Public License . 23 января 2019 года был выпущен инструмент MBROLATOR, обеспечивающий создание базы данных MBROLA из файлов WAV с той же лицензией.
Используемая технология
[ редактировать ]Программное обеспечение MBROLA использует MBROLA (дополнение многополосного повторного синтеза). [3] алгоритм генерации речи. Несмотря на то, что он основан на дифонах , качество синтеза MBROLA считается выше, чем у большинства синтезаторов дифонов, поскольку он предварительно обрабатывает дифоны, создавая постоянную высоту тона и гармонические фазы, что улучшает их конкатенацию, лишь слегка ухудшая их сегментное качество.
MBROLA — это алгоритм временной области, аналогичный PSOLA , который предполагает очень низкую вычислительную нагрузку во время синтеза. Однако, в отличие от PSOLA, MBROLA не требует предварительной разметки периодов подачи. Эта функция позволила разработать проект MBROLA на основе алгоритма MBROLA, с помощью которого многие лаборатории по исследованию речи , компании и частные лица по всему миру предоставили базы данных дифонов для многих языков и голосов.
Ссылки
[ редактировать ]- ^ Список голосов MBROLA
- ^ Мброла-64 немедленно вылетает из-за SEGFAULT.
- ^ Дютуа, Т; Лейх, Х. (декабрь 1993 г.). «MBR-PSOLA: Синтез преобразования текста в речь на основе повторного синтеза MBE базы данных сегментов». Речевое общение . 13 (3–4): 435–440. дои : 10.1016/0167-6393(93)90042-J .