Юлиус (программное обеспечение)
Оригинальный автор(ы) | Ли Акинобу |
---|---|
Разработчик(и) | Лаборатория Кавахара, Киотский университет Команда проекта Джулиус, Нагойский технологический институт |
Первоначальный выпуск | 1991 год |
Стабильная версия | 4.6
/ 2 сентября 2020 г. |
Репозиторий | github |
Написано в | С |
Операционная система | Unix ( Linux , BSD и т. д.), Windows (через Cygwin ) |
Платформа | ИА-32 , x86-64 |
Доступно в | японский, английский |
Тип | Распознавание речи |
Лицензия | Бесплатная версия . BSD в стиле [ 1 ] [ 2 ] |
Веб-сайт | Юлий |
Julius — это механизм распознавания речи , в частности, высокопроизводительное двухпроходное программное обеспечение для декодера непрерывного распознавания речи с большим словарным запасом (LVCSR) для исследователей и разработчиков, связанных с речью. Он может выполнять декодирование вычислений практически в реальном времени (RTC) на большинстве современных персональных компьютеров (ПК) в задаче диктовки 60 тысяч слов с использованием триграммы слов (3-граммы) и контекстно-зависимой скрытой марковской модели (HMM). Основные методы поиска полностью включены.
Он также тщательно структурирован по модулям, чтобы быть независимым от структур модели, и поддерживаются различные типы HMM, такие как трифоны с общим состоянием и модели связанной смеси, с любым количеством смесей, состояний или телефонов. Стандартные форматы приняты для работы с другими бесплатными инструментами моделирования. Основная платформа — Linux и другие рабочие станции Unix , работает на Windows . Julius — это бесплатное программное обеспечение с открытым исходным кодом , выпущенное под пересмотренной BSD в стиле лицензией на программное обеспечение .
Julius разрабатывался как часть набора бесплатного программного обеспечения для японских исследований LVCSR с 1997 года, а работа продолжалась в Консорциуме непрерывного распознавания речи (CSRC), Япония, с 2000 по 2003 год.
анализатор распознавания на основе грамматики под названием Julian Начиная с версии 3.4, в Julius интегрирован . Джулиан — это модифицированная версия Джулиуса, которая использует созданный вручную тип конечного автомата (FSM), называемый детерминированной грамматикой конечного автомата в качестве модели языка (DFA). Его можно использовать для создания своего рода системы голосовых команд с небольшим словарным запасом или различных системы устного диалога задач .
О моделях
[ редактировать ]Для работы распознавателю Julius необходима языковая модель и акустическая модель для каждого языка.
Hidden Markov Model Toolkit ( HTK ) Джулиус использует акустические модели в формате ASCII , словарь произношения в формате, подобном HTK, и трехграммовые языковые модели слов в стандартном формате ARPA: прямые 2-граммы и обратные 3-граммы, обученные на основе речевого корпуса с помощью обратный порядок слов.
Хотя Julius распространяется только с японскими моделями, проект VoxForge работает над созданием английских акустических моделей для использования с механизмом распознавания речи Julius.
В апреле 2018 года благодаря усилиям фонда Mozilla стал доступен 350-часовой аудиокорпус разговорного английского языка. Новая английская речевая модель ENVR-v5.4 с открытым исходным кодом была выпущена вместе с польскими моделями PLPL-v7.1 и доступна на SourceForge. [ 3 ]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Каллауэй, Том (ролик) (13 августа 2012 г.). «Лицензирование/Юлий» . Федора вики . Красная шляпа . Проверено 24 марта 2019 г.
- ^ «Средство распознавания непрерывной речи с большим словарным запасом Julius» . Команда разработчиков Юлиуса . Нагойский технологический институт. 2014 . Проверено 24 марта 2019 г.
- ^ «JuliusModels — просмотр файлов на SourceForge.net» .
Внешние ссылки
[ редактировать ]- Официальный сайт osdn.jp.