Jump to content

КМУ Сфинкс

Сфинкс4
Стабильная версия
5-преальфа / 3 августа 2015 г .; 8 лет назад ( 03.08.2015 )
Написано в Ява
Операционная система Кросс-платформенный
Тип Библиотека изображений
Лицензия BSD-стиль [1]
Веб-сайт Кмусфинкс .github .что /неделя /
Карманный сфинкс
Стабильная версия
5-преальфа / 5 августа 2015 г .; 8 лет назад ( 05.08.2015 )
Написано в С
Операционная система Кросс-платформенный
Тип Библиотека изображений
Лицензия BSD-стиль
Веб-сайт Кмусфинкс .github .что /неделя /

CMU Sphinx , также сокращенно называемый Sphinx, — это общий термин для описания группы систем распознавания речи , разработанных в Университете Карнеги-Меллона . К ним относятся серия распознавателей речи (Sphinx 2 – 4) и тренажер акустических моделей (SphinxTrain).

В 2000 году группа Sphinx в Карнеги-Меллоне обязалась открыть исходный код нескольких компонентов распознавания речи, включая Sphinx 2 и более поздний Sphinx 3 (в 2001 году). Речевые декодеры поставляются с акустическими моделями и примерами приложений. Доступные ресурсы включают в себя, кроме того, программное обеспечение для обучения акустическим моделям, компиляцию языковых моделей и общедоступный словарь произношения cmudict .

Sphinx включает в себя ряд программных систем, описанных ниже.

Sphinx — это система распознавания непрерывной речи, независимая от говорящего, использующая скрытые акустические модели Маркова ( HMM ) и статистическую языковую модель n-грамм . Его разработал Кай-Фу Ли . Sphinx продемонстрировал возможность непрерывной речи, независимого от говорящего распознавания большого словарного запаса, возможность которого в то время оспаривалась (1986). Сфинкс представляет только исторический интерес; его производительность была заменена последующими версиями. Архивная статья [2] подробно описывает систему.

Быстрый, ориентированный на производительность распознаватель, первоначально разработанный Сюэдуном Хуаном из Карнеги-Меллона и выпущенный с открытым исходным кодом с лицензией в стиле BSD на SourceForge Кевином Лензо из LinuxWorld в 2000 году. Sphinx 2 ориентирован на распознавание в реальном времени, подходящее для приложений разговорного языка. . По существу, он включает в себя такие функции, как определение конечных точек, генерация частичных гипотез, динамическое переключение языковой модели и т. д. Он используется в диалоговых системах и системах изучения языка. Его можно использовать в компьютерных системах УАТС, таких как Asterisk . Код Sphinx 2 также был включен в ряд коммерческих продуктов. Он больше не находится в активной разработке (за исключением планового обслуживания). Текущая разработка декодера реального времени ведется в рамках проекта Pocket Sphinx . Архивная статья [3] описывает систему.

В Sphinx 2 для акустического моделирования использовалось полунепрерывное представление (т. е. для всех моделей используется один набор гауссиан, а отдельные модели представлены в виде весового вектора над этими гауссианами). Sphinx 3 принял распространенное непрерывное представление HMM и использовался в основном для высокоточного распознавания не в реальном времени. Недавние разработки (в алгоритмах и аппаратном обеспечении) сделали Sphinx 3 «почти» реальным временем, хотя пока и не подходящим для критически важных интерактивных приложений. Sphinx 3 находится в активной разработке и в сочетании со SphinxTrain предоставляет доступ к ряду современных методов моделирования, таких как LDA/MLLT, MLLR и VTLN, которые повышают точность распознавания ( см. в статье «Распознавание речи описания этих методов »).

Sphinx 4 — это полная переработка движка Sphinx с целью предоставления более гибкой среды для исследований в области распознавания речи, полностью написанной на языке программирования Java. Sun Microsystems поддержала разработку Sphinx 4 и внесла в проект свой опыт разработки программного обеспечения. Среди участников были сотрудники MERL, MIT и CMU . (В настоящее время поддерживаются следующие языки: C, C++, C#, Python, Ruby, Java и JavaScript.)

Текущие цели развития включают в себя:

  • разработка нового (акустической модели) тренажера
  • реализация адаптации динамиков (например, MLLR)
  • улучшение управления конфигурацией
  • создание графического пользовательского интерфейса для проектирования графической системы

КарманныйСфинкс

[ редактировать ]

Версия Sphinx, которую можно использовать во встраиваемых системах (например, на базе процессора ARM ). PocketSphinx находится в стадии активной разработки и включает в себя такие функции, как арифметика с фиксированной запятой и эффективные алгоритмы вычислений GMM .

См. также

[ редактировать ]
  1. ^ http://www.speech.cs.cmu.edu/sphinx
  2. ^ "lee_k_f_1990_1.pdf" (PDF) .
  3. ^ "huang92sphinxii.pdf" (PDF) .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2f9e696d60ae842931a3e9eec5560e4b__1718870880
URL1:https://arc.ask3.ru/arc/aa/2f/4b/2f9e696d60ae842931a3e9eec5560e4b.html
Заголовок, (Title) документа по адресу, URL1:
CMU Sphinx - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)