Список программного обеспечения для распознавания речи
Программное обеспечение для распознавания речи доступно для многих вычислительных платформ , операционных систем , моделей использования и лицензий на программное обеспечение . Вот их список, сгруппированный по различным полезным признакам.
Акустические модели и речевой корпус (сборник)
[ редактировать ]В следующем списке представлены известные программные механизмы распознавания речи с кратким обзором характеристик.
Имя приложения | Описание | с открытым исходным кодом | Лицензия | Операционная система | Язык программирования | Поддерживаемый язык, примечание | Офлайн или онлайн |
---|---|---|---|---|---|---|---|
КМУ Сфинкс | ХМ | Да | BSD-стиль | Кросс-платформенный | Ява | английский, немецкий, французский, китайский, русский | Оффлайн |
ХТК | ХММ Нейронная сеть | Нет | специфичный для HTK | Кросс-платформенный | С | Английский; версия 3.5 выпущена в декабре 2015 г. | |
Юлий | Триграммы ХММ | Да | Стиль BSD, некоммерческий | Кросс-платформенный | С | японский, английский; [2] | Оффлайн |
остался | Нейронная сеть | Да | Апач | Кросс-платформенный | С++ | Английский | |
RWTH ASR | RWTH Ахенский университет | Нет | RWTH ASR, только для некоммерческого использования | Линукс , МакОС | С++ | Английский | |
Шепот | Трансформатор кодер/декодер | Да | МОЯ лицензия | Кросс-платформенный | Python (язык программирования) | Многоязычный | Онлайн (через API ) и оффлайн |
Макинтош
[ редактировать ]Имя приложения | Описание | с открытым исходным кодом | Лицензия | Цена | Примечание |
---|---|---|---|---|---|
Dragon для Mac (снято с производства в 2018 г.) | macOS ; от Nuance | Нет | Собственный | ||
Диктат Дракона (снято с производства) | macOS; от Nuance | Нет | Собственный | ||
MacSpeech Scribe (снято с производства) | Транскрипция записанного текста; приобретено Nuance | ||||
iListen (снято с производства) | PowerPC Макинтош; прекращено MacSpeech; приобретено Nuance | ||||
Разговорные предметы | Входит в состав macOS | ||||
ViaVoice (снято с производства) | Продукт IBM; приобретено Nuance | ||||
Голосовой навигатор | Оригинальный графический интерфейс голосового управления; 1989 год |
Кроссплатформенные веб-приложения на базе Chrome
[ редактировать ]В следующем списке представлены известные программы распознавания речи, которые работают в браузере Chrome как веб-приложения. Они используют HTML5 Web-Speech-API. [1]
Имя приложения | Описание | с открытым исходным кодом | Лицензия | Цена | Примечание |
---|---|---|---|---|---|
Речевая деятельность [2] | Облачное и локальное автоматическое распознавание речи | Нет | Собственный | От 0,06 фунта стерлингов за минуту аудио |
Мобильные устройства и смартфоны
[ редактировать ]Многие мобильные телефоны , в том числе функциональные телефоны и смартфоны , такие как iPhone и BlackBerry , имеют встроенные базовые функции голосового набора. Многие сторонние приложения реализовали поддержку распознавания речи на естественном языке, в том числе:
Имя приложения | Описание | с открытым исходным кодом | Лицензия | Цена | Примечание |
---|---|---|---|---|---|
Assistant.ai | Ассистент для Android, iOS и Windows Phone | Нет | Проприетарное , бесплатное ПО | Бесплатно | Снято с производства |
Драконий диктант | Нет | Проприетарное , бесплатное ПО | Бесплатно | ||
Google сейчас | голосовой поиск на Андроиде | Нет | Проприетарное , бесплатное ПО | Бесплатно | |
Голосовой поиск Google | Нет | Проприетарное , бесплатное ПО | Бесплатно | ||
Майкрософт Кортана | Голосовой поиск Майкрософт | Нет | Проприетарное , бесплатное ПО | Бесплатно | |
Личный помощник Сири | Виртуальный личный помощник Apple | Нет | Проприетарное , бесплатное ПО | Бесплатно | |
Алекса — Amazon Echo | Личный помощник Amazon | Нет | Собственный | ||
СИЛЬВИЯ | Андроид и iOS | Нет | |||
Влинго |
Окна
[ редактировать ]Встроенное распознавание речи Windows
[ редактировать ]Распознавание речи Windows версии 8.0 от Microsoft встроено в Windows Vista , Windows 7 , Windows 8 и Windows 10 .Распознавание речи доступно только на английском, французском, испанском, немецком, японском, упрощенном китайском и традиционном китайском языках и только в соответствующей версии Windows; это означает, что вы не можете использовать механизм распознавания речи на одном языке, если используете версию Windows на другом языке. Windows 7 Ultimate и Windows 8 Pro позволяют менять язык системы и, следовательно, выбирать доступный речевой движок. Распознавание речи Windows превратилось в Cortana (программное обеспечение) , личного помощника, включенного в Windows 10 .
Стороннее распознавание речи в Windows 7, 8, 10, 11
[ редактировать ]- Braina – диктуйте стороннее программное обеспечение и веб-сайты, [3] заполнять веб-формы и выполнять голосовые команды. [4]
- Dragon NaturallySpeaking от Nuance Communications – преемник более старого продукта DragonDictate . Сосредоточьтесь на диктовке . Поддержка 64-битной версии Windows начиная с версии 10.1.
- Tazti – Создавайте профили речевых команд для игр на ПК и управления приложениями – программами. Создавайте речевые команды для открытия файлов, папок, веб-страниц и приложений. Версии Windows 7, Windows 8 и Windows 8.1. [5]
- Voice Finger – программа, улучшающая систему распознавания речи Windows путем добавления к ней нескольких расширений. Программное обеспечение позволяет управлять мышью и клавиатурой только с помощью голоса. Это особенно полезно для того, чтобы помочь пользователям преодолеть инвалидность или вылечиться от компьютерных травм.
Только Windows XP или 2000
[ редактировать ]- Microsoft Speech API — функция распознавания речи, включенная в состав Microsoft Office и на планшетных ПК под управлением Microsoft Windows XP Tablet PC Edition. Его также можно загрузить как часть Speech SDK 5.1 для приложений Windows, но поскольку он предназначен для разработчиков, создающих речевые приложения, в чистой форме SDK отсутствует какой-либо пользовательский интерфейс, и поэтому он непригоден для конечных пользователей.
Встроенное программное обеспечение
[ редактировать ]- Microsoft Kinect включает встроенное программное обеспечение, позволяющее распознавать команды с помощью речи.
- Старые поколения телефонов Nokia , такие как Nokia N Series (до использования мобильной технологии Windows 7 ), использовали распознавание речи по фамилиям из списка контактов и нескольким командам.
- Siri , первоначально реализованная в iPhone 4S , личном помощнике Apple для iOS , использующем технологию Nuance Communications .
- Cortana (программное обеспечение) — Microsoft личный помощник , встроенный в Windows Phone и Windows 10 .
Интерактивный голосовой ответ
[ редактировать ]Ниже приведены системы интерактивного голосового ответа (IVR):
- Инструментарий CSLU
- Генезис [6]
- HTK – авторские права принадлежат Microsoft, но позволяет изменять программное обеспечение для внутреннего использования лицензиата.
- ЛюменВокс АСР
- Теллми Сети ; приобретен Microsoft
Unix-подобное программное обеспечение для транскрипции речи x86 и x86-64
[ редактировать ]- Набор инструментов распознавания Януса (JRTk) [7] [8]
- Mozilla DeepSpeech разрабатывает механизм преобразования речи в текст с открытым исходным кодом на основе исследования глубокой речи Baidu. [9]
Программное обеспечение, снятое с производства
[ редактировать ]- IBM VoiceType (ранее IBM Personal Dictation System)
- IBM ViaVoice — встроенная версия, которая до сих пор поддерживается IBM . [10] Больше не поддерживается для версий выше Windows Vista. [11] Не тестировалось выше macOS 10.4 или на Macintosh с чипсетом Intel. [12]
- Шарлатан.com ; приобретен AOL ; теперь это имя повторно используется в поисковом приложении для iPad.
- SpeechWorks от Nuance Communications .
- Yap Speech Cloud — платформа преобразования речи в текст, приобретенная Amazon.com .
См. также
[ редактировать ]- Программное обеспечение для распознавания речи для Linux – Программное обеспечение Linux для распознавания речи
- Программное обеспечение для транскрипции - программное обеспечение, которое помогает преобразовывать человеческую речь в текстовую расшифровку.
Ссылки
[ редактировать ]- ^ «Спецификация API веб-речи» . dvcs.w3.org . Архивировано из оригинала 21 июня 2016 г.
- ^ Орловский, Андрей. «Полное признание: британский искусственный интеллект совершает прорыв в области универсальной речи» . Регистр . Ситуация Публикация . Проверено 17 мая 2018 г.
- ^ «Программное обеспечение для распознавания речи для ПК с ОС Windows – Braina» . www.brainasoft.com . Архивировано из оригинала 7 апреля 2015 г.
- ^ «Список динамических огранок из большинства 57 программ и веб-служб распознавания речи» . Архивировано из оригинала 13 февраля 2019 года . Проверено 23 февраля 2019 г.
- ^ О'Нил, Марк (6 ноября 2013 г.). «Управляйте своим компьютером с помощью этих 5 программ распознавания речи» . Мир ПК . Архивировано из оригинала 1 января 2014 г. Проверено 30 декабря 2013 г.
- ^ «Интерактивный голосовой ответ» . Генезис . Архивировано из оригинала 14 октября 2016 г.
- ^ [1] [ мертвая ссылка ]
- ^ Лави, А.; Вайбель, А.; Левин, Л.; Финке, М.; Гейтс, Д.; Гавальда, М.; Цеппенфельд, Т.; Жан, Пумин (1 апреля 1997 г.). «Янус-III: речевой перевод на несколько языков». 1997 Международная конференция IEEE по акустике, речи и обработке сигналов . Том. 1. Исследование IEEE. стр. 99–102. CiteSeerX 10.1.1.36.6967 . дои : 10.1109/ICASSP.1997.599557 . ISBN 978-0-8186-7919-3 . S2CID 1514209 .
- ^ «Реализация TensorFlow архитектуры DeepSpeech от Baidu» . Мозилла. 05.12.2017 . Проверено 5 декабря 2017 г.
- ^ «IBM — Встроенный ViaVoice — Встроенный ViaVoice — Программное обеспечение» . Архивировано из оригинала 8 августа 2010 г. Проверено 29 июня 2010 г.
- ^ «Поддержка продуктов Nuance для Microsoft Windows 7» . Nuance Communications, Служба поддержки клиентов . Проверено 16 марта 2019 г.
- ^ «ViaVoice для Mac OS X на наборе микросхем Intel» . Nuance Communications, Служба поддержки клиентов . Проверено 16 марта 2019 г.