Jump to content

Список программного обеспечения для распознавания речи

Программное обеспечение для распознавания речи доступно для многих вычислительных платформ , операционных систем , моделей использования и лицензий на программное обеспечение . Вот их список, сгруппированный по различным полезным признакам.

Акустические модели и речевой корпус (сборник)

[ редактировать ]

В следующем списке представлены известные программные механизмы распознавания речи с кратким обзором характеристик.

Имя приложения Описание с открытым исходным кодом Лицензия Операционная система Язык программирования Поддерживаемый язык, примечание Офлайн или онлайн
КМУ Сфинкс ХМ Да BSD-стиль Кросс-платформенный Ява английский, немецкий, французский, китайский, русский Оффлайн
ХТК ХММ Нейронная сеть Нет специфичный для HTK Кросс-платформенный С Английский; версия 3.5 выпущена в декабре 2015 г.
Юлий Триграммы ХММ Да Стиль BSD, некоммерческий Кросс-платформенный С японский, английский; [2] Оффлайн
остался Нейронная сеть Да Апач Кросс-платформенный С++ Английский
RWTH ASR RWTH Ахенский университет Нет RWTH ASR, только для некоммерческого использования Линукс , МакОС С++ Английский
Шепот Трансформатор кодер/декодер Да МОЯ лицензия Кросс-платформенный Python (язык программирования) Многоязычный Онлайн (через API ) и оффлайн

Макинтош

[ редактировать ]
Имя приложения Описание с открытым исходным кодом Лицензия Цена Примечание
Dragon для Mac (снято с производства в 2018 г.) macOS ; от Nuance Нет Собственный
Диктат Дракона (снято с производства) macOS; от Nuance Нет Собственный
MacSpeech Scribe (снято с производства) Транскрипция записанного текста; приобретено Nuance
iListen (снято с производства) PowerPC Макинтош; прекращено MacSpeech; приобретено Nuance
Разговорные предметы Входит в состав macOS
ViaVoice (снято с производства) Продукт IBM; приобретено Nuance
Голосовой навигатор Оригинальный графический интерфейс голосового управления; 1989 год

Кроссплатформенные веб-приложения на базе Chrome

[ редактировать ]

В следующем списке представлены известные программы распознавания речи, которые работают в браузере Chrome как веб-приложения. Они используют HTML5 Web-Speech-API. [1]

Имя приложения Описание с открытым исходным кодом Лицензия Цена Примечание
Речевая деятельность [2] Облачное и локальное автоматическое распознавание речи Нет Собственный От 0,06 фунта стерлингов за минуту аудио

Мобильные устройства и смартфоны

[ редактировать ]

Многие мобильные телефоны , в том числе функциональные телефоны и смартфоны , такие как iPhone и BlackBerry , имеют встроенные базовые функции голосового набора. Многие сторонние приложения реализовали поддержку распознавания речи на естественном языке, в том числе:

Имя приложения Описание с открытым исходным кодом Лицензия Цена Примечание
Assistant.ai Ассистент для Android, iOS и Windows Phone Нет Проприетарное , бесплатное ПО Бесплатно Снято с производства
Драконий диктант Нет Проприетарное , бесплатное ПО Бесплатно
Google сейчас голосовой поиск на Андроиде Нет Проприетарное , бесплатное ПО Бесплатно
Голосовой поиск Google Нет Проприетарное , бесплатное ПО Бесплатно
Майкрософт Кортана Голосовой поиск Майкрософт Нет Проприетарное , бесплатное ПО Бесплатно
Личный помощник Сири Виртуальный личный помощник Apple Нет Проприетарное , бесплатное ПО Бесплатно
Алекса — Amazon Echo Личный помощник Amazon Нет Собственный
СИЛЬВИЯ Андроид и iOS Нет
Влинго

Встроенное распознавание речи Windows

[ редактировать ]

Распознавание речи Windows версии 8.0 от Microsoft встроено в Windows Vista , Windows 7 , Windows 8 и Windows 10 .Распознавание речи доступно только на английском, французском, испанском, немецком, японском, упрощенном китайском и традиционном китайском языках и только в соответствующей версии Windows; это означает, что вы не можете использовать механизм распознавания речи на одном языке, если используете версию Windows на другом языке. Windows 7 Ultimate и Windows 8 Pro позволяют менять язык системы и, следовательно, выбирать доступный речевой движок. Распознавание речи Windows превратилось в Cortana (программное обеспечение) , личного помощника, включенного в Windows 10 .

Стороннее распознавание речи в Windows 7, 8, 10, 11

[ редактировать ]
  • Braina – диктуйте стороннее программное обеспечение и веб-сайты, [3] заполнять веб-формы и выполнять голосовые команды. [4]
  • Dragon NaturallySpeaking от Nuance Communications – преемник более старого продукта DragonDictate . Сосредоточьтесь на диктовке . Поддержка 64-битной версии Windows начиная с версии 10.1.
  • Tazti – Создавайте профили речевых команд для игр на ПК и управления приложениями – программами. Создавайте речевые команды для открытия файлов, папок, веб-страниц и приложений. Версии Windows 7, Windows 8 и Windows 8.1. [5]
  • Voice Finger – программа, улучшающая систему распознавания речи Windows путем добавления к ней нескольких расширений. Программное обеспечение позволяет управлять мышью и клавиатурой только с помощью голоса. Это особенно полезно для того, чтобы помочь пользователям преодолеть инвалидность или вылечиться от компьютерных травм.

Только Windows XP или 2000

[ редактировать ]
  • Microsoft Speech API — функция распознавания речи, включенная в состав Microsoft Office и на планшетных ПК под управлением Microsoft Windows XP Tablet PC Edition. Его также можно загрузить как часть Speech SDK 5.1 для приложений Windows, но поскольку он предназначен для разработчиков, создающих речевые приложения, в чистой форме SDK отсутствует какой-либо пользовательский интерфейс, и поэтому он непригоден для конечных пользователей.

Встроенное программное обеспечение

[ редактировать ]

Интерактивный голосовой ответ

[ редактировать ]

Ниже приведены системы интерактивного голосового ответа (IVR):

Unix-подобное программное обеспечение для транскрипции речи x86 и x86-64

[ редактировать ]

Программное обеспечение, снятое с производства

[ редактировать ]
  • IBM VoiceType (ранее IBM Personal Dictation System)
  • IBM ViaVoice — встроенная версия, которая до сих пор поддерживается IBM . [10] Больше не поддерживается для версий выше Windows Vista. [11] Не тестировалось выше macOS 10.4 или на Macintosh с чипсетом Intel. [12]
  • Шарлатан.com ; приобретен AOL ; теперь это имя повторно используется в поисковом приложении для iPad.
  • SpeechWorks от Nuance Communications .
  • Yap Speech Cloud — платформа преобразования речи в текст, приобретенная Amazon.com .

См. также

[ редактировать ]
  1. ^ «Спецификация API веб-речи» . dvcs.w3.org . Архивировано из оригинала 21 июня 2016 г.
  2. ^ Орловский, Андрей. «Полное признание: британский искусственный интеллект совершает прорыв в области универсальной речи» . Регистр . Ситуация Публикация . Проверено 17 мая 2018 г.
  3. ^ «Программное обеспечение для распознавания речи для ПК с ОС Windows – Braina» . www.brainasoft.com . Архивировано из оригинала 7 апреля 2015 г.
  4. ^ «Список динамических огранок из большинства 57 программ и веб-служб распознавания речи» . Архивировано из оригинала 13 февраля 2019 года . Проверено 23 февраля 2019 г.
  5. ^ О'Нил, Марк (6 ноября 2013 г.). «Управляйте своим компьютером с помощью этих 5 программ распознавания речи» . Мир ПК . Архивировано из оригинала 1 января 2014 г. Проверено 30 декабря 2013 г.
  6. ^ «Интерактивный голосовой ответ» . Генезис . Архивировано из оригинала 14 октября 2016 г.
  7. ^ [1] [ мертвая ссылка ]
  8. ^ Лави, А.; Вайбель, А.; Левин, Л.; Финке, М.; Гейтс, Д.; Гавальда, М.; Цеппенфельд, Т.; Жан, Пумин (1 апреля 1997 г.). «Янус-III: речевой перевод на несколько языков». 1997 Международная конференция IEEE по акустике, речи и обработке сигналов . Том. 1. Исследование IEEE. стр. 99–102. CiteSeerX   10.1.1.36.6967 . дои : 10.1109/ICASSP.1997.599557 . ISBN  978-0-8186-7919-3 . S2CID   1514209 .
  9. ^ «Реализация TensorFlow архитектуры DeepSpeech от Baidu» . Мозилла. 05.12.2017 . Проверено 5 декабря 2017 г.
  10. ^ «IBM — Встроенный ViaVoice — Встроенный ViaVoice — Программное обеспечение» . Архивировано из оригинала 8 августа 2010 г. Проверено 29 июня 2010 г.
  11. ^ «Поддержка продуктов Nuance для Microsoft Windows 7» . Nuance Communications, Служба поддержки клиентов . Проверено 16 марта 2019 г.
  12. ^ «ViaVoice для Mac OS X на наборе микросхем Intel» . Nuance Communications, Служба поддержки клиентов . Проверено 16 марта 2019 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: deeb86ce1eca536693a0eb7416de25f7__1720404300
URL1:https://arc.ask3.ru/arc/aa/de/f7/deeb86ce1eca536693a0eb7416de25f7.html
Заголовок, (Title) документа по адресу, URL1:
List of speech recognition software - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)