Программное обеспечение для транскрипции
Эта статья нуждается в дополнительных цитатах для проверки . ( январь 2017 г. ) |
Программное обеспечение для транскрипции помогает преобразовать человеческую речь в текстовую расшифровку. Аудио- или видеофайлы могут быть расшифрованы вручную или автоматически. [ 1 ] Специалисты по расшифровке могут воспроизвести запись несколько раз в редакторе транскрипции и напечатать то, что они слышат. С помощью горячих клавиш транскрипции можно ускорить транскрипцию вручную, отфильтровать звук, выровнять его или отрегулировать темп, если четкость не очень хорошая. Благодаря технологии распознавания речи транскрипционисты могут автоматически преобразовывать записи в текстовые расшифровки, открывая записи на ПК и загружая их в облако для автоматической транскрипции, или расшифровывать записи в режиме реального времени с помощью цифровой диктовки . В зависимости от качества записей, машинно-генерируемые расшифровки, возможно, все равно придется проверять вручную. Точность автоматической транскрипции зависит от нескольких факторов, таких как фоновые шумы, расстояние говорящего до микрофона и акценты.
Программное обеспечение для транскрипции, как и услуги по транскрипции , часто предоставляется для деловых, юридических или медицинских целей . По сравнению с аудиоконтентом текстовая расшифровка доступна для поиска, занимает меньше памяти компьютера и может использоваться в качестве альтернативного метода передачи информации, например, для субтитров и субтитров .
Определение транскрипции «программное обеспечение» по сравнению с транскрипцией «сервис» заключается в том, что первое достаточно автоматизировано, чтобы пользователь мог запускать всю систему без привлечения стороннего персонала. Однако появление моделей «программное обеспечение как услуга» и облачных вычислений стирает это различие. Он использует искусственный интеллект , машинное обучение и обработку естественного языка для преобразования речи в текст и постоянного изучения новых фраз и акцентов. [ 2 ]
Разработка
[ редактировать ]Исследовательская компания Google выпустила бесплатное приложение для Android Google Live Transcribe , оно работает в Google Cloud . [ 3 ] [ 4 ] Google Chrome разработал и имеет встроенную английскую Live Caption. [ 5 ] Google Docs , Google Translate , Google Assistant , GBoard Google Text to Speech также поддерживает инструмент транскрипции. [ 6 ] [ 7 ] [ 8 ] [ 9 ]
OpenAI запустила Whisper с открытым исходным кодом . распознавания речи , модель глубокого обучения В сентябре 2022 года [ 10 ]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Функции транскрипции | Транскрипция» . Общие функции и условные обозначения транскрипции, Аудиотранскрипция . 08.06.2017 . Проверено 15 февраля 2019 г.
- ^ Бхатт, Медха. «Что такое транскрипция искусственного интеллекта? Все, что вам нужно знать» . fireflies.ai . Проверено 3 июня 2022 г.
- ^ «Использование Live Transcribe — Справка по специальным возможностям Android» . support.google.com . Проверено 14 июня 2021 г.
- ^ Батлер, Сидней (9 декабря 2019 г.). «Как расшифровать речь с помощью приложения Google Live Transcribe» . 9to5Google . Проверено 14 июня 2021 г.
- ^ «Новая функция Live Caption в Google Chrome позволит расшифровывать речь в видео» . techxplore.com . Проверено 14 июня 2021 г.
- ^ «Теперь вы можете расшифровывать речь с помощью Google Translate» . Google . 17 марта 2020 г. Проверено 14 июня 2021 г.
- ^ Краснофф, Барбара (14 августа 2020 г.). «Как использовать бесплатные инструменты транскрипции Google» . Грань . Проверено 14 июня 2021 г.
- ^ Приложения в Google Play – «Живая расшифровка и звуковые уведомления» . play.google.com . Проверено 14 июня 2021 г.
- ^ «Google внедряет транскрипцию и перевод в реальном времени для пользователей Gboard» . Проверено 14 июня 2021 г.
- ^ Голла, Рамсри Гаутам (06 марта 2023 г.). «Вот шесть практических вариантов использования нового Whisper API» . Слатор . Архивировано из оригинала 25 марта 2023 г. Проверено 12 августа 2023 г.