Программное обеспечение для транскрипции
Эта статья нуждается в дополнительных цитатах для проверки . ( январь 2017 г. ) |
Программное обеспечение для транскрипции помогает преобразовать человеческую речь в текстовую расшифровку. Аудио- или видеофайлы могут быть расшифрованы вручную или автоматически. [1] Специалисты по расшифровке могут воспроизвести запись несколько раз в редакторе транскрипции и напечатать то, что они слышат. С помощью горячих клавиш транскрипции можно ускорить транскрипцию вручную, отфильтровать звук, выровнять его или отрегулировать темп, если четкость не очень хорошая. Благодаря технологии распознавания речи транскрипционисты могут автоматически преобразовывать записи в текстовые расшифровки, открывая записи на ПК и загружая их в облако для автоматической транскрипции, или расшифровывать записи в режиме реального времени с помощью цифровой диктовки . В зависимости от качества записей, транскрипты, созданные машиной, все равно могут нуждаться в проверке вручную. Точность автоматической транскрипции зависит от нескольких факторов, таких как фоновые шумы, расстояние говорящего до микрофона и акценты.
Программное обеспечение для транскрипции, как и услуги по транскрипции , часто предоставляется для деловых, юридических или медицинских целей . По сравнению с аудиоконтентом текстовая расшифровка доступна для поиска, занимает меньше памяти компьютера и может использоваться в качестве альтернативного метода передачи информации, например, для субтитров и субтитров .
Определение транскрипции «программное обеспечение» по сравнению с транскрипцией «сервис» заключается в том, что первое достаточно автоматизировано, чтобы пользователь мог запускать всю систему без привлечения стороннего персонала. Однако появление моделей «программное обеспечение как услуга» и облачных вычислений стирает это различие. Он использует искусственный интеллект , машинное обучение и обработку естественного языка для преобразования речи в текст и постоянного изучения новых фраз и акцентов. [2]
Разработка
[ редактировать ]Исследовательская компания Google выпустила бесплатное приложение для Android Google Live Transcribe , оно работает в Google Cloud . [3] [4] Google Chrome разработал и имеет встроенную английскую Live Caption. [5] Google Docs , Google Translate , Google Assistant , GBoard Google Text to Speech также поддерживает инструмент транскрипции. [6] [7] [8] [9]
OpenAI запустила Whisper с открытым исходным кодом . распознавания речи , модель глубокого обучения В сентябре 2022 года [10]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Функции транскрипции | Транскрипция» . Общие функции и условные обозначения транскрипции, Аудиотранскрипция . 08.06.2017 . Проверено 15 февраля 2019 г.
- ^ Бхатт, Медха. «Что такое транскрипция искусственного интеллекта? Все, что вам нужно знать» . fireflies.ai . Проверено 3 июня 2022 г.
- ^ «Использование Live Transcribe — Справка по специальным возможностям Android» . support.google.com . Проверено 14 июня 2021 г.
- ^ Батлер, Сидней (9 декабря 2019 г.). «Как расшифровать речь с помощью приложения Google Live Transcribe» . 9to5Google . Проверено 14 июня 2021 г.
- ^ «Новая функция Live Caption в Google Chrome позволит расшифровывать речь в видео» . techxplore.com . Проверено 14 июня 2021 г.
- ^ «Теперь вы можете расшифровывать речь с помощью Google Translate» . Google . 17 марта 2020 г. Проверено 14 июня 2021 г.
- ^ Краснофф, Барбара (14 августа 2020 г.). «Как использовать бесплатные инструменты транскрипции Google» . Грань . Проверено 14 июня 2021 г.
- ^ Приложения в Google Play – «Живая расшифровка и звуковые уведомления» . play.google.com . Проверено 14 июня 2021 г.
- ^ «Google внедряет транскрипцию и перевод в реальном времени для пользователей Gboard» . Проверено 14 июня 2021 г.
- ^ Голла, Рамсри Гаутам (06 марта 2023 г.). «Вот шесть практических вариантов использования нового API Whisper» . Слатор . Архивировано из оригинала 25 марта 2023 г. Проверено 12 августа 2023 г.