Jump to content

Программное обеспечение для транскрипции

Программное обеспечение для транскрипции помогает преобразовать человеческую речь в текстовую расшифровку. Аудио- или видеофайлы могут быть расшифрованы вручную или автоматически. [1] Специалисты по расшифровке могут воспроизвести запись несколько раз в редакторе транскрипции и напечатать то, что они слышат. С помощью горячих клавиш транскрипции можно ускорить транскрипцию вручную, отфильтровать звук, выровнять его или отрегулировать темп, если четкость не очень хорошая. Благодаря технологии распознавания речи транскрипционисты могут автоматически преобразовывать записи в текстовые расшифровки, открывая записи на ПК и загружая их в облако для автоматической транскрипции, или расшифровывать записи в режиме реального времени с помощью цифровой диктовки . В зависимости от качества записей, транскрипты, созданные машиной, все равно могут нуждаться в проверке вручную. Точность автоматической транскрипции зависит от нескольких факторов, таких как фоновые шумы, расстояние говорящего до микрофона и акценты.

Программное обеспечение для транскрипции, как и услуги по транскрипции , часто предоставляется для деловых, юридических или медицинских целей . По сравнению с аудиоконтентом текстовая расшифровка доступна для поиска, занимает меньше памяти компьютера и может использоваться в качестве альтернативного метода передачи информации, например, для субтитров и субтитров .

Определение транскрипции «программное обеспечение» по сравнению с транскрипцией «сервис» заключается в том, что первое достаточно автоматизировано, чтобы пользователь мог запускать всю систему без привлечения стороннего персонала. Однако появление моделей «программное обеспечение как услуга» и облачных вычислений стирает это различие. Он использует искусственный интеллект , машинное обучение и обработку естественного языка для преобразования речи в текст и постоянного изучения новых фраз и акцентов. [2]

Разработка

[ редактировать ]

Исследовательская компания Google выпустила бесплатное приложение для Android Google Live Transcribe , оно работает в Google Cloud . [3] [4] Google Chrome разработал и имеет встроенную английскую Live Caption. [5] Google Docs , Google Translate , Google Assistant , GBoard Google Text to Speech также поддерживает инструмент транскрипции. [6] [7] [8] [9]

OpenAI запустила Whisper с открытым исходным кодом . распознавания речи , модель глубокого обучения В сентябре 2022 года [10]

См. также

[ редактировать ]
  1. ^ «Функции транскрипции | Транскрипция» . Общие функции и условные обозначения транскрипции, Аудиотранскрипция . 08.06.2017 . Проверено 15 февраля 2019 г.
  2. ^ Бхатт, Медха. «Что такое транскрипция искусственного интеллекта? Все, что вам нужно знать» . fireflies.ai . Проверено 3 июня 2022 г.
  3. ^ «Использование Live Transcribe — Справка по специальным возможностям Android» . support.google.com . Проверено 14 июня 2021 г.
  4. ^ Батлер, Сидней (9 декабря 2019 г.). «Как расшифровать речь с помощью приложения Google Live Transcribe» . 9to5Google . Проверено 14 июня 2021 г.
  5. ^ «Новая функция Live Caption в Google Chrome позволит расшифровывать речь в видео» . techxplore.com . Проверено 14 июня 2021 г.
  6. ^ «Теперь вы можете расшифровывать речь с помощью Google Translate» . Google . 17 марта 2020 г. Проверено 14 июня 2021 г.
  7. ^ Краснофф, Барбара (14 августа 2020 г.). «Как использовать бесплатные инструменты транскрипции Google» . Грань . Проверено 14 июня 2021 г.
  8. ^ Приложения в Google Play – «Живая расшифровка и звуковые уведомления» . play.google.com . Проверено 14 июня 2021 г.
  9. ^ «Google внедряет транскрипцию и перевод в реальном времени для пользователей Gboard» . Проверено 14 июня 2021 г.
  10. ^ Голла, Рамсри Гаутам (06 марта 2023 г.). «Вот шесть практических вариантов использования нового API Whisper» . Слатор . Архивировано из оригинала 25 марта 2023 г. Проверено 12 августа 2023 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 4fa96184ece5b062a889d352c4b1a522__1715105760
URL1:https://arc.ask3.ru/arc/aa/4f/22/4fa96184ece5b062a889d352c4b1a522.html
Заголовок, (Title) документа по адресу, URL1:
Transcription software - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)