Я звоню в Adobe
Adobe VoCo — это неизданный аудио прототип программного обеспечения для редактирования и создания от Adobe , которое позволяет выполнять новое редактирование и создание аудио. Получил название « Фотошоп для голоса». [1] Впервые она была представлена на мероприятии Adobe MAX в ноябре 2016 года. Технология, показанная на Adobe MAX, представляла собой предварительную версию, которая потенциально могла быть включена в Adobe Creative Cloud . Позже выяснилось, что Voco никогда не собирался выпускаться и должен был стать исследовательским прототипом. [2] [3]
В 2023 году Adobe представила возможность редактировать видео путем редактирования расшифровки видео, созданной искусственным интеллектом, в Premiere Pro , продемонстрировав функциональность, аналогичную Voco. [4]
Технические детали
[ редактировать ]Как показала демонстрация, программное обеспечение занимает около 20 минут речи желаемого объекта и генерирует похожий на звук голос, включая фонемы , которые не присутствовали в материале целевого примера. Adobe заявила, что Voco снизит стоимость производства звука. [1] [3]
Обеспокоенность
[ редактировать ]Проблемы этики и безопасности были высказаны по поводу возможности изменить аудиозапись, включив в нее слова и фразы, которые первоначальный говорящий никогда не произносил, а также потенциального риска для биометрических отпечатков голоса . [1]
Также возникли опасения, что его можно использовать в сочетании с:
- Синтез изображений человека достиг такого уровня сходства , который с начала 2000-х годов , что отличить человека, записанного камерой, от симуляции человека очень сложно. [5]
- Видеоманипуляции человека с выражением лица практически в реальном времени с использованием существующего 2D -видео RGB . [6]
Альтернативы
[ редактировать ]Отсутствие публичного прогресса Adobe открыло возможности для других проектов по созданию альтернативных VOCO продуктов, таких как Resemble AI и 15.ai , инструмент преобразования текста в речь в реальном времени с использованием искусственного интеллекта.
WaveNet — это аналогичный исследовательский проект с открытым исходным кодом лондонской компании по искусственному интеллекту DeepMind , разработанный независимо примерно в то же время, что и Adobe Voco.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с «сапик» . BBC.com . Би-би-си . 07.11.2016 . Проверено 5 июля 2016 г.
- ^ «Бета-тестирование #VoCo» . 8 ноября 2016 г.
- ^ Jump up to: а б «Adobe VoCo мертв?» . Блог Adobe . 27 января 2018 г. Проверено 17 июня 2020 г.
- ^ «Сейчас в бета-версии: представляем текстовое редактирование в Premiere Pro» . сообщество.adobe.com . 03 февраля 2023 г. Проверено 16 апреля 2023 г.
- ^ Роджерс, Джулиан. «Adobe Voco — стоит ли нам бояться?» . Эксперт производства . Профессиональные инструменты . Проверено 14 декабря 2018 г.
- ^ Тис, Юстус (2016). «Face2Face: захват лиц в реальном времени и реконструкция RGB-видео» . Учеб. Компьютерное зрение и распознавание образов (CVPR), IEEE . Проверено 18 июня 2016 г.