Jump to content

Преобразование голоса на основе поиска

Преобразование голоса на основе поиска
Разработчик(и) Команда проекта РВК
Первоначальный выпуск 2024  ( 2024 )
Репозиторий Гитхаб
Написано в Питон
Операционная система Windows , Linux , MacOS
Доступно в Английский , упрощенный китайский , японский , корейский , французский , турецкий , португальский
Тип Программное обеспечение для преобразования голоса
Лицензия МОЯ лицензия

Преобразование голоса на основе поиска ( RVC ) — это с открытым исходным кодом алгоритм преобразования голоса искусственный , который обеспечивает реалистичные преобразования речи в речь, точно сохраняя интонацию и звуковые характеристики исходного говорящего. [ 1 ]

В отличие от систем преобразования текста в речь, таких как ElevenLabs , RVC отличается тем, что вместо этого обеспечивает преобразование речи в речь. Он сохраняет модуляцию, тембр и вокальные характеристики оригинального динамика, что делает его пригодным для применений, где эмоциональный тон имеет решающее значение.

Алгоритм обеспечивает как предварительную обработку, так и преобразование голоса в реальном времени с низкой задержкой. Эта возможность работы в режиме реального времени знаменует собой значительный прогресс по сравнению с предыдущими технологиями преобразования голоса на базе искусственного интеллекта, такими как So-vits SVC. Его скорость и точность заставили многих отметить, что сгенерированные им голоса звучат почти неотличимо от «реальной жизни» при условии, что достаточные вычислительные характеристики и ресурсы (например, мощный графический процессор и достаточное количество оперативной памяти при локальном запуске доступны ), а также высокая производительность. - используется качественная голосовая модель. [ 2 ]

Приложения и проблемы

[ редактировать ]

Эта технология позволяет изменять голос и мимикрию, позволяя пользователям создавать точные модели других людей, используя лишь незначительное количество минут чистых аудиосэмплов. Эти голосовые модели можно сохранить как .pth ( PyTorch ) и публикуются на таких платформах, как Weights.gg. Хотя эта возможность облегчает множество творческих приложений, она также вызывает обеспокоенность по поводу возможного неправильного использования в качестве фейкового программного обеспечения для кражи личных данных и злонамеренного выдачи себя за другое лицо посредством голосовых вызовов.

В поп-культуре

[ редактировать ]

Вывод RVC использовался для создания реалистичного изображения каверов песен, например, замена оригинального вокала такими персонажами, как Сумеречная Искорка и Мордехай, чтобы они пели дуэтами популярной музыки, такой как « Airplanes » и « Somebody That I Used to Know ». Эти каверы, созданные с помощью искусственного интеллекта, которые могут звучать поразительно похоже на имитируемый голос, завоевали популярность на таких платформах, как YouTube , как юмористические мемы . [ 3 ]

  1. ^ Кочард, Дэвид (7 января 2024 г.). «RVC: устройство для изменения голоса на базе искусственного интеллекта» . Середина .
  2. ^ «Что такое РВК» . Центр ИИ . Проверено 27 мая 2024 г.
  3. ^ «Как сделать RVC WebUI — сделать каверы на песни с помощью искусственного интеллекта за считанные минуты! (Руководство по преобразованию голоса) — технический тактик» . Технический тактик . 06.07.2023 . Проверено 27 мая 2024 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ae610573cef8c0456d9cae851010d61b__1716800100
URL1:https://arc.ask3.ru/arc/aa/ae/1b/ae610573cef8c0456d9cae851010d61b.html
Заголовок, (Title) документа по адресу, URL1:
Retrieval-based Voice Conversion - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)