ПСОЛА
PSOLA (Pitch Synchronous Overlap and Add) — это метод цифровой обработки сигналов , используемый для обработки речи и, в частности, синтеза речи . Его можно использовать для изменения высоты и продолжительности речевого сигнала. Он был изобретен примерно в 1986 году. [2]
PSOLA работает путем разделения речевого сигнала на небольшие перекрывающиеся сегменты. Чтобы изменить высоту сигнала, сегменты раздвигаются (для уменьшения высоты) или сближаются (для увеличения высоты). Чтобы изменить длительность сигнала, сегменты затем повторяются несколько раз (для увеличения длительности) или некоторые из них удаляются (для уменьшения длительности). Затем сегменты объединяются с использованием метода добавления перекрытия .
PSOLA можно использовать для изменения просодии речевого сигнала.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Гражина Деменко (1999). Анализ надсегментных особенностей польского языка для целей речевой технологии (PDF) (кандидатская диссертация). Серия «Прикладная лингвистика». Том 17. Университет. Адам Мицкевич в Познани. Рис.7.1, стр.63.
- ^ Шарпантье, Ф.; Стелла, М. (1986). «Синтез дифонов с использованием метода сложения-перекрытия для конкатенации речевых сигналов». ИКАССП '86. Международная конференция IEEE по акустике, речи и обработке сигналов . Том. 11. стр. 2015–2018. дои : 10.1109/ICASSP.1986.1168657 . S2CID 62440369 .
Внешние ссылки
[ редактировать ]- Изменение высоты звука с помощью PSOLA для преобразования голоса
- Диссертация, в которой обсуждается PSOLA с диаграммами (формат PDF; см. страницу 35, которая является страницей 44 PDF-файла).