Спектральные пары линий
Линейные спектральные пары ( LSP ) или линейные спектральные частоты ( LSF ) используются для представления коэффициентов линейного предсказания (LPC) для передачи по каналу. [1] LSP имеют несколько свойств (например, меньшую чувствительность к шуму квантования), которые делают их превосходящими по сравнению с прямым квантованием LPC. По этой причине LSP очень полезны при кодировании речи .
Представление LSP было разработано Фумитадой Итакурой , [2] в Nippon Telegraph and Telephone (NTT) в 1975 году. [3] С 1975 по 1981 год изучал проблемы анализа и синтеза речи на основе метода ЛСП. [4] на основе LSP В 1980 году его команда разработала микросхему синтезатора речи . LSP является важной технологией синтеза и кодирования речи, и в 1990-х годах она была принята почти всеми международными стандартами кодирования речи в качестве важного компонента, способствуя совершенствованию цифровой речевой связи по мобильным каналам и Интернету во всем мире. [3] LSP используются в алгоритме линейного предсказания с кодовым возбуждением (CELP), разработанном Бишну С. Аталом и Манфредом Р. Шредером в 1985 году.
Математическая основа [ править ]
LP Полином может быть выражено как , где:
По построению P — палиндромный многочлен , а Q — многочлен антипалиндромный ; физически P ( z ) соответствует голосовому тракту с закрытой голосовой щелью и Q ( z ) с открытой голосовой щелью . [5] Можно показать, что:
- Корни комплексной P Q и . лежат на единичной окружности плоскости
- корни P чередуются с корнями Q. При движении по окружности
- Поскольку коэффициенты при P и Q действительны, корни встречаются в сопряженных парах.
Представление полинома LP в виде линейно-спектральной пары состоит просто из расположения корней P и Q (т.е. такой, что ). Поскольку они встречаются парами, только половина реальных корней (обычно от 0 до ) необходимо передать. Таким образом, общее количество коэффициентов как для P , так и для Q равно p , количеству исходных коэффициентов LP (не считая ).
Общий алгоритм их поиска [6] состоит в том, чтобы оценить полином в последовательности близко расположенных точек вокруг единичной окружности, наблюдая, когда результат меняет знак; в этом случае корень должен лежать между проверяемыми точками. Поскольку корни P перемежаются с корнями Q, одного прохода достаточно, чтобы найти корни обоих многочленов.
Чтобы преобразовать обратно в LPC, нам нужно оценить «проходя» через него импульс N раз (порядок фильтра), получая исходный фильтр A ( z ).
Свойства [ править ]
Спектральные пары линий обладают несколькими интересными и полезными свойствами. Когда корни P ( z ) и Q ( z ) перемежаются, устойчивость фильтра обеспечивается тогда и только тогда, когда корни монотонно возрастают. При этом чем ближе расположены два корня, тем более резонансным является фильтр на соответствующей частоте. Поскольку LSP не слишком чувствительны к шуму квантования и легко обеспечить стабильность, LSP широко используются для квантования фильтров LPC. Спектральные частоты линий можно интерполировать.
См. также [ править ]
Источники [ править ]
- Руководство и исходный код Speex (lsp.c)
- «Вычисление спектральных частот линий с использованием полиномов Чебышева» / П. Кабал и Р.П. Рамачандран. IEEE Транс. Акустика, речь, обработка сигналов, вып. 34, нет. 6, стр. 1419–1426, декабрь 1986 г.
Включает обзор в отношении LPC.
- Глава «Линейно-спектральные пары» в виде онлайн-отрывка (pdf) / «Цифровая обработка сигналов – взгляд на информатику» ( ISBN 0-471-29546-9 ) Джонатан Штайн .
Ссылки [ править ]
- ^ Сахидулла, штат Мэриленд; Чакроборти, Сандипан; Саха, Гутам (январь 2010 г.). «Об использовании перцептивных частот линейных спектральных пар и остаточных моментов более высокого порядка для идентификации говорящего» . Международный журнал биометрии . 2 (4): 358–378. дои : 10.1504/ijbm.2010.035450 .
- ^ Чжэн, Ф.; Песня, З.; Ли, Л.; Ю, В. (1998). «Мера расстояния для пар линейных спектров, применяемая к распознаванию речи» (PDF) . Материалы 5-й Международной конференции по обработке разговорной речи (ICSLP'98) (3): 1123–6.
- ↑ Перейти обратно: Перейти обратно: а б «Список вех IEEE» . ИИЭЭ . Проверено 15 июля 2019 г.
- ^ «Устная история Фумитада Итакура» . Сеть глобальной истории IEEE. 20 мая 2009 года . Проверено 21 июля 2009 г.
- ^ http://svr-www.eng.cam.ac.uk/~ajr/SpeechAnaанализ/node51.html#SECTION000713000000000000000 Тони Робинсон: Анализ речи
- ^ например, lsf.c в http://www.ietf.org/rfc/rfc3951.txt