Скорость перехода через ноль
Скорость перехода через нуль (ZCR) — это скорость, с которой сигнал меняется с положительного на ноль на отрицательный или с отрицательного на ноль на положительный. [1] Его значение широко используется как при распознавании речи , так и при поиске музыкальной информации , поскольку оно является ключевым признаком для классификации ударных звуков. [2]
ZCR формально определяется как
где является сигналом длины и является индикаторной функцией .
В некоторых случаях учитываются только «положительные» или «отрицательные» пересечения, а не все пересечения, поскольку между парой соседних положительных пересечений нуля должно быть одно отрицательное пересечение нуля.
Для монофонических тональных сигналов скорость перехода через ноль может использоваться в качестве примитивного алгоритма определения высоты тона . Скорость пересечения нуля также используется для обнаружения голосовой активности (VAD), которое определяет, присутствует ли человеческая речь в аудиосегменте или нет.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ * Чен, Ч., Справочник по обработке сигналов, Деккер, Нью-Йорк, 1988 г.
- ^ Гуйон Ф., Паше Ф., Делерю О. (2000), Об использовании скорости перехода через нуль для применения классификации ударных звуков , в материалах конференции COST G-6 по цифровым аудиоэффектам (DAFX-00) — DAFX-06), Верона, Италия, 7–9 декабря 2000 г. По состоянию на 26 апреля 2011 г.