Сигнальное подпространство
В сигналов обработке методы подпространства сигнала представляют собой эмпирические линейные методы уменьшения размерности и уменьшения шума . В последнее время эти подходы вызвали значительный интерес и исследования в контексте исследований по улучшению речи, моделированию речи и классификации речи. Подпространство сигнала также используется в радиопеленгации с использованием МУЗЫКИ (алгоритма) . [1]
По сути, методы представляют собой применение подхода анализа главных компонентов (PCA) к ансамблям наблюдаемых временных рядов, полученных путем выборки , например, выборки аудиосигнала . Такие выборки можно рассматривать как векторы в многомерном векторном пространстве над действительными числами . PCA используется для идентификации набора ортогональных базисных векторов (базисных сигналов), которые улавливают как можно больше энергии в ансамбле наблюдаемых образцов. Векторное пространство, охватываемое базисными векторами, идентифицированными в результате анализа, тогда является подпространством сигнала . Основное предположение заключается в том, что информация в речевых сигналах почти полностью содержится в небольшом линейном подпространстве общего пространства возможных векторов выборок, тогда как аддитивный шум обычно распределяется по большему пространству изотропно (например, когда это белый шум ).
Проецируя выборку на подпространство сигнала, то есть сохраняя только тот компонент выборки, который находится в подпространстве сигнала, определяемом линейными комбинациями первых нескольких базисных векторов с наибольшим напряжением, и отбрасывая остальную часть выборки, которая находится в В оставшейся части пространства, ортогональной этому подпространству, тогда достигается определенная степень фильтрации шума.
Понижение подпространственного шума сигнала можно сравнить с методами фильтра Винера . Есть два основных различия:
- Базисными сигналами, используемыми в фильтрации Винера, обычно являются гармонические синусоидальные волны , на которые сигнал может быть разложен с помощью преобразования Фурье . Напротив, базовые сигналы, используемые для построения подпространства сигналов, идентифицируются эмпирически и могут, например, представлять собой чирпы или определенные характерные формы переходных процессов после определенных событий запуска, а не чистые синусоиды.
- Фильтр Винера плавно переключается между линейными компонентами, в которых доминирует сигнал, и линейными компонентами, в которых доминирует шум. Шумовые компоненты отфильтровываются, но не полностью; компоненты сигнала сохраняются, но не полностью; и есть переходная зона, которая частично принята. Напротив, подход с подпространством сигнала представляет собой резкое отсечение: ортогональный компонент либо лежит внутри подпространства сигнала, и в этом случае он принимается на 100%, либо ортогонален ему, и в этом случае он отвергается на 100%. Такое уменьшение размерности, преобразующее сигнал в гораздо более короткий вектор, может быть особенно желательной особенностью метода.
о расширении подхода к удалению цветного шума и оценке улучшения речи на основе подпространства для надежного распознавания речи В простейшем случае методы подпространства сигналов предполагают белый шум, но также сообщалось .
Ссылки
[ редактировать ]- ^ Крым, Хамид; Виберг, Матс (1996). «Два десятилетия исследований в области обработки сигналов массива». Журнал обработки сигналов IEEE . дои : 10.1109/79.526899 .
- Крис Хермус; Патрик Вамбак и Хьюго Ван Хамм (2007). «Обзор улучшения речи в подпространстве сигнала и его применение для устойчивого к шуму распознавания речи» . Журнал EURASIP о достижениях в области обработки сигналов . 2007 : 1. дои : 10.1155/2007/45821 .