Дельта-модуляция с плавным изменением наклона
Дельта-модуляция с плавным наклоном ( CVSD или CVSDM ) — это метод кодирования голоса . Это дельта-модуляция с переменным размером шага (т. е. частный случай адаптивной дельта-модуляции ), впервые предложенная Грифкесом и Рименсом в 1970 году.
CVSD кодирует со скоростью 1 бит на выборку, поэтому звук, дискретизированный с частотой 16 кГц, кодируется со скоростью 16 кбит/с.
Кодер поддерживает эталонную выборку и размер шага. Каждый входной образец сравнивается с эталонным образцом. Если входная выборка больше, кодер выдает 1 бит и добавляет размер шага к эталонной выборке. Если входная выборка меньше, кодер выдает 0 бит и вычитает размер шага из опорной выборки. Кодер также сохраняет предыдущие N бит вывода ( очень часто встречаются N = 3 или N = 4), чтобы определить корректировку размера шага; если все предыдущие N бит равны 1 или 0, размер шага увеличивается. В противном случае размер шага уменьшается (обычно экспоненциально, с находится в диапазоне 5 мс). Размер шага настраивается для каждой обрабатываемой входной выборки.
Чтобы обеспечить исчезновение битовых ошибок и обеспечить (ре)синхронизацию с текущим битовым потоком, выходной регистр (который хранит эталонную выборку) обычно реализуется как дырявый интегратор с постоянной времени ( ) около 1 мс.
Декодер меняет этот процесс, начиная с эталонной выборки и добавляя или вычитая размер шага в соответствии с битовым потоком. Последовательность скорректированных эталонных выборок представляет собой восстановленную форму сигнала, а размер шага регулируется в соответствии с той же логикой «все 1 или 0», что и в кодере.
Адаптация размера шага позволяет избежать перегрузки наклона (шаг квантования увеличивается при быстром изменении сигнала) и уменьшает зернистый шум , когда сигнал постоянен (уменьшение шага квантования).
CVSD иногда называют компромиссом между простотой, низким битрейтом и качеством. Обычные битрейты составляют 9,6–128 кбит/с.
Как и другие методы дельта-модуляции, выходной сигнал декодера не совсем соответствует исходному входному сигналу кодера.
Приложения
[ редактировать ]CVSD со скоростью 12 кбит/с используется Motorola линейкой продуктов двусторонней радиосвязи SECURENET компании с цифровым шифрованием.
CVSD со скоростью 16 и 32 кбит / с использовался военными цифровыми телефонами TRI-TAC (DNVT, DSVT) для использования в зонах развертывания для обеспечения звука с качеством распознавания голоса. Скорость 16 кбит/с обычно использовалась силами армии США для экономии полосы пропускания по тактическим каналам связи. Скорость передачи данных 32 кбит/с обычно использовалась ВВС США для улучшения качества передачи голоса.
CVSD 64 кбит/с — один из вариантов кодирования речевых сигналов в Bluetooth профилях служб , связанных с телефонией; например, между мобильными телефонами и беспроводными гарнитурами. Другие варианты — это PCM с логарифмическим квантованием по закону или по закону μ , а также кодек mSBC с частотой дискретизации 16 кГц и лучшим качеством.
Многочисленные аркадные игры, такие как Sinistar и Smash TV , а также автоматы для игры в пинбол, такие как Gorgar или Space Shuttle , воспроизводят заранее записанную речь через CVSD-декодер HC-55516. [1] [2]
Приложение SBS, дельта-модуляция 24 кбит/с
[ редактировать ]Дельта-модуляция использовалась Satellite Business Systems или SBS для своих голосовых портов для предоставления услуг междугородной телефонной связи крупным отечественным корпорациям, испытывающим значительные потребности в межкорпорационной связи (таким как IBM). Эта система находилась в эксплуатации на протяжении 1980-х годов. В голосовых портах использовалась реализованная в цифровом формате дельта-модуляция 24 кбит/с со сжатием речевой активности (VAC) и подавителями эха для управления полусекундным путем эха через спутник. Тесты на прослушивание были проведены для проверки того, что Дельта-модулятор со скоростью 24 кбит/с обеспечивает «полное качество голоса» без заметного ухудшения по сравнению с высококачественной телефонной линией или стандартным PCM со скоростью 64 кбит/с , компандируемым по закону μ-закона . Это обеспечило улучшение пропускной способности спутниковых каналов в соотношении 8:3. IBM разработала контроллер спутниковой связи и функции голосового порта.
В первоначальном предложении 1974 года использовался современный дельта-модулятор со скоростью 24 кбит/с с одним интегратором и компандером Шиндлера, модифицированным для устранения ошибок усиления. Оказалось, что качество речи на телефонной линии ниже полного. В 1977 году одному инженеру с двумя помощниками в лаборатории IBM Research Triangle Park , Северная Каролина, было поручено улучшить качество.
В окончательной реализации интегратор был заменен на предиктор, реализованный с помощью двухполюсного фильтра нижних частот с комплексной парой, предназначенного для аппроксимации долгосрочного среднего речевого спектра. Теория заключалась в том, что в идеале интегратор должен быть предсказателем, предназначенным для согласования спектра сигнала. На смену модифицированной версии пришел почти идеальный компандер Шиндлера. Было обнаружено, что модифицированный компандер приводит к неидеальному размеру шага на большинстве уровней сигнала, а быстрое восстановление ошибки усиления увеличивает шум, как это определено в реальных тестах на прослушивание, по сравнению с простыми измерениями соотношения сигнал/шум. Последний компандер достиг очень умеренного восстановления ошибки усиления из-за естественной ошибки округления, вызванной 12-битной арифметикой.
Полная функция дельта-модуляции, VAC и эхо-контроля для 6 портов была реализована в одной цифровой интегральной микросхеме с 12-битной арифметикой. Один ЦАП использовался всеми шестью портами, обеспечивая функции сравнения напряжений для модуляторов и схемы подачи выборки и хранения для выходов демодулятора. На одной карте содержался чип, ЦАП и все аналоговые схемы интерфейса телефонной линии, включая трансформаторы.
См. также
[ редактировать ]Ссылки
[ редактировать ]- Дж. А. Грифкес и К. Рименс, «Кодовая модуляция с помощью компандирования с цифровым управлением для передачи речи», Philips Tech. Ред., стр. 335–353, 1970.
- Джаянт Н.С. Цифровое кодирование речевых сигналов: квантователи PCM, DPCM и DM. Учеб. IEEE, том. 62, нет. 5, стр. 61 1-632, май 1974 г.
- Р. Стил, Системы дельта-модуляции , Pentech Press, Лондон, Англия, 1975.
- Н. С. Джаянт и П. Нолл, Цифровое кодирование сигналов: принципы и приложения к речи и видео , Прентис-Холл, Энглвуд Клиффс, Нью-Джерси, 1984.
- Описание алгоритма, а также образцы речи
- Спецификация системы Bluetooth 2.0 + EDR, пакет базовой системы, часть B «Спецификация основной полосы», раздел 9 «Аудио», ноябрь 2004 г.
- ^ «Журнал изменений MAME 0.36b7» . Архивировано из оригинала 7 октября 2011 г. Проверено 2 октября 2010 г.
- ^ Игры Williams / Midway Y-Unit