Линейное предсказание со смешанным возбуждением
Эта статья нуждается в дополнительных цитатах для проверки . ( февраль 2018 г. ) |
Линейное предсказание со смешанным возбуждением ( MELP ) — это Министерства обороны США, стандарт кодирования речи используемый в основном в военных приложениях и спутниковой связи , защищенной голосовой связи и защищенных радиоустройствах. Его стандартизацию и последующую разработку возглавляли и поддерживали АНБ и НАТО. Текущая «расширенная» версия известна как MELPe .
История [ править ]
Первоначальный MELP был изобретен Аланом МакКри примерно в 1995 году. [1] в то время как он был аспирантом Центра обработки сигналов и изображений (CSIP) в Технологическом институте Джорджии, и срок действия оригинальных патентов, связанных с MELP, уже истек. Этот первоначальный речевой кодер был стандартизирован в 1997 году и получил название MIL-STD-3005. [2] Он превзошел других вокодеров-кандидатов на конкурсе Министерства обороны США, в том числе: (а) Частотно-селективный гармонический кодер (FSHC), (б) Расширенное многополосное возбуждение (AMBE), (в) Улучшенное многополосное возбуждение (EMBE), (г) Синусоида Кодер преобразования (STC) и (e) кодер поддиапазона LPC (SBC). [3] Благодаря своей меньшей сложности, чем кодер Waveform Interpolative (WI), вокодер MELP выиграл конкурс Министерства обороны США и был выбран для MIL-STD -3005. [4]
MIL-STD-3005 [ править ]
В период с 1998 по 2001 год был создан новый вокодер на основе MELP со скоростью вдвое меньшей (т. е. 1200 бит/с), а к MIL-STD-3005 были добавлены существенные улучшения компаниями SignalCom (позже приобретенными Microsoft ), Compandent и AT&T. Corporation , которая включала (а) дополнительный новый вокодер с половинной скоростью (т.е. 1200 бит/с), (б) существенно улучшенное кодирование (анализ), (в) существенно улучшенное декодирование (синтез), (г) предварительную обработку шума для удаления фоновый шум, (e) перекодирование между битовыми потоками 2400 бит/с и 1200 бит/с и (f) новый постфильтр. Эта довольно значительная разработка была направлена на создание нового кодера, работающего вдвое дешевле и обеспечивающего его совместимость со старым стандартом MELP. Этот расширенный стандарт MELP (также известный как MELPe) был принят как новый MIL-STD-3005 в 2001 году в виде приложений и дополнений к исходному MIL-STD-3005, обеспечивающих то же качество, что и старый стандарт MELP со скоростью 2400 бит/с. за половину ставки. Одним из величайших преимуществ нового MELPe со скоростью 2400 бит/с является то, что он использует тот же битовый формат, что и MELP, и, следовательно, может взаимодействовать с устаревшими системами MELP, но обеспечивает лучшее качество на обоих концах. MELPe обеспечивает гораздо лучшее качество, чем все старые военные стандарты, особенно в шумных условиях, таких как поле боя, транспортные средства и самолеты.
СТАНАГ-4591 (НАТО) [ править ]
В 2002 году, после обширных соревнований и испытаний, стандарт MELPe Министерства обороны США со скоростью 2400 и 1200 бит/с был принят также в качестве стандарта НАТО , известного как STANAG -4591. [5] Измерения производительности испытаний НАТО включали разборчивость голоса, качество голоса, распознавание говорящего, языковую зависимость, зависимость говорящего, 10 условий акустического шума, канал передачи с коэффициентом ошибок менее 1%, тандемное использование вокодера CVSD 16 кбит/с, шепотную речь и реализацию в реальном времени. . Данные тестирования включали более 36 000 файлов или 500 часов речи в различных условиях и на разных языках. В рамках испытаний нового стандарта НАТО MELpe был протестирован против других кандидатов, таких как французский HSX (Гармоническое стохастическое возбуждение) и Турецкий SB-LPC (Линейное прогнозирующее кодирование с расщеплением диапазоном), а также старый защищенный голосовой сигнал. такие стандарты, как FS1015 LPC-10e (2,4 кбит/с), FS1016 CELP (4,8 кбит/с) и CVSD (16 кбит/с). Впоследствии MELPe выиграл также конкурс НАТО, превзойдя качество всех других кандидатов, а также качество всех старых стандартов защищенной голосовой связи (CVSD, CELP и LPC-10e ). Конкурс НАТО пришел к выводу, что MELPe существенно улучшила производительность (с точки зрения качества речи, разборчивости и помехоустойчивости), одновременно снизив требования к пропускной способности. Тестирование НАТО также включало тесты на совместимость, использовалось более 200 часов речевых данных и проводилось тремя испытательными лабораториями по всему миру. Compandent Inc, в рамках проектов на базе MELPe, выполняемых для АНБ и НАТО , предоставила АНБ и НАТО специальную испытательную платформу, известную как устройство MELCODER , которая стала золотым эталоном для внедрения MELPe в реальном времени. Недорогое терминальное оборудование данных (DTE) FLEXI-232 производства Compandent , основанное на золотом эталоне MELCODER , очень популярно и широко используется для оценки и тестирования MELPe в режиме реального времени, различных каналов и сетей, а также в полевых условиях. .
новый вариант MELPe со скоростью 600 бит/с от Thales Group ( Франция ) (без обширной конкуренции и испытаний, как это было для MELPe со скоростью 2400/1200 бит/с). В 2005 году к стандарту НАТО STANAG-4591 был добавлен [6]
300 бит/с MELP [ править ]
В 2010 году MIT Lincoln Labs, Compandent , BBN и General Dynamics также разработали для DARPA устройство MELP со скоростью 300 бит/с. [7] Его качество было лучше, чем у MELPe со скоростью 600 бит/с, но алгоритмическая задержка была больше.
Реализации [ править ]
MELPe был реализован во многих приложениях, включая защищенные радиоустройства, спутниковую связь, VoIP и приложения для мобильных телефонов. В таких приложениях требуются дополнительные знания для борьбы с ошибками канала, потерей пакетов и потерей синхронизации. Такой опыт требует понимания чувствительности битов MELPe к ошибкам. MELPe со скоростью 2400 бит/с и 1200 бит/с включает бит синхронизации, который полезен при последовательной связи.
Уровень сжатия [ править ]
MELPe предназначен для сжатия речи. Учитывая входной аудиосигнал с частотой дискретизации 8 кГц, кодек MELPe обеспечивает следующие степени сжатия в потоке данных μ-Law G.711 со скоростью 64 кбит/с, не учитывая влияние накладных расходов протокола:
Битрейт | Степень сжатия по сравнению с G.711 | Размер полезной нагрузки | Интервал полезной нагрузки |
---|---|---|---|
2400 бит/с | 26,7 Х | 54 бита | 22,5 мс |
1200 бит/с | 53,3 Х | 81 бит | 67,5 мс |
600 бит/с | 106,7 Х | 54 бита | 90 мс |
Как правило, кодирование речи предполагает компромисс между различными аспектами, включая скорость передачи данных, качество речи, задержку (размер кадра и просмотр вперед), вычислительную сложность, устойчивость к различным говорящим и языкам, устойчивость к различным фоновым шумам, устойчивость к ошибкам канала, а также восстановление состояния кодека в случае потери пакетов. Поскольку более низкие скорости MELPe (600 и 1200 бит/с) являются надмножествами скорости 2400 бит/с, сложность алгоритма (например, в MIPS) примерно одинакова для всех скоростей. Более низкие скорости используют увеличенные кадры и просмотр вперед, а также размер кодовой книги, поэтому они требуют больше памяти.
Права интеллектуальной собственности [ править ]
MELPe (и/или его производные) подлежит лицензированию прав интеллектуальной собственности следующих компаний: Texas Instruments (алгоритм/исходный код MELP 2400 бит/с), Microsoft (транскодер 1200 бит/с), Thales Group (скорость 600 бит/с). , Compandent и AT&T (NPP с препроцессором шума).
См. также [ править ]
Ссылки [ править ]
- ^ Модель вокодера LPC со смешанным возбуждением для кодирования речи с низкой скоростью передачи данных, Алан В. МакКри, Томас П. Барнвелл, 1995 в IEEE Trans. Обработка речи и звука (оригинальный MELP)
- ^ Аналого-цифровое преобразование голоса с помощью линейного прогнозирования смешанного возбуждения со скоростью 2400 бит/секунду (MELP), Министерство обороны США (MIL_STD-3005, оригинальный MELP)
- ^ М. Р. Билефельд, Л. М. Саппли, «Разработка тестовой программы для процесса выбора вокодера Министерства обороны США со скоростью 2400 бит / с», Акустическая речь и обработка сигналов, 1996. ICASSP-96. Материалы конференции. Международная конференция IEEE 1996 г., вып. 2, стр. 1141-1144 т. 2. 2, 1996.
- ^ Л. М. Саппли, Р. П. Кон, Дж. С. Коллура, А. В. МакКри, «MELP: новый федеральный стандарт со скоростью 2400 бит/с», Акустическая речь и обработка сигналов, 1997. ICASSP-97. Международная конференция IEEE 1997 г., вып. 2, стр. 1591-1594, том 2, 1997.
- ^ СОВМЕСТИМЫЙ УЗКОПОЛОСНЫЙ ГОЛОСОВОЙ КОДЕР НАТО 1200 И 2400 БИТ/С, STANAG-4591, НАТО
- ^ ВАРИАНТ MELpe ДЛЯ 600 БИТ/С УЗКОПОЛОСНЫЙ ГОЛОСОВОЙ КОДЕР НАТО, STANAG-4591, НАТО
- ^ Алан МакКри, «Масштабируемая структура фонетического вокодера, использующая совместное прогнозирующее векторное квантование параметров MELP», в Proc. IEEE Международный. Конф. Acoust., Речь, Обработка сигналов, 2006, стр. I 705–708, Тулуза, Франция.