G.729
Кодирование речи со скоростью 8 кбит/с с использованием линейного предсказания с возбуждением алгебраического кода сопряженной структуры (CS-ACELP) | |
Статус | Действующий |
---|---|
Последняя версия | (10/17) Октябрь 2017 г. |
Организация | ЭТО Т |
комитет | 16-я Исследовательская комиссия МСЭ-Т |
Сопутствующие стандарты | G.191 , G.711 , G.729.1 |
Домен | сжатие звука |
Лицензия | Свободно доступен |
Веб-сайт | https://www.itu.int/rec/T-REC-G.729 |
G.729 — это бесплатный [1] узкополосного вокодера на основе Алгоритм сжатия аудиоданных с использованием длины кадра 10 миллисекунд. Официально оно описывается как кодирование речи со скоростью 8 кбит/с с использованием с линейным предсказанием кодирования речи (CS-ACELP) и было введено в 1996 году. [2] Широкополосное расширение G.729 называется G.729.1 , что соответствует G.729 Приложение J.
Из-за низких требований к пропускной способности G.729 в основном используется в приложениях передачи голоса по Интернет-протоколу (VoIP), когда необходимо сохранить полосу пропускания. Стандарт G.729 работает со скоростью передачи данных 8 кбит/с, но расширения обеспечивают скорости 6,4 кбит/с (Приложения D, F, H, I, C+) и 11,8 кбит/с (Приложения E, G, H, I). , C+) для худшего и лучшего качества речи соответственно.
G.729 был расширен различными функциями, обычно обозначаемыми как G.729a и G.729b:
- G.729: это оригинальный кодек, использующий алгоритм высокой сложности.
- G.729A или Приложение A: эта версия имеет среднюю сложность и совместима с G.729. Это обеспечивает немного более низкое качество передачи голоса.
- G.729B или Приложение B: эта версия расширяет G.729 за счет подавления пауз и несовместима с предыдущими версиями.
- G.729AB: эта версия расширяет G.729A за счет подавления пауз и совместима только с G.729B.
- G.729.1 или Приложение J: эта версия расширяет G.729A и B за счет масштабируемого переменного кодирования с использованием иерархических уровней улучшения. Он обеспечивает поддержку широкополосной речи и звука с использованием кодирования с модифицированным дискретным косинусным преобразованием (MDCT). [3]
Двухтональный многочастотный сигнал (DTMF), передача факсов и высококачественный звук не могут надежно передаваться с помощью этого кодека . DTMF требует использования именованных событий телефонии в полезной нагрузке RTP для цифр DTMF, телефонных тонов и телефонных сигналов, как указано в RFC 4733.
Приложения G.729
[ редактировать ]Функциональность | Приложения G.729 [4] | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
- | А | Б | С | Д | И | Ф | Г | ЧАС | я | С+ | Дж | |
Низкая сложность | Х | Х | ||||||||||
Фиксированная точка | Х | Х | Х | Х | Х | Х | Х | Х | Х | Х | ||
Плавающая точка | Х | Х | ||||||||||
8 кбит/с | Х | Х | Х | Х | Х | Х | Х | Х | Х | Х | Х | Х |
6,4 кбит/с | Х | Х | Х | Х | Х | |||||||
11,8 кбит/с | Х | Х | Х | Х | Х | |||||||
ДТХ | Х | Х | Х | Х | Х | |||||||
Встроенный переменный битрейт , широкополосный |
Х |
G.729 Приложение А
[ редактировать ]G.729a является совместимым расширением G.729, но требует меньших вычислительных мощностей. Однако эта меньшая сложность приводит к незначительному снижению качества речи.
G.729a был разработан консорциумом организаций: France Télécom , Mitsubishi Electric Corporation , Nippon Telegraph and Telephone Corporation (NTT) .
Особенности G.729a:
- Частота дискретизации 8 кГц/16 бит (80 выборок для кадров по 10 мс)
- Фиксированная скорость передачи данных (кадры 8 кбит/с, 10 мс)
- Фиксированный размер кадра (10 байт (80 бит) для кадра 10 мс)
- Алгоритмическая задержка составляет 15 мс на кадр, с задержкой упреждения 5 мс.
- G.729a — это гибридный кодер речи, использующий линейное предсказание с возбуждением алгебраического кода (ACELP).
- Сложность алгоритма оценивается в 15 баллов по относительной шкале, где G.711 равен 1, а G.723.1 — 25.
- Тестирование PSQM в идеальных условиях дает средний балл 4,04 для G.729a по сравнению с 4,45 для G.711 (μ-закон). [ нужна ссылка ]
- Тестирование PSQM в условиях сетевой нагрузки дает средний балл 3,51 для G.729a по сравнению с 4,13 для G.711 (μ-закон)
Некоторые телефоны VoIP неправильно используют описание «G729a/8000» в SDP (например, это касается некоторых телефонов Cisco и Linksys). Это неверно, поскольку G729a является альтернативным методом кодирования звука, но по-прежнему генерирует данные, декодируемые либо G729, либо G729a, т. е. нет никакой разницы с точки зрения согласования кодека. Поскольку SDP RFC позволяет переопределять статические типы полезной нагрузки с помощью текстового описания rtpmap, это может вызвать проблемы при вызове с этих телефонов на конечные точки, соответствующие RFC, если только кодек не будет переименован в их настройках, поскольку они не распознают «G729a» как «G729». без специального обходного пути для ошибки.
G.729 Приложение B
[ редактировать ]G.729 был расширен в Приложении B (G.729b), которое обеспечивает метод сжатия тишины , который позволяет использовать модуль обнаружения речевой активности (VAD). Он используется для обнаружения голосовой активности в сигнале. Он также включает в себя модуль прерывистой передачи (DTX), который принимает решение об обновлении параметров фонового шума для неречевых (зашумленных кадров). дескриптора вставки тишины (SID), Он использует 2-байтовые кадры передаваемые для инициации генерации комфортного шума (CNG). Если передача остановлена и соединение замолкает из-за отсутствия речи, принимающая сторона может предположить, что соединение прервано. Путем добавления комфортного шума аналоговое шипение имитируется в цифровом виде во время тишины, чтобы гарантировать приемнику, что связь активна и работоспособна.
Приложение J G.729 (G.729.1)
[ редактировать ]Приложение J G.729, поддерживаемое G.729.1 , обеспечивает поддержку широкополосной речи и звука. Представленный в 2006 году, [3] он определяет широкополосное улучшение с переменной скоростью передачи данных, используя до 12 иерархических уровней. Базовый уровень представляет собой битовый поток G.729 со скоростью 8 кбит/с, второй уровень представляет собой узкополосный уровень расширения 4 кбит/с, а третий уровень 2 кбит/с представляет собой уровень расширения полосы пропускания. Дополнительные уровни обеспечивают широкополосное расширение с шагом 2 кбит/с. В стандарте G.729.1 используется трехэтапное кодирование: встроенное кодирование с линейным предсказанием с кодовым возбуждением (CELP) нижнего диапазона, параметрическое кодирование верхнего диапазона с помощью расширения полосы пропускания во временной области (TDBWE) и расширение полного диапазона с помощью прогнозирующего Алгоритм кодирования с преобразованием, называемый компенсацией псевдонимов во временной области (TDAC), также известный как кодирование с модифицированным дискретным косинусным преобразованием (MDCT). [3] Скорость передачи данных и получаемое качество регулируются простым усечением потока битов.
Лицензирование
[ редактировать ]По состоянию на 1 января 2017 г. истекли сроки действия большинства патентов , лицензируемых Консорциумом G.729, оставшиеся неистекшие патенты можно использовать на безвозмездной основе. [5] G.729 включает в себя патенты нескольких компаний, которые до истечения срока действия лицензии были лицензированы Sipro Lab Telecom, уполномоченным администратором по лицензированию интеллектуальной собственности для технологии G.729 и патентного пула . [6] [7] [8] [9]
Прошлые патентные споры
[ редактировать ]AIM IP LLC, калифорнийская компания с ограниченной ответственностью, расположенная в Мишн-Вьехо , Калифорния. [10] подано 17 о нарушении патентных прав исков [11] в центральных окружных судах Калифорнии обвиняют 22 различные компании, в том числе Cisco Systems , Polycom и другие, в нарушении патента США № 5,920,853. [12] [13] Патент '853 был подан в Ведомство по патентам и товарным знакам США в 1996 году компанией Rockwell International . Изобретатели, перечисленные в патенте '853, - Беньясин Адиль, Су Хуан-Ю и Шломот Эяль. [14]
В 2000 году патент '853 был передан компанией Rockwell International компании Conexant Systems . [15] американская компания-разработчик программного обеспечения и полупроводниковая компания без собственных фабрик, которая начинала как подразделение Rockwell, а затем была выделена в отдельную публичную компанию . [16] В 2010 году патент '853 был продан компанией Conexant Systems компании AIM IP LLC, калифорнийской компании с ограниченной ответственностью, базирующейся в Мишн-Вьехо . [15]
Патент '853 содержит формулы изобретения , которые охватывают справочные таблицы, используемые в G.729. Срок действия патента истек, и он больше не действует в связи с истечением срока действия патента . [17]
Тип полезной нагрузки RTP
[ редактировать ]G.729 присвоен статический тип полезной нагрузки 18 для RTP от IANA . [18] Описание параметра rtpmap для этого типа полезных данных — «G729/8000».
И G.729a, и G.729b используют то же описание rtpmap, что и G.729. G.729a и G.729b обозначаются с помощью applicationb=no или applicationb=yes соответственно. Приложение B G.729 (G.729b) используется по умолчанию при отсутствии параметра «приложение b» в протоколе описания сеанса . [19]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Майкл Грейвс (6 марта 2017 г.). «Это официально! Срок действия патентов на G.729 истек» .
- ^ «G.729: Кодирование речи со скоростью 8 кбит/с с использованием линейного предсказания, возбуждаемого алгебраическим кодом сопряженной структуры (CS-ACELP)» . www.itu.int . Архивировано из оригинала 06 апреля 2021 г. Проверено 06 апреля 2021 г.
- ^ Jump up to: а б с Нагиредди, Сиваннараяна (2008). Обработка голосовых и факсимильных сигналов VoIP . Джон Уайли и сыновья . п. 69. ИСБН 9780470377864 .
- ^ МСЭ-Т (январь 2007 г.). «G.729: Кодирование речи со скоростью 8 кбит / с с использованием линейного предсказания, возбуждаемого алгебраическим кодом сопряженной структуры (CS-ACELP)» (PDF) : i . Проверено 21 июля 2009 г.
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Сипро Лаб Телеком (28 января 2017 г.). «О G.729» . Архивировано из оригинала 2 февраля 2017 г.
- ^ «Веб-сайт Sipro Lab Telecom» . Архивировано из оригинала 25 декабря 2012 г. Проверено 31 марта 2007 г.
- ^ Корпорация VoiceAge (14 октября 2007 г.). «Лицензирование G.729» . Архивировано из оригинала 14 октября 2007 г. Проверено 17 сентября 2009 г.
- ^ Сипро Лаб Телеком (25 октября 2007 г.). «Часто задаваемые вопросы G.729 и G.723.1» . Архивировано из оригинала 25 октября 2007 г. Проверено 17 сентября 2009 г.
- ^ Сипро Лаб Телеком (29 октября 2006 г.). «Пул IPR G.729» . Архивировано из оригинала 29 октября 2006 г. Проверено 17 сентября 2009 г.
- ^ «Бизнес-поиск – Результаты» . Поиск бизнеса - Субъекты предпринимательства - Бизнес-программы | Государственный секретарь Калифорнии .
- ^ «US 5,920,853 A — Сжатие сигнала с использованием метода отображения индексов для совместного использования таблиц квантования | RPX Insight» .
- ^ «Поиск патентных споров | RPX Insight» . Insight.rpxcorp.com .
- ^ «Aim Ip LLC против Cisco Systems Inc и др. Патентный иск» . Архивировано из оригинала 1 февраля 2014 года.
- ^ «Общественный патентный поиск | USPTO» . ppubs.uspto.gov .
- ^ Jump up to: а б «Ведомство США по патентам и товарным знакам» . назначение.uspto.gov .
- ^ Марк Лапедус (10 ноября 1998 г.). «Дочерняя компания Rockwell Semi, Conexant, будет нацелена на рынок коммуникационных микросхем» . ЭЭ Таймс .
- ^ «US5920853A — Сжатие сигнала с использованием метода отображения индексов для совместного использования таблиц квантования» . Гугл Патенты .
- ^ «Параметры транспортного протокола реального времени (RTP)» . Яна.орг . Проверено 18 сентября 2013 г.
- ^ С. Каснер, П. Хошка (июль 2003 г.). «Регистрация типа MIME форматов полезной нагрузки RTP» . Проверено 27 февраля 2013 г.