Адаптивный многоскоростной аудиокодек
Расширение имени файла | .amr, .3ga |
---|---|
Тип интернет-СМИ | аудио/амр, аудио/3gpp, аудио/3gpp2 |
Первоначальный выпуск | 23 июня 1999 г. [1] [2] |
Последний выпуск | 14.0.0 17 марта 2017 г |
Тип формата | с потерями Звук |
Открытый формат ? | Да |
Свободный формат ? | Нет |
Аудиокодек Adaptive Multi-Rate ( AMR , AMR-NB или GSM-AMR ) оптимизированный — это формат сжатия звука, для кодирования речи . AMR — это многоскоростной узкополосный речевой кодек , который кодирует узкополосные (200–3400 Гц) сигналы с переменной скоростью передачи данных в диапазоне от 4,75 до 12,2 кбит/с с качеством междугородной связи. [3] речь начинается со скорости 7,4 кбит/с. [4]
AMR был принят в качестве стандартного речевого кодека 3GPP . в октябре 1999 года и в настоящее время широко используется в GSM [5] и UMTS . Он использует адаптацию канала для выбора одной из восьми различных скоростей передачи данных в зависимости от условий канала.
AMR также является форматом файла для хранения разговорного звука с использованием кодека AMR. Многие современные мобильные телефоны могут хранить короткие аудиозаписи в формате AMR, и существуют как бесплатные , так и проприетарные программы (см. Поддержка программного обеспечения ) для преобразования между этим и другими форматами, хотя AMR — это речевой формат и вряд ли даст идеальные результаты для других форматов. аудио. Общее расширение имени файла : .amr
. Также существует другой формат хранения AMR, который подходит для приложений с более высокими требованиями к формату хранения, таких как произвольный доступ или синхронизация с видео. , определенный 3GPP, 3GP Этот формат представляет собой формат контейнера основанный на базовом формате медиафайлов ISO. [6]
Использование [ править ]
Кадры содержат 160 выборок и имеют длину 20 миллисекунд. [1] AMR использует различные методы, такие как ACELP , DTX , VAD и CNG . Использование AMR требует оптимизированной адаптации канала, которая выбирает лучший режим кодека, отвечающий требованиям местного радиоканала и пропускной способности. Если условия радиосвязи плохие, кодирование источника уменьшается, а кодирование канала увеличивается. Это улучшает качество и надежность сетевого соединения, жертвуя при этом некоторой четкостью голоса. В конкретном случае AMR это улучшение составляет где-то около S/N = 4–6 дБ для пригодной для использования связи. Новая интеллектуальная система позволяет сетевому оператору устанавливать приоритеты пропускной способности или качества для каждой базовой станции.
Всего имеется 14 режимов кодека AMR, восемь доступны в канале с полной скоростью (FR) и шесть в канале с половинной скоростью (HR) .
Режим | Битрейт (кбит/с) | Канал | Совместим с |
---|---|---|---|
АМР_12.20 | 12.20 | фр. | Расширенный полный тариф ETSI GSM |
АМР_10.20 | 10.20 | фр. | |
АМР_7,95 | 7.95 | ПТ/HR | |
АМР_7.40 | 7.40 | ПТ/HR | TIA/EIA IS-641 TDMA расширенная полная скорость |
АМР_6.70 | 6.70 | ПТ/HR | ARIB 6,7 кбит/с, расширенная полная скорость |
АМР_5.90 | 5.90 | ПТ/HR | |
АМР_5.15 | 5.15 | ПТ/HR | |
АМР_4.75 | 4.75 | ПТ/HR | |
АМР_SID | 1.80 | ПТ/HR |
Особенности [ править ]
- Частота дискретизации 8 кГц/13 бит (160 выборок для кадров по 20 мс), фильтруется до 200–3400 Гц.
- Кодек AMR использует восемь исходных кодеков со скоростями передачи данных 12,2, 10,2, 7,95, 7,40, 6,70, 5,90, 5,15 и 4,75 кбит/с.
- Генерирует кадр длиной 95, 103, 118, 134, 148, 159, 204 или 244 бита для скоростей передачи данных AMR FR 4,75, 5,15, 5,90, 6,70, 7,40, 7,95, 10,2 или 12,2 кбит/с соответственно. Длины кадров AMR HR различны.
- AMR использует прерывистую передачу (DTX) с обнаружением голосовой активности (VAD) и генерацией комфортного шума (CNG) для снижения использования полосы пропускания в периоды тишины.
- Алгоритмическая задержка составляет 20 мс на кадр. Для скорости передачи данных 12,2 «алгоритмическая» задержка упреждения отсутствует. Для других скоростей задержка упреждения составляет 5 мс. Обратите внимание, что существует «фиктивная» задержка упреждения в 5 мс, позволяющая плавно переключать режимы по кадрам с остальными скоростями.
- AMR — это гибридный кодер речи, который передает как параметры речи, так и сигнал формы волны.
- Линейное прогнозирующее кодирование (LPC) используется для синтеза речи из остаточной формы сигнала. Параметры LPC кодируются как линейные спектральные пары (LSP).
- Остаточная форма сигнала кодируется с использованием линейного предсказания с алгебраическим кодовым возбуждением (ACELP).
- Сложность алгоритма оценивается в 5 баллов по относительной шкале, где G.711 равен 1, а G.729a — 15.
- Тестирование PSQM в идеальных условиях дает средний балл 4,14 для AMR (12,2 кбит/с) по сравнению с 4,45 для G.711 (μ-закон). [ нужна ссылка ]
- Тестирование PSQM в условиях нагрузки на сеть дает средний балл 3,79 для AMR (12,2 кбит/с) по сравнению с 4,13 для G.711 (μ-закон)
Лицензирование и патентные вопросы [ править ]
в себя несколько патентов Nokia Кодеки AMR включают , Ericsson , NTT и VoiceAge, [7] [8] последний из них является администратором лицензий AMR патентных пулов . VoiceAge также принимает заявки на патенты для определения их возможной соответствия этим стандартам. Однако очень сложно определить, существовали ли на самом деле какие-либо патенты на так называемые изобретения, связанные с кодеками AMR/AMR-WB, поскольку изобретатели (и их юристы) делают все возможное, чтобы скрыть патенты, связанные с AMR/AMR-WB. Технология ВБ [ нужна ссылка ] . Судя по всему, все эти патенты скрыты от всех остальных исследователей и широкой публики, которая, возможно, могла бы обнаружить уровень техники в заявленных «изобретениях», запатентованных патентообладателями кодеков AMR/AMR-WB. [9] [10]
Первоначальный взнос за профессиональные инструменты создания контента и продукты для каналов реального времени составляет 6500 долларов США. [ когда? ] Минимальный годовой роялти составляет 10 000 долларов США, что в первый год не включает первоначальный взнос. Лицензионные сборы за каждый канал падают с 0,99 до 0,50 долларов США в зависимости от объема, максимум до 2 миллионов долларов США в год. [7] [8]
В категории продуктов для персональных компьютеров, например медиаплееров, декодер AMR лицензируется бесплатно. Лицензионный сбор за проданный кодировщик падает с 0,40 до 0,30 доллара США в зависимости от объема, максимум до 300 000 долларов США в год. Минимальный годовой роялти не применяется к лицензионным продуктам, подпадающим под категорию продуктов для персональных компьютеров и использующим только бесплатный декодер. [7] [8]
Дополнительная информация:
- Информация о лицензировании VoiceAge , включая цены на лицензию на кодеки AMR.
- Юридические вопросы 3GPP
- Патентная платформа 3G и ее лицензионная политика
- Кодеки AMR как общие библиотеки — юридические уведомления об использовании библиотек amrnb и amrwb на основе эталонной реализации.
Поддержка программного обеспечения [ править ]
- 3GPP TS 26.073 — речевой кодек AMR (исходный код C) — эталонная реализация [11]
- Audacity (бета-версия 1.3) через библиотеки интеграции FFmpeg. [12] (формат ввода и вывода)
- FFmpeg с библиотеками OpenCORE AMR [13]
- Андроид [14] Используется для диктофона.
- Кодеки AMR как общие библиотеки — сайт разработки библиотек amrnb и amrwb. Эти библиотеки основаны на эталонной реализации и созданы для предотвращения внедрения возможно запатентованного исходного кода во многие проекты с открытым исходным кодом.
- Программное обеспечение с открытым исходным кодом для преобразования формата .amr: RetroCode , Amr2Wav , оба находятся на ранней стадии разработки.
- AMR Player — это бесплатная программа для воспроизведения аудиофайлов AMR, которая может конвертировать AMR из/в аудиоформат MP3/WAV.
- Nokia Multimedia Converter 2.0 может конвертировать (создавать) образцы; можно использовать инструмент преобразования Nokia для создания файлов .amr и .awb. Он также работает в Windows 7, если установка выполняется в режиме совместимости с XP.
- MPlayer ( SMPlayer , KMPlayer [15] )
- Parole Media Player 0.8.1 (в Ubuntu 16.04)
- QuickTime Player и мультимедийная платформа
- RealPlayer версии 11 и более поздних версий
- Медиаплеер VLC версии 1.1.0 и более поздних версий (только входной формат, а не выходной формат)
- ffdshow
- Apple iPhone (может воспроизводить файлы AMR)
- iOS и macOS (iMessage)
- Смартфоны BlackBerry (используется для формата файлов диктофона, а BlackBerry 10 не может воспроизводить формат AMR)
- Пакет кодеков K-Lite
- Медиаплеер классический домашний кинотеатр, около 1.7.1
- foobar2000 с компонентом foo_input_amr
См. также [ править ]
- Адаптивный многоскоростной широкополосный доступ (AMR-WB)
- Расширенная адаптивная многоскоростная передача – широкополосная связь (AMR-WB+)
- Половина ставки
- Полная ставка
- Расширенная полная скорость (EFR)
- Частота выборки
- ИС-641
- 3GP
- Сравнение форматов кодирования звука
- Аудио-видео профиль RTP
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б «3GPP TS 26.090 — Обязательные функции обработки речи речевого кодека; Адаптивный многоскоростной (AMR) речевой кодек; Функции транскодирования» . 3ГПП . Проверено 21 июля 2010 г.
- ^ «3GPP TS 26.071 — Обязательные функции обработки речи речевого кодека; Речевой кодек AMR; Общее описание» . 3ГПП . Проверено 21 июля 2010 г.
- ^ «Что такое телефонная связь?» . ITмир . 13 декабря 2000 г. Проверено 26 июля 2019 г.
- ^ RFC 4867 - Формат полезной нагрузки RTP и формат хранения файлов для адаптивных многоскоростных (AMR) и адаптивных многоскоростных широкополосных (AMR-WB) аудиокодеков. Страница 35
- ^ «Сортировка по GSM-кодекам: учебное пособие» . 11 июля 2003 г.
- ^ RFC 4867 - Формат полезной нагрузки RTP и формат хранения файлов для адаптивных многоскоростных (AMR) и адаптивных многоскоростных широкополосных (AMR-WB) аудиокодеков. Страница 35
- ↑ Перейти обратно: Перейти обратно: а б с Корпорация VoiceAge (14 октября 2007 г.). «Условия лицензирования AMR» . Корпорация VoiceAge. Архивировано из оригинала 14 октября 2007 г. Проверено 12 сентября 2009 г.
- ↑ Перейти обратно: Перейти обратно: а б с Корпорация VoiceAge (июнь 2007 г.). «Условия лицензирования AMR» . Корпорация VoiceAge. Архивировано из оригинала 14 октября 2007 г. Проверено 12 сентября 2009 г.
- ^ Корпорация VoiceAge. «Лицензирование - Патентные заявки» . Корпорация VoiceAge. Архивировано из оригинала 14 октября 2007 г. Проверено 12 сентября 2009 г.
- ^ Корпорация VoiceAge (14 октября 2007 г.). «Лицензирование - Патентные заявки» . Архивировано из оригинала 14 октября 2007 г. Проверено 12 сентября 2009 г.
- ^ 3GPP (11 декабря 2008 г.) 3GPP TS 26.073 — речевой кодек AMR , дата обращения 8 сентября 2009 г.
- ^ Проверено 28 февраля 2010 г.
- ^ Общая документация FFmpeg — внешняя библиотека AMR , дата обращения 08 июля 2009 г.
- ^ Кодеки Android AMR , Проверено 8 июля 2009 г.. Архивировано 18 февраля 2009 г. на Wayback Machine.
- ^ Настройки внутреннего аудиодекодера KMPlayer. Архивировано 22 октября 2014 г. на Wayback Machine . Проверено 22 октября 2014 г.
Внешние ссылки [ править ]
- 3GPP TS 26.090 – Обязательные функции обработки речи речевого кодека; Адаптивный многоскоростной речевой кодек (AMR); Функции транскодирования
- 3GPP TS 26.071 – Обязательные функции обработки речи речевого кодека; Речевой кодек AMR; Общее описание
- Характеристики кодеков 3GPP; 3G и далее/GSM, 26 серия
- RFC 4867 - формат полезной нагрузки RTP и формат хранения файлов для адаптивных многоскоростных (AMR) и адаптивных многоскоростных широкополосных (AMR-WB) аудиокодеков
- RFC 4281 - параметр кодеков для типов мультимедиа «ведро».