MPEG-4, часть 3
MPEG-4 Part 3 или MPEG-4 Audio (формально ISO / IEC 14496-3) — третья часть международного стандарта ISO / IEC MPEG-4, разработанная Moving Picture Experts Group . [1] Он определяет кодирования звука методы . Первая версия ISO/IEC 14496-3 была опубликована в 1999 году. [2]
MPEG-4 Part 3 состоит из множества технологий кодирования звука — от с потерями кодирования речи ( HVXC , CELP ), общего кодирования звука ( AAC , TwinVQ , BSAC), без потерь сжатия звука ( MPEG-4 SLS , кодирования звука без потерь , MPEG). -4 DST ), интерфейс преобразования текста в речь (TTSI), структурированное аудио (с использованием SAOL , SASL, MIDI ) и множество дополнительных методов синтеза и кодирования звука. [3] [4] [5] [6] [7] [8] [9] [10] [11]
MPEG-4 Audio не предназначен для какого-то одного приложения, такого как телефония в реальном времени или сжатие высококачественного звука. Это применимо к каждому приложению, требующему использования расширенных методов сжатия, синтеза, манипулирования или воспроизведения звука.MPEG-4 Audio — это новый тип аудиостандарта, который объединяет множество различных типов аудиокодирования: естественный звук и синтетический звук, доставку с низким битрейтом и передачу высокого качества, речь и музыку, сложные и простые звуковые дорожки, традиционный контент и интерактивный контент. . [7]
Версии
[ редактировать ]Версия | Дата выпуска | Последняя поправка | Стандартный | Описание |
---|---|---|---|---|
Первое издание | 1999 | 2001 | ИСО/МЭК 14496-3:1999. [2] | также известный как «MPEG-4 Audio Version 1» |
2000 | ИСО/МЭК 14496-3:1999/Изм. 1:2000 [13] | также известная как «MPEG-4 Audio Version 2», поправка к первому изданию. [7] [8] | ||
Второе издание | 2001 | 2005 | ИСО/МЭК 14496-3:2001 [14] | |
Третье издание | 2005 | 2008 | ИСО/МЭК 14496-3:2005 [15] | |
Четвертое издание | 2009 | 2015 г. и в разработке [12] | ИСО/МЭК 14496-3:2009 [1] [16] | |
Пятое издание | 2019 | ИСО/МЭК 14496-3:2019 [17] | Текущая версия |
Подчасти
[ редактировать ]MPEG-4 Часть 3 содержит следующие подразделы: [16]
- Подчасть 1: Основная (список типов аудиообъектов, профилей, уровней, интерфейс ISO/IEC 14496-1, транспортный поток аудио MPEG-4 и т. д.)
- Подчасть 2: Кодирование речи – HVXC (кодирование гармонического векторного возбуждения)
- Подчасть 3: Кодирование речи – CELP (линейное предсказание с возбуждением кода)
- Подчасть 4: Общее кодирование звука (GA) (временно-частотное кодирование) — AAC , TwinVQ , BSAC
- Подраздел 5: Структурированное аудио (SA)
- Подчасть 6: Интерфейс преобразования текста в речь (TTSI)
- Подчасть 7: Параметрическое кодирование звука – HILN (гармоническая и индивидуальная линия плюс шум)
- Подчасть 8: Техническое описание параметрического кодирования звука высокого качества (SSC, Parametric Stereo ).
- Подраздел 9: Звук MPEG-1 / MPEG-2 в формате MPEG-4
- Подчасть 10: Техническое описание кодирования без потерь аудио с передискретизацией (MPEG-4 DST – прямая потоковая передача )
- Подчасть 11: Кодирование звука без потерь (ALS)
- Подчасть 12: Масштабируемое кодирование без потерь (SLS)
Типы аудиообъектов MPEG-4
[ редактировать ]MPEG-4 Audio включает систему для единообразной обработки различных групп аудиоформатов. Каждому формату присваивается уникальный тип аудиообъекта для его представления. [18] [19] Тип объекта используется для различения различных методов кодирования. Он напрямую определяет поднабор инструментов MPEG-4, необходимый для декодирования конкретного объекта. Профили MPEG-4 основаны на типах объектов, и каждый профиль поддерживает свой список типов объектов. [19]
Идентификатор типа объекта | Тип аудиообъекта | Дата первого публичного релиза | Описание |
---|---|---|---|
1 | Главная страница ААС | 1999 | содержит AAC LC |
2 | AAC LC (низкая сложность) | 1999 | Используется в «Профиле AAC». Тип аудиообъекта MPEG-4 AAC LC основан на профиле низкой сложности MPEG-2 Part 7 (LC) в сочетании с перцептивным шумовым замещением (PNS) (определенным в MPEG-4 Part 3 Subpart 4). [4] [22] |
3 | AAC SSR (масштабируемая частота дискретизации) | 1999 | Тип аудиообъекта MPEG-4 AAC SSR основан на профиле масштабируемой частоты дискретизации MPEG-2 Part 7 (SSR) в сочетании с перцепционным шумовым замещением (PNS) (определенным в MPEG-4 Part 3 Subpart 4). [4] [22] |
4 | AAC LTP ( долгосрочное прогнозирование ) | 1999 | содержит AAC LC |
5 | SBR ( репликация спектрального диапазона ) | 2003 [23] | используется с AAC LC в «Высокоэффективном профиле AAC» ( HE-AAC v1) |
6 | Масштабируемый AAC | 1999 | |
7 | ТвинВК | 1999 | кодирование звука с очень низким битрейтом |
8 | CELP ( линейное прогнозирование с возбуждением кода ) | 1999 | кодирование речи |
9 | HVXC (кодирование гармонического вектора возбуждения) | 1999 | кодирование речи |
10 | (Сдержанный) | ||
11 | (Сдержанный) | ||
12 | TTSI ( интерфейс преобразования текста в речь ) | 1999 | |
13 | Основной синтез | 1999 | содержит ' волновую таблицу ' синтеза на основе выборки [24] и алгоритмический синтез и аудиоэффекты |
14 | ' волновая таблица ' синтез на основе выборки | 1999 | на основе SoundFont и Downloadable Sounds , [24] содержит General MIDI |
15 | Общий MIDI | 1999 | |
16 | Алгоритмический синтез и аудиоэффекты | 1999 | |
17 | ИС ААК ЛК | 2000 | Устойчивость к ошибкам |
18 | (Сдержанный ) | ||
19 | ЕСТЬ AAC LTP | 2000 | Устойчивость к ошибкам |
20 | ER AAC масштабируемый | 2000 | Устойчивость к ошибкам |
21 | ЕС ТвинВК | 2000 | Устойчивость к ошибкам |
22 | ER BSAC (побитовое арифметическое кодирование) | 2000 | Он также известен как «Fine Granule Audio» или инструмент мелкозернистого масштабирования. Он используется в сочетании с инструментами кодирования AAC и заменяет бесшумное кодирование и форматирование битового потока кодера MPEG-4 версии 1 GA. Устойчивость к ошибкам |
23 | ER AAC LD (малая задержка) | 2000 | Устойчивость к ошибкам, используется с CELP, ER CELP, HVXC, ER HVXC и TTSI в «Профиле низкой задержки» (обычно используется для приложений разговора в реальном времени) |
24 | ЕСЛП | 2000 | Устойчивость к ошибкам |
25 | ЕСТЬ HVXC | 2000 | Устойчивость к ошибкам |
26 | ЭР ХИЛН (Гармонические и индивидуальные линии плюс шум) | 2000 | Устойчивость к ошибкам |
27 | ИС параметрический | 2000 | Устойчивость к ошибкам |
28 | SSC (синусоидальное кодирование) | 2004 [25] [26] | |
29 | PS ( параметрическое стерео ) | 2004 [27] и 2006 г. [28] [29] | используется с AAC LC и SBR в «Профиле HE-AAC v2». Инструмент кодирования PS был определен в 2004 году, а тип объекта — в 2006 году. |
30 | MPEG объемный звук | 2007 [30] | также известное как пространственное кодирование звука MPEG (SAC), это тип пространственного кодирования звука. [31] [32] (MPEG Surround также был определен в ISO/IEC 23003-1 в 2007 г. [33] ) |
31 | (ПОБЕГ) | ||
32 | MPEG-1/2 Уровень-1 | 2005 [34] | |
33 | MPEG-1/2 Уровень-2 | 2005 [34] | |
34 | MPEG-1/2, уровень-3 | 2005 [34] | также известный как «MP3onMP4» |
35 | DST ( прямая потоковая передача ) | 2005 [35] | кодирование звука без потерь, используется на Super Audio CD |
36 | ALS ( кодирование звука без потерь ) | 2006 [29] | кодирование звука без потерь |
37 | SLS ( масштабируемое кодирование без потерь ) | 2006 [36] | двухуровневое аудиокодирование со слоем без потерь и ядром/слоем General Audio с потерями (например, AAC) |
38 | SLS неосновной | 2006 | кодирование звука без потерь без ядра/слоя General Audio с потерями (например, AAC) |
39 | ER AAC ELD (улучшенная низкая задержка) | 2008 [37] | Устойчивость к ошибкам |
40 | SMR (Символическое представление музыки) Простое | 2008 | примечание: Символическое представление музыки также является стандартом MPEG-4 Part 23 (ISO/IEC 14496-23:2008). [38] [39] |
41 | СМР Главная | 2008 | |
42 | USAC ( унифицированное кодирование речи и аудио ) | 2012 | Унифицированное кодирование речи и звука определено в MPEG-D, часть 3 (ISO/IEC 23003-3:2012). [40] |
43 | SAOC (кодирование пространственных аудиообъектов) | 2010 [41] [42] | Примечание. Пространственное кодирование аудиообъектов также является стандартом MPEG-D Part 2 (ISO/IEC 23003-2:2010). [43] |
44 | LD MPEG объемный звук | 2010 [44] | Этот тип объекта передает дополнительную информацию о кодировании объемного звука MPEG с малой задержкой (которая определена в MPEG-D Part 2 – ISO/IEC 23003-2). [43] ) в формате MPEG-4 Audio. |
45 | САОК-ДЕ | 2013 | Улучшение диалога кодирования пространственных аудиообъектов |
46 | Аудио Синхронизация | 2015 | Инструмент синхронизации звука обеспечивает возможность синхронизации нескольких материалов на нескольких устройствах. |
Аудио профили
[ редактировать ]Стандарт MPEG-4 Audio определяет несколько профилей. Эти профили основаны на типах объектов, и каждый профиль поддерживает разные списки типов объектов. Каждый профиль также может иметь несколько уровней, которые ограничивают некоторые параметры инструментов, присутствующих в профиле. Этими параметрами обычно являются частота дискретизации и количество аудиоканалов, декодируемых одновременно.
Аудио профиль | Типы аудиообъектов | Дата первого публичного релиза |
---|---|---|
Профиль AAC | ААС ЛК | 2003 |
Высокоэффективный профиль AAC | ААК ЛК, СБР | 2003 |
Профиль HE-AAC v2 | ААК ЛК, СБР, ПС | 2006 |
Основной аудиопрофиль | AAC Main, AAC LC, AAC SSR, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI, основной синтез | 1999 |
Масштабируемый аудиопрофиль | AAC LC, AAC LTP, масштабируемый AAC, TwinVQ, CELP, HVXC, TTSI | 1999 |
Речевой аудиопрофиль | CELP , HVXC , TTSI | 1999 |
Синтетический аудиопрофиль | TTSI, Основной синтез | 1999 |
Профиль аудио высокого качества | AAC LC, AAC LTP, масштабируемый AAC, CELP, ER AAC LC, ER AAC LTP, масштабируемый ER AAC, ER CELP | 2000 |
Аудио профиль с низкой задержкой | CELP, HVXC, TTSI, IS AAC LD, IS CELP, IS HVXC | 2000 |
Естественный аудиопрофиль | AAC Main, AAC LC, AAC SSR, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI, ER AAC LC, ER AAC LTP, ER AAC Scalable, ER TwinVQ, ER BSAC, ER AAC LD, ER CELP, ER HVXC , ИС ХИЛН, ИС Параметрический | 2000 |
Межсетевой профиль мобильного аудио | IS AAC LC, IS AAC масштабируемый, IS TwinVQ, IS BSAC, IS AAC LD | 2000 |
Профиль HD-AAC | ААК ЛК, СЛС [45] | 2009 [46] |
Простой профиль БАС | ЕСЛИ | 2010 [42] [47] |
Хранение и транспортировка аудио
[ редактировать ]Стандартный | Описание | |
---|---|---|
Мультиплекс | ИСО/МЭК 14496-1 | Схема мультиплексирования MPEG-4 (M4Mux) [48] |
Мультиплекс | ИСО/МЭК 14496-3 | Транспортный мультиплекс аудио с низкими накладными расходами (LATM) |
Хранилище | ИСО/МЭК 14496-3 (справочный) | Формат обмена аудиоданными (ADIF) — только для AAC |
Хранилище | ИСО/МЭК 14496-12 | Формат файла MPEG-4 ( MP4 )/ базовый формат медиафайла ISO |
Передача инфекции | ИСО/МЭК 14496-3 (справочный) | Транспортный поток аудиоданных (ADTS) – только для AAC |
Передача инфекции | ИСО/МЭК 14496-3 | Аудиопоток с низкими накладными расходами (LOAS) на основе LATM |
Не существует стандарта для транспортировки элементарных потоков по каналу, поскольку широкий спектр приложений MPEG-4 предъявляет слишком широкие требования к доставке, чтобы их можно было легко охарактеризовать с помощью одного решения.
Возможности транспортного уровня и связь между функциями транспорта, мультиплексирования и демультиплексирования описаны в структуре интеграции мультимедиа доставки (DMIF) в ISO/IEC 14496-6. [16] Ниже этого интерфейса существует множество механизмов доставки, например, транспортный поток MPEG , транспортный протокол реального времени (RTP) и т. д.
Транспортировка в транспортном протоколе реального времени определена в RFC 3016 (формат полезной нагрузки RTP для аудио/визуальных потоков MPEG-4), RFC 3640 (формат полезной нагрузки RTP для транспортировки элементарных потоков MPEG-4), RFC 4281 (параметр кодеков для " Типы носителей Bucket) и RFC 4337 (регистрация типа MIME для MPEG-4).
LATM и LOAS были определены для приложений естественного звука, которые не требуют сложного объектно-ориентированного кодирования или других функций, предоставляемых системами MPEG-4.
Раздвоение технического стандарта AAC
[ редактировать ]Расширенное кодирование звука в подразделе 4 MPEG-4 Part 3 (MPEG-4 Audio) было улучшено по сравнению с предыдущим стандартом MPEG-2 Part 7 (Advanced Audio Coding), чтобы обеспечить лучшее качество звука для заданного битрейта кодирования.
Предполагается, что любые различия между Частью 3 и Частью 7 будут устранены органом по стандартизации ISO в ближайшем будущем, чтобы избежать возможности будущей несовместимости битовых потоков. В настоящее время не известно о несовместимости проигрывателей или кодеков из-за новизны стандарта.
Стандарт MPEG-2 Part 7 (Advanced Audio Coding) был впервые опубликован в 1997 году и предлагает три профиля по умолчанию: [49] [50] Профиль низкой сложности (LC), основной профиль и профиль масштабируемой частоты дискретизации (SSR).
MPEG-4 Part 3 Subpart 4 (General Audio Coding) объединил профили MPEG-2 Part 7 с перцептивной шумовой заменой (PNS) и определил их как типы аудиообъектов (AAC LC, AAC Main, AAC SSR). [4]
HE-AAC
[ редактировать ]Высокоэффективное расширенное аудиокодирование — это расширение AAC LC с использованием репликации спектральных диапазонов (SBR) и параметрического стерео (PS). Он предназначен для повышения эффективности кодирования при низких битрейтах за счет использования частичного параметрического представления звука.
ААК-ССР
[ редактировать ]Масштабируемая частота дискретизации AAC была введена Sony в стандарты MPEG-2 Part 7 и MPEG-4 Part 3. [ нужна ссылка ] Впервые он был опубликован в ISO/IEC 13818-7, часть 7: Advanced Audio Coding (AAC) в 1997 году. [49] [50] Аудиосигнал сначала разделяется на 4 полосы с использованием 4-полосного блока многофазных квадратурных фильтров . Затем эти 4 полосы дополнительно разделяются с использованием MDCT с размером k , равным 32 или 256 выборкам. Это похоже на обычный AAC LC, который использует MDCT с размером k 128 или 1024 непосредственно в аудиосигнале.
Преимущество этого метода заключается в том, что переключение коротких блоков может выполняться отдельно для каждого диапазона PQF . Таким образом, высокие частоты можно кодировать с использованием короткого блока для улучшения временного разрешения, а низкие частоты по-прежнему можно кодировать с высоким спектральным разрешением. Однако из-за наложения спектров между 4 полосами PQF эффективность кодирования около (1,2,3) * fs/8 хуже, чем у обычного MPEG-4 AAC LC. [ нужна ссылка ]
MPEG-4 AAC-SSR очень похож на ATRAC и ATRAC-3 .
Почему был введен AAC-SSR
[ редактировать ]Идея AAC-SSR заключалась не только в перечисленных выше преимуществах, но и в возможности снизить скорость передачи данных за счет удаления 1, 2 или 3 верхних полос PQF. Очень простой разделитель битового потока может удалить эти полосы и, таким образом, уменьшить битрейт и частоту дискретизации.
Пример:
- 4 поддиапазона: битрейт = 128 кбит/с, частота дискретизации = 48 кГц, f_lowpass = 20 кГц
- 3 поддиапазона: битрейт ~ 120 кбит/с, частота дискретизации = 48 кГц, f_lowpass = 18 кГц
- 2 поддиапазона: битрейт ~100 кбит/с, частота дискретизации = 24 кГц, f_lowpass = 12 кГц
- 1 поддиапазон: битрейт ~ 65 кбит/с, частота дискретизации = 12 кГц, f_lowpass = 6 кГц
Примечание: хотя и возможно, но полученное качество намного хуже типичного.для этого битрейта. Таким образом, для обычного AAC LC со скоростью 64 кбит/с полоса пропускания составляет 14–16 кГц.достигается за счет использования интенсивного стерео и уменьшенного ЯМР. Это ухудшает качество звукаменьше, чем передача с полосой пропускания 6 кГц с идеальным качеством.
БСАК
[ редактировать ]Побитовое арифметическое кодирование — это стандарт MPEG-4 (ISO/IEC 14496-3, подраздел 4) для масштабируемого кодирования звука. BSAC использует альтернативное AAC бесшумное кодирование, при этом остальная часть обработки идентична AAC. Такая поддержка масштабируемости обеспечивает почти прозрачное качество звука на скорости 64 кбит/с и постепенное ухудшение качества на более низких скоростях передачи данных. Кодирование BSAC лучше всего выполняется в диапазоне от 40 до 64 кбит/с, хотя оно работает в диапазоне от 16 до 64 кбит/с. Кодек AAC-BSAC используется в приложениях цифрового мультимедийного вещания (DMB) .
Лицензирование
[ редактировать ]В 2002 году Комитет по лицензированию аудио MPEG-4 выбрал Via Licensing Corporation в качестве администратора лицензирования патентного пула MPEG-4 Audio . [3] [51] [52]
См. также
[ редактировать ]- TwinVQ – один из типов объектов, определенных в MPEG-4 Audio версии 1.
- MPEG-4, часть 2
- Контейнерный формат MPEG-4 Part 14 (MP4)
- Управление цифровыми правами
- Расширенное кодирование звука (AAC)
- ИСО/МЭК ОТК 1/ПК 29
Ссылки
[ редактировать ]- ^ Перейти обратно: а б ИСО (2009). «ИСО/МЭК 14496-3:2009 – Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио» . ИСО . Проверено 6 октября 2009 г.
- ^ Перейти обратно: а б ИСО (1999). «ИСО/МЭК 14496-3:1999 – Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио» . ИСО . Проверено 6 октября 2009 г.
- ^ Перейти обратно: а б Деловая телеграмма (2 декабря 2002 г.). «Комитет по лицензированию аудио MPEG-4 выбирает Via Licensing Corporation в качестве администратора; Комитет по лицензированию аудио MPEG-4 определяет условия лицензирования профиля аудио» . Бесплатная библиотека . Проверено 6 октября 2009 г.
{{cite web}}
:|author=
имеет общее имя ( справка ) - ^ Перейти обратно: а б с д Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма (1999). «Кодирование естественного звука MPEG-4 – профили и уровни звука» . chiariglione.org. Архивировано из оригинала 17 июля 2010 г. Проверено 6 октября 2009 г.
- ^ Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма. «Кодирование естественного звука MPEG-4 — масштабируемость естественного звука MPEG-4» . chiariglione.org. Архивировано из оригинала 28 февраля 2010 г. Проверено 6 октября 2009 г.
- ^ Д. Том, Х. Пурнхаген и подгруппа MPEG Audio (октябрь 1998 г.). «Часто задаваемые вопросы по MPEG Audio – MPEG-4» . chiariglione.org . Проверено 6 октября 2009 г.
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Перейти обратно: а б с д ISO / IEC JTC 1/SC 29/WG 11 (июль 1999 г.), ISO/IEC 14496-3:/Amd.1 – Проект итогового комитета – MPEG-4 Audio Version 2 (PDF) , заархивировано из оригинала (PDF) на 01 августа 2012 г. , получено 7 октября 2009 г.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Перейти обратно: а б Хайко Пурнхаген (07.06.1999), Обзор MPEG-4 Audio Version 2 (PDF) , Хайко Пурнхаген, заархивировано из оригинала (PDF) 6 июля 2017 г. , получено 7 октября 2009 г.
- ^ Перейти обратно: а б Хайко Пурнхаген (1 июня 2001 г.). «Аудиостандарт MPEG-4: обзор и применение» . Хайко Пурнхаген . Проверено 7 октября 2009 г. [ мертвая ссылка ]
- ^ Хайко Пурнхаген (07 ноября 2001 г.). «Веб-страница MPEG Audio – MPEG-4 Audio (ISO/IEC 14496-3)» . Проверено 7 октября 2009 г. [ мертвая ссылка ]
- ^ Роб Коенен, ISO/IEC JTC1/SC29/WG11 (март 2002 г.). «Обзор стандарта MPEG-4» . chiariglione.org . Проверено 6 октября 2009 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Перейти обратно: а б МПЕГ. «Стандарты MPEG – Полный список стандартов, разработанных или находящихся в стадии разработки» . chiariglione.org. Архивировано из оригинала 20 апреля 2010 года . Проверено 31 октября 2009 г.
- ^ ИСО (2000). «ISO/IEC 14496-3:1999/Поправка 1:2000 – Расширения аудио» . ИСО . Проверено 7 октября 2009 г.
- ^ ИСО (2001). «ИСО/МЭК 14496-3:2001 – Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио» . ИСО . Проверено 14 октября 2009 г.
- ^ ИСО (2005). «ИСО/МЭК 14496-3:2005 – Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио» . ИСО . Проверено 14 октября 2009 г.
- ^ Перейти обратно: а б с д ISO / IEC (01.09.2009), ISO/IEC 14496-3:2009 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио (PDF) , IEC , получено 7 октября 2009 г.
- ^ ISO / IEC (2019-12-01), ISO/IEC 14496-3:2019 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио , IEC , получено 2 июня 2020 г.
- ^ Перейти обратно: а б МультимедиаВики (2009). «MPEG-4 Аудио» . МультимедиаВики . Проверено 9 октября 2009 г.
- ^ Перейти обратно: а б с Бернард Гриль; Стефан Гейерсбергер; Йоханнес Хильперт; Бодо Тейхманн (июль 2004 г.), Реализация аудиокомпонентов MPEG-4 на различных платформах (PDF) , Fraunhofer Gesellschaft, заархивировано из оригинала (PDF) 10 июня 2007 г. , получено 9 октября 2009 г.
- ^ ISO/IEC JTC1/SC29/WG11 N2203 (март 1998 г.). «MPEG-4 Audio (проект итогового комитета 14496-3)» . Хайко Пурнхаген . Проверено 7 октября 2009 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) [ мертвая ссылка ] - ^ Перейти обратно: а б с ISO/IEC JTC1/SC29/WG11/N7016 (11 января 2005 г.), Текст ISO/IEC 14496-3:2001/FPDAM 4, Кодирование без потерь звука (ALS), новые аудиопрофили и расширения BSAC , заархивировано из оригинала (DOC) 12 мая 2014 г. , получено 9 октября 2009 г.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Перейти обратно: а б Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма (1999). «Кодирование естественного звука MPEG-4 – общее кодирование звука (на основе AAC)» . chiariglione.org. Архивировано из оригинала 19 февраля 2010 г. Проверено 6 октября 2009 г.
- ^ ИСО (2003). «Расширение полосы пропускания, ISO/IEC 14496-3:2001/Поправка 1:2003» . ИСО . Проверено 13 октября 2009 г.
- ^ Перейти обратно: а б Шайрер, Эрик Д.; Рэй, Ли (1998). «Алгоритмический и волновой синтез в мультимедийном стандарте MPEG-4». Съезд Общества аудиоинженеров № 105, 1998 г. CiteSeerX 10.1.1.35.2773 .
2.2 Синтез волновых таблиц с помощью SASBF: Формат банка волновых таблиц SASBF имел довольно сложную историю развития. Исходная спецификация была предоставлена E-Mu Systems и основана на их формате SoundFont [15]. После завершения интеграции этого компонента в эталонное программное обеспечение MPEG-4 Ассоциация производителей MIDI (MMA) обратилась к MPEG с просьбой обеспечить совместимость MPEG-4 SASBF с их форматом «Загруженные звуки» [13]. E-Mu согласился, что такая совместимость желательна, и поэтому новый формат был согласован и разработан совместно всеми сторонами.
- ^ ИСО (2004). «Параметрическое кодирование для высококачественного звука, ISO/IEC 14496-3:2001/Amd 2:2004» . ИСО . Проверено 13 октября 2009 г.
- ^ ISO/IEC JTC1/SC29/WG11 (25 июля 2003 г.). «Текст ISO/IEC 14496-3:2001/FPDAM2 (параметрическое аудио) – N5713» . Архивировано из оригинала (DOC) 12 мая 2014 г. Проверено 13 октября 2009 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ 3GPP (30 сентября 2004 г.). описание улучшенного общего аудиокодека aacPlus «3GPP TS 26.401 V6.0.0 (2004-09), функции обработки звука общего аудиокодека; общее (выпуск 6)» (DOC) . 3ГПП . Проверено 13 октября 2009 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ 3GPP (04.01.2005). «ETSI TS 126 401 V6.1.0 (2004-12) - Универсальная система мобильной связи (UMTS) Общие функции обработки звука аудиокодека; Улучшенный общий аудиокодек aacPlus Общее описание (3GPP TS 26.401 версия 6.1.0 Выпуск 6)» . 3ГПП . Проверено 13 октября 2009 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Перейти обратно: а б ИСО (2006). «Кодирование без потерь звука (ALS), новые аудиопрофили и расширения BSAC, ISO/IEC 14496-3:2005/Amd 2:2006» . ИСО . Проверено 13 октября 2009 г.
- ^ ИСО (2007). «Расширения BSAC и транспортировка MPEG Surround, ISO/IEC 14496-3:2005/Amd 5:2007» . ИСО . Проверено 13 октября 2009 г.
- ^ ISO/IEC JTC1/SC29/WG11 (июль 2005 г.). «Учебное пособие по кодированию объемного звука MPEG» . Архивировано из оригинала 30 апреля 2010 г. Проверено 9 февраля 2010 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ ISO/IEC JTC1/SC29/WG11 (июль 2005 г.). «Учебное пособие по кодированию объемного звука MPEG» . Архивировано из оригинала 24 марта 2008 г. Проверено 9 февраля 2010 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ ИСО (29 января 2007 г.). «ISO/IEC 23003-1:2007. Информационные технологии. Аудиотехнологии MPEG. Часть 1. MPEG Surround» . ИСО . Проверено 24 октября 2009 г.
- ^ Перейти обратно: а б с ИСО (2005). «Аудио MPEG-1/2 в MPEG-4, ISO/IEC 14496-3:2001/Amd 3:2005» . ИСО . Проверено 13 октября 2009 г.
- ^ ИСО (2005). «Кодирование без потерь аудио с передискретизацией, ISO/IEC 14496-3:2001/Amd 6:2005» . ИСО . Проверено 13 октября 2009 г.
- ^ ИСО (2006). «Масштабируемое кодирование без потерь (SLS), ISO/IEC 14496-3:2005/Amd 3:2006» . ИСО . Проверено 13 октября 2009 г.
- ^ ИСО (2008). «Усовершенствованный AAC с малой задержкой, ISO/IEC 14496-3:2005/Amd 9:2008» . ИСО . Проверено 13 октября 2009 г.
- ^ ИСО (2008). «ИСО/МЭК 14496-23:2008, Информационные технологии. Кодирование аудиовизуальных объектов. Часть 23. Символическое представление музыки» . ИСО . Проверено 13 октября 2009 г.
- ^ ИСО (2008). «Соответствие символическому представлению музыки, ISO/IEC 14496-4:2004/Поправка 29:2008» . ИСО . Проверено 13 октября 2009 г.
- ^ ИСО (2012). «ISO/IEC 23003-3:2012 – Информационные технологии. Аудиотехнологии MPEG. Часть 3. Унифицированное кодирование речи и звука» . ИСО . Проверено 07.11.2019 .
- ^ ИСО (2009). «ISO/IEC 14496-3:2009/Поправка 2:2010, Простой профиль ALS и транспортировка SAOC» . ИСО . Проверено 13 октября 2009 г.
- ^ Перейти обратно: а б ISO/IEC JTC1/SC29/WG11 (03.07.2009), ISO/IEC 14496-3:200X/PDAM 2 – Простой профиль ALS и транспортировка SAOC, N10826 , заархивировано из оригинала (DOC) 07.2014 г. 29 , получено 13 октября 2009 г.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Перейти обратно: а б ИСО (2010). «ISO/IEC 23003-2:2010. Информационные технологии. Аудиотехнологии MPEG. Часть 2. Пространственное кодирование аудиообъектов (SAOC)» . ИСО . Проверено 27 декабря 2010 г.
- ^ Документ AES Convention 8099 — новое параметрическое стерео и многоканальное расширение для MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF) , получено 7 ноября 2019 г.
- ^ ISO/IEC JTC1/SC29/WG11 (17 октября 2008 г.), ISO/IEC 14496-3:2005/PDAM 10:200X Профиль HD-AAC, MPEG2008/N10188 , заархивировано из оригинала (DOC) 2014-05- 12 , получено 19 октября 2009 г.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ ИСО (11 сентября 2009 г.). «ISO/IEC 14496-3:2009/Поправка 1:2009 — Профиль HD-AAC и сигнализация MPEG Surround» . ИСО . Проверено 15 октября 2009 г.
- ^ ИСО (08 октября 2009 г.). «ISO/IEC 14496-3:2009/Поправка 2:2010 – Простой профиль ALS и транспортировка SAOC» . ИСО . Проверено 15 октября 2009 г.
- ^ ISO (2004-11-15), ISO/IEC 14496-1, третье издание 15 ноября 2004 г., Часть 1: Системы (PDF) , ISO, заархивировано из оригинала (PDF) 14 июня 2011 г. , получено в 2009 г. 10-14
- ^ Перейти обратно: а б ISO (15 октября 2004 г.), ISO/IEC 13818-7, третье издание, часть 7 – Расширенное кодирование звука (AAC) (PDF) , стр. 32, заархивировано из оригинала (PDF) 13 июля 2011 г. , получено 19 октября 2009 г.
- ^ Перейти обратно: а б ИСО (1997). «ИСО/МЭК 13818-7:1997, Информационные технологии. Общее кодирование движущихся изображений и связанной с ними аудиоинформации. Часть 7. Усовершенствованное кодирование звука (AAC)» . Проверено 19 октября 2009 г.
- ^ Деловая телеграмма (5 января 2009 г.). «Via Licensing объявляет о выдаче лицензии на патентный пул MPEG-4 SLS» . Рейтер. Архивировано из оригинала 4 января 2013 г. Проверено 9 октября 2009 г.
{{cite web}}
:|author=
имеет общее имя ( справка ) - ^ Через Лицензионную корпорацию (12 мая 2009 г.). «Via Licensing объявляет о доступности совместной программы патентного лицензирования MPEG-4 SLS» . Деловой провод . Проверено 9 октября 2009 г.
Внешние ссылки
[ редактировать ]- Apple: MPEG-4: AAC
- «ААК» (VideoLAN WIKI)
- Субъективные тесты прослушивания EBU на аудиокодеках с низким битрейтом. Архивировано 16 февраля 2007 г. на Wayback Machine.
- Радиостанции AAC – Интернет-радиостанции в формате AAC.
- Tuner2 – Каталог радиостанций в формате AAC+ с различным битрейтом
- RadioFeeds UK и Ireland – страница, содержащая множество наземных станций, транслирующих веб-страницы в формате AAC+.
- Результаты теста прослушивания 64 кбит/с Страница сравнения кодеков, включая HE-AAC @64 кбит/с, по результатам тестов прослушивания. (Страница не в сети)
- Официальный веб-сайт MPEG
- RFC 3016 – формат полезной нагрузки RTP для аудио/визуальных потоков MPEG-4
- RFC 3640 — формат полезной нагрузки RTP для транспортировки элементарных потоков MPEG-4.
- RFC 4281 - параметр кодеков для типов мультимедиа «ведро».
- RFC 4337 – Регистрация типа MIME для MPEG-4