MPEG-1
Расширение имени файла |
.mpeg, .mpg, .mpe, .mp1, .mp2, .mp3, .m1v, .m1a, .m2a, .m2v, .mpa, .mpv |
---|---|
Тип интернет-СМИ |
аудио/мпег, видео/мпег |
Разработано | MPEG (часть ISO/IEC JTC 1 ) |
Первоначальный выпуск | 6 декабря 1991 г [ 1 ] |
Последний выпуск | ИСО/МЭК ТР 11172-5:1998 октябрь 1998 г |
Тип формата | аудио, видео, контейнер |
Расширено с | JPEG , H.261 |
Распространено на | MPEG-2 |
Стандартный | ИСО / МЭК 11172 |
Открытый формат ? | Да |
Свободный формат ? | Да |
-1 — стандарт сжатия с потерями видео аудио и . MPEG Он предназначен для сжатия необработанного цифрового видео VHS -качества и звука компакт-диска примерно до 1,5 Мбит/с (коэффициенты сжатия 26:1 и 6:1 соответственно). [ 2 ] без чрезмерной потери качества, что делает практичными видео компакт-диски , цифровое кабельное / спутниковое телевидение и цифровое аудиовещание (DAB). [ 3 ] [ 4 ]
Сегодня MPEG-1 стал наиболее широко совместимым форматом аудио/видео с потерями в мире и используется в большом количестве продуктов и технологий. Возможно, самой известной частью стандарта MPEG-1 является первая версия MP3 представленного им аудиоформата .
Стандарт MPEG-1 опубликован как ISO / IEC 11172 под названием « Информационные технологии — кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с» .
Стандарт состоит из следующих пяти частей : [ 5 ] [ 6 ] [ 7 ] [ 8 ] [ 9 ]
- Системы (совместное хранение и синхронизация видео, аудио и других данных)
- Видео (сжатый видеоконтент)
- Аудио (сжатый аудиоконтент)
- Тестирование соответствия (проверка правильности реализации стандарта)
- Справочное программное обеспечение (пример программного обеспечения, показывающий, как кодировать и декодировать в соответствии со стандартом)
История
[ редактировать ]Предшественником MPEG-1 для кодирования видео был стандарт H.261, разработанный CCITT (теперь известный как ITU-T ). Базовая архитектура, установленная в H.261, представляла собой с компенсацией движения . DCT структуру гибридного видеокодирования [ 10 ] [ 11 ] Он использует макроблоки размером 16 × 16 с оценкой движения на основе блоков в кодере и компенсацией движения с использованием выбранных кодером векторов движения в декодере, с кодированием остаточной разности с использованием дискретного косинусного преобразования (DCT) размера 8 × 8, скалярного квантования. и коды переменной длины (например, коды Хаффмана ) для энтропийного кодирования . [ 12 ] H.261 был первым практическим стандартом кодирования видео, и все описанные в нем элементы конструкции также использовались в MPEG-1. [ 13 ]
основанная на успешном совместном подходе и технологиях сжатия, разработанных Объединенной группой экспертов по фотографии и Экспертной группой CCITT по телефонии (создателями стандарта сжатия изображений JPEG и стандарта H.261 для видеоконференций соответственно), Группа экспертов по движущимся изображениям, (MPEG) рабочая группа была создана в январе 1988 года по инициативе Хироши Ясуды ( Nippon Telegraph and Telephone ) и Леонардо Кьярильоне ( CSELT ). [ 14 ] MPEG был создан для удовлетворения потребности в стандартных форматах видео и аудио, а также для развития H.261 для достижения лучшего качества за счет использования несколько более сложных методов кодирования (например, поддержки более высокой точности векторов движения). [ 3 ] [ 15 ] [ 16 ]
Разработка стандарта MPEG-1 началась в мае 1988 года. Отдельные компании и учреждения представили на оценку четырнадцать предложений по видео и четырнадцати аудиокодекам. Кодеки были тщательно протестированы на предмет вычислительной сложности и субъективного (воспринимаемого человеком) качества при скорости передачи данных 1,5 Мбит/с. Этот конкретный битрейт был выбран для передачи по линиям T-1 / E-1 и как приблизительная скорость передачи данных аудио компакт-дисков . [ 17 ] Кодеки, которые преуспели в этом тестировании, были использованы в качестве основы для стандарта и доработаны, с добавлением дополнительных функций и других улучшений. [ 18 ]
После 20 встреч полной группы в различных городах мира и 4,5 лет разработки и тестирования окончательный стандарт (для частей 1–3) был одобрен в начале ноября 1992 года и опубликован несколько месяцев спустя. [ 19 ] Сообщаемая дата завершения разработки стандарта MPEG-1 сильно различается: практически полный проект стандарта был выпущен в сентябре 1990 года, и с этого момента вносились лишь незначительные изменения. [ 3 ] Проект стандарта был публично доступен для покупки. [ 20 ] Разработка стандарта была завершена на встрече 6 ноября 1992 года. [ 21 ] Группа мультимедийных исследований Беркли Плато разработала декодер MPEG-1 в ноябре 1992 года. [ 22 ] В июле 1990 года, еще до того, как был написан первый проект стандарта MPEG-1, началась работа над вторым стандартом, MPEG-2 . [ 23 ] предназначен для расширения технологии MPEG-1 для обеспечения видео полного вещательного качества (согласно CCIR 601 ) с высокими битрейтами (3–15 Мбит/с) и поддержки чересстрочного видео. [ 24 ] Частично из-за сходства двух кодеков стандарт MPEG-2 обеспечивает полную обратную совместимость с видео MPEG-1, поэтому любой декодер MPEG-2 может воспроизводить видео MPEG-1. [ 25 ]
Примечательно, что стандарт MPEG-1 очень строго определяет битовый поток и функцию декодера, но не определяет, как должно выполняться кодирование MPEG-1, хотя эталонная реализация представлена в ISO/IEC-11172-5. [ 2 ] Это означает, что эффективность кодирования MPEG-1 может сильно различаться в зависимости от используемого кодера и, как правило, означает, что новые кодеры работают значительно лучше, чем их предшественники. [ 26 ] Первые три части (Системы, Видео и Аудио) стандарта ISO/IEC 11172 были опубликованы в августе 1993 года. [ 27 ]
Часть | Число | Первый публичный Дата выпуска (первое издание) |
последний исправление |
Заголовок | Описание |
---|---|---|---|---|---|
Часть 1 | ISO/IEC 11172-1. Архивировано 30 августа 2017 г. на Wayback Machine. | 1993 | 1999 [ 29 ] | Системы | |
Часть 2 | ISO/IEC 11172-2. Архивировано 30 августа 2017 г. на Wayback Machine. | 1993 | 2006 [ 30 ] | Видео | |
Часть 3 | ISO/IEC 11172-3. Архивировано 15 мая 2017 г. на Wayback Machine. | 1993 | 1996 [ 31 ] | Аудио | |
Часть 4 | ISO/IEC 11172-4. Архивировано 30 августа 2017 г. на Wayback Machine. | 1995 | 2007 [ 32 ] | Тестирование на соответствие | |
Часть 5 | ISO/IEC TR 11172-5. Архивировано 30 августа 2017 г. на Wayback Machine. | 1998 | 2007 [ 33 ] | Программное моделирование |
Патенты
[ редактировать ]Из-за своего возраста MPEG-1 больше не защищен какими-либо важными патентами и, таким образом, может использоваться без получения лицензии или уплаты каких-либо сборов. [ 34 ] [ 35 ] [ 36 ] [ 37 ] [ 38 ] В базе данных патентов ISO указан один патент на ISO 11172, номер США 4 472 747, срок действия которого истек в 2003 году. [ 39 ] Почти полный проект стандарта MPEG-1 был общедоступен как ISO CD 11172. [ 20 ] к 6 декабря 1991 года. [ 1 ] Ни статья Kuro5hin от июля 2008 г. «Патентный статус MPEG-1, H.261 и MPEG-2», [ 40 ] ни ветка на gstreamer-devel за август 2008 г. [ 41 ] В списке рассылки был указан один действующий патент MPEG-1 Video и MPEG-1 Audio Layer I/II. В мае 2009 года в списке рассылки Whatwg упоминался патент США № 5 214 678, который, возможно, охватывает MPEG-1 Audio Layer II. [ 42 ] Срок действия этого патента, поданного в 1990 году и опубликованного в 1993 году, истек. [ 43 ]
Полный декодер и кодер MPEG-1 с «звуком уровня III» не мог быть реализован без лицензионных отчислений, поскольку существовали компании, которым требовались патентные сборы за реализацию MPEG-1 Audio Layer III, как обсуждалось в статье о MP3 . Срок действия всех патентов в мире, связанных с MP3, истек 30 декабря 2017 года, что делает этот формат абсолютно бесплатным для использования. [ 44 ] 23 апреля 2017 года Fraunhofer IIS прекратил взимать плату за программу лицензирования MP3 Technicolor за некоторые патенты и программное обеспечение, связанные с MP3. [ 45 ]
Бывшие обладатели патентов
[ редактировать ]Следующие корпорации подали в ISO декларации о том, что они обладают патентами на формат MPEG-1 Video (ISO/IEC-11172-2), хотя срок действия всех таких патентов уже истек. [ 46 ]
- Би-би-си
- Даймлер Бенц АГ
- Фуджицу
- ИБМ
- Мацусита Электрическая Промышленная Компания, Лтд.
- Митсубиси Электрик
- НЭК
- НХК
- Филипс
- Корпорация Пионер
- Квалкомм
- Рико
- Сони
- Техасские инструменты
- Томсон Мультимедиа
- Топпан Печать
- Тошиба
- Виктор Компания Японии
Приложения
[ редактировать ]- Большинство популярных программ для воспроизведения видео включает в себя декодирование MPEG-1, помимо любых других поддерживаемых форматов.
- Популярность аудио MP3 привела к появлению огромной базы оборудования, способного воспроизводить аудио MPEG-1 (все три уровня).
- «Практически все цифровые аудиоустройства » могут воспроизводить звук MPEG-1. [ 47 ] На сегодняшний день продано много миллионов.
- До того, как MPEG-2 получил широкое распространение, многие службы цифрового спутникового/кабельного телевидения использовали исключительно MPEG-1. [ 16 ] [ 26 ]
- Широкая популярность MPEG-2 среди вещательных компаний означает, что MPEG-1 воспроизводится большинством цифровых кабельных и спутниковых приставок , а также цифровых проигрывателей дисков и кассет благодаря обратной совместимости.
- MPEG-1 использовался для полноэкранного видео на Green Book CD-i и Video CD (VCD).
- Стандарт Super Video CD , основанный на VCD, использует исключительно аудио MPEG-1, а также видео MPEG-2.
- Формат DVD-Video в основном использует видео MPEG-2, но поддержка MPEG-1 явно определена в стандарте.
- Стандарт DVD-Video изначально требовал MPEG-1 Audio Layer II для стран PAL, но был изменен, чтобы разрешать диски только AC-3/ Dolby Digital . MPEG-1 Audio Layer II по-прежнему разрешен на DVD, хотя новые расширения формата, такие как MPEG Multichannel , поддерживаются редко.
- Большинство DVD-проигрывателей также поддерживают воспроизведение Video CD и MP3 CD , использующих MPEG-1.
- Международный стандарт цифрового видеовещания (DVB) в основном использует MPEG-1 Audio Layer II и видео MPEG-2.
- Международный стандарт цифрового аудиовещания (DAB) использует исключительно MPEG-1 Audio Layer II из-за его особенно высокого качества, скромных требований к производительности декодера и устойчивости к ошибкам.
- Цифровая компакт-кассета использует PASC (точное адаптивное поддиапазонное кодирование) для кодирования звука. PASC — это ранняя версия MPEG-1 Audio Layer I с фиксированной скоростью передачи данных 384 килобит в секунду.
Часть 1: Системы
[ редактировать ]Часть 1 стандарта MPEG-1 охватывает системы и определена в ISO/IEC-11172-1.
Системы MPEG-1 определяют логическую структуру и методы, используемые для хранения закодированных аудио, видео и других данных в стандартном битовом потоке, а также для поддержания синхронизации между различным содержимым. Этот формат файла специально разработан для хранения на носителях и передачи по каналам связи , которые считаются относительно надежными. Стандарт определяет лишь ограниченную защиту от ошибок, а небольшие ошибки в битовом потоке могут вызвать заметные дефекты.
Эта структура позже была названа программным потоком MPEG : «Дизайн системы MPEG-1 по существу идентичен структуре программного потока MPEG-2». [ 48 ] Эта терминология более популярна, точна (отличает ее от транспортного потока MPEG ) и будет использоваться здесь.
Элементарные потоки, пакеты и ссылки на часы
[ редактировать ]- Элементарные потоки (ES) — это необработанные потоки битов аудио- и видеоданных MPEG-1 (выдаваемые кодером). Эти файлы можно распространять самостоятельно, как в случае с файлами MP3.
- Пакетированные элементарные потоки (PES) — это элементарные потоки , пакетированные в пакеты переменной длины, т. е. разделенные ES на независимые фрагменты, где циклического избыточного кода (CRC) . контрольная сумма к каждому пакету для обнаружения ошибок добавлялась
- Опорный сигнал системной синхронизации (SCR) — это значение синхронизации, хранящееся в 33-битном заголовке каждого PES с частотой/точностью 90 кГц, с дополнительным 9-битным расширением, в котором хранятся дополнительные данные синхронизации с точностью 27 МГц. [ 49 ] [ 50 ] Они вводятся кодером, полученным из системных часов времени (STC). Однако одновременно кодированные аудио- и видеопотоки не будут иметь одинаковые значения SCR из-за буферизации, кодирования, дрожания и других задержек.
Программные потоки
[ редактировать ]Программные потоки (PS) связаны с объединением нескольких пакетированных элементарных потоков (обычно только одного аудио- и видеоPES) в один поток, обеспечивая одновременную доставку и поддержание синхронизации. Структура PS известна как мультиплекс или формат контейнера .
Временные метки представления (PTS) существуют в PS для исправления неизбежного несоответствия между значениями SCR аудио и видео (коррекция временной развертки). Значения PTS 90 кГц в заголовке PS сообщают декодеру, какие значения SCR видео соответствуют каким значениям SCR аудио. [ 49 ] PTS определяет, когда отображать часть программы MPEG, а также используется декодером для определения того, когда данные могут быть удалены из буфера . [ 51 ] Видео или аудио будут задержаны декодером до тех пор, пока не прибудет соответствующий сегмент другого и не будет декодирован.
Обработка PTS может быть проблематичной. Декодеры должны принимать несколько программных потоков , которые были объединены (соединены последовательно). Это приводит к тому, что значения PTS в середине видео сбрасываются до нуля, а затем снова начинают увеличиваться. Такие несоответствия переноса PTS могут вызвать проблемы синхронизации, которые должны быть специально обработаны декодером.
Кроме того, для B-кадров требуются временные метки декодирования (DTS). При использовании B-кадров в видеопотоке соседние кадры должны кодироваться и декодироваться вне порядка (переупорядоченные кадры). DTS очень похож на PTS, но вместо того, чтобы просто обрабатывать последовательные кадры, он содержит правильные временные метки, сообщающие декодеру, когда декодировать и отображать следующий B-кадр (типы кадров описаны ниже) перед его привязкой (P - или я-) кадр. Без B-кадров в видео значения PTS и DTS идентичны. [ 52 ]
Мультиплексирование
[ редактировать ]Для генерации PS мультиплексор будет чередовать (два или более) пакетированных элементарных потоков. Это сделано для того, чтобы пакеты одновременных потоков могли передаваться по одному и тому же каналу и гарантированно прибудут в декодер в одно и то же время. Это случай мультиплексирования с временным разделением .
Определить, сколько данных из каждого потока должно находиться в каждом чередующемся сегменте (размер чередования), сложно, но это важное требование. Неправильное чередование приведет к опустошению или переполнению буфера, поскольку приемник получит больше одного потока, чем он может сохранить (например, аудио), прежде чем он получит достаточно данных для декодирования другого одновременного потока (например, видео). MPEG Средство проверки буферизации видео (VBV) помогает определить, может ли мультиплексированный PS быть декодирован устройством с заданной скоростью передачи данных и размером буфера. [ 53 ] Это обеспечивает обратную связь с мультиплексором и кодировщиком, чтобы они могли изменить размер мультиплекса или отрегулировать битрейт по мере необходимости для обеспечения соответствия.
Часть 2: Видео
[ редактировать ]Часть 2 стандарта MPEG-1 касается видео и определена в ISO/IEC-11172-2. На дизайн сильно повлиял H.261 .
MPEG-1 Video использует методы перцепционного сжатия, чтобы значительно снизить скорость передачи данных, необходимую для видеопотока. Он уменьшает или полностью отбрасывает информацию в определенных частотах и областях изображения, которые человеческий глаз имеет ограниченную способность полностью воспринимать. Он также использует временную (по времени) и пространственную (по всему изображению) избыточность, обычную для видео, для достижения лучшего сжатия данных, чем это было бы возможно в противном случае. (См.: Сжатие видео )
Цветовое пространство
[ редактировать ]Перед кодированием видео в MPEG-1 цветовое пространство преобразуется в Y’CbCr (Y’=Luma, Cb=Chroma Blue, Cr=Chroma Red). Яркость (яркость, разрешение) хранится отдельно от цветности (цвет, оттенок, фаза) и даже разделяется на красный и синий компоненты.
Цветность также подвергается субдискретизации до 4:2:0 , что означает, что она уменьшается до половины разрешения по вертикали и до половины разрешения по горизонтали, т. е. всего до одной четверти количества семплов, используемых для компонента яркости видео. [ 2 ] Такое использование более высокого разрешения для некоторых цветовых компонентов по своей концепции аналогично шаблонному фильтру Байера , который обычно используется для датчика захвата изображения в цифровых цветных камерах. Поскольку человеческий глаз гораздо более чувствителен к небольшим изменениям яркости (компонент Y), чем к цвету (компоненты Cr и Cb), субдискретизация цветности является очень эффективным способом уменьшить объем видеоданных, которые необходимо сжать. Однако на видео с мелкой детализацией (высокая пространственная сложность ) это может проявляться в виде артефактов цветности . По сравнению с другими артефактами цифрового сжатия эта проблема очень редко вызывает раздражение. Из-за субдискретизации видео Y’CbCr 4:2:0 обычно сохраняется с использованием четных размеров ( делящихся на 2 по горизонтали и вертикали).
Цвет Y’CbCr часто неофициально называют YUV для упрощения обозначения, хотя этот термин более правильно применим к несколько другому цветовому формату. Точно так же термины яркость и цветность часто используются вместо (более точных) терминов яркость и цветность.
Разрешение/битрейт
[ редактировать ]MPEG-1 поддерживает разрешение до 4095×4095 (12 бит) и скорость передачи данных до 100 Мбит/с. [ 16 ]
Видео MPEG-1 чаще всего можно увидеть с разрешением исходного входного формата (SIF): 352×240, 352×288 или 320×240. Эти относительно низкие разрешения в сочетании со скоростью передачи данных менее 1,5 Мбит/с составляют так называемый битовый поток с ограниченными параметрами (CPB), позже переименованный в профиль «Низкоуровневый» (LL) в MPEG-2. Это минимальные характеристики видео любой декодер , которые должен обрабатывать , чтобы считаться совместимым с MPEG-1 . Это было выбрано, чтобы обеспечить хороший баланс между качеством и производительностью, позволяя использовать достаточно недорогое оборудование того времени. [ 3 ] [ 16 ]
Типы кадров/изображений/блоков
[ редактировать ]MPEG-1 имеет несколько типов кадров/изображений, которые служат разным целям. Самый важный, но при этом самый простой — это I-frame .
I-кадры
[ редактировать ]«I-frame» — это аббревиатура от « Intra-frame », названная так потому, что их можно декодировать независимо от любых других кадров. Их также можно назвать I-изображениями или ключевыми кадрами из-за их функции, схожей с ключевыми кадрами, используемыми в анимации. I-кадры можно считать фактически идентичными базовым изображениям JPEG . [ 16 ]
Высокоскоростной поиск по видео MPEG-1 возможен только до ближайшего I-кадра. При обрезке видео невозможно начать воспроизведение сегмента видео до первого I-кадра в сегменте (по крайней мере, без перекодирования с интенсивным использованием вычислений). По этой причине в приложениях редактирования используются видео MPEG только с I-кадром.
Сжатие только I-кадров происходит очень быстро, но создает файлы очень большого размера: в 3 раза (или более) больше, чем обычно закодированное видео MPEG-1, в зависимости от того, насколько сложным во времени является конкретное видео. [ 3 ] Видео MPEG-1 только с I-кадром очень похоже на видео MJPEG . Настолько, что можно осуществить очень быстрое и теоретически без потерь (реально есть ошибки округления) преобразование из одного формата в другой при условии соблюдения пары ограничений (цветовое пространство и матрица квантования) при создании битовый поток. [ 54 ]
Длина между I-кадрами известна как размер группы изображений (GOP). В MPEG-1 чаще всего используется размер GOP 15–18. т.е. 1 I-кадр на каждые 14-17 не-I-кадров (некоторая комбинация P- и B-кадров). В более интеллектуальных кодировщиках размер GOP выбирается динамически, вплоть до заранее установленного максимального предела. [ 16 ]
Ограничения наложены на максимальное количество кадров между I-кадрами из-за комплексирования декодирования, размера буфера декодера, времени восстановления после ошибок данных, способности поиска и накопления ошибок IDCT в низкоточных реализациях, наиболее распространенных в аппаратных декодерах (см. IEEE -1180).
P-кадры
[ редактировать ]«P-кадр» — это аббревиатура от «Предсказанный кадр». Их также можно назвать кадрами с прямым предсказанием или интеркадрами (B-кадры также являются интеркадрами).
P-кадры существуют для улучшения сжатия за счет использования временной (с течением времени) избыточности видео. P-кадры сохраняют только отличие изображения от кадра (I-кадра или P-кадра), непосредственно предшествующего ему (этот опорный кадр также называется опорным кадром ).
Разница между P-кадром и его опорным кадром вычисляется с использованием векторов движения в каждом макроблоке кадра (см. ниже). Такие данные вектора движения будут внедрены в P-кадр для использования декодером.
P-кадр может содержать любое количество блоков внутреннего кодирования (DCT и квантованных) в дополнение к любым блокам прямого прогнозирования (векторы движения). [ 55 ]
Если видео резко меняется от одного кадра к другому (например, в результате обрезки ), более эффективно закодировать его как I-кадр.
B-кадры
[ редактировать ]«B-кадр» означает «двунаправленный кадр» или «кадр с двунаправленным прогнозированием». Их также можно назвать кадрами с обратным предсказанием или B-изображениями. B-кадры очень похожи на P-кадры, за исключением того, что они могут делать прогнозы, используя как предыдущие, так и будущие кадры (т.е. два опорных кадра).
Поэтому игроку необходимо сначала декодировать следующий I- или P-привязочный кадр последовательно после B-кадра, прежде чем B-кадр сможет быть декодирован и отображен. Это означает, что декодирование B-кадров требует больших буферов данных и приводит к увеличению задержки как при декодировании, так и во время кодирования. Это также требует наличия функции меток времени декодирования (DTS) в потоке контейнера/системы (см. выше). По существу, B-кадры уже давно являются предметом многочисленных споров, их часто избегают в видео, а иногда они не полностью поддерживаются аппаратными декодерами.
Никакие другие кадры не прогнозируются из B-кадра. По этой причине при необходимости можно вставить B-кадр с очень низким битрейтом, чтобы контролировать битрейт. Если бы это было сделано с P-кадром, будущие P-кадры были бы предсказаны на его основе и снизили бы качество всей последовательности. Однако аналогичным образом будущий P-кадр должен по-прежнему кодировать все изменения между ним и предыдущим I- или P-якорным кадром. B-кадры также могут быть полезны в видеороликах, где фон за объектом раскрывается на протяжении нескольких кадров, или при плавных переходах, например при смене сцен. [ 3 ] [ 16 ]
B-кадр может содержать любое количество блоков внутреннего кодирования и блоков прямого предсказания в дополнение к блокам обратного предсказания или двунаправленно предсказанных блоков. [ 16 ] [ 55 ]
D-рамки
[ редактировать ]MPEG-1 имеет уникальный тип кадра, которого нет в более поздних видеостандартах. «D-кадры» или DC-изображения представляют собой независимо закодированные изображения (внутрикадры), которые были закодированы только с использованием коэффициентов преобразования постоянного тока (коэффициенты AC удаляются при кодировании D-кадров - см. DCT ниже) и, следовательно, имеют очень низкое качество. На D-кадры никогда не ссылаются I-, P- или B-кадры. D-кадры используются только для быстрого предварительного просмотра видео, например, при поиске видео на высокой скорости. [ 3 ]
При наличии оборудования декодирования с умеренной производительностью быстрый предварительный просмотр может быть достигнут путем декодирования I-кадров вместо D-кадров. Это обеспечивает более высокое качество предварительного просмотра, поскольку I-кадры содержат коэффициенты переменного тока, а также коэффициенты постоянного тока. Если кодер может предположить, что в декодерах доступна возможность быстрого декодирования I-кадров, он может сэкономить биты, не отправляя D-кадры (таким образом улучшая сжатие видеоконтента). По этой причине D-кадры редко используются при кодировании видео MPEG-1, а функция D-кадра не была включена ни в какие более поздние стандарты кодирования видео.
Макроблоки
[ редактировать ]MPEG-1 оперирует видео серией блоков 8×8 для квантования. Однако, чтобы уменьшить скорость передачи данных, необходимую для векторов движения, и поскольку цветность (цвет) субдискретизируется в 4 раза, каждая пара (красных и синих) блоков цветности соответствует 4 различным блокам яркости. То есть на 4 блока яркости размером 8x8 приходится один блок Cb 8x8 и один блок Cr 8x8. Этот набор из 6 блоков с разрешением изображения 16×16 обрабатывается вместе и называется макроблоком .
Все эти блоки 8x8 независимо проходят через DCT и квантование.
Макроблок — это наименьшая независимая единица (цветного) видео. Векторы движения (см. ниже) работают исключительно на уровне макроблоков.
Если высота или ширина видео не кратна 16 , полные строки и полные столбцы макроблоков все равно необходимо кодировать и декодировать, чтобы заполнить изображение (хотя дополнительные декодированные пиксели не отображаются).
Векторы движения
[ редактировать ]Чтобы уменьшить временную избыточность в видео, обновляются только те блоки, которые изменяются (до максимального размера GOP). Это известно как условное пополнение. Однако само по себе это не очень эффективно. Движение объектов и/или камеры может привести к необходимости обновления больших частей кадра, даже если изменилось только положение ранее закодированных объектов. Посредством оценки движения кодер может компенсировать это движение и удалить большое количество избыточной информации.
Кодер сравнивает текущий кадр с соседними частями видео из опорного кадра (предыдущего I- или P-кадра) в виде ромба до (специфического для кодера) предопределенного предела радиуса из области текущего макроблока. Если совпадение найдено, . е. вектор движения только направление и расстояние ( т в межкадр (P- или B-кадр) необходимо закодировать ) от предыдущей области видео до текущего макроблока. Обратный процесс, выполняемый декодером для восстановления изображения, называется компенсацией движения .
Однако предсказанный макроблок редко идеально соответствует текущей картине. Разница между предполагаемой областью совпадения и реальным кадром/макроблоком называется ошибкой прогнозирования. Чем больше величина ошибки прогнозирования, тем больше данных необходимо дополнительно закодировать в кадре. Для эффективного сжатия видео очень важно, чтобы кодер мог эффективно и точно выполнять оценку движения.
Векторы движения записывают расстояние между двумя областями на экране в зависимости от количества пикселей (также называемых пелами). В видео MPEG-1 используется точность вектора движения (MV) в половину пикселя или полпикселя. Чем выше точность MV, тем точнее будет совпадение и тем эффективнее сжатие. Однако есть компромиссы в пользу более высокой точности. Более высокая точность MV приводит к использованию большего объема данных для представления MV, поскольку в кадре должны храниться большие числа для каждого отдельного MV, увеличению сложности кодирования, поскольку как для кодера, так и для декодера требуются более высокие уровни интерполяции в макроблоке. и убывающая отдача (минимальная прибыль) с более точными MV. Точность в полпикселя была выбрана как идеальный компромисс на тот момент времени. (См.: qpel )
Поскольку соседние макроблоки, вероятно, будут иметь очень похожие векторы движения, эта избыточная информация может быть достаточно эффективно сжата путем хранения в кодировке DPCM . Только (меньшая) разница между MV для каждого макроблока должна быть сохранена в конечном потоке битов.
P-кадры имеют один вектор движения на макроблок относительно предыдущего опорного кадра. Однако B-кадры могут использовать два вектора движения; один из предыдущего опорного кадра и один из будущего опорного кадра. [ 55 ]
Частичные макроблоки и черные границы/полосы, закодированные в видео, которые не попадают точно на границу макроблока, нарушают прогнозирование движения. Информация о заполнении/границе блока предотвращает точное совпадение макроблока с любой другой областью видео, и поэтому для каждого из нескольких десятков частичных макроблоков вдоль границы экрана необходимо кодировать значительно большую информацию об ошибке прогнозирования. Кодирование и квантование DCT (см. ниже) также не столь эффективны, когда в блоке имеется большой/резкий контраст изображения.
Еще более серьезная проблема существует с макроблоками, которые содержат значительный случайный краевой шум , когда изображение становится (обычно) черным. Все вышеперечисленные проблемы также применимы к краевому шуму. Кроме того, добавленную случайность просто невозможно существенно сжать. Все эти эффекты существенно снижают качество (или увеличивают битрейт) видео.
ДКП
[ редактировать ]Каждый блок 8×8 кодируется сначала применением прямого дискретного косинусного преобразования (FDCT), а затем процесса квантования. Процесс FDCT (сам по себе) теоретически не имеет потерь и может быть отменен путем применения обратного DCT ( IDCT ) для воспроизведения исходных значений (при отсутствии каких-либо ошибок квантования и округления). В действительности существуют некоторые (иногда большие) ошибки округления, вызванные как квантованием в кодере (как описано в следующем разделе), так и ошибкой аппроксимации IDCT в декодере. Минимально допустимая точность аппроксимации IDCT декодера определяется стандартом ISO/IEC 23002-1. (До 2006 года это было указано в стандарте IEEE 1180–1990 .)
Процесс FDCT преобразует блок 8×8 несжатых значений пикселей (значений яркости или цветового различия) в индексированный массив 8×8 значений частотных коэффициентов . Одним из них является (статистически высокая дисперсия) «коэффициент постоянного тока», который представляет собой среднее значение всего блока 8×8. Остальные 63 коэффициента представляют собой статистически меньшие «коэффициенты переменного тока», которые имеют положительные или отрицательные значения, каждое из которых представляет синусоидальные отклонения от значения плоского блока, представленного коэффициентом постоянного тока.
Пример закодированного блока FDCT 8×8:
Поскольку значение коэффициента DC статистически коррелирует от одного блока к другому, оно сжимается с использованием кодирования DPCM . В конечном потоке битов должна быть представлена только (меньшая) разница между каждым значением DC и значением коэффициента DC в блоке слева от него.
Кроме того, преобразование частоты, выполняемое с помощью DCT, обеспечивает функцию статистической декорреляции для эффективной концентрации сигнала на меньшем количестве значений с высокой амплитудой перед применением квантования (см. ниже).
Квантование
[ редактировать ]Квантование , по сути, представляет собой процесс снижения точности сигнала путем его деления на более крупный шаг и округления до целочисленного значения (т. е. нахождения ближайшего кратного и отбрасывания остатка).
Квантизатор уровня кадра представляет собой число от 0 до 31 (хотя кодировщики обычно пропускают/отключают некоторые крайние значения), которое определяет, сколько информации будет удалено из данного кадра. Квантизатор уровня кадра обычно либо динамически выбирается кодировщиком для поддержания определенного битрейта, заданного пользователем, либо (гораздо реже) задается пользователем напрямую.
«Матрица квантования» — это строка из 64 чисел (в диапазоне от 0 до 255), которая сообщает кодировщику, насколько относительно важна или неважна каждая часть визуальной информации. Каждое число в матрице соответствует определенной частотной составляющей видеоизображения.
Пример матрицы квантования:
Квантование выполняется путем взятия каждого из 64 значений частоты блока DCT, деления их на квантователь уровня кадра, а затем деления их на соответствующие значения в матрице квантования. Наконец, результат округляется в меньшую сторону. Это существенно уменьшает или полностью исключает информацию в некоторых частотных компонентах изображения. Обычно высокочастотная информация менее важна визуально, поэтому высокие частоты квантоваются гораздо сильнее (резко уменьшаются). MPEG-1 фактически использует две отдельные матрицы квантования: одну для внутриблоков (I-блоки) и одну для межблоков (P- и B-блоки), поэтому квантование разных типов блоков может выполняться независимо и, следовательно, более эффективно. . [ 3 ]
значительное количество коэффициентов AC Этот процесс квантования обычно сводит к нулю (известное как разреженные данные), которые затем можно более эффективно сжимать с помощью энтропийного кодирования (сжатие без потерь) на следующем этапе.
Пример квантованного блока DCT:
Квантование исключает большой объем данных и является основным этапом обработки с потерями при кодировании видео MPEG-1. Это также основной источник большинства артефактов сжатия видео MPEG-1 , таких как блочность , цветовые полосы , шум , звон , обесцвечивание и т. д. Это происходит, когда видео кодируется с недостаточным битрейтом, и поэтому кодировщику приходится использовать квантователи высокого уровня кадра ( сильное квантование ) на протяжении большей части видео.
Энтропийное кодирование
[ редактировать ]Некоторые этапы кодирования видео MPEG-1 выполняются без потерь, то есть при декодировании они будут обратными для получения точно таких же (исходных) значений. Поскольку эти этапы сжатия данных без потерь не добавляют шум или иным образом не изменяют содержимое (в отличие от квантования), его иногда называют бесшумным кодированием . [ 47 ] оно известно как энтропийное кодирование Поскольку сжатие без потерь направлено на устранение как можно большей избыточности, в области теории информации .
Коэффициенты квантованных блоков DCT стремятся к нулю ближе к правому нижнему углу. Максимального сжатия можно достичь за счет зигзагообразного сканирования блока DCT, начиная с верхнего левого угла, и используя методы кодирования по длине.
Коэффициенты постоянного тока и векторы движения кодируются DPCM .
Кодирование длин серий (RLE) — это простой метод сжатия повторений. Последовательную строку символов, независимо от ее длины, можно заменить несколькими байтами, отметив, какое значение повторяется и сколько раз. Например, если кто-то скажет «пять девяток», вы поймете, что он имеет в виду число: 99999.
RLE особенно эффективен после квантования, поскольку значительная часть коэффициентов AC теперь равна нулю (так называемые разреженные данные) и может быть представлена всего парой байтов. Это хранится в специальной двумерной таблице Хаффмана, которая кодирует длину серии и символ окончания серии.
Кодирование Хаффмана — очень популярный и относительно простой метод энтропийного кодирования, используемый в видео MPEG-1 для уменьшения размера данных. Данные анализируются, чтобы найти строки, которые часто повторяются. Затем эти строки помещаются в специальную таблицу, где наиболее часто повторяющимся данным присваивается кратчайший код. Благодаря этой форме сжатия данные остаются как можно меньшими. [ 47 ] После создания таблицы эти строки в данных заменяются их (гораздо меньшими) кодами, которые ссылаются на соответствующую запись в таблице. Декодер просто обращает этот процесс для получения исходных данных.
Это последний этап процесса кодирования видео, поэтому результат кодирования Хаффмана известен как «битовый поток» видео MPEG-1.
Конфигурации GOP для конкретных приложений
[ редактировать ]I-кадры хранят полную информацию о кадре внутри кадра и поэтому подходят для произвольного доступа. P-кадры обеспечивают сжатие с использованием векторов движения относительно предыдущего кадра (I или P). B-кадры обеспечивают максимальное сжатие, но для вычислений требуют как предыдущий, так и следующий кадр. Следовательно, обработка B-кадров требует большего буфера на декодированной стороне. Конфигурацию группы изображений (GOP) следует выбирать исходя из этих факторов. Последовательности только I-кадров обеспечивают наименьшее сжатие, но полезны для произвольного доступа, FF/FR и возможности редактирования. Последовательности I- и P-кадров обеспечивают умеренное сжатие, но добавляют определенную степень произвольного доступа и функциональность FF/FR. Последовательности I-, P- и B-кадров обеспечивают очень высокую степень сжатия, но также значительно увеличивают задержку кодирования/декодирования. Поэтому такие конфигурации не подходят для приложений видеотелефонии или видеоконференций.
Типичная скорость передачи данных I-кадра составляет 1 бит на пиксель, P-кадра — 0,1 бит на пиксель, а B-кадра — 0,015 бита на пиксель. [ 56 ]
Часть 3: Аудио
[ редактировать ]Часть 3 стандарта MPEG-1 касается звука и определена в ISO/IEC-11172-3.
MPEG-1 Audio использует психоакустику , чтобы значительно снизить скорость передачи данных, необходимую для аудиопотока. Он уменьшает или полностью отбрасывает определенные части звука, которые, по его мнению, не слышит человеческое ухо , либо потому, что они находятся на частотах, на которых ухо имеет ограниченную чувствительность, либо маскируются другими (обычно более громкими) звуками. [ 57 ]
Режимы кодирования канала:
- Мононуклеоз
- Суставное стерео – интенсивность закодирована
- Совместное стерео – кодирование M/S (только Layer III)
- Стерео
- Двойной (два некоррелированных моноканала)
- 32000 Гц
- 44100 Гц
- 48000 Гц
Битрейт :
- Уровень I: 32, 64, 96, 128, 160, 192, 224, 256, 288, 320, 352, 384, 416 и 448 кбит/с. [ 58 ]
- Уровень II: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 и 384 кбит/с.
- Уровень III: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 и 320 кбит/с.
MPEG-1 Audio разделен на 3 слоя. Каждый более высокий уровень является более сложным в вычислительном отношении и, как правило, более эффективным при более низких битрейтах, чем предыдущий. [ 16 ] Уровни полуобратно совместимы, поскольку технологии повторного использования более высоких уровней реализуются нижними уровнями. «Полный» декодер уровня II также может воспроизводить звук уровня I, но не звук уровня III, хотя не все проигрыватели более высокого уровня являются «полными». [ 57 ]
Слой I
[ редактировать ]MPEG-1 Audio Layer I — это упрощенная версия MPEG-1 Audio Layer II. [ 18 ] Уровень I использует меньший размер кадра (384 семпла) для очень низкой задержки и более высокого разрешения. [ 26 ] Это выгодно для таких приложений, как телеконференции, студийный монтаж и т. д. Он имеет меньшую сложность, чем уровень II, и облегчает кодирование в реальном времени на доступном оборудовании c. 1990 . [ 47 ]
использовался на Philips несуществующей Слой I в свое время получил ограниченное распространение и, в первую очередь , цифровой компактной кассете со скоростью передачи данных 384 кбит / с. [ 2 ] Благодаря существенному повышению производительности цифровой обработки с момента ее появления, Layer I быстро стал ненужным и устаревшим.
Аудиофайлы уровня I обычно используют расширение «.mp1» или иногда «.m1a».
Слой II
[ редактировать ]MPEG-1 Audio Layer II (первая версия MP2, часто неофициально называемая MUSICAM) [ 57 ] — это аудиоформат с потерями, предназначенный для обеспечения высокого качества стереозвука со скоростью около 192 кбит/с. [ 59 ] Декодирование звука MP2 вычислительно проще по сравнению с MP3, AAC и т. д.
История/МУЗИКАМ
[ редактировать ]MUSICAM ( адаптированный шаблон маскировки Universal Subband Integrated Coding And Multiplexing MPEG-1 Audio Layer II был создан на основе аудиокодека ), разработанного Центром социальных исследований телевидения и телекоммуникаций (CCETT), Philips и Institut für Rundfunktechnik (IRT/CNET). ) [ 16 ] [ 18 ] [ 60 ] в рамках EUREKA 147 общеевропейской межправительственной инициативы по исследованиям и разработкам по развитию цифрового аудиовещания.
Большинство ключевых функций MPEG-1 Audio были напрямую унаследованы от MUSICAM, включая банк фильтров, обработку во временной области, размеры аудиокадров и т. д. Однако были внесены улучшения, и фактический алгоритм MUSICAM не использовался в окончательной версии MPEG-1. Стандарт аудио Layer II. Широкое использование термина MUSICAM для обозначения уровня II совершенно неверно и не рекомендуется как по техническим, так и по юридическим причинам. [ 57 ]
Технические детали
[ редактировать ]MP2 — это кодер во временной области. Он использует 32-поддиапазонный многофазный фильтр с малой задержкой для частотно-временного отображения; наличие перекрывающихся диапазонов (т.е. многофазных) для предотвращения наложения псевдонимов. [ 61 ] Психоакустическая модель основана на принципах слуховой маскировки , одновременного маскирующего воздействия и абсолютного порога слышимости (АТН). Размер кадра уровня II фиксирован и составляет 1152 выборки (коэффициента).
Временная область относится к тому, как анализ и квантование выполняются на коротких дискретных выборках/фрагментах звукового сигнала. Это обеспечивает низкую задержку, поскольку перед кодированием анализируется лишь небольшое количество сэмплов, в отличие от кодирования в частотной области (например, MP3), при котором необходимо анализировать во много раз больше семплов, прежде чем он сможет решить, как преобразовать и вывести закодированный звук. Это также обеспечивает более высокую производительность при обработке сложных, случайных и кратковременных импульсов (таких как ударные инструменты и аплодисменты), позволяя избежать таких артефактов, как предварительное эхо.
Банк фильтров из 32 поддиапазонов возвращает 32 амплитудных коэффициента , по одному для каждой полосы частот/сегмента звука одинакового размера, ширина которого составляет около 700 Гц (в зависимости от частоты дискретизации звука). Затем кодер использует психоакустическую модель, чтобы определить, какие поддиапазоны содержат менее важную аудиоинформацию и, следовательно, где квантование будет неслышимым или, по крайней мере, гораздо менее заметным. [ 47 ]
Психоакустическая модель применяется с использованием 1024-точечного быстрого преобразования Фурье (БПФ). Из 1152 выборок на кадр при этом анализе игнорируются 64 выборки в верхней и нижней части частотного диапазона. Вероятно, они недостаточно значительны, чтобы изменить результат. Психоакустическая модель использует эмпирически определенную модель маскировки, чтобы определить, какие поддиапазоны вносят больший вклад в порог маскировки и сколько шума квантования каждый может содержать, не будучи воспринимаемым. Любые звуки ниже абсолютного порога слышимости (АТН) полностью игнорируются. Доступные биты затем соответственно назначаются каждому поддиапазону. [ 57 ] [ 61 ]
Обычно поддиапазоны менее важны, если они содержат более тихие звуки (меньший коэффициент), чем соседний (т.е. схожий по частоте) поддиапазон с более громкими звуками (больший коэффициент). Кроме того, «шумовые» компоненты обычно обладают более значительным маскирующим эффектом, чем «тональные». [ 60 ]
Точность менее значимых поддиапазонов снижается за счет квантования. По сути, это предполагает сжатие частотного диапазона (амплитуда коэффициента), т.е. повышение уровня шума. Затем вычисляется коэффициент усиления, который декодер будет использовать для повторного расширения каждого поддиапазона до надлежащего частотного диапазона. [ 62 ] [ 63 ]
Уровень II также может дополнительно использовать стереокодирование интенсивности , форму совместного стерео. Это означает, что частоты выше 6 кГц обоих каналов объединяются/смикшируются в один единственный (моно) канал, но информация «побочного канала» об относительной интенсивности (объем, амплитуда) каждого канала сохраняется и кодируется в битовый поток отдельно. При воспроизведении один канал воспроизводится через левый и правый динамики, при этом информация об интенсивности применяется к каждому каналу, чтобы создать иллюзию стереозвука. [ 47 ] [ 60 ] Этот трюк восприятия известен как «стерео-нерелевантность». Это может позволить дальнейшее снижение битрейта аудио без заметной потери точности, но обычно не используется с более высокими битрейтами, поскольку не обеспечивает очень высокого качества (прозрачного) звука. [ 47 ] [ 61 ] [ 64 ] [ 65 ]
Качество
[ редактировать ]Субъективное тестирование звука, проведенное экспертами в наиболее критических условиях, когда-либо проводившихся, показало, что MP2 обеспечивает прозрачное сжатие звука со скоростью 256 кбит/с для 16-битного звука компакт-диска с частотой 44,1 кГц с использованием самой ранней эталонной реализации (более поздние кодеры, по-видимому, должны работать еще лучше). . [ 2 ] [ 60 ] [ 61 ] [ 66 ] Эта (приблизительно) степень сжатия 1:6 для аудио компакт-дисков особенно впечатляет, поскольку она довольно близка к предполагаемому верхнему пределу перцептивной энтропии , чуть более 1:8. [ 67 ] [ 68 ] Достижение гораздо более высокого сжатия просто невозможно без отбрасывания некоторой воспринимаемой информации.
MP2 остается предпочтительным стандартом кодирования звука с потерями из-за его особенно высоких характеристик аудиокодирования для важных аудиоматериалов, таких как кастаньеты, симфонический оркестр, мужские и женские голоса, а также особенно сложных и высокоэнергетических переходных процессов (импульсов), таких как ударные звуки: треугольник, колокольчик и аудитория. аплодисменты. [ 26 ] Более поздние испытания показали, что MPEG Multichannel (на основе MP2), несмотря на то, что ему мешает худший матричный режим (ради обратной совместимости), [ 2 ] [ 61 ] скорости лишь немного ниже, чем у гораздо более поздних аудиокодеков, таких как Dolby Digital (AC-3) и Advanced Audio Coding (AAC) (в основном в пределах погрешности, а в некоторых случаях существенно превосходят, например, при аплодисментах аудитории). [ 69 ] [ 70 ] Это одна из причин того, что аудио MP2 продолжает широко использоваться. Однако проверочные тесты MPEG-2 AAC Stereo пришли к совершенно иному выводу: они показали, что AAC обеспечивает превосходную производительность по сравнению с MP2 при вдвое меньшей скорости передачи данных. [ 71 ] Причина этого несоответствия как с предыдущими, так и с более поздними тестами не ясна, но, как ни странно, в последнем тесте заметно отсутствует образец аплодисментов.
Аудиофайлы уровня II обычно используют расширение «.mp2» или иногда «.m2a».
Слой III
[ редактировать ]MPEG-1 Audio Layer III (первая версия MP3 ) — это аудиоформат с потерями, разработанный для обеспечения приемлемого качества со скоростью около 64 кбит/с для монофонического звука по одноканальным ( BRI ) каналам ISDN и 128 кбит/с для стереозвука. .
История/АСПЭК
[ редактировать ]MPEG-1 Audio Layer III был создан на основе кодека адаптивного спектрально-перцептивного энтропийного кодирования (ASPEC), разработанного Фраунгофером в рамках EUREKA 147 общеевропейской межправительственной инициативы по исследованиям и разработкам для развития цифрового аудиовещания. ASPEC был адаптирован для соответствия модели уровня II (размер кадра, банк фильтров, БПФ и т. д.) и стал уровнем III. [ 18 ]
ASPEC сам по себе был основан на множественном адаптивном спектральном кодировании звука (MSC) Э. Ф. Шредера , Оптимальном кодировании в частотной области (OCF) ( докторская диссертация Карлхайнца Бранденбурга в Университете Эрланген-Нюрнберг) , Кодировании перцептивного преобразования (PXFM) Дж. Д. Джонстона в AT&T Bell Labs и преобразование кодирования аудиосигналов Ю. Маье и Дж. Пети в Institut für Rundfunktechnik (IRT/CNET). [ 72 ]
Технические детали
[ редактировать ]звука в частотной области MP3 — это кодировщик преобразования . Несмотря на то, что MP3 использует некоторые функции нижнего уровня, он сильно отличается от MP2.
MP3 работает с 1152 выборками, как и MP2, но для анализа необходимо взять несколько кадров, прежде чем обработка и квантование в частотной области (MDCT) станут эффективными. Он выводит переменное количество выборок, используя битовый буфер для включения кодирования с переменной скоростью передачи данных (VBR), сохраняя при этом выходные кадры размера выборки 1152. Это приводит к значительно более длительной задержке перед выводом, в результате чего MP3 считается непригодным для студийных приложений, где необходимо выполнять редактирование или другую обработку. [ 61 ]
MP3 не использует набор полифазных фильтров с 32 поддиапазонами, вместо этого просто используется 18-точечное преобразование MDCT на каждом выходе для разделения данных на 576 частотных компонентов и их обработки в частотной области. [ 60 ] Эта дополнительная степень детализации позволяет MP3 иметь гораздо более точную психоакустическую модель и более тщательно применять соответствующее квантование к каждой полосе, обеспечивая гораздо лучшую производительность при низком битрейте.
Обработка в частотной области также накладывает некоторые ограничения, приводя к тому, что временное разрешение в 12 или 36 раз хуже, чем на уровне II. Это вызывает артефакты квантования из-за переходных звуков, таких как ударные звуки и другие высокочастотные события, которые распространяются в большем окне. Это приводит к слышимому размытию и опережающему эхо . [ 61 ] В MP3 используются процедуры обнаружения упреждающего эха и кодирование VBR, что позволяет временно увеличивать битрейт во время сложных фрагментов в попытке уменьшить этот эффект. Он также может переключаться между обычным окном квантования из 36 выборок и вместо этого использовать 3 × короткие окна по 12 выборок, чтобы уменьшить временную (временную) продолжительность артефактов квантования. [ 61 ] И все же, выбирая довольно маленький размер окна, чтобы сделать временной отклик MP3 достаточно адекватным, чтобы избежать наиболее серьезных артефактов, MP3 становится гораздо менее эффективным при сжатии в частотной области стационарных тональных компонентов.
Принуждение к использованию гибридной модели во временной области (банк фильтров)/частотной области (MDCT) для соответствия уровню II просто приводит к потере времени обработки и снижению качества из-за появления артефактов наложения псевдонимов. В MP3 есть этап подавления наложения спектров, специально предназначенный для маскировки этой проблемы, но вместо этого он генерирует энергию частотной области, которая должна быть закодирована в аудио. Он переносится в верхнюю часть частотного диапазона, где у большинства людей слух ограничен, в надежде, что вызванные этим искажения будут менее слышны.
1024-точечное БПФ уровня II не полностью охватывает все выборки и пропускает несколько целых поддиапазонов MP3, где необходимо определить коэффициенты квантования. Вместо этого MP3 использует два прохода анализа БПФ для спектральной оценки для расчета глобального и индивидуального порогов маскировки. Это позволяет охватить все 1152 выборки. Из этих двух параметров он использует глобальный пороговый уровень маскировки из более критического прохода с самым сложным звуком.
В дополнение к объединенному стереофоническому звуку уровня II, закодированному по интенсивности, MP3 может использовать совместное стереофоническое соединение среднее/стороннее (mid/side, m/s, MS, матричное). При использовании среднего/бокового стерео определенные частотные диапазоны обоих каналов объединяются в один моноканал (средний, средний, L+R), а разница звука между левым и правым каналами сохраняется как отдельный (боковой, LR) канал. . В отличие от интенсивного стерео, этот процесс не отбрасывает никакой аудиоинформации. Однако в сочетании с квантованием это может привести к преувеличению артефактов.
Если разница между левым и правым каналами невелика, побочный канал будет небольшим, что обеспечит экономию битрейта до 50% и соответствующее улучшение качества. Если разница между левым и правым велика, может быть предпочтительным стандартное (дискретное, левое/правое) стереокодирование, поскольку совместное стерео среднее/боковое не даст никаких преимуществ. Кодер MP3 может переключаться между стереофоническим режимом м/с и полным стерео покадрово. [ 60 ] [ 65 ] [ 73 ]
переменной длины В отличие от слоев I и II, MP3 использует кодирование Хаффмана (после перцептивного) для дальнейшего снижения битрейта без дальнейшей потери качества. [ 57 ] [ 61 ]
Качество
[ редактировать ]Более детальное и выборочное квантование MP3 действительно превосходит MP2 при более низких битрейтах. Он способен обеспечить качество звука, почти эквивалентное уровню II, с меньшим битрейтом на 15% (приблизительно). [ 70 ] [ 71 ] 128 кбит/с считается «золотой серединой» для MP3; Это означает, что он обеспечивает стереозвук в целом приемлемого качества для большей части музыки, и уменьшению дальнейшее увеличение битрейта приводит к улучшения качества. MP3 также считается демонстрирующим артефакты, которые менее раздражают, чем Layer II, когда оба используются со слишком низким битрейтом, чтобы обеспечить достоверное воспроизведение.
Аудиофайлы уровня III используют расширение «.mp3».
Расширения аудио MPEG-2
[ редактировать ]Стандарт MPEG-2 включает в себя несколько расширений MPEG-1 Audio. [ 61 ] Они известны как MPEG-2 BC и обратно совместимы с MPEG-1 Audio. [ 74 ] [ 75 ] [ 76 ] [ 77 ] Аудио MPEG-2 определено в ISO/IEC 13818-3.
- Многоканальный MPEG – 5.1-канальный объемный звук с обратной совместимостью . [ 25 ]
- Частота дискретизации : 16 000, 22 050 и 24 000 Гц.
- Битрейт : 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144 и 160 кбит/с.
Эти частоты дискретизации составляют ровно половину тех, которые изначально были определены для MPEG-1 Audio. Они были введены для обеспечения более высокого качества звука при кодировании звука с более низким битрейтом. [ 25 ] Еще более низкие битрейты были введены, потому что тесты показали, что MPEG-1 Audio может обеспечить более высокое качество, чем любые существующие ( около 1994 года с очень низким битрейтом (т.е. речи ). ) аудиокодеки [ 78 ]
Часть 4: Тестирование на соответствие
[ редактировать ]Часть 4 стандарта MPEG-1 охватывает тестирование на соответствие и определена в ISO/IEC-11172-4.
Соответствие: процедуры проверки соответствия.
Содержит два набора рекомендаций и эталонные потоки битов для тестирования соответствия аудио- и видеодекодеров MPEG-1, а также потоков битов, создаваемых кодировщиками. [ 16 ] [ 23 ]
Часть 5. Справочное программное обеспечение
[ редактировать ]Часть 5 стандарта MPEG-1 включает эталонное программное обеспечение и определена в ISO/IEC TR 11172–5.
Моделирование: Справочное программное обеспечение.
Справочный код C для кодирования и декодирования аудио и видео, а также мультиплексирования и демультиплексирования. [ 16 ] [ 23 ]
Сюда входит ISO Dist10 код аудиокодера LAME и TooLAME , на котором изначально основывались .
Расширение файла
[ редактировать ].mpg — это одно из нескольких расширений файлов для сжатия аудио и видео MPEG-1 или MPEG-2 . Видео MPEG-1 Part 2 в настоящее время встречается редко, и это расширение обычно относится к программному потоку MPEG (определенному в MPEG-1 и MPEG-2) или транспортному потоку MPEG (определенному в MPEG-2). Существуют и другие суффиксы, такие как .m2ts, указывающие точный контейнер, в данном случае MPEG-2 TS, но это не имеет большого отношения к носителям MPEG-1.
.mp3 — наиболее распространенное расширение для файлов, содержащих аудио MP3 (обычно MPEG-1 Audio, иногда MPEG-2 Audio). Файл MP3 обычно представляет собой несдерживаемый поток необработанного звука; Обычный способ пометить файлы MP3 — записать данные в «мусорные» сегменты каждого кадра, которые сохраняют мультимедийную информацию, но отбрасываются проигрывателем. Это во многом похоже на то, как помечаются необработанные файлы .AAC (но в настоящее время это менее поддерживается, например, iTunes ).
Обратите внимание: хотя это и применимо, .mpg обычно не добавляет необработанный AAC или AAC в контейнерах MPEG-2 Part 7 . Расширение .aac обычно обозначает эти аудиофайлы.
См. также
[ редактировать ]- MPEG Группа экспертов по движущимся изображениям, разработчики стандарта MPEG-1.
- MP3 Дополнительные менее технические подробности о MPEG-1 Audio Layer III
- Многоканальный MPEG с обратной совместимостью, расширение 5.1-канального объемного звука для MPEG-1 Audio Layer II
- MPEG-2 Прямой преемник стандарта MPEG-1.
- ИСО/МЭК ОТК 1/ПК 29
- Реализации
- Libavcodec включает кодеры и декодеры видео/аудио MPEG-1/2.
- Mjpegtools. Архивировано 20 апреля 2008 г. на Wayback Machine. Видео/аудиокодеры MPEG-1/2.
- TooLAME Высококачественный кодер MPEG-1 Audio Layer II.
- LAME Высококачественный аудиокодер MP3.
- Musepack Формат, первоначально основанный на MPEG-1 Audio Layer II, но теперь несовместимый.
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Патель К., Смит Б.К., Роу Л.А. (1 сентября 1993 г.). «Производительность программного декодера видео MPEG» . Материалы первой международной конференции ACM по мультимедиа-МУЛЬТИМЕДИА'93 . АКМ Мультимедиа. Нью-Йорк: Ассоциация вычислительной техники. стр. 75–82. дои : 10.1145/166266.166274 . ISBN 978-0-89791-596-0 . S2CID 3773268 . Архивировано из оригинала 15 декабря 2021 г. Проверено 15 декабря 2021 г. Ссылка 3 в документе относится к проекту комитета стандарта ISO/IEC 11172 от 6 декабря 1991 г.
- ^ Перейти обратно: а б с д и ж Адлер, Марк; Попп, Харальд; Хьерде, Мортен (9 ноября 1996 г.), MPEG-FAQ: сжатие мультимедиа [1/9] , faqs.org, заархивировано из оригинала 4 января 2017 г. , получено 11 ноября 2016 г.
- ^ Перейти обратно: а б с д и ж г час Ле Галль, Дидье (апрель 1991 г.), MPEG: стандарт сжатия видео для мультимедийных приложений (PDF) , Communications of ACM , заархивировано (PDF) из оригинала 27 января 2017 г. , получено 11 ноября 2016 г.
- ^ Кьярильоне, Леонардо (21 октября 1989 г.), пресс-релиз Курихама 89 , ISO / IEC , заархивировано из оригинала 5 августа 2010 г. , получено 9 апреля 2008 г.
- ^ ISO/IEC JTC 1/SC 29 (30 октября 2009 г.). «Программа работы — передана SC 29/WG 11, MPEG-1 (Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с)» . Архивировано из оригинала 31 декабря 2013 г. Проверено 10 ноября 2009 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ ИСО. «ISO/IEC 11172-1:1993 – Информационные технологии. Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с. Часть 1: Системы» . Архивировано из оригинала 12 ноября 2016 г. Проверено 11 ноября 2016 г.
- ^ МПЕГ. «О MPEG – Достижения» . chiariglione.org. Архивировано из оригинала 8 июля 2008 г. Проверено 31 октября 2009 г.
- ^ МПЕГ. «Техническое задание» . chiariglione.org. Архивировано из оригинала 21 февраля 2010 г. Проверено 31 октября 2009 г.
- ^ Перейти обратно: а б МПЕГ. «Стандарты MPEG – Полный список стандартов, разработанных или находящихся в стадии разработки» . chiariglione.org. Архивировано из оригинала 20 апреля 2010 г. Проверено 31 октября 2009 г.
- ^ Леа, Уильям (1994). Видео по запросу: Исследовательская работа 94/68 . Библиотека Палаты общин . Архивировано из оригинала 20 сентября 2019 года . Проверено 20 сентября 2019 г.
- ^ «История сжатия видео» . МСЭ-Т . Объединенная группа по видео (JVT) ISO/IEC MPEG и ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 и ITU-T SG16 Q.6). Июль 2002. стр. 11, 24–9, 33, 40–1, 53–6. Архивировано из оригинала 8 марта 2021 года . Проверено 3 ноября 2019 г.
- ^ Ганбари, Мохаммед (2003). Стандартные кодеки: от сжатия изображения до расширенного кодирования видео . Институт техники и технологий . стр. 1–2. ISBN 9780852967102 .
- ^ «Инфографика истории форматов видеофайлов» . РеалНетворкс . 22 апреля 2012 г. Архивировано из оригинала 29 июня 2018 г. . Проверено 5 августа 2019 г.
- ^ Ханс Геог Мусманн, Генезис стандарта кодирования аудио MP3 (PDF) , заархивировано из оригинала (PDF) 17 января 2012 г. , получено 26 июля 2011 г.
- ^ Фогг, Чад (2 апреля 1996 г.), Часто задаваемые вопросы по MPEG-2 , Калифорнийский университет в Беркли , заархивировано из оригинала 29 августа 2000 г. , получено 9 апреля 2008 г.
- ^ Перейти обратно: а б с д и ж г час я дж к л Фогг, Чад (2 апреля 1996 г.), Часто задаваемые вопросы по MPEG-2 (архив веб-сайта) , Калифорнийский университет, Беркли , заархивировано из оригинала 16 июня 2008 г. , получено 11 ноября 2016 г.
- ^ Кьяриглионе, Леонардо (март 2001 г.), Открытый исходный код в MPEG , Linux Journal , заархивировано из оригинала 25 июля 2011 г. , получено 9 апреля 2008 г.
- ^ Перейти обратно: а б с д Кьярилионе, Леонардо; Ле Галль, Дидье; Мусманн, Ханс-Георг; Саймон, Аллен (сентябрь 1990 г.), Пресс-релиз - Отчет о состоянии ISO MPEG , ISO / IEC , заархивировано из оригинала 14 февраля 2010 г. , получено 9 апреля 2008 г.
- ^ Встречи , ISO / IEC , заархивировано из оригинала 10 февраля 2010 г. , получено 9 апреля 2008 г.
- ^ Перейти обратно: а б «Часто задаваемые вопросы по MPEG, версия 3.1» . Архивировано из оригинала 23 июля 2009 г. Проверено 12 октября 2008 г.
В. Хорошо, тогда как мне получить документы, такие как MPEG, который я проектирую? О. MPEG — это проект стандарта ISO. Его [ sic ] точное название — ISO CD 11172. [...] Вы можете заказать его в своем национальном органе по стандартизации (например, ANSI в США) или купить у таких компаний, как OMNICOM [...]
- ^ «MPEG Press Release» (Пресс-релиз). ISO/IEC JTC1/SC29/WG11. 6 ноября 1992 года. Архивировано из оригинала 12 августа 2010 года . Проверено 7 мая 2018 г.
- ^ «Реферат, страница № 101» . Архивировано из оригинала 6 октября 2008 г. Проверено 13 июля 2008 г. «БМРК» . Архивировано из оригинала 12 июня 2008 г. Проверено 13 июля 2008 г. Непрерывный медиаплеер, Лоуренс А. Роу и Брайан К. Смит, Proc. 3-й Межд. Семинар по поддержке сети и ОС для цифрового аудио и видео, Сан-Диего, Калифорния (ноябрь 1992 г.) [ мертвая ссылка ]
- ^ Перейти обратно: а б с Достижения , ISO / IEC , заархивировано из оригинала 8 июля 2008 г. , получено 3 апреля 2008 г.
- ^ Кьярильоне, Леонардо (6 ноября 1992 г.), пресс-релиз MPEG, Лондон, 6 ноября 1992 г. , ISO / IEC , заархивировано из оригинала 12 августа 2010 г. , получено 9 апреля 2008 г.
- ^ Перейти обратно: а б с Уоллес, Грег (2 апреля 1993 г.), Пресс-релиз , ISO / IEC , архивировано из оригинала 6 августа 2010 г. , получено 9 апреля 2008 г.
- ^ Перейти обратно: а б с д Попп, Харальд; Хьерде, Мортен (9 ноября 1996 г.), MPEG-FAQ: сжатие мультимедиа [2/9] , faqs.org, заархивировано из оригинала 4 января 2017 г. , получено 11 ноября 2016 г.
- ^ «МЕЖДУНАРОДНАЯ ОРГАНИЗАЦИЯ ПО СТАНДАРТИЗАЦИИ ОРГАНИЗАЦИЯ МЕЖДУНАРОДНОЙ НОРМАЛИЗАЦИИ ISO» . 26 июля 2010 г. Архивировано из оригинала 26 июля 2010 г. Проверено 7 мая 2018 г.
- ^ ISO/IEC JTC 1/SC 29 (17 июля 2010 г.). «MPEG-1 (Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с)» . Архивировано из оригинала 31 декабря 2013 г. Проверено 18 июля 2010 г.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ ИСО. «ISO/IEC 11172-1:1993 – Информационные технологии. Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с. Часть 1: Системы» . Архивировано из оригинала 30 августа 2017 г. Проверено 11 ноября 2016 г.
- ^ ИСО. «ISO/IEC 11172-2:1993 – Информационные технологии – Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с – Часть 2: Видео» . Архивировано из оригинала 30 августа 2017 г. Проверено 11 ноября 2016 г.
- ^ ИСО. «ISO/IEC 11172-3:1993 – Информационные технологии – Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с – Часть 3: Аудио» . Архивировано из оригинала 15 мая 2017 г. Проверено 11 ноября 2016 г.
- ^ ИСО. «ISO/IEC 11172-4:1995 – Информационные технологии – Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с – Часть 4: Тестирование на соответствие» . Архивировано из оригинала 30 августа 2017 г. Проверено 11 ноября 2016 г.
- ^ ИСО. «ISO/IEC TR 11172-5:1998 – Информационные технологии – Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с – Часть 5: Программное моделирование» . Архивировано из оригинала 30 августа 2017 г. Проверено 11 ноября 2016 г.
- ^ Озер, Январь (12 октября 2001 г.), Выбор оптимального разрешения видео: Рынок проигрывателей MPEG-2 , Extremetech.com , заархивировано из оригинала 7 июня 2011 г. , получено 11 ноября 2016 г.
- ^ Сравнение MPEG 1 и 2 , заархивировано из оригинала 10 февраля 2012 г. , получено 11 ноября 2016 г.
- ^ Сравнение MPEG 1 и 2 , Pure Motion Ltd., 2003 г., заархивировано из оригинала 14 декабря 2005 г. , получено 9 апреля 2008 г.
- ^ Дэйв Сингер (9 ноября 2007 г.). «домашнее задание] краткое изложение обсуждения видео (и аудио) кодеков» . Архивировано из оригинала 21 декабря 2016 года . Проверено 11 ноября 2016 г.
- ^ «Кодирование видео MPEG-1 (H.261)» . Библиотека Конгресса , цифровая сохранность. 21 октября 2014. Архивировано из оригинала 11 января 2017 года . Проверено 11 ноября 2016 г.
- ^ «Стандарты и патенты ISO» . Архивировано из оригинала 15 ноября 2016 г. Проверено 11 ноября 2016 г.
Искать 11172
- ^ "архив.ф" . архив.ph . Архивировано из оригинала 16 сентября 2008 г. Проверено 21 января 2023 г.
{{cite web}}
: CS1 maint: bot: исходный статус URL неизвестен ( ссылка ) - ^ «[gst-devel] Может ли MPEG-1 с плагином Audio Layers 1 и 2 быть в категории «Хорошие плагины» (с точки зрения патента)?» . SourceForge.net . 23 августа 2008 г. Архивировано из оригинала 2 февраля 2014 г. Проверено 11 ноября 2016 г.
- ^ «[whatwg] Предложение по подмножеству MPEG-1 для видеокодека HTML5» . lists.whatwg.org . Архивировано из оригинала 19 июля 2011 года . Проверено 11 января 2022 г.
- ^ http://patft1.uspto.gov/netacgi/nph-Parser?patentnumber=5214678. Архивировано 13 июля 2012 г. на archive.today «Система цифровой передачи с использованием поддиапазонного кодирования цифрового сигнала». Подано: 31 мая 1990 г., разрешено. 25 мая 1993 г., срок действия истекает 31 мая 2010 г.?
- ^ «MP3 (кодирование звука MPEG Layer III)» . www.loc.gov . 21 апреля 2023 г. Архивировано из оригинала 14 августа 2017 г. Проверено 24 сентября 2023 г.
- ^ «mp3» . Институт интегральных микросхем Фраунгофера IIS . Архивировано из оригинала 22 марта 2018 года . Проверено 7 мая 2018 г.
- ^ «Стандарты и патенты ISO» . ИСО . Архивировано из оригинала 24 мая 2019 года . Проверено 10 июля 2019 г.
- ^ Перейти обратно: а б с д и ж г Гриль, Б.; Квакенбуш, С. (октябрь 2005 г.), MPEG-1 Audio , ISO / IEC , заархивировано из оригинала 30 апреля 2010 г.
- ^ Кьярильоне, Леонардо, MPEG-1 Systems , ISO / IEC , заархивировано из оригинала 12 ноября 2016 г. , получено 11 ноября 2016 г.
- ^ Перейти обратно: а б Заголовок пакета , заархивировано из оригинала 27 октября 2016 г. , получено 11 ноября 2016 г.
- ^ Фимофф, Марк; Бретл, Уэйн Э. (1 декабря 1999 г.), Учебное пособие по MPEG2 , заархивировано из оригинала 12 ноября 2016 г. , получено 11 ноября 2016 г.
- ^ Фимофф, Марк; Бретл, Уэйн Э. (1 декабря 1999 г.), Учебное пособие по MPEG2 , заархивировано из оригинала 5 ноября 2016 г. , получено 11 ноября 2016 г.
- ^ Фимофф, Марк; Бретл, Уэйн Э. (1 декабря 1999 г.), Учебное пособие по MPEG2 , заархивировано из оригинала 5 ноября 2016 г. , получено 11 ноября 2016 г.
- ^ Фимофф, Марк; Бретл, Уэйн Э. (1 декабря 1999 г.), Учебное пособие по MPEG2 , заархивировано из оригинала 12 ноября 2016 г. , получено 11 ноября 2016 г.
- ^ Ачарья, Соам; Смит, Брайан (1998), Перекодирование сжатого домена MPEG , Корнелльский университет , Компьютерное общество IEEE , Международная конференция IEEE по мультимедийным вычислениям и системам, стр. 3, заархивировано из оригинала 23 февраля 2011 г. , получено 11 ноября 2016 г. - (Требуется внимательное прочтение: говорится, что матрицы квантования различаются, но это просто значения по умолчанию, и их можно выбрать) ( требуется регистрация )
- ^ Перейти обратно: а б с Ви, Сьюзи Дж.; Васудев, Бхаскаран; Лю, Сэм (13 марта 1997 г.), Транскодирование видеопотоков MPEG в сжатом домене , Hewlett-Packard , CiteSeerX 10.1.1.24.633 , заархивировано из оригинала 17 августа 2007 г. , получено 11 ноября 2016 г.
- ^ «БМРК» . Архивировано из оригинала 3 мая 2009 г. Проверено 3 мая 2009 г.
- ^ Перейти обратно: а б с д и ж Том, Д.; Пурнхаген, Х. (октябрь 1998 г.), Часто задаваемые вопросы по MPEG Audio, версия 9 , ISO / IEC , заархивировано из оригинала 18 февраля 2010 г. , получено 11 ноября 2016 г.
- ^ Заголовок аудиокадра MPEG , заархивировано из оригинала 8 февраля 2015 г. , получено 11 ноября 2016 г.
- ^ «Аудиостандарт: MPEG-2 Номер детали: 3» . Архивировано из оригинала 4 февраля 2024 г. Проверено 7 февраля 2024 г.
- ^ Перейти обратно: а б с д и ж Черч, Стив, Перцептивное кодирование и сжатие MPEG , Справочник инженеров NAB, Telos Systems , заархивировано из оригинала 8 мая 2001 г. , получено 9 апреля 2008 г.
- ^ Перейти обратно: а б с д и ж г час я дж Пэн, Дэвис (лето 1995 г.), Учебное пособие по сжатию MPEG/аудио (PDF) , IEEE MultiMedia Journal, стр. 8, заархивировано из оригинала (PDF) 19 сентября 2004 г. , получено 9 апреля 2008 г.
- ^ Смит, Брайан (1996), Обзор методов обработки сжатых доменов , Корнельский университет , стр. 7, заархивировано из оригинала 23 февраля 2011 г. , получено 9 апреля 2008 г. ( требуется регистрация )
- ^ Ченг, Майк, Психоакустические модели в TwoLAME , twolame.org, заархивировано из оригинала 22 октября 2016 г. , получено 11 ноября 2016 г.
- ^ Гриль, Б.; Квакенбуш, С. (октябрь 2005 г.), MPEG-1 Audio , заархивировано из оригинала 27 апреля 2008 г. , получено 11 ноября 2016 г.
- ^ Перейти обратно: а б Херре, Юрген (5 октября 2004 г.), От совместного стерео к пространственному кодированию звука (PDF) , Международная конференция по цифровым аудиоэффектам , стр. 2, заархивировано из оригинала (PDF) 5 апреля 2006 г. , получено 17 апреля 2008 г.
- ^ К.Гревин и Т.Райден, Субъективные оценки аудиокодеков с низкой скоростью передачи данных , Материалы 10-й Международной конференции AES, стр. 91–102, Лондон, 1991 г.
- ^ Дж. Джонстон, Оценка перцептивной энтропии с использованием критериев маскировки шума, в Proc. ICASSP-88, стр. 2524–2527, май 1988 г.
- ^ Дж. Джонстон, Преобразование кодирования аудиосигналов с использованием критериев перцептивного шума, Журнал IEEE по избранным областям коммуникаций, том. 6, нет. 2, стр. 314–323, февраль 1988 г.
- ^ Вустенхаген и др., Тест на субъективное прослушивание многоканальных аудиокодеков , Документ 105-й конвенции AES 4813, Сан-Франциско, 1998 г.
- ^ Перейти обратно: а б Проектная группа B/MAE (сентябрь 2007 г.), оценки многоканальных аудиокодеков EBU (PDF) , Европейский вещательный союз , заархивировано из оригинала (PDF) 30 октября 2008 г. , получено 9 апреля 2008 г.
- ^ Перейти обратно: а б Мирес, Дэвид; Ватанабэ, Каору; Шайрер, Эрик (февраль 1998 г.), Отчет о проверочных испытаниях стерео MPEG-2 AAC (PDF) , ISO / IEC , стр. 18, заархивировано из оригинала (PDF) 14 апреля 2008 г. , получено 11 ноября 2016 г.
- ^ Художник, Тед; Спаниас, Андреас (апрель 2000 г.), Перцептивное кодирование цифрового звука (Proceedings of the IEEE, VOL. 88, NO. 4) (PDF) , Proceedings of the IEEE , заархивировано из оригинала (PDF) 16 сентября 2006 г. , получено 2016-11-11
- ^ Аморим, Роберто (19 сентября 2006 г.), GPSYCHO - Mid/Side Stereo , LAME , заархивировано из оригинала 16 декабря 2016 г. , получено 11 ноября 2016 г.
- ^ ИСО (октябрь 1998 г.). «Часто задаваемые вопросы по MPEG Audio, версия 9 – MPEG-1 и MPEG-2 BC» . ИСО. Архивировано из оригинала 18 февраля 2010 г. Проверено 11 ноября 2016 г.
- ^ Д. Том, Х. Пурнхаген и подгруппа MPEG Audio (октябрь 1998 г.). «Часто задаваемые вопросы по MPEG Audio, версия 9 — MPEG Audio» . Архивировано из оригинала 7 августа 2011 г. Проверено 11 ноября 2016 г.
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ MPEG.ORG. «ААК» . Архивировано из оригинала 31 августа 2007 г. Проверено 28 октября 2009 г.
- ^ ISO (2006-01-15), ISO/IEC 13818-7, четвертое издание, Часть 7 – Advanced Audio Coding (AAC) (PDF) , заархивировано (PDF) из оригинала 06 марта 2009 г. , получено 11 2016 г. -11
- ^ Кьярильоне, Леонардо (11 ноября 1994 г.), Пресс-релиз , ISO / IEC , заархивировано из оригинала 8 августа 2010 г. , получено 9 апреля 2008 г.
Внешние ссылки
[ редактировать ]- Официальная веб-страница Группы экспертов по движущимся изображениям (MPEG), рабочей группы ISO / IEC. Архивировано 7 декабря 2017 г. на Wayback Machine.
- Организация отраслевого форума MPEG. Архивировано 30 августа 2004 г. в Wayback Machine.
- Исходный код для реализации MPEG-1. Архивировано 30 декабря 2006 г. на Wayback Machine.
- Простое и краткое объяснение от Центра мультимедийных исследований Беркли.