H.262/MPEG-2, часть 2
Информационные технологии. Общее кодирование движущихся изображений и связанной с ними аудиоинформации: видео. | |
Статус | Действующий |
---|---|
Год начался | 1995 |
Впервые опубликовано | Май 1996 г. |
Последняя версия | ИСО/МЭК 13818-2:2013 Октябрь 2013 г. |
Организация | МСЭ-Т , ИСО/МЭК ОТК 1 |
комитет | 16-я Исследовательская комиссия МСЭ-Т VCEG , MPEG |
Базовые стандарты | H.261 , MPEG-2 |
Сопутствующие стандарты | H.222.0 , H.263 , H.264 , H.265 , H.266 , ISO/IEC 14496-2 |
Домен | Сжатие видео |
Лицензия | Патенты с истекшим сроком действия [1] |
Веб-сайт | https://www.itu.int/rec/T-REC-H.262 |
H.262 [2] или MPEG-2 Part 2 (официально известный как Рекомендации ITU-T H.262 и ISO/IEC 13818-2 , [3] также известный как MPEG-2 Video ) — формат кодирования видео , стандартизированный и совместно поддерживаемый 16-й Исследовательской группы ITU-T Группой экспертов по кодированию видео (VCEG) и ISO / IEC Экспертной группой по движущимся изображениям (MPEG), и разработанный при участии многих компании. Это вторая часть стандарта ISO/IEC MPEG-2 . Документы Рекомендации ITU-T H.262 и ISO/IEC 13818-2 идентичны.
Стандарт доступен за плату в ITU-T. [2] и ИСО. MPEG-2 Video очень похож на MPEG-1 , но также обеспечивает поддержку чересстрочного видео (метод кодирования, используемый в аналоговых телевизионных системах NTSC, PAL и SECAM). Видео MPEG-2 не оптимизировано для низких скоростей передачи данных (например, менее 1 Мбит/с), но несколько превосходит MPEG-1 при более высоких скоростях передачи данных (например, 3 Мбит/с и выше), хотя и не с большим отрывом. если видео не чересстрочное. Все декодеры видео MPEG-2, соответствующие стандарту, также полностью способны воспроизводить видеопотоки MPEG-1. [4]
История
[ редактировать ]Процесс утверждения ISO/IEC был завершен в ноябре 1994 года. [5] Первое издание было утверждено в июле 1995 года. [6] и опубликовано МСЭ-Т [2] и ИСО/МЭК в 1996 году. [7] Дидье ЛеГалл из Bellcore возглавлял разработку стандарта. [8] а Сакаэ Окубо из NTT был координатором МСЭ-Т и председательствовал на соглашениях по его требованиям. [9]
Технология была разработана при участии ряда компаний. Компания Hyundai Electronics (ныне SK Hynix ) разработала первый декодер MPEG-2 SAVI (система/аудио/видео) в 1995 году. [10]
Большинство патентов , которые позже были включены в патентный пул как необходимые для реализации стандарта, поступили от трех компаний: Sony (311 патентов), Thomson (198 патентов) и Mitsubishi Electric (119 патентов). [11]
В 1996 году он был расширен двумя поправками, включившими регистрацию идентификаторов авторских прав и профиля 4:2:2. [2] [12] МСЭ-Т опубликовал эти поправки в 1996 году, а ISO – в 1997 году. [7]
Существуют также другие поправки, опубликованные позднее ITU-T и ISO/IEC. [2] [13] Самая последняя редакция стандарта была опубликована в 2013 году и включает все предыдущие поправки. [3]
Издания
[ редактировать ]Версия | Дата выпуска | Последняя поправка | Стандарт ИСО/МЭК | Рекомендация МСЭ-Т |
---|---|---|---|---|
Первое издание | 1995 | 2000 | ИСО/МЭК 13818-2:1996. [7] | H.262 (07/95) |
Второе издание | 2000 | 2010 [2] [14] | ИСО/МЭК 13818-2:2000 [15] | H.262 (02/00) |
Третье издание | 2013 | ИСО/МЭК 13818-2:2013 [3] | H.262 (12 февраля), включая Поправку 1 (13 марта) |
Кодирование видео
[ редактировать ]Этот раздел может содержать чрезмерное количество сложных деталей, которые могут заинтересовать только определенную аудиторию . Конкретно здесь не место так подробно объяснять общую концепцию сжатия видео; основное внимание следует уделить видеокодеку H.262. . ( Май 2020 г. ) |
Выборка изображений
[ редактировать ]Камера HDTV с 8-битной дискретизацией генерирует необработанный видеопоток размером 25 × 1920 × 1080 × 3 = 155 520 000 байт в секунду для видео с частотой 25 кадров в секунду (с использованием формата дискретизации 4:4:4 ). Этот поток данных должен быть сжат, чтобы цифровое телевидение уместилось в полосе пропускания доступных телевизионных каналов и если фильмы должны поместиться на DVD. Сжатие видео практично, поскольку данные в изображениях часто избыточны в пространстве и времени. Например, небо может быть голубым в верхней части изображения, и это голубое небо может сохраняться кадр за кадром. Кроме того, из-за особенностей работы глаза можно удалить или приблизить некоторые данные из видеоизображений практически без заметного ухудшения качества изображения.
Распространенный (и старый) прием уменьшения объема данных заключается в разделении каждого полного «кадра» видео на два «поля» при трансляции/кодировании: «верхнее поле», представляющее собой горизонтальные линии с нечетными номерами, и «верхнее поле», представляющее собой горизонтальные линии с нечетными номерами. нижнее поле», то есть четные строки. При приеме/декодировании два поля отображаются поочередно, при этом строки одного поля чередуются между строками предыдущего поля; этот формат называется чересстрочным видео . Типичная скорость передачи полей составляет 50 (Европа/PAL) или 59,94 (США/NTSC) полей в секунду, что соответствует 25 (Европа/PAL) или 29,97 (Северная Америка/NTSC) целым кадрам в секунду. Если видео не чересстрочное, то оно называется видео с прогрессивной разверткой , и каждое изображение представляет собой полный кадр. MPEG-2 поддерживает оба варианта.
Цифровое телевидение требует, чтобы эти изображения были оцифрованы, чтобы их можно было обрабатывать с помощью компьютерного оборудования. Каждый элемент изображения ( пиксель ) затем представляется одним числом яркости и двумя числами цветности . Они описывают яркость и цвет пикселя (см. YCbCr ). Таким образом, каждое оцифрованное изображение изначально представлено тремя прямоугольными массивами чисел.
Другой распространенной практикой уменьшения объема обрабатываемых данных является субдискретизация двух плоскостей цветности (после низкочастотной фильтрации во избежание наложения спектров ). Это работает, потому что зрительная система человека лучше различает детали яркости, чем детали оттенка и насыщенности цветов. Термин 4:2:2 используется для видео с субдискретизацией цветности 2:1 по горизонтали, а 4:2:0 используется для видео с субдискретизацией цветности 2:1 как по вертикали, так и по горизонтали. Видео с одинаковым разрешением яркости и цветности называется 4:4:4 . В документе MPEG-2 Video рассматриваются все три типа выборки, хотя 4:2:0, безусловно, является наиболее распространенным для потребительского видео, и не существует определенных «профилей» MPEG-2 для видео 4:4:4 (см. ниже). для дальнейшего обсуждения профилей).
Хотя обсуждение ниже в этом разделе в основном описывает сжатие видео MPEG-2, есть много деталей, которые не обсуждаются, включая детали, связанные с полями, форматами цветности, реакциями на изменения сцены, специальными кодами, которые маркируют части битового потока, и другими частями. информации. Помимо функций обработки полей для чересстрочного кодирования, MPEG-2 Video очень похож на MPEG-1 Video (и даже очень похож на более ранний стандарт H.261 ), поэтому все приведенное ниже описание одинаково хорошо применимо и к MPEG-1.
I-кадры, P-кадры и B-кадры
[ редактировать ]MPEG-2 включает три основных типа кодированных кадров: кадры с внутренним кодированием ( I-кадры ), кадры с предсказанием ( P-кадры ) и кадры с двунаправленным предсказанием ( B-кадры ).
I-кадр — это отдельно сжатая версия одного несжатого (необработанного) кадра. Кодирование I-кадра использует преимущества пространственной избыточности и неспособности глаза обнаружить определенные изменения в изображении. В отличие от P-кадров и B-кадров, I-кадры не зависят от данных в предыдущем или последующих кадрах, поэтому их кодирование очень похоже на кодирование неподвижной фотографии (примерно аналогично кодированию изображения JPEG ). Вкратце, необработанный кадр делится на блоки размером 8х8 пикселей. Данные в каждом блоке преобразуются дискретным косинусным преобразованием (DCT). Результатом является матрица коэффициентов 8×8, имеющих действительные числовые значения. Преобразование преобразует пространственные изменения в частотные изменения, но не меняет информацию в блоке; если преобразование вычислено с идеальной точностью, исходный блок можно точно воссоздать, применив обратное косинусное преобразование (также с идеальной точностью). Преобразование 8-битных целых чисел в действительные коэффициенты преобразования фактически увеличивает объем данных, используемых на этом этапе обработки, но преимущество преобразования состоит в том, что данные изображения затем можно аппроксимировать с помощью квантование коэффициентов. Многие коэффициенты преобразования, обычно высокочастотные компоненты, после квантования, которое по сути является операцией округления, будут равны нулю. Наказанием этого шага является потеря некоторых тонких различий в яркости и цвете. Квантование может быть грубым или точным, в зависимости от выбора кодера. Если квантование не слишком грубое и к матрице после квантования применяется обратное преобразование, получается изображение, которое очень похоже на исходное изображение, но не совсем то же самое. Затем сама квантованная матрица коэффициентов сжимается. Обычно после применения квантования один угол массива коэффициентов 8×8 содержит только нули. Начав с противоположного угла матрицы, затем зигзагообразно перемещаясь по матрице, чтобы объединить коэффициенты в строку, затем заменяя кодами длины серии последовательные нули в этой строке , а затем применяя к этому результату кодирование Хаффмана , можно свести матрицу к меньшее количество данных. Это это энтропийно-кодированные данные, которые транслируются или записываются на DVD. В приемнике или проигрывателе весь процесс обратный, что позволяет приемнику с высокой точностью восстановить исходный кадр.
Обработка B-кадров аналогична обработке P-кадров, за исключением того, что B-кадры используют изображение из последующего опорного кадра, а также изображение из предыдущего опорного кадра. В результате B-кадры обычно обеспечивают большее сжатие, чем P-кадры. B-кадры никогда не являются опорными кадрами в видео MPEG-2.
Обычно каждый 15-й кадр или около того превращается в I-кадр. P-кадры и B-кадры могут следовать за I-кадром, подобным этому, IBBPBBPBBPBB(I), чтобы сформировать группу изображений (GOP) ; однако стандарт является гибким в этом отношении. Кодер выбирает, какие изображения кодируются как I-, P- и B-кадры.
Макроблоки
[ редактировать ]P-кадры обеспечивают большее сжатие, чем I-кадры, поскольку они используют данные предыдущего I-кадра или P-кадра – опорного кадра . Для генерации P-кадра восстанавливается предыдущий опорный кадр, как это было бы в ТВ-приемнике или DVD-плеере. Сжимаемый кадр делится на макроблоки размером 16х16 пикселей . Затем для каждого из этих макроблоков восстанавливаемый опорный кадр ищет область размером 16 на 16, которая точно соответствует содержимому сжимаемого макроблока. Смещение кодируется как «вектор движения». Часто смещение равно нулю, но если что-то на изображении движется, смещение может составлять примерно 23 пикселя вправо и 4 с половиной пикселя вверх. В MPEG-1 и MPEG-2 значения векторов движения могут представлять собой целочисленные или полуцелые смещения. Сочетание между двумя регионами часто не будет идеальным. Чтобы исправить это, кодер берет разницу всех соответствующих пикселей двух областей и на основе этой разницы макроблоков затем вычисляет DCT и строки значений коэффициентов для четырех областей 8×8 в макроблоке 16×16, как описано выше. Этот «остаток» добавляется к вектору движения, и результат отправляется на приемник или сохраняется на DVD для каждого сжимаемого макроблока. Иногда подходящего совпадения не находится. Затем макроблок обрабатывается как макроблок I-кадра.
Видео профили и уровни
[ редактировать ]Видео MPEG-2 поддерживает широкий спектр приложений: от мобильных до высококачественного редактирования HD. Для многих приложений поддерживать весь стандарт нереально и слишком дорого. Чтобы позволить таким приложениям поддерживать только его подмножества, стандарт определяет профили и уровни.
Профиль определяет наборы функций , таких как B-изображения, 3D-видео, формат цветности и т. д. Уровень ограничивает необходимую память и вычислительную мощность, определяя максимальную скорость передачи данных, размеры кадров и частоту кадров.
Затем приложение MPEG определяет возможности с точки зрения профиля и уровня. Например, DVD-проигрыватель может указать, что он поддерживает основной профиль и основной уровень (часто обозначаемый как MP@ML). Это означает, что плеер может воспроизводить любой поток MPEG, закодированный как MP@ML или меньше.
В таблицах ниже приведены ограничения каждого профиля и уровня, хотя есть ограничения, не перечисленные здесь. [2] : Приложение Е Обратите внимание, что не все комбинации профилей и уровней допустимы, а масштабируемые режимы изменяют ограничения уровней.
Сокр. | Имя | Типы кодирования изображений | Формат цветности | Масштабируемые режимы | Внутрипостоянная точность |
---|---|---|---|---|---|
СП | Простой профиль | я, П | 4:2:0 | никто | 8, 9, 10 |
член парламента | Основной профиль | Я, П, Б | 4:2:0 | никто | 8, 9, 10 |
ОСШ | Масштабируемый профиль SNR | Я, П, Б | 4:2:0 | ОСШ [а] | 8, 9, 10 |
Пространственный | Пространственно масштабируемый профиль | Я, П, Б | 4:2:0 | СНР, [а] пространственный [б] | 8, 9, 10 |
HP | Громкий | Я, П, Б | 4:2:2 или 4:2:0 | СНР, [а] пространственный [б] | 8, 9, 10, 11 |
422 | Профиль 4:2:2 | Я, П, Б | 4:2:2 или 4:2:0 | никто | 8, 9, 10, 11 |
MVP | Многопрофильный профиль | Я, П, Б | 4:2:0 | Временной [с] | 8, 9, 10 |
- ^ Jump up to: а б с Масштабируемость SNR отправляет различия в области преобразования на более низкий уровень квантования каждого блока, повышая качество и скорость передачи данных при объединении обоих потоков. Основной поток можно воссоздать без потерь.
- ^ Jump up to: а б Пространственная масштабируемость кодирует разницу между потоками HD и SD с повышенным разрешением, которая объединяется с SD для воссоздания потока HD. Основной поток не может быть воссоздан без потерь.
- ^ Временная масштабируемость вставляет дополнительные кадры между каждым базовым кадром, чтобы повысить частоту кадров или добавить трехмерную точку обзора. Это единственный профиль MPEG-2, допускающий адаптивную ссылку на кадры, что является важной особенностью H.264/AVC . Основной поток может быть воссоздан без потерь, только если не используются расширенные ссылки.
Сокр. | Имя | Частота кадров (Гц) | Максимальное разрешение | Макс. выборок яркости в секунду (приблизительно высота x ширина x частота кадров) | Максимальная скорость передачи данных MP@ (Мбит/с) | |
---|---|---|---|---|---|---|
горизонтальный | вертикальный | |||||
LL | Низкий уровень | 23.976, 24, 25, 29.97, 30 | 352 | 288 | 3,041,280 | 4 |
МЛ | Основной уровень | 23.976, 24, 25, 29.97, 30 | 720 | 576 | 10 368 000, за исключением High-profile: ограничение составляет 14 475 600 для 4:2:0 и 11 059 200 для 4:2:2. | 15 |
Н-14 | Высота 1440 | 23.976, 24, 25, 29.97, 30, 50, 59.94, 60 | 1440 | 1152 | 47 001 600, за исключением High-profile: ограничение составляет 62 668 800 для 4:2:0. | 60 |
ХЛ | Высокий уровень | 23.976, 24, 25, 29.97, 30, 50, 59.94, 60 | 1920 | 1152 | 62 668 800, за исключением High-profile: ограничение составляет 83 558 400 для 4:2:0. | 80 |
Ниже представлены несколько распространенных комбинаций профиля/уровня MPEG-2 с указанием конкретных максимальных пределов:
Профиль @ Уровень | Разрешение (пикселей) | Частота кадров макс. (Гц) | Выборка | Битрейт (Мбит/с) | Пример приложения |
---|---|---|---|---|---|
СП@ЛЛ | 176 × 144 | 15 | 4:2:0 | 0.096 | Беспроводные телефоны |
СП@МЛ | 352 × 288 | 15 | 4:2:0 | 0.384 | КПК |
320 × 240 | 24 | ||||
МП@ЛЛ | 352 × 288 | 30 | 4:2:0 | 4 | Телеприставки (STB) |
МП@МЛ | 720 × 480 | 30 | 4:2:0 | 15 | DVD (9,8 Мбит/с), SD DVB (15 Мбит/с) |
720 × 576 | 25 | ||||
МП@Н-14 | 1440 × 1080 | 30 | 4:2:0 | 60 | HDV (25 Мбит/с) |
1280 × 720 | 30 | ||||
МП@ХЛ | 1920 × 1080 | 30 | 4:2:0 | 80 | ATSC (18,3 Мбит/с), SD DVB (31 Мбит/с), HD DVB (50,3 Мбит/с) |
1280 × 720 | 60 | ||||
422P@ML | 720 × 480 | 30 | 4:2:2 | 50 | Sony IMX (только I), вклад в трансляцию (только I&P) |
720 × 576 | 25 | ||||
422P@H-14 | 1440 × 1080 | 30 | 4:2:2 | 80 | |
422P@HL | 1920 × 1080 | 30 | 4:2:2 | 300 | Sony MPEG HD422 (50 Мбит/с), кодек Canon XF (50 Мбит/с), Регистратор Nanoflash конвергентного дизайна (до 160 Мбит/с) |
1280 × 720 | 60 |
Приложения
[ редактировать ]Некоторые приложения перечислены ниже.
- DVD-Video – потребительский видеоформат стандартной четкости. Использует субдискретизацию цвета 4:2:0 и переменную скорость видеоданных до 9,8 Мбит/с.
- MPEG IMX – профессиональный формат записи видео стандартной четкости. Использует внутрикадровое сжатие, цветовую субдискретизацию 4:2:2 и выбираемую пользователем постоянную скорость видеоданных 30, 40 или 50 Мбит/с.
- HDV – формат записи видео высокой четкости на ленту. Использует субдискретизацию цвета 4:2:0 и общую скорость передачи данных 19,4 или 25 Мбит/с.
- XDCAM – семейство форматов безленточной видеозаписи, в которое, в частности, входят форматы на базе MPEG-2 Part 2. Это: MPEG IMX стандартной четкости (см. выше), MPEG HD высокой четкости, MPEG HD422 высокой четкости. MPEG IMX и MPEG HD422 используют цветовую субдискретизацию 4:2:2, MPEG HD использует цветовую субдискретизацию 4:2:0. В большинстве подформатов используется выбираемая постоянная скорость передачи видеоданных от 25 до 50 Мбит/с, хотя существует также режим с переменным битрейтом с максимальной скоростью передачи данных 18 Мбит/с.
- Кодек XF — профессиональный формат безленточной видеозаписи, аналогичный MPEG HD и MPEG HD422, но хранящийся в другом файле-контейнере.
- HD DVD - несуществующий потребительский формат видео высокой четкости.
- Blu-ray Disc – потребительский формат видео высокой четкости.
- Телерадиовещание – в некоторых странах MPEG-2 Part 2 используется для цифрового вещания в высоком разрешении . Например, ATSC определяет как несколько форматов сканирования (480i, 480p, 720p, 1080i, 1080p), так и частоту кадров/полей при субдискретизации цвета 4:2:0 со скоростью передачи данных до 19,4 Мбит/с на канал.
- Цифровое кабельное телевидение
- Спутниковое телевидение
Обладатели патентов
[ редактировать ]Следующие организации имеют патенты на видеотехнологию MPEG-2, как указано в MPEG LA . Срок действия всех этих патентов истек в США и большинстве других территорий. [1]
Организация | Патенты [16] |
---|---|
Sony Корпорация | 311 |
Томсон Лицензирование | 198 |
Митсубиси Электрик | 119 |
Филипс | 99 |
GE Technology Development, Inc. | 75 |
Корпорация Панасоник | 55 |
КИФ Лицензирование, ООО | 44 |
JVC Кенвуд | 39 |
Самсунг Электроникс | 38 |
Alcatel Lucent (включая Патентный фонд мультимедиа) | 33 |
Cisco Technology, Inc. | 13 |
Корпорация Тошиба | 9 |
Колумбийский университет | 9 |
LG Электроникс | 8 |
Хитачи | 7 |
Оранжевый СА | 7 |
Фуджицу | 6 |
Роберт Бош ГмбХ | 5 |
Общий инструмент | 4 |
Британские телекоммуникации | 3 |
Кэнон Инк. | 2 |
КДДИ Корпорация | 2 |
Японский телеграф и телефон (NTT) | 2 |
АРРИС Технолоджи, Инк. | 2 |
Саньо Электрик | 1 |
Корпорация Шарп | 1 |
Хьюлетт-Паккард Компания Энтерпрайз | 1 |
Ссылки
[ редактировать ]- ^ Jump up to: а б «Истечение срока действия патента MPEG-2 открывает двери для бесплатного использования» . Техреспублика . 15 февраля 2018 года . Проверено 13 декабря 2021 г.
- ^ Jump up to: а б с д и ж г «H.262: Информационные технологии. Общее кодирование движущихся изображений и связанной с ними аудиоинформации: Видео» . Веб-сайт МСЭ-Т . Международный союз электросвязи – Сектор стандартизации электросвязи ( ITU-T ). Февраль 2000 года . Проверено 13 августа 2009 г.
- ^ Jump up to: а б с ИСО. «ISO/IEC 13818-2:2013 – Информационные технологии – Общее кодирование движущихся изображений и связанной с ними аудиоинформации: Видео» . ИСО . Проверено 24 июля 2014 г.
- ^ Группа экспертов по движущимся изображениям. «Видео MPEG-2» . Проверено 15 июня 2019 г. - через mpeg.chiariglione.org.
- ^ П.Н. Тюдор (декабрь 2005 г.). «Сжатие видео MPEG-2» . Проверено 1 ноября 2009 г.
- ^ H.262 (07/95) Информационные технологии – общее кодирование движущегося изображения и связанной с ним аудиоинформации: видео , ITU , получено 3 ноября 2009 г.
- ^ Jump up to: а б с ИСО. «ISO/IEC 13818-2:1996 – Информационные технологии – Общее кодирование движущихся изображений и связанной с ними аудиоинформации: Видео» . ИСО . Проверено 24 июля 2014 г.
- ^ «Дидье ЛеГалл, исполнительный вице-президент» . Ambarella Inc. Проверено 2 июня 2017 г.
- ^ «Сакаэ Окубо» . МСЭ . Проверено 27 января 2017 г.
- ^ «История: 1990-е годы» . СК Хайникс . Архивировано из оригинала 5 февраля 2021 года . Проверено 6 июля 2019 г.
- ^ «Список патентов MPEG-2» (PDF) . MPEG Лос-Анджелес . Проверено 7 июля 2019 г.
- ^ Леонардо Кьярильоне – руководитель (октябрь 2000 г.). «Краткое описание MPEG-2» . Проверено 1 ноября 2009 г.
- ^ Jump up to: а б МПЕГ. «Стандарты MPEG» . chiariglione.org . Проверено 24 июля 2014 г.
- ^ ИСО. «ISO/IEC 13818-2:2000/Amd 3 – Новый уровень для 1080@50p/60p» . Проверено 24 июля 2014 г.
- ^ ИСО. «ISO/IEC 13818-2:2000 – Информационные технологии – Общее кодирование движущихся изображений и связанной с ними аудиоинформации: Видео» . ИСО . Проверено 24 июля 2014 г.
- ^ «Список патентов MPEG-2» (PDF) . MPEG Лос-Анджелес . Проверено 7 июля 2019 г.
Внешние ссылки
[ редактировать ]- Официальный веб-сайт MPEG
- Кодирование видео MPEG-2 (H.262) – Библиотека Конгресса США