Преобразование кодирования
Эта статья нуждается в дополнительных цитатах для проверки . ( сентябрь 2018 г. ) |
Кодирование с преобразованием — это тип сжатия «естественных» данных, таких как или аудиосигналы фотографические изображения . Преобразование обычно происходит без потерь (совершенно обратимо) само по себе, но используется для обеспечения лучшего (более целенаправленного) квантования , что затем приводит к получению копии исходного ввода более низкого качества ( сжатие с потерями ).
При кодировании с преобразованием информация о приложении используется для выбора информации, которую нужно отбросить, тем самым снижая пропускную способность . Оставшуюся информацию затем можно сжать различными методами. Когда выходные данные декодируются, результат может не быть идентичен исходному входному, но ожидается, что он будет достаточно близок для целей приложения.
Цветной телевизор [ править ]
NTSC [ править ]
Одна из наиболее успешных систем кодирования с преобразованием обычно не упоминается как таковая — например, NTSC цветное телевидение . После обширной серии исследований в 1950-х годах Альда Бедфорд показала, что человеческий глаз имеет высокое разрешение только для черного и белого цветов, несколько меньше для цветов «среднего диапазона», таких как желтый и зеленый, и гораздо меньше для цветов на конце диапазона. спектр, красный и синий.
Использование этих знаний позволило RCA разработать систему, в которой они отбрасывали большую часть синего сигнала после того, как он исходит от камеры, сохраняя большую часть зеленого и только часть красного; это субдискретизация цветности в YIQ цветовом пространстве .
В результате получается сигнал со значительно меньшим содержанием, который вписывается в существующие черно-белые сигналы 6 МГц в качестве фазомодулированного дифференциального сигнала. Средний телевизор отображает эквивалент 350 пикселей в строке, но телевизионный сигнал содержит достаточно информации только для примерно 50 пикселей синего цвета и, возможно, 150 пикселей красного цвета. В большинстве случаев это не очевидно для зрителя, поскольку глаз все равно мало использует «недостающую» информацию.
PAL и SECAM [ править ]
Системы PAL и SECAM используют почти идентичные или очень похожие методы передачи цвета. В любом случае обе системы являются субдискретными.
Цифровой [ править ]
Этот термин гораздо чаще используется в цифровых медиа и цифровой обработке сигналов . Наиболее широко используемым в этом отношении методом кодирования с преобразованием является дискретное косинусное преобразование (ДКП). [1] [2] предложен Насиром Ахмедом в 1972 году, [3] [4] и представлен Ахмедом вместе с Т. Натараджан и К. Р. Рао в 1974 году. [5] Это ДКП в контексте семейства дискретных косинусных преобразований называется ДКП-II. Это основа общего JPEG стандарта сжатия изображений . [6] который исследует небольшие блоки изображения и преобразует их в частотную область для более эффективного квантования (с потерями) и сжатия данных . При кодировании видео стандарты H.26x компенсации и MPEG модифицируют этот метод сжатия изображения DCT по кадрам движущегося изображения с использованием движения , еще больше уменьшая размер по сравнению с серией JPEG.
При кодировании звука сжатие звука MPEG анализирует преобразованные данные в соответствии с психоакустической моделью , которая описывает чувствительность человеческого уха к частям сигнала, аналогично телевизионной модели. MP3 использует гибридный алгоритм кодирования, сочетающий модифицированное дискретное косинусное преобразование (MDCT) и быстрое преобразование Фурье (FFT). [7] На смену ему пришла технология Advanced Audio Coding (AAC), которая использует чистый алгоритм MDCT для значительного повышения эффективности сжатия. [8]
Основной процесс оцифровки аналогового сигнала — это своего рода кодирование с преобразованием, в котором используется выборка в качестве преобразования в одном или нескольких доменах.
См. также [ править ]
Ссылки [ править ]
- ^ Мухахари, Д.; Мондал, Эй Джей; Пармар, РС; Бора, AD; Маджумдер, А. (2015). «Упрощенный подход к проектированию для эффективного расчета DCT». 2015 Пятая Международная конференция по системам связи и сетевым технологиям . стр. 483–487. дои : 10.1109/CSNT.2015.134 . ISBN 978-1-4799-1797-6 . S2CID 16411333 .
- ^ Чен, Вай Кай (2004). Справочник по электротехнике . Эльзевир . п. 906. ИСБН 9780080477480 .
- ^ Ахмед, Насир (январь 1991 г.). «Как я придумал дискретное косинусное преобразование» . Цифровая обработка сигналов . 1 (1): 4–5. дои : 10.1016/1051-2004(91)90086-Z .
- ^ Станкович, Радомир С.; Астола, Яакко Т. (2012). «Воспоминания о ранней работе в DCT: интервью с К.Р. Рао» (PDF) . Отпечатки первых дней информационных наук . 60 . Проверено 13 октября 2019 г.
- ^ Ахмед, Насир ; Натараджан, Т.; Рао, КР (январь 1974 г.), «Дискретное косинусное преобразование», Транзакции IEEE на компьютерах , C-23 (1): 90–93, doi : 10.1109/TC.1974.223784 , S2CID 149806273
- ^ «T.81 – Цифровое сжатие и кодирование неподвижных изображений с непрерывным тоном – Требования и рекомендации» (PDF) . ССИТТ . Сентябрь 1992 года . Проверено 12 июля 2019 г.
- ^ Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Проверено 14 июля 2019 г.
- ^ Бранденбург, Карлхайнц (1999). «Объяснение MP3 и AAC» (PDF) . Архивировано (PDF) из оригинала 13 февраля 2017 г.