MP3
Расширение имени файла | .mp3 .bit (до 1995 г.) [1] |
---|---|
Тип интернет-СМИ | |
Разработано | Карлхайнц Бранденбург , Эрнст Эберляйн, Хайнц Герхойзер, Бернхард Гриль , Юрген Херре и Харальд Попп (все из Общества Фраунгофера ), [5] и другие |
Первоначальный выпуск | 6 декабря 1991 г [6] |
Последний выпуск | ИСО/МЭК 13818-3:1998. апрель 1998 г |
Тип формата | с потерями Звук |
Содержится | MPEG-ES |
Стандарты | |
Открытый формат ? | Да [9] |
Свободный формат ? | Патенты с истекшим сроком действия [10] |
MP3 (формально MPEG-1 Audio Layer III или MPEG-2 Audio Layer III ) [4] — это формат кодирования разработанный цифрового звука, в основном Обществом Фраунгофера в Германии под руководством Карлхайнца Бранденбурга , [11] [12] при поддержке других ученых в области цифровых технологий из других стран. Первоначально определенный как третий аудиоформат стандарта MPEG-1 , он был сохранен и расширен - определяя дополнительные скорости передачи данных и поддержку большего количества аудиоканалов - как третий аудиоформат последующего стандарта MPEG-2 . Третья версия, известная как MPEG-2.5, расширенная для лучшей поддержки более низких скоростей передачи данных , широко применяется, но не является признанным стандартом.
MP3 (или mp3 ) как формат файла обычно обозначает файлы, содержащие элементарный поток данных, закодированных в формате MPEG-1 Audio или MPEG-2 Audio, без других сложностей стандарта MP3.
Что касается сжатия звука (аспект стандарта, наиболее очевидный для конечных пользователей и благодаря которому он наиболее известен), MP3 использует сжатие данных с потерями для кодирования данных с использованием неточных приближений и частичного отбрасывания данных. Это позволяет значительно уменьшить размеры файлов по сравнению с несжатым аудио. Сочетание небольшого размера и приемлемой точности привело к буму распространения музыки через Интернет в середине-конце 1990-х годов, когда MP3 служил передовой технологией в то время, когда пропускная способность и объем памяти все еще были на первом месте. Формат MP3 вскоре стал ассоциироваться с противоречиями, связанными, среди прочего, с нарушением авторских прав , музыкальным пиратством файлами копирования и обмена , а также с сервисами MP3.com и Napster . С появлением портативных медиаплееров (в эту категорию продуктов входят и смартфоны ) поддержка MP3 остается практически универсальной.
Сжатие MP3 работает за счет уменьшения (или аппроксимации) точности определенных компонентов звука, которые, как считается (психоакустический анализ), находятся за пределами слухового восприятия большинства людей. Этот метод обычно называют перцептивным кодированием или психоакустическим моделированием. [13] Оставшаяся аудиоинформация затем записывается экономичным способом с использованием алгоритмов MDCT и FFT . По сравнению с цифровым звуком качества компакт-диска , сжатие MP3 обычно позволяет уменьшить размер на 75–95%. Например, MP3, закодированный с постоянной скоростью передачи данных 128 кбит/с, приведет к созданию файла размером примерно в 9% от размера исходного аудио компакт-диска. [14] В начале 2000-х годов проигрыватели компакт-дисков все чаще стали поддерживать воспроизведение файлов MP3 на компакт-дисках с данными.
Группа экспертов по кинематографии (MPEG) разработала MP3 как часть своих стандартов MPEG-1 , а затем и MPEG-2 . MPEG-1 Audio (MPEG-1 Part 3), который включал MPEG-1 Audio Layer I, II и III, был одобрен в качестве проекта комитета по стандарту ISO / IEC в 1991 году. [15] [16] завершено в 1992 году, [17] и опубликован в 1993 году как ISO/IEC 11172-3:1993. [7] Расширение MPEG-2 Audio (MPEG-2 Part 3) с более низкими скоростями дискретизации и битрейтами было опубликовано в 1995 году как ISO/IEC 13818-3:1995. [8] [18] Он требует лишь минимальных модификаций существующих декодеров MPEG-1 (распознавание бита MPEG-2 в заголовке и добавление новых более низких скоростей дискретизации и битрейта).
История [ править ]
Предыстория [ править ]
MP3 с потерями Алгоритм сжатия аудиоданных использует преимущество восприятия ограничения человеческого слуха, называемое слуховой маскировкой . В 1894 году американский физик Альфред М. Майер сообщил, что тон можно сделать неслышимым с помощью другого тона более низкой частоты. [19] В 1959 году Ричард Эмер описал полный набор слуховых кривых, касающихся этого явления. [20] Между 1967 и 1974 годами Эберхард Цвикер работал в области настройки и маскировки критических полос частот. [21] [22] который, в свою очередь, основывался на фундаментальных исследованиях в этой области, проведенных Харви Флетчером и его сотрудниками из Bell Labs . [23]
Перцептивное кодирование было впервые использовано для кодирования речи сжатия с помощью кодирования с линейным предсказанием (LPC). [24] которая берет свое начало в работе Фумитады Итакуры ( Университет Нагои ) и Сюдзо Сайто ( Nippon Telegraph and Telephone ) в 1966 году. [25] В 1978 году Бишну С. Атал и Манфред Р. Шредер LPC из Bell Labs предложили речевой кодек , называемый адаптивным прогнозирующим кодированием , который использовал психоакустический алгоритм кодирования, использующий маскирующие свойства человеческого уха. [24] [26] О дальнейшей оптимизации Шредера и Атала с Дж. Л. Холлом позже сообщалось в статье 1979 года. [27] В том же году кодек психоакустической маскировки был предложен М. А. Краснером. [28] который опубликовал и произвел аппаратное обеспечение для речи (непригодное для сжатия музыкальных битов), но опубликовал свои результаты в относительно малоизвестном лаборатории Линкольна. техническом отчете [29] не оказал немедленного влияния на основное направление развития психоакустических кодеков.
Дискретное косинусное преобразование (DCT), тип кодирования преобразования для сжатия с потерями , предложенное Насиром Ахмедом в 1972 году, было разработано Ахмедом совместно с Т. Натараджан и К. Р. Рао в 1973 году; они опубликовали свои результаты в 1974 году. [30] [31] [32] Это привело к разработке модифицированного дискретного косинусного преобразования (MDCT), предложенного Дж. П. Принсеном, А. В. Джонсоном и А. Б. Брэдли в 1987 году. [33] после более ранней работы Принсена и Брэдли в 1986 году. [34] Позже MDCT стал основной частью алгоритма MP3. [35]
Эрнст Терхардт и другие сотрудники построили алгоритм, описывающий слуховую маскировку с высокой точностью в 1982 году. [36] Эта работа дополнила множество отчетов авторов, относящихся еще к Флетчеру, а также к работе, которая первоначально определила критические соотношения и критические полосы пропускания.
В 1985 году Атал и Шредер представили линейное предсказание с кодовым возбуждением (CELP), алгоритм перцептивного кодирования речи на основе LPC со слуховой маскировкой, который достиг значительной для своего времени степени сжатия данных . [24] журнале IEEE В 1988 году в рецензируемом Journal on Selected Areas in Communications сообщалось о широком разнообразии (в основном перцептивных) алгоритмов сжатия звука. [37] В выпуске «Кодирование голоса для коммуникаций», опубликованном в феврале 1988 года, сообщалось о широком спектре существующих и работающих технологий сжатия аудиоданных. [37] некоторые из них используют слуховую маскировку как часть своей фундаментальной конструкции, а некоторые демонстрируют аппаратную реализацию в реальном времени.
Развитие [ править ]
Происхождение технологии MP3 полностью описано в статье профессора Ганса Мусмана. [38] который несколько лет возглавлял группу ISO MPEG Audio. В декабре 1988 года MPEG призвал к созданию стандарта кодирования звука. В июне 1989 года было представлено 14 алгоритмов кодирования звука. Из-за определенного сходства между этими предложениями по кодированию они были объединены в четыре группы разработки. Первой группой была ASPEC, созданная Fraunhofer Gesellschaft , AT&T , France Telecom , Deutsche и Thomson-Brandt . Второй группой была MUSICAM от Matsushita , CCETT , ITT и Philips . Третьей группой стал ATAC (ATRAC Coding) от Fujitsu , JVC , NEC и Sony . И четвертой группой была SB-ADPCM от NTT и BTRL. [38]
Непосредственными предшественниками MP3 были «Оптимальное кодирование в частотной области» (OCF), [39] и кодирование перцептивного преобразования (PXFM). [40] Эти два кодека вместе с разработками Thomson-Brandt в области коммутации блоков были объединены в кодек под названием ASPEC, который был представлен MPEG и выиграл конкурс качества, но был ошибочно отклонен как слишком сложный для реализации. Первой практической реализацией кодера восприятия звука (OCF) на аппаратном уровне (аппаратное обеспечение Краснера было слишком громоздким и медленным для практического использования) стала реализация кодера психоакустического преобразования на базе Motorola 56000 микросхем DSP .
Еще одним предшественником формата и технологии MP3 является перцепционный кодек MUSICAM, основанный на банке фильтров целочисленной арифметики с 32 поддиапазонами, управляемый психоакустической моделью. В первую очередь он был разработан для цифрового аудиовещания (цифрового радио) и цифрового телевидения, а его основные принципы были раскрыты научному сообществу CCETT (Франция) и IRT (Германия) в Атланте во время конференции IEEE- ICASSP в 1991 году. [41] после работы над MUSICAM с Matsushita и Philips с 1989 года. [38]
Этот кодек, встроенный в систему вещания с использованием модуляции COFDM, был продемонстрирован в эфире и в полевых условиях. [42] с Radio Canada и CRC Canada во время шоу NAB (Лас-Вегас) в 1991 году. Реализация аудиочасти этой системы вещания была основана на двухчиповом кодере (один для преобразования поддиапазонов, другой для психоакустической модели, разработанной команда Г. Столла (IRT Германия), позже известная как психоакустическая модель I) и декодер реального времени, использующий один чип Motorola 56001 DSP, на котором работает программное обеспечение для целочисленной арифметики, разработанное командой Ю. Ф. Дехери (CCETT, Франция). Простота соответствующего декодера вместе с высоким качеством звука этого кодека, впервые использующего частоту дискретизации 48 кГц и входной формат 20 бит/выборка (наивысший доступный стандарт дискретизации 1991 года, совместимый с профессиональным цифровым стандартом AES/EBU). входной студийный стандарт) стали основными причинами, по которым впоследствии характеристики MUSICAM были приняты в качестве основных функций для усовершенствованного кодека сжатия цифровой музыки.
При разработке программного обеспечения для кодирования MUSICAM команда Столла и Дехери тщательно использовала набор высококачественных материалов для оценки звука. [43] выбран группой профессионалов в области аудио из Европейского вещательного союза и позже использован в качестве эталона для оценки кодеков сжатия музыки. Метод поддиапазонного кодирования оказался эффективным не только для перцепционного кодирования высококачественных звуковых материалов, но особенно для кодирования важных перкуссионных звуковых материалов (барабаны, треугольник и т. д.) благодаря специфическому эффекту временной маскировки набор фильтров поддиапазонов MUSICAM (это преимущество является специфической особенностью методов кодирования с коротким преобразованием).
Будучи докторантом немецкого университета Эрланген-Нюрнберг , Карлхайнц Бранденбург начал работать над сжатием цифровой музыки в начале 1980-х годов, уделяя особое внимание тому, как люди воспринимают музыку. Докторскую диссертацию он завершил в 1989 году. [44] MP3 является прямым потомком OCF и PXFM и представляет собой результат сотрудничества Бранденбурга, работавшего в качестве постдокторанта в AT&T-Bell Labs с Джеймсом Д. Джонстоном («Джей-Джей») из AT&T-Bell Labs, с Институтом интегрированных технологий Фраунгофера . Circuits , Эрланген (где он работал с Бернхардом Гриллом и четырьмя другими исследователями – «Оригинальная шестерка»). [45] ), с относительно небольшим вкладом со стороны ветви кодеров психоакустических поддиапазонов MP2. В 1990 году Бранденбург стал доцентом Эрланген-Нюрнберга. Находясь там, он продолжал работать над сжатием музыки с учёными из Фраунгофера Общества Института Генриха Герца . В 1993 году он присоединился к коллективу Fraunhofer HHI. [44] Версия песни " Tom's Diner " Сюзанны Вега в акапелле была первой песней, использованной Бранденбургом для разработки формата MP3. Его использовали в качестве эталона, чтобы увидеть, насколько хорошо алгоритм сжатия MP3 обрабатывает человеческий голос. Бранденбург взял песню для тестирования, прослушивая ее снова и снова каждый раз, когда уточнял алгоритм сжатия, проверяя, чтобы он не оказал негативного влияния на воспроизведение голоса Веги. [46] Соответственно, он окрестил Вегу «Матерью MP3». [47] Инструментальную музыку было легче сжимать, но в ранних версиях формата голос Веги звучал неестественно. В конце концов Бранденбург встретил Вегу и услышал живое выступление Tom's Diner.
Стандартизация [ править ]
аудиостандарту MPEG: MUSICAM ( универсальное шаблону запроса поддиапазонов интегрированное , кодирование мультиплексирование адаптированное и к . ) 1991 году были рассмотрены два и ASPEC адаптивное спектральное ( доступных предложения по перцептивно - энтропийное В кодирование ) Метод MUSICAM, предложенный Philips (Нидерланды), CCETT (Франция), Институтом технологий вещания (Германия) и Matsushita (Япония), [48] был выбран из-за его простоты и устойчивости к ошибкам, а также из-за высокого уровня вычислительной эффективности. [49] Формат MUSICAM, основанный на поддиапазонном кодировании , стал основой формата сжатия MPEG Audio, включив, например, его структуру кадра, формат заголовка, частоту дискретизации и т. д.
Хотя большая часть технологий и идей MUSICAM была включена в определение MPEG Audio Layer I и Layer II, сам по себе банк фильтров и структура данных, основанная на кадрировании 1152 семплов (формат файла и байт-ориентированный поток) MUSICAM, остались на уровне III. (MP3) как часть вычислительно неэффективного банка гибридных фильтров . Под председательством профессора Мусмана из Ганноверского университета Лейбница редактирование стандарта было поручено Леону ван де Керкхофу (Нидерланды), Герхарду Столлю (Германия) и Иву-Франсуа Деэри (Франция), которые работали над Layer I и Layer. II. ASPEC был совместным предложением AT&T Bell Laboratories, Thomson Consumer Electronics, Общества Фраунгофера и CNET . [50] Это обеспечило высочайшую эффективность кодирования.
состоящая Рабочая группа, из ван де Керкхофа, Столла, Леонардо Кьярильоне ( вице-президент CSELT по СМИ), Ива-Франсуа Деэри, Карлхайнца Бранденбурга (Германия) и Джеймса Д. Джонстона (США), взяла идеи ASPEC, интегрировала банк фильтров Layer II, добавили некоторые из своих идей, таких как совместное стереокодирование MUSICAM, и создали формат MP3, который был разработан для достижения того же качества при скорости 128 кбит/с , что и MP2 при скорости 192 кбит/с.
Алгоритмы MPEG-1 Audio Layer I, II и III были утверждены в 1991 году. [15] [16] и завершено в 1992 г. [17] как часть MPEG-1 , первого набора стандартов MPEG , результатом которого стал международный стандарт ISO / IEC 11172-3 (он же MPEG-1 Audio или MPEG-1 Part 3 ), опубликованный в 1993 году. [7] Файлы или потоки данных, соответствующие этому стандарту, должны поддерживать частоты дискретизации 48k, 44100 и 32k и продолжать поддерживаться современными MP3-плеерами и декодерами. Таким образом, первое поколение MP3 определяло 14 × 3 = 42 интерпретации структур данных кадров MP3 и макетов размеров.
Эффективность сжатия кодеров обычно определяется скоростью передачи данных, поскольку степень сжатия зависит от разрядности и частоты дискретизации входного сигнала. Тем не менее, степени сжатия часто публикуются. Они могут использовать параметры компакт-диска (CD) в качестве эталона (44,1 кГц , 2 канала по 16 бит на канал или 2 × 16 бит) или иногда параметры SP цифровой аудиоленты (DAT) (48 кГц, 2 × 16 бит). . Коэффициенты сжатия в последнем случае выше, что демонстрирует проблему использования термина « коэффициент сжатия» для кодеров с потерями.
Карлхайнц Бранденбург использовал запись на компакт-диске Сюзанны Веги песни « Tom's Diner MP3 » для оценки и усовершенствования алгоритма сжатия . [51] Эта песня была выбрана из-за ее почти монофонической природы и широкого спектрального содержания, что позволяет легче услышать недостатки формата сжатия во время воспроизведения. Этот конкретный трек имеет интересное свойство: два канала почти, но не полностью, одинаковы, что приводит к случаю, когда снижение уровня бинауральной маскировки вызывает пространственную демаскировку шумовых артефактов, если кодер должным образом не распознает ситуацию и не применит исправления, аналогичные тем, которые подробно описано в психоакустической модели MPEG-2 AAC. Некоторые более важные аудиофрагменты ( глокеншпиль , треугольник, аккордеон и т. д.) были взяты с эталонного компакт-диска EBU V3/SQAM и использовались профессиональными звукорежиссерами для оценки субъективного качества форматов MPEG Audio. [ нужна ссылка ]
Публикация [ править ]
Эталонная реализация программного обеспечения для моделирования, написанная на языке C и позже известная как ISO 11172-5 , была разработана (в 1991–1996 годах) членами комитета ISO MPEG Audio для создания побитово-совместимых аудиофайлов MPEG (уровень 1, уровень 2, слой 3). Он был одобрен комитетом как проект технического отчета ISO/IEC в марте 1994 г. и напечатан как документ CD 11172-5 в апреле 1994 г. [52] Он был одобрен как проект технического отчета (DTR/DIS) в ноябре 1994 г. [53] доработан в 1996 году и опубликован в качестве международного стандарта ISO/IEC TR 11172-5:1998 в 1998 году. [54] Эталонное программное обеспечение на языке C было позже опубликовано как свободно доступный стандарт ISO. [55] Работая не в реальном времени в нескольких операционных системах, он смог продемонстрировать первое аппаратное декодирование в реальном времени (на основе DSP) сжатого звука. Некоторые другие реализации кодеров и декодеров MPEG Audio в реальном времени. [56] были доступны для цифрового вещания (радио DAB , телевидение DVB ) на потребительские приемники и телеприставки.
7 июля 1994 года Общество Фраунгофера выпустило первый программный кодировщик MP3 под названием l3enc . [57] .mp3 Расширение имени файла было выбрано командой Фраунгофера 14 июля 1995 года (ранее файлы назывались .bit ). [1] Благодаря первому программному MP3-плееру реального времени WinPlay3 (выпущенному 9 сентября 1995 г.) многие люди получили возможность кодировать и воспроизводить файлы MP3 на своих компьютерах. Из-за относительно небольших жестких дисков той эпохи (≈500–1000 МБ ) сжатие с потерями было необходимо для хранения музыки из нескольких альбомов на домашнем компьютере в виде полных записей (в отличие от нотации MIDI или файлов трекера , которые сочетали нотацию с короткие записи инструментов, играющих отдельные ноты).
Пример реализации Фраунгофера [ править ]
Хакер по имени SoloH обнаружил исходный код MPEG «dist10» эталонной реализации вскоре после релиза на серверах Эрлангенского университета . Он разработал более качественную версию и распространил ее в Интернете. Этот код положил начало широкому копированию компакт-дисков и распространению цифровой музыки в формате MP3 через Интернет. [58] [59] [60] [61]
Дальнейшие версии [ править ]
Дальнейшая работа над звуком MPEG [62] был завершен в 1994 году как часть второго набора стандартов MPEG, MPEG-2 , более формально известного как международный стандарт ISO/IEC 13818-3 (также известный как MPEG-2 Part 3 или обратно совместимый MPEG-2 Audio или MPEG-2 Audio BC). [18] ), первоначально опубликованный в 1995 году. [8] [63] MPEG-2 Part 3 (ISO/IEC 13818-3) определил 42 дополнительные скорости передачи данных и частоты дискретизации для MPEG-1 Audio Layer I, II и III. Новые частоты дискретизации составляют ровно половину тех, которые изначально были определены в MPEG-1 Audio. Такое снижение частоты дискретизации снижает доступную точность частоты вдвое, одновременно сокращая скорость передачи данных на 50%. MPEG-2 Part 3 также улучшил звук MPEG-1, позволив кодировать аудиопрограммы с более чем двумя каналами, вплоть до многоканального 5.1. [62] MP3, закодированный с помощью MPEG-2, обеспечивает воспроизведение половины полосы пропускания MPEG-1, подходящей для фортепиано и пения.
Третье поколение потоков данных (файлов) в стиле «MP3» расширило идеи и реализацию MPEG-2 , но было названо аудио MPEG-2.5, поскольку MPEG-3 уже имел другое значение. Это расширение было разработано в Fraunhofer IIS, зарегистрированном держателе патента MP3, путем уменьшения поля синхронизации кадров в заголовке MP3 с 12 до 11 бит. Как и при переходе от MPEG-1 к MPEG-2, в MPEG-2.5 добавляются дополнительные частоты дискретизации, ровно половина от тех, которые доступны при использовании MPEG-2. Таким образом, он расширяет возможности MP3, включая человеческую речь и другие приложения, но при этом требует только 25% полосы пропускания (воспроизведения частоты), возможной при использовании частот дискретизации MPEG-1. Несмотря на то, что MPEG-2.5 не является стандартом, признанным ISO, он широко поддерживается как недорогими китайскими, так и фирменными цифровыми аудиоплеерами, а также компьютерными программными кодировщиками MP3 ( LAME ), декодерами (FFmpeg) и проигрывателями (MPC), добавляя 3 × 8 = 24 дополнительных типа кадров MP3. Таким образом, каждое поколение MP3 поддерживает 3 частоты дискретизации, ровно вдвое меньше, чем в предыдущем поколении, всего 9 разновидностей файлов формата MP3. Таблица сравнения частоты дискретизации между MPEG-1, 2 и 2.5 приведена далее в статье. [64] [65] MPEG-2.5 поддерживается LAME (с 2000 г.), Media Player Classic (MPC), iTunes и FFmpeg.
MPEG-2.5 не был разработан MPEG (см. выше) и никогда не был утвержден в качестве международного стандарта. Таким образом, MPEG-2.5 является неофициальным или проприетарным расширением формата MP3. Тем не менее, он широко распространен и особенно выгоден для приложений человеческой речи с низкой скоростью передачи данных.
Версия | Международный стандарт [*] | Дата публичного выхода первого издания | Дата публичного выхода последнего издания |
---|---|---|---|
Звуковой уровень MPEG-1 III | ISO/IEC 11172-3. Архивировано 28 мая 2012 г. на Wayback Machine (MPEG-1, часть 3). [7] [16] | 1993 | |
Аудио MPEG-2, уровень III | ISO/IEC 13818-3. Архивировано 11 мая 2011 г. на Wayback Machine (MPEG-2, часть 3). [8] [66] | 1995 | 1998 |
Аудио уровень MPEG-2.5 III | нестандартный, запатентованный Фраунгофером [64] [65] | 2000 | 2008 |
* Стандарт ISO/IEC 11172-3 (также известный как MPEG-1 Audio) определяет три формата: MPEG-1 Audio Layer I, Layer II и Layer III. Стандарт ISO/IEC 13818-3 (также известный как MPEG-2 Audio) определяет расширенную версию MPEG-1 Audio: MPEG-2 Audio Layer I, Layer II и Layer III. MPEG-2 Audio (MPEG-2 часть 3) не следует путать с MPEG-2 AAC (MPEG-2 часть 7 – ISO/IEC 13818-7). [18]
LAME — самый продвинутый кодер MP3. [ нужна ссылка ] LAME включает кодирование с переменной скоростью передачи данных (VBR), в котором используется параметр качества, а не целевая скорость передачи данных. Более поздние версии (2008+) поддерживают цель качества n.nnn , которая автоматически выбирает частоту дискретизации MPEG-2 или MPEG-2.5 в зависимости от записей человеческой речи, для которых требуется разрешение полосы пропускания только 5512 Гц.
Интернет-распространение [ править ]
Во второй половине 1990-х годов файлы MP3 начали распространяться в Интернете , часто через подпольные сети пиратских песен. Первый известный эксперимент по распространению через Интернет был организован в начале 1990-х годов Интернет- андеграундным музыкальным архивом , более известным под аббревиатурой IUMA. После некоторых экспериментов [67] Используя несжатые аудиофайлы, этот архив начал доставлять в локальный низкоскоростной Интернет по всему миру некоторые сжатые аудиофайлы MPEG в формате MP2 (Layer II), а затем, когда стандарт был полностью завершен, использовались файлы MP3. Популярность MP3 начала быстро расти с появлением от Nullsoft аудиоплеера Winamp , выпущенного в 1997 году, сообщество которого в 2023 году все еще насчитывало 80 миллионов активных пользователей. [68] первый портативный твердотельный цифровой аудиоплеер MPMan , разработанный компанией SaeHan Information Systems со штаб-квартирой в Сеуле , Южная Корея В 1998 году был выпущен , а Rio PMP300 был продан впоследствии в 1998 году, несмотря на юридические усилия по пресечению со стороны RIAA . [69]
В ноябре 1997 года сайт mp3.com бесплатно предлагал тысячи MP3-файлов, созданных независимыми исполнителями. [69] Небольшой размер файлов MP3 позволил широко распространить одноранговый обмен файлами музыки, скопированной с компакт-дисков, что раньше было практически невозможно. Первая крупная одноранговая сеть обмена файлами Napster была запущена в 1999 году. Простота создания и обмена файлами MP3 привела к повсеместному нарушению авторских прав . Крупнейшие звукозаписывающие компании утверждали, что такое бесплатное распространение музыки снижает продажи, и называли это « музыкальным пиратством ». В ответ они подали иски против Napster , который в конечном итоге был закрыт, а затем продан, а также против отдельных пользователей, занимавшихся обменом файлами. [70]
нового поколения Несанкционированный обмен файлами MP3 продолжается в одноранговых сетях . Некоторые авторизованные сервисы, такие как Beatport , Bleep , Juno Records , eMusic , Zune Marketplace , Walmart.com , Rhapsody , звукозаписывающая индустрия одобрила реинкарнацию Napster , а Amazon.com продают неограниченную музыку в формате MP3.
Дизайн [ править ]
Структура файла [ править ]
Файл MP3 состоит из кадров MP3, которые состоят из заголовка и блока данных. Эта последовательность кадров называется элементарным потоком . Из-за «битового резервуара» кадры не являются независимыми элементами и обычно не могут быть извлечены на произвольных границах кадра. Блоки данных MP3 содержат (сжатую) аудиоинформацию в виде частот и амплитуд. На диаграмме показано, что заголовок MP3 состоит из слова синхронизации , которое используется для идентификации начала действительного кадра. За ним следует бит, указывающий, что это стандарт MPEG , и два бита, указывающие, что используется уровень 3; следовательно, MPEG-1 Audio Layer 3 или MP3. После этого значения будут различаться в зависимости от файла MP3. ISO / IEC 11172-3 определяет диапазон значений для каждого раздела заголовка вместе со спецификацией заголовка. Сегодня большинство файлов MP3 содержат ID3 метаданные , которые предшествуют кадрам MP3 или следуют за ними, как показано на схеме. Поток данных может содержать необязательную контрольную сумму .
Совместное стерео делается только покадрово. [71]
Кодирование и декодирование [ править ]
Алгоритм кодирования MP3 обычно делится на четыре части. Часть 1 делит аудиосигнал на более мелкие части, называемые кадрами, а затем на выходе применяется фильтр MDCT. Часть 2 передает образец в 1024-точечное быстрое преобразование Фурье (БПФ), затем психоакустическая применяется модель и на выходе применяется еще один фильтр MDCT. Часть 3 количественно оценивает и кодирует каждый семпл, известный как распределение шума, которое настраивается в соответствии с требованиями к скорости передачи данных и маскировке звука . Часть 4 форматирует битовый поток , называемый аудиокадром, который состоит из 4 частей: заголовка , проверки ошибок , аудиоданных и вспомогательных данных . [35]
Стандарт MPEG-1 не включает точную спецификацию кодера MP3, но предоставляет примеры психоакустических моделей, циклов скорости и т.п. в ненормативной части исходного стандарта. [72] MPEG-2 удваивает количество поддерживаемых частот дискретизации, а MPEG-2.5 добавляет еще 3. На момент написания предложенные реализации были весьма устаревшими. Реализаторы стандарта должны были разработать алгоритмы, пригодные для удаления частей информации из аудиовхода. В результате стало доступно множество различных кодеров MP3, каждый из которых создает файлы разного качества. Сравнения были широко доступны, поэтому потенциальному пользователю кодировщика было легко найти лучший выбор. Некоторые кодеры, которые умели кодировать на более высоких скоростях передачи данных (например, LAME ), не обязательно были так же хороши на более низких скоростях передачи данных. Со временем LAME развивался на веб-сайте SourceForge, пока не стал де-факто кодировщиком MP3 CBR. Позже был добавлен режим ABR. Работа продолжалась над истинно переменной скоростью передачи данных с использованием целевого показателя качества от 0 до 10. В конце концов, числа (такие как -V 9.600) могли генерировать превосходное качество кодирования голоса с низкой скоростью передачи данных со скоростью всего 41 кбит / с с использованием расширений MPEG-2.5.
MP3 использует перекрывающуюся структуру MDCT. Каждый кадр MPEG-1 MP3 состоит из 1152 выборок, разделенных на две гранулы по 576 выборок. Эти выборки, первоначально во временной области, преобразуются в одном блоке в 576 выборок в частотной области с помощью MDCT. [73] MP3 также позволяет использовать более короткие блоки в гранулах размером до 192 образцов; эта функция используется при переходного процесса обнаружении . Это ограничивает временное распространение шума квантования, сопровождающего переходный процесс (см. Психоакустика ). Разрешение по частоте ограничено небольшим размером окна длинного блока, что снижает эффективность кодирования. [71] Временное разрешение может быть слишком низким для сильно переходных сигналов и может привести к размытию перкуссионных звуков. [71]
Из-за древовидной структуры набора фильтров проблемы предэха усугубляются, поскольку комбинированная импульсная характеристика двух наборов фильтров не обеспечивает и не может обеспечить оптимальное решение по временному/частотному разрешению. [71] Кроме того, объединение выходных сигналов двух банков фильтров создает проблемы с наложением спектров, которые необходимо частично решать на этапе «компенсации сглаживания»; однако это создает избыточную энергию для кодирования в частотной области, тем самым снижая эффективность кодирования. [74]
С другой стороны, декодирование тщательно определено в стандарте. Большинство декодеров « совместимы с битовым потоком », что означает, что распакованный вывод, который они производят из данного файла MP3, будет таким же, с определенной степенью допуска округления , как вывод, математически определенный в документе высоких стандартов ISO / IEC (ISO). /МЭК 11172-3). Поэтому сравнение декодеров обычно основано на том, насколько они эффективны в вычислительном отношении (т. е. сколько памяти или процессорного времени они используют в процессе декодирования). Со временем эта проблема стала менее серьезной, поскольку тактовая частота процессора перешла с МГц на ГГц. Общая задержка кодера/декодера не определена, что означает отсутствие официального положения о воспроизведении без пауз . Однако некоторые кодировщики, такие как LAME, могут прикреплять дополнительные метаданные, которые позволят проигрывателям, которые могут их обработать, обеспечить плавное воспроизведение.
Качество [ править ]
При выполнении кодирования звука с потерями, например при создании потока данных MP3, существует компромисс между объемом генерируемых данных и качеством звука результатов. Человек, генерирующий MP3, выбирает скорость передачи данных, которая определяет, сколько килобит в секунду требуется для звука. Чем выше скорость передачи данных, тем больше будет поток данных MP3 и, как правило, тем ближе он будет звучать к исходной записи. При слишком низкой скорости передачи данных при воспроизведении могут быть слышны артефакты сжатия (т. е. звуки, которых не было в исходной записи). Некоторый звук трудно сжать из-за его хаотичности и резких атак. Когда этот тип звука сжимается, такие артефакты, как звон или предварительное эхо обычно слышны . Образец аплодисментов или треугольный инструмент с относительно низкой скоростью передачи данных являются хорошими примерами артефактов сжатия. Большинство субъективных испытаний перцептивных кодеков, как правило, избегают использования этих типов звуковых материалов, однако артефакты, создаваемые перкуссионными звуками, едва заметны из-за специфической временной маскировки 32-поддиапазонного банка фильтров уровня II, на котором основан формат. .
Помимо скорости передачи данных закодированного фрагмента звука, качество звука, закодированного в формате MP3, также зависит от качества алгоритма кодирования, а также от сложности кодируемого сигнала. Поскольку стандарт MP3 допускает некоторую свободу в алгоритмах кодирования, разные кодеры обеспечивают совершенно разное качество даже при одинаковой скорости передачи данных. Например, в тесте публичного прослушивания с участием двух ранних кодеров MP3, установленных на скорости около 128 кбит/с, [75] один набрал 3,66 по шкале от 1 до 5, а другой - только 2,22. Качество зависит от выбора кодера и параметров кодирования. [76]
Это наблюдение вызвало революцию в кодировании звука. Вначале скорость передачи данных была главным и единственным фактором. В то время файлы MP3 были самого простого типа: они использовали одинаковую скорость передачи данных для всего файла: этот процесс известен как кодирование с постоянной скоростью передачи данных (CBR). Использование постоянной скорости передачи данных упрощает кодирование и снижает нагрузку на процессор. Однако также возможно оптимизировать размер файла, создавая файлы, в которых скорость передачи данных меняется по всему файлу. Они известны как переменная скорость передачи данных. Битовый резервуар и кодирование VBR были частью исходного стандарта MPEG-1. Идея, лежащая в их основе, заключается в том, что в любом фрагменте аудио некоторые фрагменты сжимать легче, например тишину или музыку, содержащую всего несколько тонов, тогда как другие сжимать труднее. Таким образом, общее качество файла можно повысить, используя более низкую скорость передачи данных для менее сложных фрагментов и более высокую для более сложных частей. В некоторых продвинутых кодировщиках MP3 можно указать заданное качество, и кодер соответствующим образом отрегулирует скорость передачи данных. Пользователи, которым нужна определенная «настройка качества», то есть «прозрачно для их ушей» могут использовать это значение при кодировании всей своей музыки, и, вообще говоря, им не нужно беспокоиться о проведении индивидуальных тестов прослушивания каждого музыкального произведения, чтобы определить правильную скорость передачи данных.
На воспринимаемое качество могут влиять условия прослушивания (окружающий шум), внимание слушателя, его подготовка и, в большинстве случаев, аудиооборудование слушателя (например, звуковые карты, динамики и наушники). Кроме того, достаточное качество может быть достигнуто за счет более низких настроек качества для лекций и приложений, использующих человеческую речь, и сокращает время и сложность кодирования. Тест, проведенный профессором музыки Стэнфордского университета Джонатаном Бергером для новых студентов, показал, что предпочтение студентов музыке в формате MP3 растет с каждым годом. Бергер сказал, что студенты, похоже, предпочитают шипящие звуки, которые привносят в музыку MP3. [77]
Углубленное исследование качества звука MP3, проект звукорежиссера и композитора Райана Магуайра «Призрак в MP3» изолирует звуки, потерянные при сжатии MP3. В 2015 году он выпустил трек «moDernisT» (анаграмма «Tom's Diner»), составленный исключительно из звуков, удаленных при сжатии MP3 песни «Tom's Diner». [78] [79] [80] трек, первоначально использованный при разработке стандарта MP3. Подробный отчет о методах, используемых для изоляции звуков, удаленных во время сжатия MP3, а также концептуальная мотивация проекта была опубликована в материалах Международной компьютерной музыкальной конференции 2014 года. [81]
Битрейт [ править ]
MPEG-1 Аудио уровень III | MPEG-2 Аудио уровень III | MPEG-2.5 Аудио уровень III |
---|---|---|
– | 8 | 8 |
– | 16 | 16 |
– | 24 | 24 |
32 | 32 | 32 |
40 | 40 | 40 |
48 | 48 | 48 |
56 | 56 | 56 |
64 | 64 | 64 |
80 | 80 | – |
96 | 96 | – |
112 | 112 | – |
128 | 128 | – |
н/д | 144 | – |
160 | 160 | – |
192 | – | – |
224 | – | – |
256 | – | – |
320 | – | – |
MPEG-1 Аудио уровень III | MPEG-2 Аудио уровень III | MPEG-2.5 Аудио уровень III |
---|---|---|
– | – | 8 кГц |
– | – | 11,025 кГц |
– | – | 12 кГц |
– | 16 кГц | – |
– | 22,05 кГц | – |
– | 24 кГц | – |
32 кГц | – | – |
44,1 кГц | – | – |
48 кГц | – | – |
Этот раздел нуждается в дополнительных цитатах для проверки . ( Июль 2020 г. ) |
Скорость передачи данных — это произведение частоты дискретизации и количества битов на выборку, используемых для кодирования музыки. Звук компакт-диска составляет 44100 сэмплов в секунду. Количество битов на выборку также зависит от количества аудиоканалов. Компакт-диск стереофонический, 16 бит на канал. Таким образом, умножение 44100 на 32 дает 1411200 — битрейт несжатого цифрового звука компакт-диска. MP3 был разработан для кодирования данных со скоростью 1411 кбит/с со скоростью 320 кбит/с или меньше. Если алгоритмы MP3 обнаруживают менее сложные отрывки, можно использовать более низкие скорости передачи данных. При использовании MPEG-2 вместо MPEG-1 MP3 поддерживает только более низкие частоты дискретизации (16 000, 22 050 или 24 000 выборок в секунду) и предлагает выбор скорости передачи данных от 8 кбит/с, но не выше 160 кбит/с. Понижая частоту дискретизации, уровень III MPEG-2 удаляет все частоты выше половины новой частоты дискретизации, которые могли присутствовать в исходном аудио.
Как показано в этих двух таблицах, в стандарте MPEG-1 Audio Layer III разрешены 14 выбранных скоростей передачи данных: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 и 320 кбит. /с, а также три самые высокие доступные частоты дискретизации: 32, 44,1 и 48 кГц . [65] MPEG-2 Audio Layer III также допускает 14 несколько разных (и в основном более низких) скоростей передачи данных: 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 кбит/с с частоты дискретизации 16, 22,05 и 24 кГц , что ровно вдвое меньше, чем у MPEG-1. [65] Кадры MPEG-2.5 Audio Layer III ограничены только 8 битовыми скоростями: 8, 16, 24, 32, 40, 48, 56 и 64 кбит/с и тремя еще более низкими частотами дискретизации: 8, 11,025 и 12 кГц. [ нужна ссылка ] В более ранних системах, поддерживающих только стандарт MPEG-1 Audio Layer III, файлы MP3 со скоростью передачи данных ниже 32 кбит/с могли воспроизводиться с ускорением и повышением тональности.
В более ранних системах также отсутствуют элементы управления быстрой перемоткой вперед и назад для воспроизведения MP3. [83] [84]
Кадры MPEG-1 содержат наибольшую детализацию в режиме 320 кбит/с, максимально допустимой скорости передачи данных, [85] с тишиной и простыми тонами, по-прежнему требующими скорости 32 кбит/с. Кадры MPEG-2 могут захватывать воспроизведение звука с частотой до 12 кГц, необходимое для скорости до 160 кбит/с. Файлы MP3, созданные с помощью MPEG-2, не имеют полосы пропускания 20 кГц из-за теоремы выборки Найквиста-Шеннона . Воспроизведение частоты всегда строго меньше половины частоты дискретизации, а несовершенные фильтры требуют большего запаса на погрешность (уровень шума в зависимости от резкости фильтра), поэтому частота дискретизации 8 кГц ограничивает максимальную частоту до 4 кГц, а частота дискретизации 48 кГц Скорость ограничивает воспроизведение звука в формате MP3 до 24 кГц. MPEG-2 использует половину, а MPEG-2.5 только четверть частоты дискретизации MPEG-1.
Для общей области воспроизведения человеческой речи полосы пропускания 5 512 Гц достаточно для получения отличных результатов (для голоса) с использованием частоты дискретизации 11 025 и кодирования VBR из 44 100 (стандартных) WAV-файлов. Для носителей английского языка средняя скорость составляет 41–42 кбит/с с настройкой -V 9,6, но это может варьироваться в зависимости от количества записанной тишины или скорости доставки (слов в минуту). Повторная выборка до 12 000 (полоса пропускания 6K) выбирается параметром LAME -V 9.4. Аналогично -V 9.2 выбирает частоту дискретизации 16 000 и результирующую фильтрацию нижних частот 8K. Более старые версии LAME и FFmpeg поддерживают только целочисленные аргументы для параметра выбора качества с переменной скоростью передачи данных. Параметр качества n.nnn (-V) документирован на lame.sourceforge.net, но поддерживается только в LAME с новым селектором качества переменной скорости передачи данных VBR, а не средней скоростью передачи данных (ABR).
Частота дискретизации 44,1 кГц обычно используется для воспроизведения музыки, поскольку она также используется для аудио компакт-дисков , основного источника, используемого для создания файлов MP3. В Интернете используется большое разнообразие скоростей передачи данных. Обычно используется скорость передачи данных 128 кбит/с. [86] со степенью сжатия 11:1, обеспечивая адекватное качество звука в относительно небольшом пространстве. Поскольку доступность полосы пропускания Интернета и размеры жестких дисков увеличились, широкое распространение получили более высокие скорости передачи данных до 320 кбит/с. Несжатый звук, хранящийся на аудио-CD, имеет скорость передачи данных 1411,2 кбит/с (16 бит/выборку × 44 100 выборок в секунду × 2 канала / 1000 бит/килобит), поэтому скорость передачи данных составляет 128, 160 и 192 кбит. /s представляют степени сжатия примерно 11:1, 9:1 и 7:1 соответственно.
Нестандартная скорость передачи данных до 640 кбит/с может быть достигнута с помощью кодера LAME и опции свободного формата, хотя немногие MP3-плееры могут воспроизводить эти файлы. Согласно стандарту ISO, декодеры должны иметь возможность декодировать только потоки со скоростью до 320 кбит/с. [87] [88] [89] Ранние кодеры MPEG Layer III использовали то, что сейчас называется постоянной скоростью передачи данных (CBR). Программное обеспечение могло использовать только одинаковую скорость передачи данных для всех кадров в файле MP3. Позже более сложные кодеры MP3 смогли использовать битовый резервуар для определения средней скорости передачи данных , выбирая скорость кодирования для каждого кадра в зависимости от сложности звука в этой части записи.
Более сложный кодер MP3 может воспроизводить звук с переменной скоростью передачи данных. Звук MPEG может использовать переключение скорости передачи данных для каждого кадра, но его должны поддерживать только декодеры уровня III. [65] [90] [91] [92] VBR используется, когда целью является достижение фиксированного уровня качества. Конечный размер файла при кодировании VBR менее предсказуем, чем при постоянной скорости передачи данных. Средняя скорость передачи данных — это тип VBR, реализованный как компромисс между ними: скорость передачи данных может варьироваться для более стабильного качества, но контролируется так, чтобы оставаться близкой к среднему значению, выбранному пользователем, для предсказуемых размеров файлов. Хотя декодер MP3 должен поддерживать VBR, чтобы соответствовать стандартам, исторически некоторые декодеры имели ошибки с декодированием VBR, особенно до того, как кодеры VBR получили широкое распространение. Самый совершенный MP3-кодер LAME поддерживает создание MP3-форматов VBR, ABR и даже более старых форматов CBR.
Аудио уровня III также может использовать «битовый резервуар», способность частично полного кадра хранить часть аудиоданных следующего кадра, что позволяет временно изменять эффективную скорость передачи данных даже в потоке с постоянной скоростью передачи данных. [65] [90] Внутренняя обработка битового резервуара увеличивает задержку кодирования. [ нужна ссылка ] Полоса масштабного коэффициента 21 (sfb21) отсутствует для частот выше примерно 16 кГц , что вынуждает кодер выбирать между менее точным представлением в полосе 21 или менее эффективным хранением во всех полосах ниже полосы 21, что приводит к потере битовой скорости при кодировании VBR. . [93]
Вспомогательные данные [ править ]
Поле вспомогательных данных можно использовать для хранения пользовательских данных. Вспомогательные данные являются необязательными, и количество доступных бит явно не указывается. Вспомогательные данные располагаются после битов кода Хаффмана и находятся в диапазоне, на который указывает main_data_begin следующего кадра. Кодер mp3PRO использовал вспомогательные данные для кодирования дополнительной информации, которая могла улучшить качество звука при декодировании с помощью его алгоритма.
Метаданные [ править ]
«Тег» в аудиофайле — это раздел файла, содержащий метаданные , такие как название, исполнитель, альбом, номер трека или другую информацию о содержимом файла. Стандарты MP3 не определяют форматы тегов для файлов MP3, а также не существует стандартного формата контейнера , который поддерживал бы метаданные и устранял бы необходимость в тегах. Однако де-факто существует несколько стандартов форматов тегов. По состоянию на 2010 год наиболее распространенными являются ID3v1 и ID3v2 , а совсем недавно представленный APEv2 . Эти теги обычно встраиваются в начало или конец файлов MP3 отдельно от фактических данных кадра MP3. Декодеры MP3 либо извлекают информацию из тегов, либо просто обрабатывают их как игнорируемые ненужные данные, не относящиеся к MP3.
Программное обеспечение для воспроизведения и редактирования часто содержит функции редактирования тегов, но существуют также приложения для редактирования тегов, предназначенные для этой цели. Помимо метаданных об аудиоконтенте, для DRM также могут использоваться теги . [94] ReplayGain — это стандарт измерения и хранения громкости MP3-файла ( нормализация звука ) в его теге метаданных, позволяющий проигрывателю, совместимому с ReplayGain, автоматически регулировать общую громкость воспроизведения для каждого файла. MP3Gain можно использовать для обратимого изменения файлов на основе измерений ReplayGain, чтобы обеспечить корректное воспроизведение на проигрывателях без функции ReplayGain.
право собственности и законодательство Лицензирование ,
Базовая технология декодирования и кодирования MP3 не имеет патентов в Европейском Союзе, срок действия всех патентов там истек не позднее 2012 года. В США 16 апреля 2017 года технология стала практически безпатентной (см. ниже). Срок действия патентов на MP3 истек в США в период с 2007 по 2017 год. В прошлом многие организации заявляли о своих правах на патенты, связанные с декодированием или кодированием MP3. Эти претензии привели к нескольким юридическим угрозам и действиям из различных источников. В результате в странах, где разрешены патенты на программное обеспечение , неопределенность относительно того, какие патенты должны быть лицензированы для создания продуктов MP3 без нарушения патентных прав, была обычным явлением на ранних этапах внедрения технологии.
Первоначальный почти полный стандарт MPEG-1 (части 1, 2 и 3) был общедоступен 6 декабря 1991 года как ISO CD 11172. [95] [96] В большинстве стран патенты не могут быть поданы после предшествующего уровня техники обнародования , а срок действия патентов истекает через 20 лет после первоначальной даты подачи заявки, а в других странах срок действия патентов может составлять до 12 месяцев. В результате срок действия патентов, необходимых для реализации MP3, истек в большинстве стран к декабрю 2012 года, через 21 год после публикации ISO CD 11172.
Исключением являются Соединенные Штаты, где патенты, действующие, но поданные до 8 июня 1995 г., истекают по истечении 17 лет с даты выдачи или 20 лет с даты приоритета. Длительный процесс выдачи патента может привести к тому, что патент будет выдан намного позже, чем обычно ожидается (см. Патенты на подводные лодки ). Срок действия различных патентов, связанных с MP3, истек в США в период с 2007 по 2017 год. [97] Патенты на что-либо, раскрытое в ISO CD 11172, поданные через год или более после его публикации, сомнительны. Если учитывать только известные патенты на MP3, поданные до декабря 1992 года, то декодирование MP3 является в США безпатентным с 22 сентября 2015 года, когда истек срок действия патента США № 5 812 672 , поданный по процедуре PCT в октябре 1992 года. [98] [99] [100] Если принять за меру самый продолжительный патент, упомянутый в вышеупомянутых ссылках, то технология MP3 стала безпатентной в Соединенных Штатах 16 апреля 2017 года, когда вступил в силу патент США № 6 009 399 . [101] и администрируется Technicolor , [102] истекший. В результате многие проекты бесплатного программного обеспечения с открытым исходным кодом , такие как операционная система Fedora , решили начать поддержку MP3 по умолчанию, и пользователям больше не придется прибегать к установке неофициальных пакетов, поддерживаемых сторонними репозиториями программного обеспечения для MP3. воспроизведение или кодирование. [103]
Компания Technicolor (ранее называвшаяся Thomson Consumer Electronics) утверждала, что контролирует лицензирование MP3 по патентам уровня 3 во многих странах, включая США, Японию, Канаду и страны ЕС. [104] Technicolor активно защищала эти патенты. [105] Доходы от лицензий на MP3 от администрации Technicolor принесли Обществу Фраунгофера около 100 миллионов евро в 2005 году. [106] В сентябре 1998 года Институт Фраунгофера разослал письмо нескольким разработчикам программного обеспечения для MP3, в котором говорилось, что для «распространения и/или продажи декодеров и/или кодировщиков» требуется лицензия. В письме утверждалось, что нелицензионные продукты «нарушают патентные права Фраунгофера и Томсона. Чтобы производить, продавать или распространять продукты с использованием стандарта [MPEG Layer-3] и, следовательно, наших патентов, вам необходимо получить у нас лицензию по этим патентам». [107] Это привело к ситуации, когда проект кодировщика MP3 LAME не мог предложить своим пользователям официальные двоичные файлы, которые можно было бы запускать на их компьютерах. Позиция проекта заключалась в том, что в качестве исходного кода LAME был просто описанием того, как можно реализовать кодировщик MP3. Неофициально скомпилированные двоичные файлы были доступны из других источников.
Sisvel SpA, компания со штаб-квартирой в Люксембурге, управляет лицензиями на патенты, применимые к MPEG Audio. [108] Они вместе со своей дочерней компанией в США Audio MPEG, Inc. ранее подали в суд на Thomson за нарушение патентных прав на технологию MP3. [109] но эти споры были разрешены в ноябре 2005 года, когда Sisvel предоставила Thomson лицензию на свои патенты. Вскоре за этим последовала Motorola и в декабре 2005 года подписала с Sisvel соглашение о лицензировании патентов, связанных с MP3. [110] За исключением трех патентов, патенты США, администрируемые Sisvel [111] срок действия всех патентов истек в 2015 году. Три исключения: патент США № 5 878 080 , срок действия которого истек в феврале 2017 года; Патент США № 5 850 456 , срок действия которого истек в феврале 2017 г.; и патент США № 5 960 037 , срок действия которого истек 9 апреля 2017 года. Примерно с первого квартала 2023 года программа лицензирования Sisvel стала унаследованной. [112]
В сентябре 2006 года немецкие чиновники конфисковали MP3-плееры со SanDisk стенда на выставке IFA в Берлине после того, как итальянская патентная фирма выиграла судебный запрет от имени Sisvel против SanDisk в споре о лицензионных правах. Позднее судебный запрет был отменен берлинским судьей. [113] но это изменение, в свою очередь, было заблокировано в тот же день другим судьей того же суда, что, по словам одного комментатора, «принесло в Германию Патентный Дикий Запад». [114] В феврале 2007 года компания Texas MP3 Technologies подала в суд на Apple, Samsung Electronics и Sandisk в федеральном суде восточного Техаса , заявив о нарушении патента на портативный MP3-плеер, который, по словам Texas MP3, был передан ему. Apple, Samsung и Sandisk урегулировали иски против них в январе 2009 года. [115] [116]
Alcatel-Lucent заявила в своих собственных судебных процессах несколько патентов на кодирование и сжатие MP3, предположительно унаследованных от AT&T-Bell Labs. В ноябре 2006 года, еще до слияния компаний, Alcatel подала в суд на Microsoft за нарушение семи патентов. 23 февраля 2007 года суд присяжных Сан-Диего присудил Alcatel-Lucent компенсацию в размере 1,52 миллиарда долларов США за нарушение двух из них. [117] Однако впоследствии суд отменил решение, установив, что один патент не был нарушен, а другой не принадлежал Alcatel-Lucent; что совладельцами компании были AT&T и Фраунгофер, которые передали лицензию Microsoft . Судья постановил, [118] Это решение защиты было оставлено в силе в апелляционном порядке в 2008 году. [119]
Альтернативные технологии [ править ]
Существуют и другие форматы с потерями. Среди них Advanced Audio Coding наиболее широко используется (AAC), который был разработан как преемник MP3. Существуют также другие форматы с потерями, такие как mp3PRO и MP2 . Они являются членами того же технологического семейства, что и MP3, и зависят от примерно аналогичных психоакустических моделей и алгоритмов MDCT. В то время как MP3 использует гибридный подход кодирования, который частично состоит из MDCT и частично из FFT , AAC представляет собой чисто MDCT, что значительно повышает эффективность сжатия. [120] Многие из основных патентов, лежащих в основе этих форматов, принадлежат Обществам Фраунгофера, Alcatel-Lucent, Thomson Consumer Electronics , [120] Белл , Dolby , LG Electronics , NEC , NTT Docomo , Panasonic , Sony Corporation , [121] ETRI , JVC Kenwood , Philips , Microsoft и NTT . [122]
Когда рынок цифровых аудиоплееров развивался, MP3 получил широкое распространение в качестве стандарта, отсюда и популярное название «MP3-плеер». Sony была исключением и использовала собственный кодек ATRAC, взятый из формата MiniDisc , который, по утверждению Sony, был лучше. [123] После критики и более низких, чем ожидалось, продаж Walkman , в 2004 году Sony впервые представила встроенную поддержку MP3 в своих плеерах Walkman. [124]
Существуют также открытые форматы сжатия, такие как Opus и Vorbis , которые доступны бесплатно и без каких-либо известных патентных ограничений. Некоторые из новых форматов сжатия звука, такие как AAC, WMA Pro, Vorbis и Opus, свободны от некоторых ограничений, присущих формату MP3, которые не может преодолеть ни один кодировщик MP3. [97] [125]
Помимо методов сжатия с потерями, форматы без потерь являются существенной альтернативой MP3, поскольку они обеспечивают неизмененный аудиоконтент, хотя и с увеличенным размером файла по сравнению со сжатием с потерями. К форматам без потерь относятся FLAC (бесплатный аудиокодек без потерь), Apple Lossless и многие другие.
См. также [ править ]
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б «С Днем Рождения, MP3!» . Фраунгофера ИИС. 12 июля 2005 г. Архивировано из оригинала 11 декабря 2014 г. Проверено 18 июля 2010 г.
- ^ Нильссон, М. (ноябрь 2000 г.). «Тип носителя audio/mpeg — RFC 3003» . IETF. дои : 10.17487/RFC3003 . Архивировано из оригинала 13 апреля 2012 года . Проверено 7 декабря 2009 г.
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Каснер, С.; Хошка, П. (июль 2003 г.). «Регистрация типов MIME форматов полезной нагрузки RTP — RFC 3555» . IETF. дои : 10.17487/RFC3555 . Архивировано из оригинала 14 января 2012 года . Проверено 7 декабря 2009 г.
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ↑ Перейти обратно: Перейти обратно: а б Финлейсон, Р. (февраль 2008 г.). «Более устойчивый к потерям формат полезной нагрузки RTP для аудио MP3 — RFC 5219» . IETF. дои : 10.17487/RFC5219 . Архивировано из оригинала 26 января 2021 года . Проверено 4 декабря 2014 г.
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ «Команда mp3» . Фраунгофера ИИС . Архивировано из оригинала 14 июля 2020 года . Проверено 12 июня 2020 г.
- ^ Патель К., Смит Б.К., Роу Л.А. (1 сентября 1993 г.). «Производительность программного декодера видео MPEG» . Материалы первой международной конференции ACM по мультимедиа-МУЛЬТИМЕДИА'93 . АКМ Мультимедиа. Нью-Йорк: Ассоциация вычислительной техники. стр. 75–82. дои : 10.1145/166266.166274 . ISBN 978-0-89791-596-0 . S2CID 3773268 . Архивировано из оригинала 15 декабря 2021 года . Проверено 15 декабря 2021 г. Ссылка 3 в документе относится к проекту комитета стандарта ISO/IEC 11172 от 6 декабря 1991 г.
- ↑ Перейти обратно: Перейти обратно: а б с д «ISO/IEC 11172-3:1993 – Информационные технологии. Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с. Часть 3: Аудио» . ИСО. 1993. Архивировано из оригинала 28 мая 2012 года . Проверено 14 июля 2010 г.
- ↑ Перейти обратно: Перейти обратно: а б с д «ИСО/МЭК 13818-3:1995 – Информационные технологии. Общее кодирование движущихся изображений и связанной с ними аудиоинформации. Часть 3: Аудио» . ИСО. 1995. Архивировано из оригинала 12 января 2012 года . Проверено 14 июля 2010 г.
- ^ «Технология MP3 в Fraunhofer IIS» . Фраунгофера ИИС . Архивировано из оригинала 15 августа 2021 года . Проверено 12 июня 2020 г.
- ^ MP3 (кодирование звука MPEG Layer III) (полный проект). Устойчивость цифровых форматов. Вашингтон, округ Колумбия: Библиотека Конгресса. 3 мая 2017 года . Проверено 1 декабря 2021 г.
- ^ «73. «Отец» MP3 Карлхайнц Бранденбург» . Архивировано из оригинала 2 января 2023 года . Проверено 2 января 2023 г. - через www.youtube.com.
- ^ «К 20-летию MP3, интервью с «отцом» MP3 Карлхайнцем Бранденбургом» . Архивировано из оригинала 2 января 2023 года . Проверено 2 января 2023 г.
- ^ Джаянт, Никил ; Джонстон, Джеймс; Сафранек, Роберт (октябрь 1993 г.). «Сжатие сигналов на основе моделей человеческого восприятия». Труды IEEE . 81 (10): 1385–1422. дои : 10.1109/5.241504 .
- ^ «MP3 (кодирование звука MPEG Layer III)» . Библиотека Конгресса. 27 июля 2017 года. Архивировано из оригинала 14 августа 2017 года . Проверено 9 ноября 2017 г.
- ↑ Перейти обратно: Перейти обратно: а б ИСО (ноябрь 1991 г.). «Пресс-релиз MPEG, Курихама, ноябрь 1991 г.» . ИСО. Архивировано из оригинала 3 мая 2011 года . Проверено 17 июля 2010 г.
- ↑ Перейти обратно: Перейти обратно: а б с д и ИСО (ноябрь 1991 г.). «CD 11172-3 – КОДИРОВАНИЕ ДВИЖУЩИХСЯ ИЗОБРАЖЕНИЙ И СООТВЕТСТВУЮЩЕГО АУДИО ДЛЯ ЦИФРОВЫХ НОСИТЕЛЕЙ СО СКОРОСТЬЮ ДО 1,5 МБИТ/С, ЧАСТЬ 3 АУДИО» (PDF) . Архивировано из оригинала (PDF) 30 декабря 2013 года . Проверено 17 июля 2010 г.
- ↑ Перейти обратно: Перейти обратно: а б ИСО (6 ноября 1992 г.). «Пресс-релиз MPEG, Лондон, 6 ноября 1992 г.» . Кьярильоне. Архивировано из оригинала 12 августа 2010 года . Проверено 17 июля 2010 г.
- ↑ Перейти обратно: Перейти обратно: а б с ИСО (октябрь 1998 г.). «Часто задаваемые вопросы по MPEG Audio, версия 9 – MPEG-1 и MPEG-2 BC» . ИСО. Архивировано из оригинала 18 февраля 2010 года . Проверено 28 октября 2009 г.
- ^ Майер, Альфред Маршалл (1894). «Исследования по акустике» . Философский журнал Лондона, Эдинбурга и Дублина . 37 (226): 259–288. дои : 10.1080/14786449408620544 . Архивировано из оригинала 12 сентября 2019 года . Проверено 26 июня 2019 г.
- ^ Эмер, Ричард Х. (1959). «Маскировка тонами и полосами шума». Журнал Акустического общества Америки . 31 (9): 1253. Бибкод : 1959ASAJ...31.1253E . дои : 10.1121/1.1907853 .
- ^ Цвикер, Эберхард (1974). «О психоакустическом эквиваленте кривых настройки». Факты и модели в слушании . Связь и кибернетика. Том. 8. С. 132–141 . дои : 10.1007/978-3-642-65902-7_19 . ISBN 978-3-642-65904-1 .
- ^ Цвикер, Эберхард; Фельдткеллер, Ричард (1999) [1967]. как приемник сообщения Ухо Пер. Ханнеса Мюша, Сёрена Бууса и Мэри Флорентайн. Архивировано из оригинала 14 сентября 2000 года . Проверено 29 июня 2008 г.
- ^ Флетчер, Харви (1995). Речь и слух в общении . Акустическое общество Америки. ISBN 978-1-56396-393-3 .
- ↑ Перейти обратно: Перейти обратно: а б с Шредер, Манфред Р. (2014). «Лаборатории Белла» . Акустика, информация и связь: Мемориальный том в честь Манфреда Р. Шредера . Спрингер. п. 388. ИСБН 978-3-319-05660-9 .
- ^ Грей, Роберт М. (2010). «История цифровой речи в реальном времени в пакетных сетях: Часть II линейного прогнозирующего кодирования и интернет-протокола» (PDF) . Найденный. Процесс сигналов трендов . 3 (4): 203–303. дои : 10.1561/2000000036 . ISSN 1932-8346 . Архивировано (PDF) из оригинала 9 октября 2022 года . Проверено 14 июля 2019 г.
- ^ Атал, Б.; Шредер, М. (1978). «Прогнозирующее кодирование речевых сигналов и субъективные критерии ошибок». ИКАССП '78. Международная конференция IEEE по акустике, речи и обработке сигналов . Том. 3. С. 573–576. дои : 10.1109/ICASSP.1978.1170564 .
- ^ Шредер, MR ; Атал, Б.С. ; Холл, Дж. Л. (декабрь 1979 г.). «Оптимизация цифровых кодеров речи путем использования маскирующих свойств человеческого уха». Журнал Акустического общества Америки . 66 (6): 1647. Бибкод : 1979ASAJ...66.1647S . дои : 10.1121/1.383662 .
- ^ Краснер, Массачусетс (18 июня 1979 г.). Цифровое кодирование речи и аудиосигналов на основе перцептивных потребностей слуховой системы (Диссертация). Массачусетский технологический институт. hdl : 1721.1/16011 .
- ^ Краснер, Массачусетс (18 июня 1979 г.). «Цифровое кодирование речи на основе перцептивных требований слуховой системы (технический отчет 535)» (PDF) . Архивировано (PDF) из оригинала 3 сентября 2017 г.
- ^ Ахмед, Насир (январь 1991 г.). «Как я придумал дискретное косинусное преобразование» . Цифровая обработка сигналов . 1 (1): 4–5. дои : 10.1016/1051-2004(91)90086-Z . Архивировано из оригинала 10 июня 2016 года . Проверено 19 ноября 2019 г.
- ^ Ахмед, Насир ; Натараджан, Т.; Рао, КР (январь 1974 г.), «Дискретное косинусное преобразование», Транзакции IEEE на компьютерах , C-23 (1): 90–93, doi : 10.1109/TC.1974.223784 , S2CID 149806273
- ^ Рао, КР ; Йип, П. (1990), Дискретное косинусное преобразование: алгоритмы, преимущества, приложения , Бостон: Academic Press, ISBN 978-0-12-580203-1
- ^ Дж. П. Принсен, А. В. Джонсон и А. Б. Брэдли: Кодирование поддиапазонов/преобразований с использованием конструкций банка фильтров на основе отмены наложения псевдонимов во временной области , IEEE Proc. Международный Конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987 г.
- ^ Джон П. Принсен, Алан Б. Брэдли: Разработка банка фильтров анализа/синтеза на основе отмены псевдонимов во временной области , IEEE Trans. Акуст. Обработка речевых сигналов, ASSP-34 (5), 1153–1161, 1986 г.
- ↑ Перейти обратно: Перейти обратно: а б Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Архивировано (PDF) из оригинала 12 февраля 2021 года . Проверено 14 июля 2019 г.
- ^ Терхардт, Э.; Столл, Г.; Зеванн, М. (март 1982 г.). «Алгоритм извлечения высоты тона и значимости тона из сложных тональных сигналов». Журнал Акустического общества Америки . 71 (3): 679. Бибкод : 1982ASAJ...71..679T . дои : 10.1121/1.387544 .
- ↑ Перейти обратно: Перейти обратно: а б «Голосовое кодирование для связи». Журнал IEEE по избранным областям коммуникаций . 6 (2). Февраль 1988 года.
- ↑ Перейти обратно: Перейти обратно: а б с Генезис стандарта кодирования аудио MP3 в транзакциях IEEE в бытовой электронике, IEEE, Vol. 52, №. 3, стр. 1043–1049, август 2006 г.
- ^ Бранденбург, Карлхайнц; Зейцер, Дитер (3–6 ноября 1988 г.). OCF: кодирование высококачественного звука со скоростью передачи данных 64 кбит/с . 85-й съезд Общества аудиоинженеров. Архивировано из оригинала 4 июня 2008 года . Проверено 18 марта 2008 г.
- ^ Джонстон, Джеймс Д. (февраль 1988 г.). «Преобразование кодирования аудиосигналов с использованием критериев перцептивного шума». Журнал IEEE по избранным областям коммуникаций . 6 (2): 314–323. дои : 10.1109/49.608 .
- ^ Ю. Ф. Дехери и др. (1991) Исходный кодек MUSICAM для цифрового аудиовещания и хранения. Труды IEEE-ICASSP, 91 страница, 3605–3608, май 1991 г.
- ^ «Комментарий DAB от Алана Бокса, EZ Communication и председателя оперативной группы NAB DAB» (PDF) .
- ^ Компакт-диск EBU SQAM. Оценка качества звука. Записи материалов для субъективных тестов . 7 октября 2008 г. Архивировано из оригинала 11 февраля 2017 г. Проверено 8 февраля 2017 г.
- ↑ Перейти обратно: Перейти обратно: а б Юинг, Джек (5 марта 2007 г.). «Как родился MP3» . Блумберг БизнесУик . Архивировано из оригинала 15 марта 2016 года . Проверено 24 июля 2007 г.
- ^ Витт, Стивен (2016). Как музыка стала бесплатной: конец индустрии, начало века и терпеливый ноль пиратства . Соединенные Штаты Америки: Penguin Books. п. 13. ISBN 978-0-14-310934-1 .
К Бранденбургу и Грилю присоединились еще четыре исследователя Фраунгофера. Хайнц Герхаузер руководил исследовательской группой в области аудио; Харальд Попп был специалистом по аппаратному обеспечению; Эрнст Эберляйн был экспертом по обработке сигналов; Юрген Херре был еще одним аспирантом, чье математическое мастерство не уступало Бранденбургу. В последующие годы эта группа будет называть себя «первоначальной шестеркой».
- ^ Джонатан Стерн (17 июля 2012 г.). MP3: значение формата . Издательство Университета Дьюка. п. 178. ИСБН 978-0-8223-5287-7 .
- ^ «Сюзанна Вега | Биография» . Официальное сообщество Сюзанны Веги . Архивировано из оригинала 18 января 2022 года . Проверено 17 января 2022 г.
- ^ Технология цифрового видео- и аудиовещания: Практическое инженерное руководство (Сигналы и коммуникационные технологии) ISBN 3-540-76357-0 стр. 144: «В 1988 году метод MASCAM был разработан в Институте радиотехнической техники (IRT) в Мюнхене в рамках подготовки к системе цифрового аудиовещания (DAB). Из MASCAM произошел MUSICAM (шаблон маскировки, универсальное интегрированное кодирование поддиапазонов и мультиплексирование). Метод был разработан в 1989 году в сотрудничестве с CCETT, Philips и Matsushita».
- ^ «Отчет о состоянии ISO MPEG» (Пресс-релиз). Международная организация по стандартизации . Сентябрь 1990 г. Архивировано из оригинала 14 февраля 2010 г.
- ^ «Aspec-Адаптивное спектрально-энтропийное кодирование высококачественных музыкальных сигналов» . Электронная библиотека AES . 1991. Архивировано из оригинала 11 мая 2011 года . Проверено 24 августа 2010 г.
- ^ «MP3: история инноваций и предательства» . ЭНЕРГЕТИЧЕСКИЙ ЯДЕРНЫЙ РЕАКТОР . 23 марта 2011 г. Архивировано из оригинала 3 августа 2023 г. . Проверено 3 августа 2023 г.
- ^ MPEG (25 марта 1994 г.). «Одобрено на 26-м заседании (Париж)» . Архивировано из оригинала 26 июля 2010 года . Проверено 5 августа 2010 г.
- ^ MPEG (11 ноября 1994 г.). «Одобрено на 29-м заседании» . Архивировано из оригинала 8 августа 2010 года . Проверено 5 августа 2010 г.
- ^ ИСО. «ISO/IEC TR 11172-5:1998 – Информационные технологии – Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с – Часть 5: Программное моделирование» . Архивировано из оригинала 11 мая 2011 года . Проверено 5 августа 2010 г.
- ^ «ISO/IEC TR 11172-5:1998 – Информационные технологии – Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с – Часть 5: Программное моделирование (Справочное программное обеспечение)» (ZIP) . Архивировано из оригинала 30 декабря 2006 года . Проверено 5 августа 2010 г.
- ^ Деэри, Ив-Франсуа (1994). Стандарт высококачественного кодирования звука для радиовещательных, телекоммуникационных и мультимедийных систем . Нидерланды: Elsevier Science BV. стр. 53–64. ISBN 978-0-444-81580-4 .
В этой статье речь идет о рабочей станции сжатого цифрового аудио Musicam (MPEG Audio Layer II), реализованной на микрокомпьютере, используемой не только в качестве профессиональной станции редактирования, но и в качестве сервера в Ethernet для библиотеки сжатого цифрового аудио, что предвосхищает будущее MP3 в Интернете.
- ^ «Технологии MP3 сегодня» . Много познавательной информации о музыке . 2005. Архивировано из оригинала 4 июля 2008 года . Проверено 15 сентября 2016 г.
- ↑ Небесный музыкальный автомат. Архивировано 30 апреля 2013 года в Wayback Machine на The Atlantic. «Чтобы показать предприятиям, как использовать кодек, MPEG собрал бесплатный образец программы, которая конвертировала музыку в файлы MP3. Демонстрационное программное обеспечение создавало звук низкого качества, и Фраунгофер «Исходный код» программного обеспечения — лежащие в его основе инструкции — хранился на легкодоступном компьютере в Университете Эрлангена, с которого он был загружен неким SoloH, хакером из Нидерландов (и еще одним). предполагает фанат «Звездных войн»). SoloH обновил исходный код, чтобы создать программное обеспечение, которое преобразует треки компакт-дисков в музыкальные файлы приемлемого качества». (2000)
- ^ Поп-идолы и пираты: механизмы потребления и глобальная циркуляция ... Архивировано 15 октября 2023 года в Wayback Machine доктором Чарльзом Фэйрчайлдом.
- ^ Технологии пиратства? - Исследование взаимодействия между коммерциализмом и идеализмом в развитии MP3 и DivX. Архивировано 19 сентября 2020 года в Wayback Machine, авторы: ХЕНДРИК СТОРШТЕЙН СПИЛКЕР, СВЕЙН ХОЙЕР, страница 2072.
- ^ www.euronet.nl/~soloh/mpegEnc/ ( Archive.org )
- ↑ Перейти обратно: Перейти обратно: а б «Принято на 22-м заседании WG11» (пресс-релиз). Международная организация по стандартизации . 2 апреля 1993 года. Архивировано из оригинала 6 августа 2010 года . Проверено 18 июля 2010 г.
- ^ Бранденбург, Карлхайнц; Боси, Марина (февраль 1997 г.). «Обзор MPEG Audio: текущие и будущие стандарты кодирования аудио с низкой скоростью передачи данных» . Журнал Общества аудиоинженеров . 45 (1/2): 4–21. Архивировано из оригинала 17 апреля 2009 года . Проверено 30 июня 2008 г.
- ↑ Перейти обратно: Перейти обратно: а б с д «Технические подробности MP3 (MPEG-2 и MPEG-2.5)» . Фраунгофера ИИС . Сентябрь 2007 г. Архивировано из оригинала 24 января 2008 г.
«MPEG-2.5» — это название собственного расширения, разработанного Fraunhofer IIS. Он позволяет MP3 удовлетворительно работать при очень низких битрейтах и вводит дополнительные частоты дискретизации 8 кГц, 11,025 кГц и 12 кГц.
- ↑ Перейти обратно: Перейти обратно: а б с д и ж г час я Супурович, Предраг (22 декабря 1999 г.). «Заголовок аудиокадра MPEG» . Архивировано из оригинала 7 сентября 2008 года . Проверено 29 мая 2009 г.
- ↑ Перейти обратно: Перейти обратно: а б с «ISO/IEC 13818-3:1994(E) – Информационные технологии. Общее кодирование движущихся изображений и связанного с ними аудио: аудио» (ZIP) . 11 ноября 1994 года. Архивировано из оригинала 13 июня 2010 года . Проверено 4 августа 2010 г.
- ^ «Об интернет-архиве андеграундной музыки» .
- ^ Вайнилавичюс, Юстинас (15 ноября 2023 г.). «Winamp вернулся после обновления; вызывающий ностальгию вид остался неизменным» . киберньюс . Архивировано из оригинала 4 декабря 2023 года . Проверено 8 декабря 2023 г.
- ↑ Перейти обратно: Перейти обратно: а б Шуберт, Рут (10 февраля 1999 г.). «Технически подкованные люди получают музыку за песню; индустрия разочарована тем, что Интернет делает бесплатную музыку простой» . Сиэтлский пост-разведчик . Проверено 22 ноября 2008 г. [ постоянная мертвая ссылка ]
- ^ Гислер, Маркус (2008). «Конфликт и компромисс: драма в эволюции рынка». Журнал потребительских исследований . 34 (6): 739–753. CiteSeerX 10.1.1.564.7146 . дои : 10.1086/522098 . S2CID 145796529 .
- ↑ Перейти обратно: Перейти обратно: а б с д Бувинь, Габриэль (2003). «Технология MP3 — ограничения» . Архивировано из оригинала 7 января 2011 года.
- ^ «ИСО/МЭК 11172-3:1993/Кор 1:1996» . Международная организация по стандартизации . 2006. Архивировано из оригинала 11 мая 2011 года . Проверено 27 августа 2009 г.
- ^ Тейлор, Марк (июнь 2000 г.). «Технические часто задаваемые вопросы LAME» . Архивировано из оригинала 8 декабря 2023 года . Проверено 9 декабря 2023 г.
- ^ Либерман, Сербия. DSP — технология мультимедиа .
- ^ Аморим, Роберто (3 августа 2003 г.). «Результаты публичного прослушивания расширения 128 кбит/с» . Архивировано из оригинала 27 декабря 2011 года . Проверено 17 марта 2007 г.
- ^ Марес, Себастьян (декабрь 2005 г.). «Результаты публичного теста прослушивания мультиформата @ 128 кбит/с» . Архивировано из оригинала 21 ноября 2011 года . Проверено 17 марта 2007 г.
- ^ Догерти, Дейл (1 марта 2009 г.). «Шипящие звуки музыки» . О'Рейли Радар . Архивировано из оригинала 20 декабря 2009 года . Проверено 27 марта 2009 г.
- ^ «Знакомьтесь с музыкальным ясновидящим, который находит призраков в ваших MP3-файлах» . ШУМНО . 18 марта 2015 года. Архивировано из оригинала 29 апреля 2015 года . Проверено 25 апреля 2015 г.
- ^ «Призраки в mp3» . 15 марта 2015 года. Архивировано из оригинала 14 июня 2017 года . Проверено 25 апреля 2015 г.
- ^ «Потерянные и найденные: аспирант Университета Вирджинии обнаруживает призраков в MP3» . УВА сегодня . 23 февраля 2015 года. Архивировано из оригинала 13 июня 2015 года . Проверено 25 апреля 2015 г.
- ^ «Призрак в MP3» (PDF) . Архивировано (PDF) из оригинала 12 июня 2015 года . Проверено 25 апреля 2015 г.
- ^ «Руководство по параметрам командной строки (в CVS)» . Архивировано из оригинала 8 апреля 2013 года . Проверено 4 августа 2010 г.
- ^ «Руководство по эксплуатации JVC RC-EX30» (PDF) (на нескольких языках). 2004. с. 14. Архивировано из оригинала (PDF) 20 августа 2020 года.
Поиск – поиск нужной позиции на диске (только аудио компакт-диск)
( бумбокс 2004 г. ) - ^ «Руководство по эксплуатации DV-RW250H» (PDF) . 2004. с. 33. Архивировано (PDF) из оригинала 20 августа 2020 г. . Проверено 20 августа 2020 г.
• Перемотка вперед и обзорное воспроизведение не работают с MP3/WMA/JPEG-CD.
- ^ «Сравнение качества звука Hi-Res Audio, CD и MP3» . www.sony.com . Сони . Архивировано из оригинала 14 сентября 2020 года . Проверено 11 августа 2020 г. .
- ^ Вун-Сенг Ган; Сен-Мау Куо (2007). Встроенная обработка сигналов с помощью архитектуры Micro Signal . Wiley-IEEE Press . п. 382. ИСБН 978-0-471-73841-1 . Архивировано из оригинала 10 марта 2021 года . Проверено 16 ноября 2020 г.
- ^ Бувинь, Габриэль (28 ноября 2006 г.). "Freeformat со скоростью 640 кбит/с и foobar2000, возможности?" . Архивировано из оригинала 19 сентября 2016 года . Проверено 15 сентября 2016 г.
- ^ «lame(1): создавать аудиофайлы в формате mp3 — справочная страница Linux» . linux.die.net . Архивировано из оригинала 22 августа 2020 года . Проверено 22 августа 2020 г.
- ^ «Онлайн-страницы руководства Linux — страницы руководства man.cx» . man.cx. Архивировано из оригинала 22 августа 2020 года . Проверено 22 августа 2020 г.
- ↑ Перейти обратно: Перейти обратно: а б «GPSYCHO – переменная скорость передачи данных» . LAME MP3-кодер . Архивировано из оригинала 22 апреля 2009 года . Проверено 11 июля 2009 г.
- ^ «TwoLAME: MPEG Audio Layer II VBR» . Архивировано из оригинала 3 июля 2010 года . Проверено 11 июля 2009 г.
- ^ Подгруппа аудио ISO MPEG. «Часто задаваемые вопросы по MPEG Audio, версия 9: MPEG-1 и MPEG-2 BC» . Архивировано из оригинала 18 февраля 2010 года . Проверено 11 июля 2009 г.
- ^ «ХРОМЫЙ Y-переключатель» . База знаний Hydrogenaudio . Архивировано из оригинала 2 апреля 2015 года . Проверено 23 марта 2015 г.
- ^ Рэй, Кейси. «Метаданные и вы» . Будущее музыкальной коалиции . Архивировано из оригинала 29 июня 2017 года . Проверено 12 декабря 2014 г.
- ^ Патель, Кетан; Смит, Брайан С.; Роу, Лоуренс А. Производительность программного декодера видео MPEG (PDF) . Конференция ACM Multimedia 1993. Архивировано (PDF) из оригинала 2 сентября 2019 года . Проверено 1 июля 2019 г.
- ^ «Часто задаваемые вопросы по MPEG, версия 3.1» . 14 мая 1994 года. Архивировано из оригинала 23 июля 2009 года.
- ↑ Перейти обратно: Перейти обратно: а б «Большой список патентов на MP3 (и предполагаемые сроки их действия)» . мелодия квест . 26 февраля 2007 г. Архивировано из оригинала 2 марта 2007 г. Проверено 19 марта 2007 г.
- ^ Коглиати, Джош (20 июля 2008 г.). «Патентный статус MPEG-1, H.261 и MPEG-2» . Куро5хин . Архивировано из оригинала 16 сентября 2008 года . Проверено 6 октября 2009 г. В этой работе не были рассмотрены разделения и продления патентов.
- ^ Патент США № 5812672.
- ^ «Срок действия патента США на MP3, MPEG-2, H.264» . OSNews.com. Архивировано из оригинала 2 апреля 2013 года . Проверено 22 июля 2011 г.
- ^ «Способ и устройство для кодирования цифровых сигналов с использованием распределения битов с использованием комбинаций различных пороговых моделей для достижения желаемой скорости передачи данных» . Архивировано из оригинала 21 января 2023 года . Проверено 21 января 2023 г.
- ^ «mp3licensing.com – Патенты» . mp3licensing.com . Архивировано из оригинала 9 мая 2008 года . Проверено 10 мая 2008 г.
- ^ «Полная поддержка MP3 скоро появится в Fedora» . 5 мая 2017 года. Архивировано из оригинала 27 июня 2017 года . Проверено 17 июня 2017 г.
- ^ «Сжатие акустических данных – базовый патент MP3» . Фонд свободной информационной инфраструктуры . 15 января 2005 г. Архивировано из оригинала 15 июля 2007 г. Проверено 24 июля 2007 г.
- ^ «Интеллектуальная собственность и лицензирование» . Техниколор . Архивировано из оригинала 4 мая 2011 года.
- ^ Кистенфегер, Muzinée (июль 2007 г.). «Общество Фраунгофера (Fraunhofer-Gesellschaft, FhG)» . Генеральное консульство Великобритании в Мюнхене. Архивировано из оригинала 18 августа 2002 года . Проверено 24 июля 2007 г.
- ^ «Ранняя защита патентов на MP3» . Информационный центр по леденящим душу эффектам . 1 сентября 1998 года. Архивировано из оригинала 19 августа 2014 года . Проверено 24 июля 2007 г.
- ^ «Программа лицензирования MPEG Audio от SISVEL» . Архивировано из оригинала 11 февраля 2017 года . Проверено 8 февраля 2017 г.
- ^ «Аудио MPEG и Sisvel: на Thomson подали в суд за нарушение патентных прав в Европе и США — MP3-плееры остановились на таможне» . ZDNet Индия . 6 октября 2005 г. Архивировано из оригинала 11 октября 2007 г. Проверено 24 июля 2007 г.
- ^ «предоставляет Motorola патентную лицензию на аудио MP3 и MPEG 2» . СИСВЕЛ. 21 декабря 2005 г. Архивировано из оригинала 21 января 2014 г. Проверено 18 января 2014 г.
- ^ «Патенты США на MPEG Audio» (PDF) . Сисвел. Архивировано из оригинала (PDF) 27 октября 2016 года . Проверено 7 апреля 2017 г.
- ^ «Программы лицензирования — устаревшие программы» . www.sisvel.com . Архивировано из оригинала 19 февраля 2023 года . Проверено 15 сентября 2023 г.
- ^ Огг, Эрика (7 сентября 2006 г.). «Приказ об изъятии SanDisk MP3 отменен» . Новости CNET . Архивировано из оригинала 4 ноября 2012 года . Проверено 24 июля 2007 г.
- ^ «Sisvel приносит патентный Дикий Запад в Германию» . Блог IPEG . 7 сентября 2006 г. Архивировано из оригинала 23 мая 2007 г. Проверено 24 июля 2007 г.
- ^ «Apple и SanDisk Settle Texas, патентная ссора в отношении MP3» . Закон об интеллектуальной собственности360 . 26 января 2009 года . Проверено 16 августа 2010 г.
- ^ «Профессионалы Baker Botts LLP: Лиза Кэтрин Келли — представительские обязательства» . ТОО «Бейкер Боттс» . Архивировано из оригинала 10 декабря 2014 года . Проверено 15 сентября 2016 г.
- ^ «Microsoft грозит выплата в размере 1,5 миллиарда долларов за MP3» . Новости Би-би-си . 22 февраля 2007 г. Архивировано из оригинала 2 ноября 2008 г. Проверено 30 июня 2008 г.
- ^ «Microsoft добивается отмены решения по патенту MP3» . CNET . 6 августа 2007 года. Архивировано из оригинала 30 декабря 2013 года . Проверено 17 августа 2010 г.
- ^ «Апелляционный суд по решению федерального округа» (PDF) . 25 сентября 2008 г. Архивировано из оригинала (PDF) 29 октября 2008 г.
- ↑ Перейти обратно: Перейти обратно: а б Бранденбург, Карлхайнц (1999). «Объяснение MP3 и AAC» . Архивировано из оригинала (PDF) 19 октября 2014 года.
- ^ «Via Licensing объявляет об обновлении совместной патентной лицензии AAC» . Деловой провод . 5 января 2009 г. Архивировано из оригинала 18 июня 2019 г. . Проверено 18 июня 2019 г.
- ^ «Лицензиары ААС» . Через Корп . Архивировано из оригинала 28 июня 2019 года . Проверено 6 июля 2019 г.
- ^ Марриотт, Мишель (30 сентября 1999 г.). «NEWS WATCH; Новый плеер от Sony отдаст должное MP3» . Нью-Йорк Таймс . Архивировано из оригинала 3 июля 2021 года . Проверено 24 сентября 2020 г.
- ^ «Сетевой Walkman Sony NW-E105» . Архивировано из оригинала 31 октября 2020 года . Проверено 24 сентября 2020 г.
- ^ Жан-Марк Вален; Грегори Максвелл; Тимоти Б. Терриберри; Коэн Вос (октябрь 2013 г.). Высококачественное кодирование музыки с малой задержкой в кодеке Opus . 135-я конференция AES. arXiv : 1602.04845 .
Его CBR создает пакеты точно такого размера, который запрашивал кодер, без битового резервуара, который приводит к дополнительным задержкам буферизации, как это происходит в таких кодеках, как MP3 или AAC-LD. [...] [Тональный шум] наиболее заметен в MP3 с низким битрейтом.
Дальнейшее чтение [ править ]
- Герт Ловинк (9 ноября 2014 г.). «Размышления о формате MP3: интервью с Джонатаном Стерном» . Вычислительная культура (4). ISSN 2047-2390 . Архивировано из оригинала 22 августа 2015 года . Проверено 14 августа 2015 г.
Внешние ссылки [ править ]
- MP3 в Керли
- MP3-history.com. Архивировано 11 февраля 2020 года в Wayback Machine . История MP3: как был изобретен MP3, автор Fraunhofer IIS.
- Архив новостей MP3 . Архивировано 3 марта 2019 года в Wayback Machine — более 1000 статей с 1999 по 2011 год посвящены MP3 и цифровому аудио.
- MPEG.chiariglione.org. Архивировано 10 апреля 2024 г. на Wayback Machine - официальный сайт MPEG.