Jump to content

MP3

(Перенаправлен из MP3 )

MP3
Расширение имени файла .mp3
.bit (до 1995 г.) [ 1 ]
Интернет -медиа -тип
Разработан Карлхейнц Бранденбург , Эрнст Эберлейн, Хайнц Герхаузер, Бернхард Гриль , Юрген Херре и Харальд Попп (все из Общества Фраунхофера ), [ 5 ] и другие
Первоначальный выпуск 6 December 1991; 32 years ago (1991-12-06)[6]
Latest release
ISO/IEC 13818-3:1998
April 1998; 26 years ago (1998-04)
Type of formatLossy audio
Contained byMPEG-ES
Standards
Open format?Yes[9]
Free format?Expired patents[10]

MP3 (формально MPEG-1 Audio Layer III или Audio-Layer MPEG-2 III ) [ 4 ] является форматом кодирования для цифрового аудио, разработанного в основном Обществом Фраунхофера в Германии под руководством Карлхейнца Бранденбурга , [ 11 ] [ 12 ] при поддержке других цифровых ученых в других странах. Первоначально определяемый как третий аудиоформат стандарта MPEG-1 , он был сохраняется и дополнительно расширен-определяя дополнительные показатели битов и поддержку большего количества аудиоканалов -как третий аудиоформат последующего стандарта MPEG-2 . Третья версия, известная как MPEG-2,5-для лучшей поддержки с более низкой скоростью бита -обычно реализована, но не является признанным стандартом.

Mp3 (или mp3 ) в виде формата файла обычно обозначает файлы, содержащие элементарный поток данных звука MPEG-1 или аудио, кодируемых MPEG-2, без других сложностей стандарта MP3.

Что касается сжатия звука (аспект стандартного наиболее очевидного для конечных пользователей и для которого он наиболее известен), MP3 использует сжатие с потерей для кодирования данных с использованием неточных приближений и частичного отброса данных. Это обеспечивает значительное сокращение размеров файлов по сравнению с несжатым звуком. Комбинация небольшого размера и приемлемой верности привела к буму в распространении музыки по Интернету в середине-конце 1990-х годов, а MP3 служил в качестве обеспечивающей технологии в то время, когда пропускная способность и хранение еще были на высшем уровне. Формат MP3 вскоре стал связан с противоречиями, связанными с нарушением авторских прав , музыкальной пиратством , а также разорвающими и обменами службами, mp3.com и Napster , среди прочих. С появлением портативных медиаплееров , категория продуктов, включая смартфоны , поддержка MP3 остается почти универсальной.

MP3 compression works by reducing the accuracy of certain components of sound that are considered (by psychoacoustic analysis) to be beyond the hearing capabilities of most humans. This method is commonly referred to as perceptual coding or psychoacoustic modeling.[13] The remaining audio information is then recorded in a space-efficient manner using MDCT and FFT algorithms. Compared to CD-quality digital audio, MP3 compression can commonly achieve a 75–95% reduction in size. For example, an MP3 encoded at a constant bit rate of 128 kbit/s would result in a file approximately 9% the size of the original CD audio.[14] In the early 2000s, compact disc players increasingly adopted support for playback of MP3 files on data CDs.

The Moving Picture Experts Group (MPEG) designed MP3 as part of its MPEG-1, and later MPEG-2, standards. MPEG-1 Audio (MPEG-1 Part 3), which included MPEG-1 Audio Layer I, II, and III, was approved as a committee draft for an ISO/IEC standard in 1991,[15][16] finalized in 1992,[17] and published in 1993 as ISO/IEC 11172-3:1993.[7] An MPEG-2 Audio (MPEG-2 Part 3) extension with lower sample and bit rates was published in 1995 as ISO/IEC 13818-3:1995.[8][18] It requires only minimal modifications to existing MPEG-1 decoders (recognition of the MPEG-2 bit in the header and addition of the new lower sample and bit rates).

History

[edit]

Background

[edit]

The MP3 lossy compression algorithm takes advantage of a perceptual limitation of human hearing called auditory masking. In 1894, the American physicist Alfred M. Mayer reported that a tone could be rendered inaudible by another tone of lower frequency.[19] In 1959, Richard Ehmer described a complete set of auditory curves regarding this phenomenon.[20] Between 1967 and 1974, Eberhard Zwicker did work in the areas of tuning and masking of critical frequency-bands,[21][22] which in turn built on the fundamental research in the area from Harvey Fletcher and his collaborators at Bell Labs.[23]

Perceptual coding was first used for speech coding compression with linear predictive coding (LPC),[24] which has origins in the work of Fumitada Itakura (Nagoya University) and Shuzo Saito (Nippon Telegraph and Telephone) in 1966.[25] In 1978, Bishnu S. Atal and Manfred R. Schroeder at Bell Labs proposed an LPC speech codec, called adaptive predictive coding, that used a psychoacoustic coding-algorithm exploiting the masking properties of the human ear.[24][26] Further optimization by Schroeder and Atal with J.L. Hall was later reported in a 1979 paper.[27] That same year, a psychoacoustic masking codec was also proposed by M. A. Krasner,[28] who published and produced hardware for speech (not usable as music bit-compression), but the publication of his results in a relatively obscure Lincoln Laboratory Technical Report[29] did not immediately influence the mainstream of psychoacoustic codec-development.

The discrete cosine transform (DCT), a type of transform coding for lossy compression, proposed by Nasir Ahmed in 1972, was developed by Ahmed with T. Natarajan and K. R. Rao in 1973; they published their results in 1974.[30][31][32] This led to the development of the modified discrete cosine transform (MDCT), proposed by J. P. Princen, A. W. Johnson and A. B. Bradley in 1987,[33] following earlier work by Princen and Bradley in 1986.[34] The MDCT later became a core part of the MP3 algorithm.[35]

Ernst Terhardt and other collaborators constructed an algorithm describing auditory masking with high accuracy in 1982.[36] This work added to a variety of reports from authors dating back to Fletcher, and to the work that initially determined critical ratios and critical bandwidths.

In 1985, Atal and Schroeder presented code-excited linear prediction (CELP), an LPC-based perceptual speech-coding algorithm with auditory masking that achieved a significant data compression ratio for its time.[24] IEEE's refereed Journal on Selected Areas in Communications reported on a wide variety of (mostly perceptual) audio compression algorithms in 1988.[37] The "Voice Coding for Communications" edition published in February 1988 reported on a wide range of established, working audio bit compression technologies,[37] some of them using auditory masking as part of their fundamental design, and several showing real-time hardware implementations.

Development

[edit]

The genesis of the MP3 technology is fully described in a paper from Professor Hans Musmann,[38] who chaired the ISO MPEG Audio group for several years. In December 1988, MPEG called for an audio coding standard. In June 1989, 14 audio coding algorithms were submitted. Because of certain similarities between these coding proposals, they were clustered into four development groups. The first group was ASPEC, by Fraunhofer Gesellschaft, AT&T, France Telecom, Deutsche and Thomson-Brandt. The second group was MUSICAM, by Matsushita, CCETT, ITT and Philips. The third group was ATAC (ATRAC Coding), by Fujitsu, JVC, NEC and Sony. And the fourth group was SB-ADPCM, by NTT and BTRL.[38]

The immediate predecessors of MP3 were "Optimum Coding in the Frequency Domain" (OCF),[39] and Perceptual Transform Coding (PXFM).[40] These two codecs, along with block-switching contributions from Thomson-Brandt, were merged into a codec called ASPEC, which was submitted to MPEG, and which won the quality competition, but that was mistakenly rejected as too complex to implement. The first practical implementation of an audio perceptual coder (OCF) in hardware (Krasner's hardware was too cumbersome and slow for practical use), was an implementation of a psychoacoustic transform coder based on Motorola 56000 DSP chips.

Another predecessor of the MP3 format and technology is to be found in the perceptual codec MUSICAM based on an integer arithmetics 32 sub-bands filter bank, driven by a psychoacoustic model. It was primarily designed for Digital Audio Broadcasting (digital radio) and digital TV, and its basic principles were disclosed to the scientific community by CCETT (France) and IRT (Germany) in Atlanta during an IEEE-ICASSP conference in 1991,[41] after having worked on MUSICAM with Matsushita and Philips since 1989.[38]

This codec incorporated into a broadcasting system using COFDM modulation was demonstrated on air and in the field[42] with Radio Canada and CRC Canada during the NAB show (Las Vegas) in 1991. The implementation of the audio part of this broadcasting system was based on a two-chip encoder (one for the subband transform, one for the psychoacoustic model designed by the team of G. Stoll (IRT Germany), later known as psychoacoustic model I) and a real-time decoder using one Motorola 56001 DSP chip running an integer arithmetics software designed by Y.F. Dehery's team (CCETT, France). The simplicity of the corresponding decoder together with the high audio quality of this codec using for the first time a 48 kHz sampling rate, a 20 bits/sample input format (the highest available sampling standard in 1991, compatible with the AES/EBU professional digital input studio standard) were the main reasons to later adopt the characteristics of MUSICAM as the basic features for an advanced digital music compression codec.

During the development of the MUSICAM encoding software, Stoll and Dehery's team made thorough use of a set of high-quality audio assessment material[43] selected by a group of audio professionals from the European Broadcasting Union, and later used as a reference for the assessment of music compression codecs. The subband coding technique was found to be efficient, not only for the perceptual coding of high-quality sound materials but especially for the encoding of critical percussive sound materials (drums, triangle,...), due to the specific temporal masking effect of the MUSICAM sub-band filterbank (this advantage being a specific feature of short transform coding techniques).

As a doctoral student at Germany's University of Erlangen-Nuremberg, Karlheinz Brandenburg began working on digital music compression in the early 1980s, focusing on how people perceive music. He completed his doctoral work in 1989.[44] MP3 is directly descended from OCF and PXFM, representing the outcome of the collaboration of Brandenburg — working as a postdoctoral researcher at AT&T-Bell Labs with James D. Johnston ("JJ") of AT&T-Bell Labs — with the Fraunhofer Institute for Integrated Circuits, Erlangen (where he worked with Bernhard Grill and four other researchers – "The Original Six"[45]), with relatively minor contributions from the MP2 branch of psychoacoustic sub-band coders. In 1990, Brandenburg became an assistant professor at Erlangen-Nuremberg. While there, he continued to work on music compression with scientists at the Fraunhofer Society's Heinrich Herz Institute. In 1993, he joined the staff of Fraunhofer HHI.[44] An acapella version of the song "Tom's Diner" by Suzanne Vega was the first song used by Brandenburg to develop the MP3 format. It was used as a benchmark to see how well MP3's compression algorithm handled the human voice. Brandenburg adopted the song for testing purposes, listening to it again and again each time he refined the compression algorithm, making sure it did not adversely affect the reproduction of Vega's voice.[46] Accordingly, he dubbed Vega the "Mother of MP3".[47] Instrumental music had been easier to compress, but Vega's voice sounded unnatural in early versions of the format. Brandenburg eventually met Vega and heard Tom's Diner performed live.

Standardization

[edit]

In 1991, two available proposals were assessed for an MPEG audio standard: MUSICAM (Masking pattern adapted Universal Subband Integrated Coding And Multiplexing) and ASPEC (Adaptive Spectral Perceptual Entropy Coding). The MUSICAM technique, proposed by Philips (Netherlands), CCETT (France), the Institute for Broadcast Technology (Germany), and Matsushita (Japan),[48] was chosen due to its simplicity and error robustness, as well as for its high level of computational efficiency.[49] The MUSICAM format, based on sub-band coding, became the basis for the MPEG Audio compression format, incorporating, for example, its frame structure, header format, sample rates, etc.

While much of MUSICAM technology and ideas were incorporated into the definition of MPEG Audio Layer I and Layer II, the filter bank alone and the data structure based on 1152 samples framing (file format and byte-oriented stream) of MUSICAM remained in the Layer III (MP3) format, as part of the computationally inefficient hybrid filter bank. Under the chairmanship of Professor Musmann of the Leibniz University Hannover, the editing of the standard was delegated to Leon van de Kerkhof (Netherlands), Gerhard Stoll (Germany), and Yves-François Dehery (France), who worked on Layer I and Layer II. ASPEC was the joint proposal of AT&T Bell Laboratories, Thomson Consumer Electronics, Fraunhofer Society, and CNET.[50] It provided the highest coding efficiency.

A working group consisting of van de Kerkhof, Stoll, Leonardo Chiariglione (CSELT VP for Media), Yves-François Dehery, Karlheinz Brandenburg (Germany) and James D. Johnston (United States) took ideas from ASPEC, integrated the filter bank from Layer II, added some of their ideas such as the joint stereo coding of MUSICAM and created the MP3 format, which was designed to achieve the same quality at 128 kbit/s as MP2 at 192 kbit/s.

The algorithms for MPEG-1 Audio Layer I, II and III were approved in 1991[15][16] and finalized in 1992[17] as part of MPEG-1, the first standard suite by MPEG, which resulted in the international standard ISO/IEC 11172-3 (a.k.a. MPEG-1 Audio or MPEG-1 Part 3), published in 1993.[7] Files or data streams conforming to this standard must handle sample rates of 48k, 44100, and 32k and continue to be supported by current MP3 players and decoders. Thus the first generation of MP3 defined 14 × 3 = 42 interpretations of MP3 frame data structures and size layouts.

The compression efficiency of encoders is typically defined by the bit rate because the compression ratio depends on the bit depth and sampling rate of the input signal. Nevertheless, compression ratios are often published. They may use the compact disc (CD) parameters as references (44.1 kHz, 2 channels at 16 bits per channel or 2×16 bit), or sometimes the Digital Audio Tape (DAT) SP parameters (48 kHz, 2×16 bit). Compression ratios with this latter reference are higher, which demonstrates the problem with the use of the term compression ratio for lossy encoders.

Karlheinz Brandenburg used a CD recording of Suzanne Vega's song "Tom's Diner" to assess and refine the MP3 compression algorithm.[51] This song was chosen because of its nearly monophonic nature and wide spectral content, making it easier to hear imperfections in the compression format during playbacks. This particular track has an interesting property in that the two channels are almost, but not completely, the same, leading to a case where Binaural Masking Level Depression causes spatial unmasking of noise artifacts unless the encoder properly recognizes the situation and applies corrections similar to those detailed in the MPEG-2 AAC psychoacoustic model. Some more critical audio excerpts (glockenspiel, triangle, accordion, etc.) were taken from the EBU V3/SQAM reference compact disc and have been used by professional sound engineers to assess the subjective quality of the MPEG Audio formats.[citation needed]

Going public

[edit]

A reference simulation software implementation, written in the C language and later known as ISO 11172-5, was developed (in 1991–1996) by the members of the ISO MPEG Audio committee to produce bit-compliant MPEG Audio files (Layer 1, Layer 2, Layer 3). It was approved as a committee draft of the ISO/IEC technical report in March 1994 and printed as document CD 11172-5 in April 1994.[52] It was approved as a draft technical report (DTR/DIS) in November 1994,[53] finalized in 1996 and published as international standard ISO/IEC TR 11172-5:1998 in 1998.[54] The reference software in C language was later published as a freely available ISO standard.[55] Working in non-real time on several operating systems, it was able to demonstrate the first real-time hardware decoding (DSP based) of compressed audio. Some other real-time implementations of MPEG Audio encoders and decoders[56] were available for digital broadcasting (radio DAB, television DVB) towards consumer receivers and set-top boxes.

On 7 July 1994, the Fraunhofer Society released the first software MP3 encoder, called l3enc.[57] The filename extension .mp3 was chosen by the Fraunhofer team on 14 July 1995 (previously, the files had been named .bit).[1] With the first real-time software MP3 player WinPlay3 (released 9 September 1995) many people were able to encode and play back MP3 files on their PCs. Because of the relatively small hard drives of the era (≈500–1000 MB) lossy compression was essential to store multiple albums' worth of music on a home computer as full recordings (as opposed to MIDI notation, or tracker files which combined notation with short recordings of instruments playing single notes).

Fraunhofer example implementation

[edit]

A hacker named SoloH discovered the source code of the "dist10" MPEG reference implementation shortly after the release on the servers of the University of Erlangen. He developed a higher-quality version and spread it on the internet. This code started the widespread CD ripping and digital music distribution as MP3 over the internet.[58][59][60][61]

Further versions

[edit]

Further work on MPEG audio[62] was finalized in 1994 as part of the second suite of MPEG standards, MPEG-2, more formally known as international standard ISO/IEC 13818-3 (a.k.a. MPEG-2 Part 3 or backward compatible MPEG-2 Audio or MPEG-2 Audio BC[18]), originally published in 1995.[8][63] MPEG-2 Part 3 (ISO/IEC 13818-3) defined 42 additional bit rates and sample rates for MPEG-1 Audio Layer I, II and III. The new sampling rates are exactly half that of those originally defined in MPEG-1 Audio. This reduction in sampling rates serves to cut the available frequency fidelity in half while likewise cutting the bit rate by 50%. MPEG-2 Part 3 also enhanced MPEG-1's audio by allowing the coding of audio programs with more than two channels, up to 5.1 multichannel.[62] An MP3 coded with MPEG-2 results in half of the bandwidth reproduction of MPEG-1 appropriate for piano and singing.

A third generation of "MP3" style data streams (files) extended the MPEG-2 ideas and implementation but was named MPEG-2.5 audio since MPEG-3 already had a different meaning. This extension was developed at Fraunhofer IIS, the registered patent holder of MP3, by reducing the frame sync field in the MP3 header from 12 to 11 bits. As in the transition from MPEG-1 to MPEG-2, MPEG-2.5 adds additional sampling rates exactly half of those available using MPEG-2. It thus widens the scope of MP3 to include human speech and other applications yet requires only 25% of the bandwidth (frequency reproduction) possible using MPEG-1 sampling rates. While not an ISO-recognized standard, MPEG-2.5 is widely supported by both inexpensive Chinese and brand-name digital audio players as well as computer software-based MP3 encoders (LAME), decoders (FFmpeg) and players (MPC) adding 3 × 8 = 24 additional MP3 frame types. Each generation of MP3 thus supports 3 sampling rates exactly half that of the previous generation for a total of 9 varieties of MP3 format files. The sample rate comparison table between MPEG-1, 2, and 2.5 is given later in the article.[64][65] MPEG-2.5 is supported by LAME (since 2000), Media Player Classic (MPC), iTunes, and FFmpeg.

MPEG-2.5 was not developed by MPEG (see above) and was never approved as an international standard. MPEG-2.5 is thus an unofficial or proprietary extension to the MP3 format. It is nonetheless ubiquitous and especially advantageous for low-bit-rate human speech applications.

MPEG Audio Layer III versions
Version International Standard[*] First edition public release date Latest edition public release date
MPEG-1 Audio Layer III ISO/IEC 11172-3 Archived 28 May 2012 at the Wayback Machine (MPEG-1 Part 3)[7][16] 1993
MPEG-2 Audio Layer III ISO/IEC 13818-3 Archived 11 May 2011 at the Wayback Machine (MPEG-2 Part 3)[8][66] 1995 1998
MPEG-2.5 Audio Layer III nonstandard, Fraunhofer proprietary[64][65] 2000 2008

* The ISO standard ISO/IEC 11172-3 (a.k.a. MPEG-1 Audio) defined three formats: the MPEG-1 Audio Layer I, Layer II and Layer III. The ISO standard ISO/IEC 13818-3 (a.k.a. MPEG-2 Audio) defined an extended version of MPEG-1 Audio: MPEG-2 Audio Layer I, Layer II, and Layer III. MPEG-2 Audio (MPEG-2 Part 3) should not be confused with MPEG-2 AAC (MPEG-2 Part 7 – ISO/IEC 13818-7).[18]

LAME is the most advanced MP3 encoder.[citation needed] LAME includes a variable bit rate (VBR) encoding which uses a quality parameter rather than a bit rate goal. Later versions (2008+) support an n.nnn quality goal which automatically selects MPEG-2 or MPEG-2.5 sampling rates as appropriate for human speech recordings that need only 5512 Hz bandwidth resolution.

Internet distribution

[edit]

Во второй половине 1990 -х годов MP3 -файлы начали распространяться в Интернете , часто через подземные пиратские песни. Первый известный эксперимент в интернет -дистрибутиве был организован в начале 1990 -х годов Интернет -подземным музыкальным архивом , более известным под акронимированием IUMA. После некоторых экспериментов [ 67 ] Используя несжатые аудиофайлы, этот архив начал доставлять в нативном мире низкоскоростного Интернета в некоторых сжатых аудиофайлах MPEG с использованием формата MP2 (Layer II), а затем используемых файлов MP3, когда стандарт был полностью завершен. Популярность MP3 начала быстро расти благодаря появлению от Nullsoft аудиоплеерного Winamp Winamp , выпущенного в 1997 году, которое все еще имело в 2023 году сообщество из 80 миллионов активных пользователей. [ 68 ] В 1998 году был выпущен первый портативный твердотельный цифровой аудиоплееры MPMAN , разработанный Saehan Information Systems, который был выпущен в Сеул , Южная Корея , и RIO PMP300 был продан впоследствии в 1998 году, несмотря на усилия по юридическому подавлению RIAA . [ 69 ]

В ноябре 1997 года веб -сайт mp3.com предлагал бесплатно тысячи MP3, созданных независимыми артистами. [ 69 ] в одноранговых Небольшой размер файлов MP3 включил широко распространенный обмен файлами файлов файлах, вырванных с компакт-дисков, что ранее было бы почти невозможно. Первая крупная одноранговая сеть филиша, Napster , была запущена в 1999 году. Легкость создания и обмена MP3 привела к широко распространенному нарушению авторских прав . Крупные звукозаписывающие компании утверждали, что это бесплатное обмен музыкой сократило продажи, и назвали ее « Music Piracy ». Они отреагировали, преследуя судебные процессы против Напстера , который в конечном итоге был закрыт, а затем продан, а также против отдельных пользователей, которые занимались обменом файлами. [ 70 ]

следующего поколения Несанкционированный обмен файлами MP3 продолжается в одноранговых сетях . Некоторые авторизованные услуги, такие как Beatport , Bleep , Juno Records , Emusic , Zune Marketplace , Walmart.com , Rhapsody , звукозаписывающая индустрия, одобрили перевоплощение Napster и Amazon.com, продают неограниченную музыку в формате MP3.

Структура файла

[ редактировать ]
Диаграмма структуры файла mp3
Диаграмма структуры файла MP3 (версия MPEG 2.5, не описанная здесь, изменяет последний бит синхронизации на «0» в качестве индикации, эффективно перемещая один бит в поле версии [ 65 ] ).

MP3 -файл состоит из кадров MP3, которые состоят из заголовка и блока данных. Эта последовательность кадров называется элементарным потоком . Из -за «битового водохранилища» кадры не являются независимыми элементами и обычно не могут быть извлечены на произвольных границах кадра. Блоки данных MP3 содержат (сжатую) аудио информацию с точки зрения частот и амплитуд. Диаграмма показывает, что заголовок MP3 состоит из слова синхронизации , которое используется для идентификации начала действительного кадра. За этим следует бит, указывающий, что это стандарт MPEG и два бита, которые указывают на то, что используется слой 3; Отсюда MPEG-1 Audio Layer 3 или MP3. После этого значения будут отличаться, в зависимости от файла mp3. ISO/IEC 11172-3 определяет диапазон значений для каждого раздела заголовка вместе со спецификацией заголовка. Большинство файлов MP3 сегодня содержат ID3 метаданные , которые предшествуют или следует за кадрами MP3, как отмечено на диаграмме. Поток данных может содержать дополнительную контрольную сумму .

Совместное стерео выполняется только на основе рамы. [ 71 ]

Кодирование и декодирование

[ редактировать ]

Алгоритм кодирования MP3 обычно разделен на четыре части. Часть 1 делит аудиосигнал на более мелкие кусочки, называемые кадрами, и затем на выходе выполняется фильтр MDCT. Часть 2 передает образец в 1024-точечное быстрое преобразование Фурье (FFT), затем применяется психоакустическая модель, а на выходе выполняется еще один фильтр MDCT. Часть 3 количественно определяет и кодирует каждый образец, известный как распределение шума, который регулируется, чтобы соответствовать требованиям бита и звукового маскировки . Часть 4 форматирует битстрофы , называемый аудио кадром, который состоит из 4 частей, заголовка , проверки ошибок , аудиоданных и вспомогательных данных . [ 35 ]

Стандарт MPEG-1 не включает точную спецификацию для MP3-энкодера, но дает примеры психоакустических моделей, петли скорости и тому подобное в ненормативной части исходного стандарта. [ 72 ] MPEG-2 удваивает количество поддерживаемых показателей отбора проб, а MPEG-2,5 добавляет еще 3. Когда это было написано, предлагаемые реализации были довольно датированы. Предполагалось, что реализаторы стандарта должны были разработать алгоритмы, подходящие для удаления частей информации из аудио входа. В результате стали доступны многие разные энкодеры MP3, каждый из которых производит файлы различного качества. Сравнения были широко доступны, поэтому потенциальному пользователю энкодера было легко исследовать лучший выбор. Некоторые кодеры, которые были опытными при кодировании с более высокими показателями битов (например, хромыми ), не обязательно были такими же хорошими при более низких показателях битов. Со временем Lame развивался на веб -сайте Sourceforge, пока он не стал де -факто CBR MP3 Encoder. Позже был добавлен режим ABR. Работа прогрессировала по истинной переменной скорости битов с использованием цели качества от 0 до 10.

MP3 использует перекрывающуюся структуру MDCT. Каждая кадра MPEG-1 MP3 составляет 1152 образца, разделенные на две гранулы из 576 образцов. Эти образцы, изначально в домене во времени, преобразуются в одном блоке в 576 образцов частотной области с помощью MDCT. [ 73 ] MP3 также позволяет использовать более короткие блоки в грануле, до 192 образцов; Эта функция используется при переходного процесса обнаружении . Это ограничивает временное распространение шума квантования, сопровождающего переход (см. Психоакустика ). Разрешение частоты ограничено небольшим размером длинного блока, который снижает эффективность кодирования. [ 71 ] Разрешение времени может быть слишком низким для высокоходных сигналов и может вызвать размазывание ударных звуков. [ 71 ]

Из-за структуры дерева банка фильтров проблемы предварительного эхо усугубляются, так как комбинированный импульсный отклик двух банков фильтров не является и не может обеспечивать оптимальное решение по разрешению времени/частоты. [ 71 ] Кроме того, сочетание выходов двух банка фильтров создает проблемы с псевдонимом, которые должны быть частично решены на этапе «компенсации псевдонимов»; Однако это создает избыточную энергию, которая будет кодирована в частотной области, тем самым снижая эффективность кодирования. [ 74 ]

Декодирование, с другой стороны, тщательно определено в стандарте. Большинство декодеров являются « совместимыми с битом », что означает, что декомпрессированный вывод, который они производят из данного файла MP3, будет таким же, в пределах указанной степени допуска округления , так как вывод, указанный математически в документе с высоким стандартом ISO/IEC (ISO /IEC 11172-3). Следовательно, сравнение декодеров обычно основано на том, насколько они эффективны вычислительно (т.е., сколько памяти или времени процессора они используют в процессе декодирования). Со временем эта проблема стала меньшей проблемой, так как тактовые частоты процессора , переходящие от МГц к ГЗЗ. Общая задержка Encoder/Decoder не определена, что означает, что нет официального положения о воспроизведении без разрыва . Тем не менее, некоторые энкодеры, такие как Lame, могут прикрепить дополнительные метаданные, которые позволят игрокам, которые могут справиться с ним, чтобы обеспечить плавное воспроизведение.

Качество

[ редактировать ]

При выполнении кодирования аудио-стержней, например, создание потока данных MP3, существует компромисс между объемом генерируемых данных и качеством звука результатов. Человек, генерирующий MP3, выбирает бит -скорость, которая указывает, сколько килобит в секунду требуется аудио. Чем выше скорость битов, тем больше будет поток данных MP3, и, как правило, он будет звучать к исходной записи. С слишком низкой скоростью бить, артефакты сжатия (то есть звуки, которые не присутствовали в исходной записи) могут быть слышен в воспроизводстве. Некоторое аудио трудно сжать из -за его случайности и резких атак. Когда этот тип звука сжат, артефакты, такие как звон или предварительное эхо обычно слышатся . Образец аплодисментов или треугольный инструмент с относительно низкой скоростью бита дает хорошие примеры артефактов сжатия. Большинство субъективных тестов кодеков восприятия имеют тенденцию избегать использования этих типов звуковых материалов, однако артефакты, генерируемые ударными звуками, едва ли воспринимаются из-за специфической функции временной маскировки 32 суб-фильтрации слоя II, на котором основан формат. Полем

Помимо скорости битов кодированного фрагмента звука, качество кодируемого MP3-кодируемого звука также зависит от качества алгоритма кодера, а также от сложности кодируемого сигнала. Поскольку стандарт MP3 обеспечивает немалую свободу с алгоритмами кодирования, разные кодировщики имеют совершенно другое качество, даже с одинаковыми скоростями битов. Например, в публичном прослушивании с участием двух ранних MP3 -энкодеров, установленных около 128 кбит/с, [ 75 ] Один набрал 3,66 по шкале 1–5, а другой набрал только 2,22. Качество зависит от выбора параметров кодера и кодирования. [ 76 ]

Это наблюдение вызвало революцию в кодировании звука. Ранний уровень битов был главным и только рассмотрением. В то время файлы mp3 были очень простым типом: они использовали одинаковую скорость битов для всего файла: этот процесс известен как кодирование постоянной скорости битов (CBR). Использование постоянной скорости бита делает кодирование более простым и менее интенсивным процессором. Тем не менее, также возможно оптимизировать размер файла путем создания файлов, где скорость бита меняется по всему файлу. Они известны как переменная скорость. Кодирование битового резервуара и VBR было частью исходного стандарта MPEG-1. Концепция, стоящая за ними, заключается в том, что в любой части звука некоторые разделы легче сжимать, такие как молчание или музыка, содержащая всего несколько тонов, в то время как другим будет сложнее сжаться. Таким образом, общее качество файла может быть увеличено за счет использования более низкой скорости бита для менее сложных отрывков и более высокого для более сложных частей. С некоторыми расширенными энкодерами MP3 можно указать заданное качество, и энкодер будет соответствующим образом скорректирует скорость битов. Пользователи, которые желают конкретной «настройки качества», который Прозрачный для их ушей может использовать это значение при кодировании всей их музыки, и вообще говоря, не нужно беспокоиться о выполнении личных тестов на прослушивание на каждом произведении музыки, чтобы определить правильную скорость битов.

На воспринимаемое качество может влиять среда прослушивания (окружающий шум), внимание слушателя, обучение слушателей и в большинстве случаев аудиооборудование для слушателя (например, звуковые карты, динамики и наушники). Кроме того, достаточное качество может быть достигнуто за счет меньшего качества настройки для лекций и человеческих речевых приложений и сокращает время и сложность кодирования. Тест, проведенный новым студентам профессором музыки Стэнфордского университета Джонатаном Бергером, показал, что предпочтение студентов для музыки качества MP3 вырос каждый год. Бергер сказал, что студенты, кажется, предпочитают звуки «Sizzle», которые MP3 приносят музыке. [ 77 ]

Углубленное исследование качества звука MP3, звукового художника и композитора Райана Магуайра "The Ghost in the Mp3" Изоляты The Sounds Lost во время сжатия MP3. В 2015 году он выпустил трек "Modernist" (анаграмма "Tom's Diner"), написанная исключительно из звуков, удаленных во время сжатия MP3 песни "Tom's Diner", [ 78 ] [ 79 ] [ 80 ] Трек изначально использовался в формулировке стандарта MP3. Подробный отчет о методах, используемых для изоляции звуков, удаленных во время сжатия MP3, наряду с концептуальной мотивацией для проекта, был опубликован в «Слушаниях Международной компьютерной музыки» 2014 года. [ 81 ]

Скорость бита

[ редактировать ]
MPEG Audio Layer III
Доступные ставки битов (кбит/с) [ 16 ] [ 64 ] [ 65 ] [ 66 ] [ 82 ]
MPEG-1
Аудио слой III
MPEG-2
Аудио слой III
MPEG-2.5
Аудио слой III
8 8
16 16
24 24
32 32 32
40 40 40
48 48 48
56 56 56
64 64 64
80 80
96 96
112 112
128 128
144
160 160
192
224
256
320
Поддерживаемые показатели отбора проб
от MPEG Audio Format [ 16 ] [ 64 ] [ 65 ] [ 66 ]
MPEG-1
Аудио слой III
MPEG-2
Аудио слой III
MPEG-2.5
Аудио слой III
8 кГц
11.025 кГц
12 кГц
16 кГц
22,05 кГц
24 кГц
32 кГц
44,1 кГц
48 кГц

Скорость битов является продуктом скорости дискретизации и количества бит на образец, используемой для кодирования музыки. CD Audio составляет 44100 образцов в секунду. Количество битов на выборку также зависит от количества аудиоканалов. CD - это стерео и 16 бит на канал. Таким образом, умножение 44100 на 32 дает 1411200 - скорость бита несжатого цифрового звука CD. MP3 был разработан для кодирования этих данных 1411 кбит/с в 320 кбит/с или меньше. Если алгоритмы MP3 обнаруживаются менее сложные отрывки, то могут использоваться более низкие показатели битов. При использовании MPEG-2 вместо MPEG-1 MP3 поддерживает только более низкие показатели дискретизации (16 000, 22 050 или 24 000 выборок в секунду) и предлагает выбор битов, всего 8 кбит/с, но не более 160 кбит/с. Понизив скорость отбора проб, слой III MPEG-2 удаляет все частоты выше половины новой скорости отбора проб, которые могли присутствовать в исходном аудио.

Как показано в этих двух таблицах, 14 выбранных ставок битов разрешены в стандартном уровне MPEG-1 Audio Layer III: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 и 320 кбит /S, наряду с 3 самыми высокими показателями отбора проб 32, 44,1 и 48 кГц . [ 65 ] MPEG-2 Audio Layer III также позволяет 14 несколько разных (в основном ниже) скорости битов 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 кбит/с с Скорость отбора проб 16, 22,05 и 24 кГц , которые точно вдвое меньше, чем у MPEG-1. [ 65 ] Аудиоуровные рамки MPEG-2,5 ограничены только 8-битными показателями 8, 16, 24, 32, 40, 48, 56 и 64 кбит/с с 3 даже более низкими показателями отбора 8, 11,025 и 12 кГц. [ Цитация необходима ] В более ранних системах, которые поддерживают только стандарт Audio MPEG-1 Audio Layer III, MP3-файлы с скоростью бита ниже 32 кбит/с могут быть воспроизведены ускоренные и разбитые.

Более ранние системы также не хватает быстрого пересылки и перемотки управления воспроизведением на MP3. [ 83 ] [ 84 ]

Кадры MPEG-1 содержат наиболее подробную информацию в режиме 320 кбит/с, наиболее допустимая настройка битовой скорости, [ 85 ] с тишиной и простыми тонами, все еще требующими 32 кбит/с. Кадры MPEG-2 могут захватывать до 12 кГц воспроизведения звука, необходимые до 160 кбит/с. MP3-файлы, сделанные с MPEG-2, не имеют пропускной способности 20 кГц из-за теоремы отбора проб Nyquist-Shannon . Частотное воспроизведение всегда строго менее половины скорости отбора проб, а несовершенные фильтры требуют большего запаса для ошибки (уровень шума в зависимости от резкости фильтра), поэтому скорость отбора проб 8 кГц ограничивает максимальную частоту до 4 кГц, в то время как выборка 48 кГц. Оценка ограничивает MP3 до максимального воспроизведения звука 24 кГц. MPEG-2 использует половину и MPEG-2,5 только четверть показателей дискретистов MPEG-1.

Для общей области воспроизведения человеческой речи достаточно полосы пропускания 5512 Гц достаточна для получения отличных результатов (для голоса), используя скорость отбора проб 11,025 и кодировки VBR из 44 100 (стандартных) файла WAV. Английские носители в среднем 41–42 кбит/с с настройкой -V 9,6, но это может варьироваться в зависимости от количества записанных молчаний или скорости доставки (WPM). Повторная выборка до 12 000 (6K полосы пропускания) выбирается с помощью Harme Parameter -v 9.4. Аналогичным образом -V 9.2 выбирает 16 000 дискретистов и результирующей фильтрации на низком уровне 8K. Более старые версии LAME и FFMPEG поддерживают только целочисленные аргументы для параметра выбора качества переменной скорости. Параметр качества N.NNN (-V) задокументирован на rame.sourceforge.net, но поддерживается только в хромых с новым селектором качества качества качества с переменной скоростью VBR, а не средней скоростью битов (ABR).

Скорость дискретизации 44,1 кГц обычно используется для воспроизведения музыки, потому что это также используется для CD Audio , основного источника, используемого для создания файлов MP3. В Интернете используется большое разнообразие ставок битов. Скорость бита 128 кбит/с обычно используется, [ 86 ] При коэффициенте сжатия 11: 1, предлагая адекватное качество звука в относительно небольшом пространстве. Поскольку доступность полосы пропускания интернета и размеры жесткого диска увеличились, более высокие показатели до 320 кбит/с широко распространены. Неснаправленный звук, хранящийся на аудио-CD, составляет 1411,2 кбит/с (16-битный/выборка × 44 100 образцов/второй × 2 каналы/1000 бит/килобит), так что скорости битов 128, 160 и 192 кбит /s представляют соотношение сжатия приблизительно 11: 1, 9: 1 и 7: 1 соответственно.

Нестандартные ставки битов до 640 кбит/с могут быть достигнуты с помощью хромого энкодера и опции бесплатного формата, хотя немногие игроки в MP3 могут воспроизводить эти файлы. Согласно стандарту ISO, декодеры должны иметь возможность декодировать потоки до 320 кбит/с. [ 87 ] [ 88 ] [ 89 ] Ранние кодеры MPEG -слоя III использовали то, что сейчас называется постоянной скоростью бита (CBR). Программное обеспечение могло использовать только одинаковую скорость битов на всех кадрах в файле MP3. Позднее более сложные энкодеры MP3 смогли использовать битовое резервуар для нацеливания средней скорости битов, выбирая скорость кодирования для каждого кадра на основе сложности звука в той части записи.

Более сложный энкодер MP3 может создавать аудио с переменной скоростью бита. MPEG Audio может использовать переключение скорости битов на основе на рамку, но только декодеры уровня III должны поддерживать его. [ 65 ] [ 90 ] [ 91 ] [ 92 ] VBR используется, когда цель состоит в том, чтобы достичь фиксированного уровня качества. Окончательный размер файла кодирования VBR менее предсказуем, чем с постоянной скоростью бита. Средняя скорость битов - это тип VBR, реализованный в качестве компромисса между ними: скорость битов разрешена варьироваться для более последовательного качества, но контролируется, чтобы оставаться почти средним значением, выбранным пользователем, для предсказуемых размеров файлов. Хотя декодер MP3 должен поддерживать VBR, соответствующую стандартам, исторически у некоторых декодеров есть ошибки с декодированием VBR, особенно до того, как энкодеры VBR стали широко распространенными. Самый развитый хромой MP3 Encoder поддерживает поколение VBR, ABR и даже более старых форматов MP3 CBR.

Audio Layer III также может использовать «Бит -резервуар», частично полную способность удерживать часть аудиоданных следующего кадра, что позволяет временные изменения в эффективной скорости битов, даже в потоке постоянной скорости битов. [ 65 ] [ 90 ] Внутренняя обработка резервуара бита увеличивает задержку кодирования. [ Цитация необходима ] Нет масштабных факторных групп 21 (SFB21) для частот выше приблизительно 16 кГц , что вынуждает энкодер выбирать между менее точным представлением в полосе 21 или менее эффективном хранении во всех полосах ниже полосы 21, что приводит к тому, что потраченная скорость битов в кодировании VBR Полем [ 93 ]

Вспомогательные данные

[ редактировать ]

Вспомогательное поле данных можно использовать для хранения пользовательских данных. Вспомогательные данные являются необязательными, и количество доступных битов явно не указано. Вспомогательные данные расположены после того, как кодовые биты Хаффмана и диапазоны до того, на чем указывает следующий кадр main_data_begin. Encoder mp3pro использовал вспомогательные данные для кодирования дополнительной информации, которая может улучшить качество звука при декодировании с помощью его алгоритма.

Метаданные

[ редактировать ]

«Тег» в аудиофайле - это раздел файла, который содержит метаданные , такие как название, артист, альбом, номер трека или другая информация о содержании файла. Стандарты MP3 не определяют форматы тегов для файлов MP3, и не существует стандартного формата контейнеров , который бы поддерживал метаданные и не устраивает необходимость в тегах. Тем не менее, существуют несколько фактических стандартов для форматов тегов. По состоянию на 2010 год наиболее распространенными являются ID3V1 и ID3V2 , а также недавно введенный APEV2 . Эти теги обычно встроены в начало или конец файлов MP3, отделенных от фактических данных MP3 -кадра. Декодеры mp3 либо извлекают информацию из тегов, либо просто рассматривают их как игнорируемые не-MP3 нежелательные данные.

Программное обеспечение для воспроизведения и редактирования часто содержит функциональность редактирования тегов, но есть также приложения редактора тегов, посвященные этой цели. Помимо метаданных о аудиоконтенте, теги также могут использоваться для DRM . [ 94 ] ReplayGain -это стандарт для измерения и хранения громкости файла MP3 ( нормализация звука ) в своем теге метаданных, что позволяет игроку, согласующемуся с ReplayGain, автоматически регулировать общий громкость воспроизведения для каждого файла. MP3Gain может использоваться для обратимости изменений файлов на основе измерений ReplayGain, чтобы на игровых игроках можно было достичь скорректированного воспроизведения без возможностей ReplayGain.

Лицензирование, владение и законодательство

[ редактировать ]

Основная технология декодирования и кодирования MP3 в Европейском Союзе без патентов, и все патенты с истекшим сроком срок действия истек к 2012 году. В Соединенных Штатах технология стала существенно без патентов 16 апреля 2017 года (см. Ниже). Срок действия патентов MP3 истек в США в период с 2007 по 2017 год. В прошлом многие организации претендовали на владение патентами, связанными с декодированием MP3 или кодированием. Эти претензии привели к нескольким юридическим угрозам и действиям из различных источников. В результате, в странах, которые разрешают патенты на программное обеспечение , неопределенность в отношении того, какие патенты должны были быть лицензированы на создание продуктов MP3 без совершения нарушения патентов на ранних стадиях принятия технологии.

Начальный стандарт MPEG-1, близкий к полкону (части 1, 2 и 3), был общедоступным 6 декабря 1991 года в качестве ISO CD 11172. [ 95 ] [ 96 ] В большинстве стран патенты не могут быть поданы после того, как предыдущее искусство было обнародовано, а патенты истекают через 20 лет после первоначальной даты подачи, что может быть до 12 месяцев спустя для подачи заявок в других странах. В результате патенты, необходимые для реализации MP3, истек в большинстве стран к декабрю 2012 года, 21 год после публикации ISO CD 11172.

Исключением являются Соединенные Штаты, где действуют патенты, но истекают до 8 июня 1995 года после 17 лет с даты выпуска или 20 лет с даты приоритета. Длительный процесс судебного преследования может привести к тому, что патент выпущен гораздо позже, чем обычно ожидалось (см. Патенты на подводные лодки ). Различные патенты, связанные с MP3, истекли на даты с 2007 по 2017 год в Соединенных Штатах. [ 97 ] Патенты на что -либо, раскрытое в ISO CD 11172, подано через год или более после того, как ее публикация сомнительна. Если рассматриваться только известные патенты на MP3, поданные к декабрю 1992 года, то декодирование MP3 не содержало патентов в США с 22 сентября 2015 года, когда патент в США 5 812 672 , у которого истек заявка PCT в октябре 1992 года. [ 98 ] [ 99 ] [ 100 ] самый продолжительный патент, упомянутый в вышеупомянутых ссылках Если [ 101 ] и администрируется Technicolor , [ 102 ] истекший. В результате многие бесплатные программные проекты с открытым исходным кодом , такие как операционная система Fedora , решили начать доставку поддержки MP3 по умолчанию, и пользователям больше не придется прибегать к установке неофициальных пакетов, поддерживаемых сторонним программным обеспечением для MP3 воспроизведение или кодирование. [ 103 ]

Technicolor (ранее называемый Thomson Consumer Electronics) утверждал, что контролирует лицензирование MP3 патентов уровня 3 во многих странах, включая Соединенные Штаты, Японию, Канаду и страны ЕС. [ 104 ] Technicolor активно обеспечивает соблюдение этих патентов. [ 105 ] Доходы от лицензии MP3 от администрации Technicolor принесли около 100 миллионов евро для общества Fraunhofer в 2005 году. [ 106 ] В сентябре 1998 года Институт Fraunhofer отправил письмо нескольким разработчикам программного обеспечения MP3, в котором говорилось, что лицензия была необходима для «распределения и/или продажи декодеров и/или кодеров». В письме утверждается, что нелицензированные продукты «нарушают патентные права Фраунхофера и Томсона. Чтобы сделать, продавать или распространять продукты, используя стандарт [MPEG Layer-3] и, таким образом, наши патенты необходимо получить лицензию в соответствии с этими патентами от нас». [ 107 ] Это привело к ситуации, когда проект Lame Mp3 Encoder не мог предложить своим пользователям официальные двоичные файлы, которые могут работать на их компьютере. Позиция проекта заключалась в том, что в качестве исходного кода LAME было просто описанием того, как можно реализовать энкодер MP3. Неофициально, составленные двоичные файлы были доступны из других источников.

Sisvel Spa, компания из Люксембурга, управляет лицензиями на патенты, подающие заявку на MPEG Audio. [ 108 ] Они, наряду со своей дочерней компанией США Audio Mpeg, Inc. ранее подали в суд на Томсон за нарушение патентов на технологию MP3, [ 109 ] Но эти споры были разрешены в ноябре 2005 года, когда Sisvel предоставила Томсону лицензию на их патенты. Motorola последовал вскоре после этого и подписала контракт с Sisvel, чтобы лицензировать патенты, связанные с MP3, в декабре 2005 года. [ 110 ] За исключением трех патентов, патенты США, управляемые Sisvel [ 111 ] истек срок действия всех в 2015 году. Три исключения: патент США 5 878 080 , истек в феврале 2017 года; Патент США 5 850 456 , истек в феврале 2017 года; и патент на США 5 960 037 , истек срок действия 9 апреля 2017 года. По состоянию на первое квартал 2023 года программа лицензирования Sisvel стала наследием. [ 112 ]

В сентябре 2006 года немецкие чиновники изъяли MP3 -плееры со Sandisk стенда на шоу IFA в Берлине после того, как итальянская фирма патентов выиграла судебный запрет от имени Sisvel против Sandisk в споре о правах на лицензирование. Судебный запрет был позже изменен судьей Берлина, [ 113 ] Но это изменение было, в свою очередь, было заблокировано в тот же день другим судьей из того же суда, «приводя патентный дикий Запад в Германию» словами одного комментатора. [ 114 ] В феврале 2007 года Texas Mp3 Technologies подали в суд на Apple, Samsung Electronics и Sandisk в федеральном суде восточного Техаса , утверждая, что нарушение патента на портативном MP3 -плеере, который, по словам Texas Mp3, был назначен. Apple, Samsung и Sandisk все урегулировали претензии против них в январе 2009 года. [ 115 ] [ 116 ]

Alcatel-Lucent утвердил несколько патентов на кодирование и сжатие MP3, якобы унаследованные от AT & T-Bell Labs в собственном судебном разбирательстве. В ноябре 2006 года, до слияния компаний, Alcatel подал в суд на Microsoft за то, что он якобы нарушил семь патентов. 23 февраля 2007 года жюри Сан-Диего присудило Alcatel-Lucent 1,52 миллиарда долларов США в виде убытков за нарушение двух из них. [ 117 ] Впоследствии суд отменил это награду, обнаружив, что один патент не был нарушен и что другой не принадлежал Alcatel-Lucent; он был совместно с собственностью AT & T и Fraunhofer, которые лицензировали его Microsoft . Судья постановил, что [ 118 ] Это защитное решение было поддержано при апелляции в 2008 году. [ 119 ]

Альтернативные технологии

[ редактировать ]

Существуют другие форматы потерь. Среди них Advanced Audio Coding (AAC) является наиболее широко используемым и разработано, чтобы быть преемником MP3. Существуют также другие форматы с потерями, такие как mp3pro и mp2 . Они являются членами того же технологического семейства, что и MP3, и зависят от примерно похожих психоакустических моделей и алгоритмов MDCT. Принимая во внимание, что в mp3 используется гибридный подход кодирования, который является частью MDCT и частично FFT , AAC является чисто MDCT, что значительно повышает эффективность сжатия. [ 120 ] Многие из основных патентов лежащих в основе этих , форматов [ 120 ] Bell , Dolby , LG Electronics , NEC , NTT DOCOMO , Panasonic , Sony Corporation , [ 121 ] Etri , JVC Kenwood , Philips , Microsoft и NTT . [ 122 ]

Когда рынок Digital Audio Player вышел, MP3 был широко принят в качестве стандарта, следовательно, популярное название «MP3 -плеер». Sony была исключением и использовала свой собственный ATRAC, кодек взятый из их формата Minidisc , который, как утверждал Sony, была лучше. [ 123 ] После критики и ниже ожидаемых продаж Walkman , в 2004 году Sony впервые ввела нативную поддержку MP3 своим игрокам Walkman. [ 124 ]

Существуют также открытые форматы сжатия, такие как Opus и Vorbis , которые доступны бесплатно и без каких -либо известных патентных ограничений. Некоторые из новых форматов сжатия звука, таких как AAC, WMA Pro, Vorbis и Opus, свободны от некоторых ограничений, присущих формату MP3, которые не могут быть преодолены каким -либо кодером MP3. [ 97 ] [ 125 ]

Помимо методов сжатия потерь, форматы без потерь являются важной альтернативой MP3, поскольку они обеспечивают неизменное аудиоконтент, хотя с увеличенным размером файла по сравнению с сжатием с потерей. Форматы без потерь включают FLAC (свободный аудиокодек без потерь), Apple Lossless и многие другие.

Смотрите также

[ редактировать ]
  1. ^ Jump up to: а беременный "С Днем Рождения mp3!" Полем Fraunhofer IIS. 12 июля 2005 года. Архивировано с оригинала 11 декабря 2014 года . Получено 18 июля 2010 года .
  2. ^ Нильссон, М. (ноябрь 2000 г.). "Audio/Mpeg Media Type - RFC 3003" . IETF. doi : 10.17487/rfc3003 . Архивировано из оригинала 13 апреля 2012 года . Получено 7 декабря 2009 года . {{cite journal}}: CITE Journal требует |journal= ( помощь )
  3. ^ Casner, S.; Hoschka, P. (июль 2003 г.). «Регистрация типа MIME в форматах полезной нагрузки RTP - RFC 3555» . IETF. doi : 10.17487/rfc3555 . Архивировано из оригинала 14 января 2012 года . Получено 7 декабря 2009 года . {{cite journal}}: CITE Journal требует |journal= ( помощь )
  4. ^ Jump up to: а беременный Финлейсон Р. (февраль 2008 г.). «Более устойчивый к потере формат полезной нагрузки RTP для MP3 Audio-RFC 5219» . IETF. doi : 10.17487/rfc5219 . Архивировано из оригинала 26 января 2021 года . Получено 4 декабря 2014 года . {{cite journal}}: CITE Journal требует |journal= ( помощь )
  5. ^ "The Mp3 Team" . Fraunhofer IIS . Архивировано из оригинала 14 июля 2020 года . Получено 12 июня 2020 года .
  6. ^ Патель К, Смит Британская Колумбия, Роу Л.А. (1 сентября 1993 г.). «Производительность программного видеородера MPEG» . Материалы первой международной конференции ACM по мультимедиа - мультимедиа '93 . ACM мультимедиа. Нью -Йорк: Ассоциация по компьютерной технике. С. 75–82. doi : 10.1145/166266.166274 . ISBN  978-0-89791-596-0 Полем S2CID   3773268 . Архивировано из оригинала 15 декабря 2021 года . Получено 15 декабря 2021 года . Ссылка 3 в документе - это проект комитета стандартного ISO/IEC 11172, 6 декабря 1991 года.
  7. ^ Jump up to: а беременный в дюймовый «ISO/IEC 11172-3: 1993-Информационные технологии-Кодирование движущихся изображений и связанных с ними аудио для цифровых хранилищ в размере около 1,5 MBIT/S-Часть 3: Аудио» . Iso. 1993. Архивировано из оригинала 28 мая 2012 года . Получено 14 июля 2010 года .
  8. ^ Jump up to: а беременный в дюймовый «ISO/IEC 13818-3: 1995-Информационные технологии-общее кодирование движущихся изображений и связанной аудио информации-Часть 3: Аудио» . Iso. 1995. Архивировано из оригинала 12 января 2012 года . Получено 14 июля 2010 года .
  9. ^ "Mp3 Technology в Fraunhofer IIS" . Fraunhofer IIS . Архивировано из оригинала 15 августа 2021 года . Получено 12 июня 2020 года .
  10. ^ MP3 (MPEG Layer III Audio Encoding) (полный черновик). Устойчивость цифровых форматов. Вашингтон, округ Колумбия: Библиотека Конгресса. 3 мая 2017 года . Получено 1 декабря 2021 года .
  11. ^ «73.« Отец »MP3, Карлхейнц Бранденбург» . 13 июля 2015 года. Архивировано с оригинала 2 января 2023 года . Получено 2 января 2023 года - через www.youtube.com.
  12. ^ «В 20 -й день рождения MP3, интервью с« Отцом »MP3, Карлхейнц Бранденбург» . Архивировано из оригинала 2 января 2023 года . Получено 2 января 2023 года .
  13. ^ Джаянт, Никил ; Джонстон, Джеймс; Сафранек, Роберт (октябрь 1993 г.). «Сжатие сигнала на основе моделей человеческого восприятия». Труды IEEE . 81 (10): 1385–1422. doi : 10.1109/5.241504 .
  14. ^ "MP3 (MPEG Layer III Audio Encoding)" . Библиотека Конгресса. 27 июля 2017 года. Архивировано с оригинала 14 августа 2017 года . Получено 9 ноября 2017 года .
  15. ^ Jump up to: а беременный ISO (ноябрь 1991). «Пресс -релиз MPEG, Курихама, ноябрь 1991 года» . Iso. Архивировано из оригинала 3 мая 2011 года . Получено 17 июля 2010 года .
  16. ^ Jump up to: а беременный в дюймовый и ISO (ноябрь 1991). «CD 11172-3-Кодирование движущихся изображений и связанных с ними аудио для цифрового хранилища со скоростью до 1,5 Мбит/с. Часть 3 аудио» (PDF) . Архивировано из оригинала (PDF) 30 декабря 2013 года . Получено 17 июля 2010 года .
  17. ^ Jump up to: а беременный ISO (6 ноября 1992 г.). «Пресс -релиз MPEG, Лондон, 6 ноября 1992 года» . Чиариглионе. Архивировано из оригинала 12 августа 2010 года . Получено 17 июля 2010 года .
  18. ^ Jump up to: а беременный в ISO (октябрь 1998 г.). «FAQ Audio MPEG Версия 9-MPEG-1 и MPEG-2 BC» . Iso. Архивировано из оригинала 18 февраля 2010 года . Получено 28 октября 2009 года .
  19. ^ Майер, Альфред Маршалл (1894). «Исследования в акустике» . Лондон, Эдинбург и Дублинский философский журнал . 37 (226): 259–288. doi : 10.1080/14786449408620544 . Архивировано с оригинала 12 сентября 2019 года . Получено 26 июня 2019 года .
  20. ^ Эмер, Ричард Х. (1959). «Маскировка от тонов против шумовых полос». Журнал Акустического общества Америки . 31 (9): 1253. Bibcode : 1959asaj ... 31.1253e . doi : 10.1121/1.1907853 .
  21. ^ Цвикер, Эберхард (1974). «На психоакустическом эквиваленте кривых настройки». Факты и модели на слушании . Коммуникация и кибернетика. Тол. 8. С. 132 –141. doi : 10.1007/978-3-642-65902-7_19 . ISBN  978-3-642-65904-1 .
  22. ^ Цвикер, Эберхард; Feldtkeller, Richard (1999) [1967]. Ухо как получатель новостей [ ухо как приемник связи ]. Транс. Архивировано из оригинала 14 сентября 2000 года . Получено 29 июня 2008 года .
  23. ^ Флетчер, Харви (1995). Речь и слух в общении . Акустическое общество Америки. ISBN  978-1-56396-393-3 .
  24. ^ Jump up to: а беременный в Шредер, Манфред Р. (2014). "Bell Laboratories" . Акустика, информация и общение: мемориал в честь Манфреда Р. Шредера . Спрингер. п. 388. ISBN  978-3-319-05660-9 .
  25. ^ Грей, Роберт М. (2010). «История цифровой речи в реальном времени в пакетных сетях: часть II линейного прогнозирующего кодирования и интернет -протокола» (PDF) . Найденный. Тенденции сигнализирует процесс . 3 (4): 203–303. doi : 10.1561/2000000036 . ISSN   1932-8346 . Архивировано (PDF) из оригинала 9 октября 2022 года . Получено 14 июля 2019 года .
  26. ^ Атал, Б.; Шредер, М. (1978). «Прогнозирующее кодирование сигналов речевых и критерии субъективных ошибок». ICASSP '78. Международная конференция IEEE по акустике, речи и обработке сигналов . Тол. 3. С. 573–576. doi : 10.1109/icassp.1978.1170564 .
  27. ^ Шредер, MR ; Атал, BS ; Холл, JL (декабрь 1979 г.). «Оптимизация цифровых речевых кодеров, используя маскирующие свойства человеческого уха». Журнал Акустического общества Америки . 66 (6): 1647. Bibcode : 1979asaj ... 66.1647s . doi : 10.1121/1,383662 .
  28. ^ Краснер, Массачусетс (18 июня 1979 г.). Цифровое кодирование речевых и аудиосигналов на основе восприятия требований слуховой системы (тезис). Массачусетский технологический институт. HDL : 1721.1/16011 .
  29. ^ Краснер, Массачусетс (18 июня 1979 г.). «Цифровое кодирование речи на основе требований восприятия слуховой системы (Технический отчет 535)» (PDF) . Архивировано (PDF) из оригинала 3 сентября 2017 года.
  30. ^ Ахмед, Насир (январь 1991). «Как я придумал дискретную косинусную преобразование» . Цифровая обработка сигнала . 1 (1): 4–5. Bibcode : 1991dsp ..... 1 .... 4a . doi : 10.1016/1051-2004 (91) 90086-z . Архивировано с оригинала 10 июня 2016 года . Получено 19 ноября 2019 года .
  31. ^ Ахмед, Насир ; Натараджан, Т.; Рао, К.Р. (январь 1974 г.), «Дискретный косинусный преобразование», IEEE Transactions на компьютерах , C-23 (1): 90–93, doi : 10.1109/tc.1974.223784 , s2cid   149806273
  32. ^ Рао, Кр ; Yip, P. (1990), Discrete Cosine Transform: алгоритмы, преимущества, приложения , Бостон: Академическая пресса, ISBN  978-0-12-580203-1
  33. ^ JP Princen, Aw Johnson und ab bradley: поддионер/преобразование кодирование с использованием проектов банка фильтров на основе отмены псевдонимов доменов , IEEE Proc. Intl. Конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987
  34. ^ Джон П. Принсен, Алан Б. Брэдли: Анализ/Синтез Фильтрой Банк Дизайн банка на основе отмены псевдонима времени , IEEE Trans. Акуст. Обработка речевого сигнала, ASSP-34 (5), 1153–1161, 1986
  35. ^ Jump up to: а беременный Гукерт, Джон (весна 2012). «Использование FFT и MDCT в MP3 Audio Compression» (PDF) . Университет Юты . Архивировано (PDF) из оригинала 12 февраля 2021 года . Получено 14 июля 2019 года .
  36. ^ Terhardt, E.; Stoll, G.; Seewann, M. (март 1982). «Алгоритм извлечения высоты и высоты высоты из сложных тональных сигналов». Журнал Акустического общества Америки . 71 (3): 679. Bibcode : 1982asaj ... 71..679t . doi : 10.1121/1,387544 .
  37. ^ Jump up to: а беременный «Голосовое кодирование для коммуникаций». Журнал IEEE по выбранным областям в общении . 6 (2). Февраль 1988.
  38. ^ Jump up to: а беременный в Genesis of mp3 Audio Coding Standard в IEEE Transactions на потребительской электронике, IEEE, Vol. 52, Nr. 3, с. 1043–1049, август 2006 г.
  39. ^ Бранденбург, Карлхайнц; Seitzer, Dieter (3–6 ноября 1988 г.). OCF: Кодирование высокого качества звука с показателями передачи данных 64 кбит/с . 85th Convention of Audio Engineering Society. Архивировано из оригинала 4 июня 2008 года . Получено 18 марта 2008 года .
  40. ^ Джонстон, Джеймс Д. (февраль 1988 г.). «Преобразование кодирования аудиосигналов с использованием критериев шума восприятия». Журнал IEEE по выбранным областям в общении . 6 (2): 314–323. doi : 10.1109/49.608 .
  41. ^ YF Dehery, et al. (1991) Кодек Source-Source Musicam для цифровой аудиовещательной передачи и хранения IEEE-ICASSP 91 страницы 3605–3608 мая 1991 г.
  42. ^ «Комментарий DAB от Alan Box, EZ Communication и председатель NAB DAB Целевая группа» (PDF) .
  43. ^ EBU SQAM CD CD Качество качества записей материалов для субъективных тестов . 7 октября 2008 года. Архивировано с оригинала 11 февраля 2017 года . Получено 8 февраля 2017 года .
  44. ^ Jump up to: а беременный Юинг, Джек (5 марта 2007 г.). "Как родился mp3" . Bloomberg Businessweek . Архивировано с оригинала 15 марта 2016 года . Получено 24 июля 2007 года .
  45. ^ Витт, Стивен (2016). Как музыка стала бесплатной: конец индустрии, рубеж века и нулевое пиратство пациента . Соединенные Штаты Америки: книги пингвинов. п. 13. ISBN  978-0-14-310934-1 Полем Бренденбург и гриль присоединились к четырем другим исследователям Фраунхофера. Хайнц Герхаузер курировал аудио исследовательскую группу института; Харальд Попп был специалистом по аппаратному обеспечению; Эрнст Эберлейн был экспертом по обработке сигналов; Юрген Херре был еще одним аспирантом, чье математическое мастерство соперничало с собственным Бранденбургом. В последующие годы эта группа будет называть себя «оригинальной шестеркой».
  46. ^ Джонатан Стерн (17 июля 2012 г.). Mp3: значение формата . Герцогский издательство Университета Герцога. п. 178. ISBN  978-0-8223-5287-7 .
  47. ^ "Сюзанна Вега | Био" . Официальное сообщество Сюзанны Вега . Архивировано из оригинала 18 января 2022 года . Получено 17 января 2022 года .
  48. ^ Цифровая технология видео и аудиовещания: руководство по практической инженерии (сигналы и технология коммуникации) ISBN   3-540-76357-0 с. 144: «В 1988 году метод MASCAM был разработан в Институте Für Rundfunktechnik (IRT) в Мюнхене в подготовке к системе цифрового аудиовещательного вещания (DAB). Из MASCAM (Musicam (Masicking Maniversal Subbed Subbed Coding и мультиплексирование). Метод был разработан в 1989 году в сотрудничестве с CCETT, Philips и Matsushita ».
  49. ^ «Отчет о состоянии ISO MPEG» (пресс -релиз). Международная организация по стандартизации . Сентябрь 1990 года. Архивировано из оригинала 14 февраля 2010 года.
  50. ^ «Адаптивная спектральная энтропия кодирование высококачественных музыкальных сигналов» . EES E-Library . 1991. Архивировано из оригинала 11 мая 2011 года . Получено 24 августа 2010 года .
  51. ^ «MP3: история инноваций и предательства» . ЭНЕРГЕТИЧЕСКИЙ ЯДЕРНЫЙ РЕАКТОР . 23 марта 2011. Архивировано с оригинала 3 августа 2023 года . Получено 3 августа 2023 года .
  52. ^ MPEG (25 марта 1994 г.). «Одобрено на 26 -м собрании (Париж)» . Архивировано из оригинала 26 июля 2010 года . Получено 5 августа 2010 года .
  53. ^ MPEG (11 ноября 1994 г.). «Утверждено на 29 -м собрании» . Архивировано из оригинала 8 августа 2010 года . Получено 5 августа 2010 года .
  54. ^ Iso. «ISO/IEC TR 11172-5: 1998-Информационные технологии-Кодирование движущихся изображений и связанных с ними аудио для цифрового хранилища со скоростью около 1,5 MBIT/S-Часть 5: Программное обеспечение» . Архивировано из оригинала 11 мая 2011 года . Получено 5 августа 2010 года .
  55. ^ «ISO/IEC TR 11172-5: 1998-Информационные технологии-Кодирование движущихся изображений и связанных с ними аудио для цифрового хранилища со скоростью около 1,5 MBIT/S-Часть 5: Программное обеспечение (справочное программное обеспечение)» (ZIP) . Архивировано из оригинала 30 декабря 2006 года . Получено 5 августа 2010 года .
  56. ^ Dehery, Yves-Francois (1994). Высококачественный стандарт звука кодирования для вещания, телекоммуникаций и мультимедийных систем . Нидерланды: Elsevier Science Bv. С. 53–64. ISBN  978-0-444-81580-4 Полем Эта статья относится к сжатой цифровой аудио -станции Musicam (MPEG Audio II), реализованной на микрокомпьютере, используемой не только в качестве профессиональной станции редактирования, но и в качестве сервера на Ethernet для сжатой цифровой аудио библиотеки, поэтому предвидеть будущее в mp3 в Интернете.
  57. ^ "Mp3 сегодняшняя технология" . Много информативной информации о музыке . 2005. Архивировано из оригинала 4 июля 2008 года . Получено 15 сентября 2016 года .
  58. ^ Небесный музыкальный автомат архивировал 30 апреля 2013 года на The Wayback Machine на Атлантике «чтобы показать отрасли, как использовать кодек, MPEG собрал бесплатную программу образцов, которая преобразовала музыку в файлы MP3. Демонстрационное программное обеспечение создало низкокачественный звук и Fraunhofer не намеревался, чтобы он был использован. Предполагается, фанат «Звездных войн»). (2000)
  59. ^ Поп -идолы и пираты: механизмы потребления и глобальное кровообращение ... Архивировано 15 октября 2023 г. на машине Wayback от доктора Чарльза Фэйрчайлда
  60. ^ Технологии пиратства? - Изучение взаимодействия между коммерциализмом и идеализмом в разработке MP3 и Divx Archived 19 сентября 2020 года на машине Wayback от Hendrik Storstein Spilker, Svein Höier, стр. 2072
  61. ^ www.euronet.nl/~soloh/mpegenc/ ( archive.org )
  62. ^ Jump up to: а беременный «Принято на 22 -м собрании WG11» (пресс -релиз). Международная организация по стандартизации . 2 апреля 1993 года. Архивировано из оригинала 6 августа 2010 года . Получено 18 июля 2010 года .
  63. ^ Бранденбург, Карлхайнц; Бози, Марина (февраль 1997 г.). «Обзор MPEG Audio: текущие и будущие стандарты для звукового кодирования с низкой скоростью» . Журнал Аудиоинженерного общества . 45 (1/2): 4–21. Архивировано из оригинала 17 апреля 2009 года . Получено 30 июня 2008 года .
  64. ^ Jump up to: а беременный в дюймовый «Технические детали MP3 (MPEG-2 и MPEG-2.5)» . Fraunhofer IIS . Сентябрь 2007 года. Архивировано из оригинала 24 января 2008 года . Это позволяет MP3 удовлетворительно работать на очень низких битратах и ​​вводит дополнительные показатели отбора проб 8 кГц, 11,025 кГц и 12 кГц.
  65. ^ Jump up to: а беременный в дюймовый и фон глин час я Supurovic, Predrag (22 декабря 1999 г.). "Audio рамный заголовок MPEG" . Архивировано из оригинала 7 сентября 2008 года . Получено 29 мая 2009 г.
  66. ^ Jump up to: а беременный в «ISO/IEC 13818-3: 1994 (E)-Информационная технология-общее кодирование движущихся изображений и связанных с ними аудио: аудио» (ZIP) . 11 ноября 1994 года. Архивировано с оригинала 13 июня 2010 года . Получено 4 августа 2010 года .
  67. ^ «О интернете подземного музыкального архива» .
  68. ^ Вайнилавичюс, Джастинас (15 ноября 2023 г.). «Winamp вернулся после обновления; ностальгия, вызывающая нетронутую» . Киберньюс . Архивировано из оригинала 4 декабря 2023 года . Получено 8 декабря 2023 года .
  69. ^ Jump up to: а беременный Шуберт, Рут (10 февраля 1999 г.). «Технологическое получение музыки для песни; индустрия разочарована, что Интернет делает бесплатную музыку простой» . Сиэтл Пост-Интеллигенсер . Получено 22 ноября 2008 года . [ Постоянная мертвая ссылка ]
  70. ^ Giesler, Markus (2008). «Конфликт и компромисс: драма в эволюции рынка». Журнал потребительских исследований . 34 (6): 739–753. Citeseerx   10.1.1.564.7146 . doi : 10.1086/522098 . S2CID   145796529 .
  71. ^ Jump up to: а беременный в дюймовый Bouvigne, Gabriel (2003). "Mp3 Tech - ограничения" . Архивировано из оригинала 7 января 2011 года.
  72. ^ «ISO/IEC 11172-3: 1993/COR 1: 1996» . Международная организация по стандартизации . 2006. Архивировано из оригинала 11 мая 2011 года . Получено 27 августа 2009 года .
  73. ^ Тейлор, Марк (июнь 2000 г.). «Хратящие технические часто задаваемые вопросы» . Архивировано из оригинала 8 декабря 2023 года . Получено 9 декабря 2023 года .
  74. ^ Либерман, Сербио. DSP - технология мультимедиа .
  75. ^ Аморим, Роберто (3 августа 2003 г.). «Результаты 128 кбит/с расширения теста на прослушивание» . Архивировано из оригинала 27 декабря 2011 года . Получено 17 марта 2007 года .
  76. ^ Mares, Себастьян (декабрь 2005 г.). «Результаты общественного многоформного теста прослушивания @ 128 кбит / с» . Архивировано из оригинала 21 ноября 2011 года . Получено 17 марта 2007 года .
  77. ^ Догерти, Дейл (1 марта 2009 г.). «Шипительный звук музыки» . О'Рейли радар . Архивировано из оригинала 20 декабря 2009 года . Получено 27 марта 2009 г.
  78. ^ «Познакомьтесь с музыкальным ясновидением, который находит призраков в ваших mp3» . Шумоподавление . 18 марта 2015 года. Архивировано с оригинала 29 апреля 2015 года . Получено 25 апреля 2015 года .
  79. ^ «Призраки в mp3» . 15 марта 2015 года. Архивировано с оригинала 14 июня 2017 года . Получено 25 апреля 2015 года .
  80. ^ «Потерянный и найденный: U.Va. Grad Student обнаруживает призраков в MP3» . UVA сегодня . 23 февраля 2015 года. Архивировано с оригинала 13 июня 2015 года . Получено 25 апреля 2015 года .
  81. ^ «Призрак в mp3» (PDF) . Архивировано (PDF) из оригинала 12 июня 2015 года . Получено 25 апреля 2015 года .
  82. ^ «Руководство по параметрам командной строки (в CVS)» . Архивировано из оригинала 8 апреля 2013 года . Получено 4 августа 2010 года .
  83. ^ «Руководство по эксплуатации JVC RC-EX30» (PDF) (на нескольких языках). 2004. с. Архивировано из оригинала PDF) 20 августа 2020 . года ( 14.
  84. ^ «DV-RW250H Операция-управление GB» (PDF) . 2004. с. 33. Архивировал (PDF) из оригинала 20 августа 2020 года . Получено 20 августа 2020 года . • Воспроизведение первого перехода и обзора не работает с MP3/WMA/JPEG-CD.
  85. ^ «Сравнение качества звука Hi-Res Audio против CD против MP3» . www.sony.com . Sony . Архивировано из оригинала 14 сентября 2020 года . Получено 11 августа 2020 года .
  86. ^ Вун-Сенг Ган; СЕН-МОРК Куо (2007). Встроенная обработка сигнала с помощью микро сигнальной архитектуры . Wiley-Ieee Press . п. 382. ISBN  978-0-471-73841-1 Полем Архивировано из оригинала 10 марта 2021 года . Получено 16 ноября 2020 года .
  87. ^ Бувин, Габриэль (28 ноября 2006 г.). "Freeformat в 640 кбит/с и foobar2000, возможности?" Полем Архивировано с оригинала 19 сентября 2016 года . Получено 15 сентября 2016 года .
  88. ^ "Lame (1): Create Mp3 Audio File - страница Linux Man" . linux.die.net . Архивировано из оригинала 22 августа 2020 года . Получено 22 августа 2020 года .
  89. ^ "Linux Manges Online - Man.cx Manual Pages" . man.cx. Архивировано из оригинала 22 августа 2020 года . Получено 22 августа 2020 года .
  90. ^ Jump up to: а беременный "GPSycho - переменная битовая скорость" . Хронный MP3 Encoder . Архивировано из оригинала 22 апреля 2009 года . Получено 11 июля 2009 года .
  91. ^ "Twolame: MPEG Audio Layer II VBR" . Архивировано из оригинала 3 июля 2010 года . Получено 11 июля 2009 года .
  92. ^ Аудиоподгруппа ISO MPEG. «MPEG Audio FAQ Версия 9: MPEG-1 и MPEG-2 BC» . Архивировано из оригинала 18 февраля 2010 года . Получено 11 июля 2009 года .
  93. ^ "Хронный Y переключатель" . Wydrogenaudio Knowledgebase . Архивировано с оригинала 2 апреля 2015 года . Получено 23 марта 2015 года .
  94. ^ Рей, Кейси. «Метаданные и ты» . Будущее музыкальной коалиции . Архивировано с оригинала 29 июня 2017 года . Получено 12 декабря 2014 года .
  95. ^ Патель, Кетан; Смит, Брайан С.; Роу, Лоуренс А. Производительность программного видеородера MPEG (PDF) . ACM Multimedia 1993 Конференция. Архивировано (PDF) из оригинала 2 сентября 2019 года . Получено 1 июля 2019 года .
  96. ^ «MPEG-FAQ, версия 3.1» . 14 мая 1994 года. Архивировано из оригинала 23 июля 2009 года.
  97. ^ Jump up to: а беременный «Большой список патентов MP3 (и предполагаемые даты истечения срока годности)» . Tunequest . 26 февраля 2007 года. Архивировано с оригинала 2 марта 2007 года . Получено 19 марта 2007 года .
  98. ^ Cogliati, Джош (20 июля 2008 г.). «Патентный статус MPEG-1, H.261 и MPEG-2» . Kuro5hin . Архивировано из оригинала 16 сентября 2008 года . Получено 6 октября 2009 года . Эта работа не смогла рассмотреть патентные подразделения и продолжения.
  99. ^ Патент США № 5812672
  100. ^ «Исток патента США для MP3, MPEG-2, H.264» . Osnews.com. Архивировано с оригинала 2 апреля 2013 года . Получено 22 июля 2011 года .
  101. ^ «Метод и аппарат для кодирования цифровых сигналов, использующих распределение битов с использованием комбинаций различных пороговых моделей для достижения желаемых скоростей битов» . Архивировано из оригинала 21 января 2023 года . Получено 21 января 2023 года .
  102. ^ "mp3licensing.com - патенты" . mp3licensing.com . Архивировано из оригинала 9 мая 2008 года . Получено 10 мая 2008 года .
  103. ^ «Полная поддержка MP3 скоро появится в Fedora» . 5 мая 2017 года. Архивировано с оригинала 27 июня 2017 года . Получено 17 июня 2017 года .
  104. ^ «Акустическое сжатие данных - базовый патент MP3» . Фонд для бесплатной информационной инфраструктуры . 15 января 2005 года. Архивировано с оригинала 15 июля 2007 года . Получено 24 июля 2007 года .
  105. ^ «Интеллектуальная собственность и лицензирование» . Technicolor . Архивировано из оригинала 4 мая 2011 года.
  106. ^ Kistenfeger, Muzinée (июль 2007 г.). «Общество Фраунхофера (Фраунхофер-Геселлшафт, FHG)» . Генерал британского консульства Мюнхен. Архивировано из оригинала 18 августа 2002 года . Получено 24 июля 2007 года .
  107. ^ «Раннее патентное правоприменение MP3» . Охлаждающие эффекты Крингхаус . 1 сентября 1998 года. Архивировано с оригинала 19 августа 2014 года . Получено 24 июля 2007 года .
  108. ^ «Программа лицензирования Sisvel's Audio» . Архивировано из оригинала 11 февраля 2017 года . Получено 8 февраля 2017 года .
  109. ^ «Audio Mpeg и Sisvel: Томсон подал в суд на нарушение патентов в Европе и Соединенных Штатах - MP3 -плееры остановлены на обычаи» . Zdnet India . 6 октября 2005 года. Архивировано с оригинала 11 октября 2007 года . Получено 24 июля 2007 года .
  110. ^ «Grants Motorola A MP3 и MPEG 2 Аудио -патентная лицензия» . СИСВЕЛЬ. 21 декабря 2005 года. Архивировано с оригинала 21 января 2014 года . Получено 18 января 2014 года .
  111. ^ «Аудио -патенты на MPEG» (PDF) . СИСВЕЛЬ. Архивировано из оригинала (PDF) 27 октября 2016 года . Получено 7 апреля 2017 года .
  112. ^ «Программы лицензирования - устаревшие программы» . www.sisvel.com . Архивировано из оригинала 19 февраля 2023 года . Получено 15 сентября 2023 года .
  113. ^ Огг, Эрика (7 сентября 2006 г.). «Сандиск MP3 заказа переворачивается» . Cnet News . Архивировано с оригинала 4 ноября 2012 года . Получено 24 июля 2007 года .
  114. ^ «Сисвель приносит патент Дикого Запада в Германию» . Блог IPEG . 7 сентября 2006 года. Архивировано с оригинала 23 мая 2007 года . Получено 24 июля 2007 года .
  115. ^ «Apple, Sandisk Settle Texas Mp3 Patent Spat» . IP Law360 . 26 января 2009 г. Получено 16 августа 2010 года .
  116. ^ «Профессионалы Baker Botts LLP: Лиза Кэтрин Келли - представительные обязательства» . Baker Botts LLP . Архивировано с оригинала 10 декабря 2014 года . Получено 15 сентября 2016 года .
  117. ^ «Microsoft сталкивается с 1,5 млрд. MP3 выплаты» . BBC News . 22 февраля 2007 года. Архивировано с оригинала 2 ноября 2008 года . Получено 30 июня 2008 года .
  118. ^ «Microsoft выигрывает изменение патентного решения MP3» . CNET . 6 августа 2007 года. Архивировано с оригинала 30 декабря 2013 года . Получено 17 августа 2010 года .
  119. ^ «Апелляционный суд по решению федерального округа» (PDF) . 25 сентября 2008 года. Архивировано из оригинала (PDF) 29 октября 2008 года.
  120. ^ Jump up to: а беременный Бранденбург, Карлхейнц (1999). "MP3 и AAC объяснили" . Архивировано из оригинала (PDF) 19 октября 2014 года.
  121. ^ «Через лицензирование объявляет обновленную лицензию AAC совместной патентной лицензии» . Бизнес -проволока . 5 января 2009 г. Архивировано с оригинала 18 июня 2019 года . Получено 18 июня 2019 года .
  122. ^ "AAC лицензиары" . Через корпорацию . Архивировано из оригинала 28 июня 2019 года . Получено 6 июля 2019 года .
  123. ^ Marriott, Michel (30 сентября 1999 г.). "News Watch; новый игрок от Sony будет кивать MP3" . New York Times . Архивировано из оригинала 3 июля 2021 года . Получено 24 сентября 2020 года .
  124. ^ «Sony NW-E105 Network Walkman» . Архивировано из оригинала 31 октября 2020 года . Получено 24 сентября 2020 года .
  125. ^ Жан-Марк Валин; Грегори Максвелл; Тимоти Б. Терриберри; Koen Vos (октябрь 2013 г.). Высококачественное музыкальное кодирование с низким уровнем залегания в кодеке Opus . 135 -я конвенция AES. Arxiv : 1602.04845 . Его CBR производит пакеты с именно таким размером, который запросил энкодер, без резервуара, чтобы наложить дополнительные задержки из буферизации, как обнаружено в кодеках, таких как MP3 или AAC-LD. [...] [Тональный шум] наиболее заметен в MP3 с низким битратом.

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d62aae47ee2caa7cc943b83c08257036__1726721340
URL1:https://arc.ask3.ru/arc/aa/d6/36/d62aae47ee2caa7cc943b83c08257036.html
Заголовок, (Title) документа по адресу, URL1:
MP3 - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)