MP3

Материал из свободной русской энциклопедии «Традиция»
Перейти к навигации Перейти к поиску

MP3 (более точно, англ. MPEG-1/2/2.5 Layer 3 (но не MPEG-3) — третий формат кодирования звуковой дорожки MPEG) — лицензируемый формат файла для хранения аудио-информации.[1] На данный момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации. Он широко используется в файлообменных сетях для передачи музыкальных произведений. Формат может проигрываться в любой современной операционной системе (например, в последних версиях Windows даже имеется уже встроенный кодек), на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров. Необходимо отметить, что эта популярность представляет собой «порочный круг»: пользователи кодируют аудио в MP3 в основном из-за широкой поддержки формата производителями программного и аппаратного обеспечения, а производители, в свою очередь, вкладывают средства в наиболее популярный среди пользователей формат MP3.

История[править | править код]

MP3 разработан рабочей группой института Фраунхофера (англ. Fraunhofer Society) MPEG (англ. Motion Pictures Expert Group — группа экспертов в области кинематографа) состоящей из Джонсона, Штолла, Деери и Карлхайнца Бранденбурга. Основой разработки MP3 послужил экспериментальный кодек ASPEC (Adaptive Spectral Perceptual Entropy Coding). Первым кодировщиком в формат MP3 стала программа L3Enc, выпущенная летом 1994 года. Спустя один год появился первый программный MP3-плеер — Winplay3. При разработке алгоритма тесты проводились на вполне конкретных популярных композициях. Основной стала песня Сюзанны Веги «Tom's Diner». Отсюда возникла шутка, что «MP3 был создан исключительно ради комфортного прослушивания любимой песни Бранденбурга», а Вегу стали называть «мамой MP3».

Описание формата[править | править код]

В этом формате звуки кодируются частотным образом (без дискретных партий); есть поддержка стерео, причём в двух форматах (подробности — ниже). MP3 является форматом сжатия с потерями, то есть часть звуковой информации, которую (согласно психоакустической модели) ухо человека воспринять не может или воспринимается не всеми людьми, из записи удаляется безвозвратно. Степень сжатия можно варьировать, в том числе в пределах одного файла. Интервал возможных значений битрейта составляет 8 — 320 кбит/c. Для сравнения, поток данных с обычного компакт-диска формата Audio-CD равен 1411,2 кбит/c при частоте дискретизации 44100 Гц.

MP3 и «качество Audio-CD»[править | править код]

Распространено мнение, что запись с битрейтом 128 кбит/c подходит для музыкальных произведений, предназначенных для прослушивания большинством людей, обеспечивая качество звучания Audio-CD. В действительности всё намного сложнее. Во-первых, качество полученного MP3 зависит не только от битрейта, но и от кодирующей программы (кодека). Во-вторых, помимо превалирующего режима CBR (Constant Bitrate — постоянный битрейт) (в котором, проще говоря, каждая секунда аудио кодируется одинаковым числом бит) существуют режимы ABR (Average Bitrate — усредненный битрейт) и VBR (Variable Bitrate — переменный битрейт) (в которых битрейт варьируется, обеспечивая более высокое качество звучания). В-третьих, граница 128 кбит/c является условной, так как она была «изобретена» в эпоху становления формата, когда на некачественных аудиокартах и компьютерных колонках было практически невозможно отличить MP3 от оригинала. На данный момент считается, что неотличимое от оригинала звучание (при правильно выбранном и настренном кодеке) обычно достижимо при битрейте от 160 кбит/c и выше — в зависимости от исходного аудиофайла, слушателя и его аудиосистемы. Некоторые аудиофилы предпочитают сжимать музыку с «максимальным качеством» — 320 кбит/c. На самом деле известны семплы (фрагменты аудиозаписи), не поддающиеся качественному сжатию с потерями: на всех возможных битрейтах не составляет особого труда отличить сжатое аудио от оригинала. Некоторые мелодии (из тех, что используют шум и акустические помехи в качестве фона) кодируются только как «стерео», но не как «объединённое стерео», иначе отличия слышны на любом битрейте [Источник?].

Режимы кодирования и опции[править | править код]

Существует три версии MP3 формата для различных нужд: MPEG-1, MPEG-2 и MPEG-2.5. Отличаются они возможными диапазонами битрейта и частоты дискретизации:

  • 32 — 320 кбит/c при частотах дискретизации 32000 Гц, 44100 Гц и 48000 Гц для MPEG-1 Layer 3;
  • 16 — 160 кбит/c при частотах дискретизации 16000 Гц, 22050 Гц и 24000 Гц для MPEG-2 Layer 3;
  • 8 — 160 кбит/c при частотах дискретизации 8000 Гц и 11025 Гц для MPEG-2.5 Layer 3.

Режимы управления кодированием звуковых каналов[править | править код]

Так как формат MP3 поддерживает двухканальное кодирование (стерео), существует 3 режима:

  • Стерео — двухканальное кодирование, при котором каналы кодируются независимо друг от друга. Таким образом, заданный битрейт делится на два канала. Например, если заданный битрейт 192 кбит/c, то для каждого канала он будет равен только 96 кбит/c.
  • Моно — одноканальное кодирование. Если закодировать двухканальный материал этим способом, различия между каналами будут полностью стёрты, так как два канала смешиваются в один, он кодируется и он же воспроизводится в обоих каналах стереосистемы. Единственным плюсом данного режима может являться только выходное качество по сравнению с режимом Стерео при одинаковом битрейте, так как на один канал приходится вдвое большее количество бит, чем в режиме Стерео. Но различий между каналами вы не услышите, так как канал здесь только один.
  • Объединённое стерео (Joint Stereo) — оптимальный способ двухканального кодирования, при котором левый и правый каналы преобразуются в их сумму и разность. Для большинства звуковых файлов канал с разницей получается намного тише канала с суммой, поэтому на сумму отводится бо́льшая часть битрейта. Таким образом, качество выходного файла разительно отличается в лучшую сторону от режима Стерео при одинаковом битрейте, особенно при низком. Бытует мнение, что данный режим не подходит для звукового стереоматериала, в котором в двух каналах воспроизводится субъективно абсолютно различный материал, так как он стирает различия между каналами. Это ошибочное мнение, так как в действительности MP3-кодек оперирует частотами, а определенные частоты в большинстве случаев пересекаются в обоих каналах, то есть идентичная информация все же присутствует, а различная кодируется отдельно. Особенно эффективен этот способ двухканального кодирования при использовании переменного битрейта, речь о котором пойдет ниже.

CBR, VBR, ABR[править | править код]

CBR расшифровывается как Constant Bit Rate, то есть Постоянный Битрейт, который задается пользователем и не изменяется при кодирования произведения, таким образом каждой секунде произведения соответствует одинаковое количество закодированных бит данных (даже при кодировании тишины). На самом деле данный режим кодирования не является оптимальным, так как он не годится для большинства динамичных музыкальных произведений при битрейте ниже 256 кбит/c. VBR расшифровывается как Variable Bit Rate, то есть Варьирующийся Битрейт или Переменный Битрейт, который динамически изменяется программой-кодером при кодировании, в зависимости от насыщенности кодируемого аудиоматериала и установленного пользователем качества кодирования (например, тишина закодируется с минимальным битрейтом). Этот метод MP3-кодирования является самым прогрессивным и до сих пор развивается и улучшается, так как аудиоматериал разной насыщенности может быть закодирован с определенным качеством, которое обычно выше, чем при установке среднего значения в методе CBR. Плюс к тому, размер файла уменьшается за счет фрагментов, не требующих высокого битрейта. Единственным минусом данного метода кодирования является полная невозможность предсказать размер выходного файла. Но этот недостаток VBR-кодирования меркнет перед его достоинствами. ABR расшифровывается как Average Bit Rate, то есть Усредненый Битрейт, который является гибридом VBR и CBR: битрейт в кбит/c задается пользователем, а программа варьирует его, постоянно подгоняя под заданный битрейт. Таким образом, кодер будет с осторожностью использовать максимально и минимально возможные значения битрейта, так как рискует не вписаться в заданный пользователем битрейт. Это является явным минусом данного метода, так как сказывается на качестве выходного файла, которое будет немного лучше, чем при использовании CBR, но намного хуже, чем при использовании VBR. С другой стороны, этот метод позволяет наиболее гибко задавать битрейт (может быть любым числом между 8 и 320, против исключительно кратных 16 чисел метода CBR) и вычислять размер выходного файла.

Кодеки[править | править код]

Типы программ, необходимые для преобразования форматов файлов. Наиболее распространённые кодеки мр3:

  • mp3PRO-codec
  • mp3LAME-codec

Теги[править | править код]

Метки в границах mp3-файла (вначале и\или в конце). В них могут быть записана информация об авторстве, альбоме, годе выпуска и прочая информация о треке. В более поздних версиях тегов возможно хранение обложек альбомов и текста песни. Существуют различные версии тегов. (см. музыкальные теги).

Достоинства и недостатки[править | править код]

MP3 является лидером по распространенности, но при этом не является лучшим по техническим параметрам. Например, существуют форматы, позволяющие получить сравнимое качество (субъективно) при большей плотности. Также в формате MP3 отсутствует режим кодирования без потерь англ. lossless, подходящий для профессионалов. Для домашней музыкальной коллекции (когда нет необходимости проигрывать композиции на музыкальном центре или распространять их через интернет) можно воспользоваться конкурирующими форматами. MP3 непригоден для профессионального использования музыкантами уже из-за того, что данные сжимаются с потерями, и при каждом редактировании файла качество ухудшается. При этом формат вполне подходит (с профессиональной точки зрения) для распространения демонстрационных композиций или иных способов «раздачи» своей музыки из-за повсеместной распространённости проигрывателей.

См. также[править | править код]

Ссылки[править | править код]

Примечания[править | править код]

  1. Для аудиовизуальных примеров, в словарно-энциклопедических статьях возможно использование загруженных в базу данных или сторонних mp3-файлов.