MP3 -- сокращение от MPEG Layer3. Это один из цифровых форматов
хранения аудио, разработанный Fraunhofer IIS и THOMSON, позднее
утвержденный как часть стандартов сжатого видео и аудио MPEG1 и MPEG2.
Данная схема является наиболее сложной схемой семейства MPEG Layer 1/2/3.
Она требует наибольших затрат машинного времени для кодирования по
сравнению с двумя другими и обеспечивает более высокое качество
кодирования. Используется главным образом для передачи аудио в реальном
времени по сетевым каналам и для кодирования CD Audio.
MP3 -- потоковый формат. В данном случае это значит, что исходный сигнал
при кодировании разбивается на равные по продолжительности участки,
именуемые фреймами и кодируемые отдельно, а при декодировании
конечный сигнал формируется из последовательности декодированных
фреймов.
Высокая степень компактности MP3 по сравнению с PCM 16Bit Stereo 44.1kHz
(CD Audio) и ему подобными форматами при сохранении аналогичного
качества звучания достигается с помощью дополнительного квантования по
установленной схеме, позволяющей минимизировать потери качества.
Последнее, в свою очередь, достигается учетом особенностей человеческого
слуха, в том числе эффекта маскирования слабого сигнала одного диапазона
частот более мощным сигналом соседнего диапазона, когда он имеет место,
или мощным сигналом, предыдущего фрейма, вызывающего временное
понижение чувствительности уха к сигналу текущего фрейма. Также
учитывается неспособность большинства людей различать сигналы, по
мощности лежащие ниже определенного уровня, разного для разных
частотных диапазонов. Эта и ей подобные техники называются адаптивным
кодированием и позволяют экономить на наименее значимых с точки зрения
восприятия человеком деталях звучания.
Степень сжатия, и, соответственно, объем дополнительного квантования,
определяются не форматом, а самим пользователем в момент задания
параметров кодирования. Ширина потока (bitrate) варьируется от
наибольшего для MP3, равного 320kbs (320 килобит в секунду), до 96kbs и
ниже. Термин битрейт обозначает общую ширину потока, безразлично к
тому, монофонический или стереофонический сигнал он содержит.
На проведенных тестах специально приглашенные опытные эксперты,
специализирующиеся на субъективной оценке качественности звучания, не
смогли различить звучание оригинального трека на CD и закодированного в
MP3 с коэффициентом сжатия 6:1, то есть с битрейтом в 256kbs.
Более низкие битрейты, несмотря на их популярность, не дают возможности
обеспечить надлежащее качество кодирования. Фактически, и 256kbs не дает
возможности осуществить полностью прозрачное кодирование, то же самое
можно сказать и про наивысший возможный для MP3 битрейт -- 320kbs, но
отличия от CD Audio, по которому кодируется тестовый MP3, сравнимы с
отличиями самого CD Audio от исходного высококачественного сигнала, из
которого он был получен путем оцифровки. То есть, вообще говоря, потери
есть, но несущественны с точки зрения того, кому CD Audio представляется
верхом качественности.
Поэтому самое большое на сегодня преимущество MP3 перед другими
подобными форматами состоит в том, что ни про один другой формат нельзя
пока уверенно сказать, что он полностью гарантирует устойчивое сохранение
качества звучания на достаточно высоких битрейтах, или что для него
написано такое же множество удобного программного обеспечения, как для
MP3. Для MP3 же, с учетом выше сделанной оговорки, такие утверждения
справедливы.
Возможно, "монополия" MP3 будет сломлена начинанием Microsoft - WMA.
Но пока рано говорить об этом. В то же время, в связи с появлением Microsoft
на данном рынке со столь сильно разработкой можно уверенно
предположить, что разработки семейства AAC, прямого наследника MP3, уже
не успеют завоевать популярности.
Описание процесса кодирования
Подготовка к кодированию. Фреймовая структура
Перед кодированием исходный сигнал разбивается на участки, называемые
фреймами, каждый из которых кодируется отдельно и помещается к конечном
файле независимо от других. Последовательность воспроизведения
определяется порядком расположения фреймов. Каждый фрейм может
кодироваться с разными параметрами. Информация о них содержится в
заголовке фрейма.
Начало кодирования
Кодирование начинается с того, что исходный сигнал с помощью фильтров
разделяется на несколько, представляющих отдельные частотные диапазоны,
сумма которых эквивалентна исходному сигналу.
Работа психоакустической модели.
Для каждого диапазона определяется величина маскирующего эффекта,
создаваемого сигналом соседних диапазонов и сигналом предыдущего
фрейма. Если она превышает мощность сигнала интересующего диапазона
или мощность сигнала в нем оказывается ниже определенного опытным
путем порога слышимости, то для данного фрейма данный диапазон сигнала
не кодируется.
Для оставшихся данных для каждого диапазона определяется,
Читать далее...