Весь Мир Hi-Fi

Учимся читать графики и взвешивать MP3-искажения

Отделяем главное от второстепенного в измерениях и узнаем, во сколько раз МР3 хуже оригинала.

Один нехороший человек как-то сказал в 1940-м году: «У каждой ошибки есть имя и фамилия». Да, автору цитаты лучше бы вообще не рождаться, но в данном случае утверждение абсолютно точное и нужное. Если вам что-то не нравится в аудиосистеме или фонограмме, значит где-то схалтурило слабое звено. Поплыла фаза, выросли искажения, да что угодно.

На протяжении своих вопросов к аудио я всегда инстинктивно доверял отчетам, в которых присутствовали хоть какие-то измерения. Оно и понятно. В какой-то момент понимаешь, что любое авторское красноречие не подразумевает никакой ответственности. Я так слышу! Ок, может быть, и слышишь, но перефразируя другого человека, — «хватит слышать мир ушами Сенкевича».

Нам нужна определенная метрологическая сетка, которая в связке с субъективным опытом эксперта позволяет воссоздать более-менее реалистичную картину аудио опыта, выявить определенные закономерности. А если измерили и ничего не нашли, значит, не там искали.

Впрочем, благая идея технических тестов также может оказаться объектом манипуляций. Производитель ЦАПа приводит красивые цифры без учета влияния остальной обвязки — т.е. не меряет, а просто копирует даташит самого чипа. Другой производитель наушников за три копейки рисует сумасшедшие горизонты инфрабаса и ультразвука, недоступные даже напольникам за миллион. Разумеется, без указания неравномерности АЧХ. Кстати, с нее вот и начнем — с неравномерности АЧХ и трюков с графиками.

В этом исследовании нам помогут несколько маленьких друзей различной стоимости. Самым дорогим компонентом является блок АЦП, который отвечает за приведение в цифровой вид внешнего тестового сигнала от компонента. PCI-аудиокарта LynxTwo появилась еще в 2000-м году, но до сих пор мало кто превзошел ее в точности. И если полевые записи я выполняю портативным рекордером Sony PCM-D100, то всю домашнюю работу, в частности, архивацию винила, я доверяю именно LynxTwo. Пишет практически один в один. В принципе, можно использовать и карту попроще, но следует понимать, чтобы характеристики тестируемого не превысили возможности АЦП, после этого объективность теста теряет смысл.

Сгенерировать нужный тестовый сигнал и проанализировать его девиации на звучании компонента мне помогает программа RightMark Audio Analyzer (RMAA). Вообще-то чаще всего ее пользуют бесплатно, но мне не жалко было перечислить за труды разработчикам 1600 рублей и получить так называемую PRO-версию с незначительным расширением настроек.

Источником звука в этот раз будет банальный iPad mini первого поколения. Обычная походная вещица, которая тем не менее преподала несколько любопытных поводов для размышления.

До начала тестов программа RMAA сгенерировала тестовый WAV-файл в размерности 16 бит/44 кГц — т.е. аудиопоток в той же разрядности, что и 99,99% коммерческих фонограмм. Да, это не музыкальный трек, но сам он содержит различные мультитоны и прочие специальные импульсы, позволяющие определить пределы возможностей аудиоисточника. Загружаем и воспроизводим WAV на iPad, подключенном к линейным входам карты LynxTwo в режиме записи. Далее RMAA математически рассчитывает величины отклонений этой записи относительно эталонной модели и строит графики. Итак, смотрим АЧХ.

Эти два таких непохожих графика на самом деле описывают один и тот же результат измерения аудиовыхода iPad mini. Обратите внимание на вертикальную шкалу дБ. Согласно полученным данным, лишь в конце полосы 20 Гц – 20 кГц наш айпад демонстрирует снижение отклика всего на минус 0,23 дБ. Если растянуть вертикальную шкалу на сотню дБ (на первом графике) то АЧХ сделается просто ровной линией. А если масштабировать вертикальную шкалу до десятых долей децибел (на втором графике), да еще горизонтальный отсчет вести от нуля, то получится вот такой унылый горбик. Угадайте, какой масштаб предпочтут в маркетинговом отделе?

К слову сказать, Apple при всех своих сектантских заморочках никогда не тыкала в нос красивыми цифрами. А они у iPad действительно выглядят неплохо, как мы убедимся ниже. И все же, в каком масштабе следует оценивать график АЧХ?

Поскольку речь идет не об измерении колонок в реальной комнате, где перепады полос могут достигать 10 дБ, то для слаботочных источников вполне достаточно будет плюс-минус 3 дБ. А для сильно любопытных можно уменьшить вертикальную шкалу до 1 дБ. И что же мы видим?

Мы видим отличный результат, абсолютно адекватная характеристика АЧХ. Мягкий спад отклика начиная с 10 кГц свидетельствует о применении фильтра с минимальной фазой. С форматом Red Book всегда так. Приходится выбирать что-то одно в приоритете — либо фазу, либо абсолютную линейность АЧХ. Можно было обеспечить «линейку» вплоть до 22 кГц, но тогда перед импульсом появился бы паразитный «звон» на фронте. А все из-за того, что как-то надо фильтровать зеркальные помехи квантования, которые могут влиять на полезный сигнал в районе высоких частот. Apple выбрал заботу о фазе, и это решение вполне в русле современных взглядов на цифровое звукоизвлечение. Посмотрим на остальные данные замеров RMAA.

Уровень шума у iPad mini составил минус 96,9 дБ. Фактически динамический диапазон 16-битного сигнала отработан полностью. Взаимопроникновение каналов и искажения также держатся на минимальном уровне.

Закодируем WAV в лосслесс и повторим замер. По цифрам ничего не изменилось, да и на слух тоже. Привет всем, кто утверждает, что несжатый PCM звучит «свободнее» лосслесса. По крайней мере, не на этом планшете.

Теперь, памятуя, что среди хайрезов большую долю составляют релизы 24 бит/44 кГц, проверим iPad mini соответствующим аудиопотоком. Характер и неравномерность АЧХ остались прежними, а показатели динамического диапазона и искажений сделались еще лучше.

Выходит, что внутренний эпловский ЦАП (Cirrus-Logic 338S1213) в состоянии обрабатывать 24-битовый код без транкейта до 16 бит. Между прочим, многие портативные устройства с аудиофильской претензией, включая мой Audioquest Dragonfly Black, демонстрируют куда больше искажений. И если честно, то айфона и Tidal Hi-Fi будет достаточно, чтобы обеспечить звук достаточного качества, где бы вы не оказались. Цепляйте мини-джек на аудиосистему — и все будет в порядке.

Конечно, реальное разрешение аудиовыхода iPad, согласно измеренному динамическому диапазону (т.е. разницей между уровнем шума и максимальной амплитудой сигнала), составит 104/6 = 17 бит. Всего один бит прибавки, вроде бы совсем немного, да?

Но поверьте, 24 бит х 6 = 144 дБ. Таких цифр не обеспечит ни одно реальное устройство! У LynxTwo этот показатель составляет около 115 дБ (т.е. 19 бит), а самые современные и навороченные конвертеры еле-еле обеспечивают 20-битное разрешение, т.е. 120 дБ на аудиовыходе.

Теперь попытаемся оценить, насколько деградирует сигнал, когда его сжимают lossy-кодеками для интернет-трансляции и других задач, где экономия стоит на первом месте. Можно сказать, что измерения в данном случае абсурдны, т.к. психоакустическая модель MP3-кодера с музыкальным сигналом работает иначе чем с генерированными синусами. Разумеется, не существует и фонограмм с динамическим диапазон 90 или более децибел. Но, как было сказано, технические сигналы позволяют нам понять рамки формата, пределы его возможностей, выше которых уже не прыгнуть.

Исходник RMAA был закодирован в несколько типичных битрейтов — 320, 192, 160 и 128 кбс. Ну, «типичных» — это еще преувеличение. Я использовал LAME 3.99 с установкой 0 — т.е. максимального качества кодирования в ущерб времени, отводимого на задачу. Учитывая, насколько не парятся по этому поводу остальные граждане, реальные величины искажений будут еще больше.

Итак, MP3 320 кбс, самая мажорная установка insane — и уже какая-то трясучка по всей АЧХ.

Динамический диапазон и разделение каналов не изменились, а вот интермодуляционные искажения + шум выросли более чем в два раза. Да, пока формально они остаются достаточно низкими. Но не забывайте, что впереди у такого сигнала — каскады усиления и колонки со своей кривизной, где все эти девиации будут только мультиплицироваться новыми кругами ада.

Следующий образец на 192 кбс (этот битрейт считается «хорошим качеством» для интернет-радио и видеострима) более откровенен в своем бесстыдстве.

Здесь спектр отсекается на 18 кГц, но полагаю, что на реальном музыкальном сигнале психоакустическая модель будет периодически выгрызать куда большие куски. Теперь вместо интермодуляционных искажений начали стремительно расти гармонические + шум. Немного стал меньше динамический диапазон — это уже меньше теоретических 16 бит.

Образец 160 кбс уже просто вопиет. Гармонические и интермодуляционные искажения с шумом выглядят крайне неприглядно. Динамический диапазон опустился до 15 бит. Только радует низкий уровень взаимопроникновения каналов, который практически стоит на месте. Здесь хоть joint stereo отключен или включен?

Сравнение уровня гармонических искажений синуса оригинала и МР3 различных битрейтов. Обвал качества начинается с битрейта 160 кбс

Файл 128 кбс демонстрирует еще большие безобразия, хотя и не такие страшные, как ожидалось при снижении битрейта с 160 кбс. На один децибел стал ниже динамический диапазон — теперь это меньше 15 бит. Секрет мягкого звука как у легендарных «филипсов» на TDA1540 (ха-ха, ладно, извините за шутку). Все-таки уровни искажений для нас важнее любых битов. Теперь одни только интермодуляционные искажения + шум выше в 25 раз чем в оригинале. При этом размер самого МР3 на 128 кбс оказался в 11 раз меньше WAV-оригинала и в два раза меньше чем лосслесс во FLAC или ALAC. Вот такая экономика для экономных.