Для многих начинающих мастеринг-инженеров феномен межсемпловых пиков является чем-то пугающим и непонятным. Некоторые аудиофилы уверены, что межсемпловые пики – это одно из унизительных последствий так называемой «войны громкости» и вполне устранимая форма искажения сигнала. Другие же считают, что межсемпловые пики – явление настолько редкое и незаметное, что можно вообще не обращать на него никакого внимания.
Так что же скрывается за межсемпловыми пиками, и представляют ли они собой что-то важное и интересное для нас?
Пиковые уровни сигнала
Для того чтобы понять, что подразумевается под межсемпловым пиком, мы должны более внимательно изучить уровни сигнала в области цифровых данных и, в частности, сам процесс цифро-аналогового преобразования. Как нам всем известно, уровни сигнала в области цифровых данных представлены фиксированными рядами чисел, где самый громкий записываемый сигнал обозначается в виде 0dBFS (0dB Full Scale – «полная шкала»). Когда сигнал записывается на уровне, превышающем 0dBFS, мы получаем клиппированную волну с верхушками, срезанными на 0dBFS. Конечно, у большинства исходных цифровых записей остаётся большой хедрум, поскольку все инженеры стараются держаться подальше от страшного «цифрового перегиба».
Однако при сведении и мастеринге инженеры всё чаще и чаще поднимают конечные уровни сигналов до 0dBFS. В большинстве случаев громкость, присущая современной музыке, достигается путём агрессивного ограничения сигнала, которое напрямую воздействует на пиковые сигналы и сопровождается поднятием мастера до 0dBFS, однако при этом на слышимом уровне волна не клиппируется. В мире, где самое главное – это уровень, такой подход вполне оправдан, поскольку он гарантирует, что ваша песня будет такой же громкой (если не громче), чем песня конкурента. Но как этот подход влияет на качество звука?
Межсемпловые пики могут привезти к клиппингу «между» семплами
Ещё выше
Когда мы поднимаем мастера до 0dBFS, основная проблема заключается в том, что мы полагаем, будто уровни цифровых сигналов являются абсолютными, – другими словами, что ничто никогда не может превысить 0dBFS. Однако нам следует учитывать и ту часть пути прохождения сигнала, которая следует за созданием финального микса и настройкой уровней мастеров, – а именно, процесс цифро-аналогового преобразования. Поскольку не представляется возможным передать цифровой звук прямо в мозг человека, любая цифровая запись должна быть преобразована обратно в аналоговые сигналы перед тем, как мы услышим её. При этом цифро-аналоговые преобразователи используют форму восстанавливающего фильтра – закругляющего (или интерполирующего) ступенчатую цифровую волну и образующего сглаженный сигнал на выходе.
Как правило, при интерполяции восстанавливающие фильтры создают небольшие перепады между возможными уровнями выходного сигнала. Конечно, в большинстве случаев эти маленькие изменения уровня сигнала не имеют никакого значения для нашего динамического диапазона, но для сигналов, уровень которых приближается к 0dBFS, малейшие изменения могут стать большой проблемой. Характер этой проблемы может варьироваться в зависимости от типа преобразователя и устройств, следующих за ним. У профессионального ЦА преобразователя предусмотрен необходимый хедрум, но у дешёвых CD плееров хедрума для этих межсемпловых пиков нет. Одним словом, вы не будете слышать искажений в своём миксе, находясь в студии, но на дешёвом оборудовании пики могут звучать явно обрезанными.
Хотя проблема заключается не конкретно в части межсемплового пика, стоит также подумать о том, что происходит с миксами, которые были сведены очень быстро и сконвертированы с помощью аудиокодека в lossy-формат, например, mp3. Чтобы достичь желаемого сжатия данных, многие кодеки используют различные формы фильтрации для уменьшения количества аудиоинформации, при этом аудиокодеки, обеспечивающие сжатие с потерями, используют более жёсткую фильтрацию. При этой фильтрации, как и при использовании восстанавливающих фильтров в процессе ЦА преобразования, образуются определённые несоответствия уровней оригинального несжатого аудиофайла и конечной сжатой версии. Чем больше сжимаются данные, тем вероятнее появление искажений звука, что, в общем-то, вполне закономерно.
Функция True Peak Limiting в Maximizer от Ozone позволяет избежать межсемпловых пиков, анализируя уровни пиков и предупреждая межеспловый клиппинг
Работа с пиками
Определив некоторые причины межсемпловых пиков и проблемы, с ними связанные, что мы можем предпринять во избежание их появления? Самым оперативным решением, безусловно, будет формирование определённого хедрума между максимальными уровнями ваших мастеров и 0dBFS. Единственная проблема здесь заключается в том, что мнения специалистов по этому вопросу довольно сильно варьируются: некоторые аудиофилы считают, что единственно безопасный уровень пиков составляет -3dBFS, а другие спокойно поднимают мастера до -0.3dBFS. Проблема в том, что определить необходимый запас надёжности довольно трудно, учитывая различия между CD плеерами и ЦА преобразователями и принимая во внимание динамические и тембральные качества музыки.
Другим относительно простым решением проблемы межсемпловых пиков является улучшение качества измерения в плагинах, таких как X-ISM от SSL или, в случае искажений от сжатия данных, Pro-Codec от Sonnox . При работе с плагином X-ISM цифровой фильтр с конечной импульсной характеристикой используется для моделирования типичной интерполяции, применяемой в процессе ЦА преобразования, после которого сигнал подаётся на «аналоговый» индикатор межсемплового клиппирования. В теории, измеритель сигнализирует о возможности появления межсемпловых пиков (хотя, конечно, нельзя быть полностью уверенным), позволяя вам установить конечный хедрум, полагаясь на полученные данные.
Плагин X-ISM от SSL моделирует поведение восстанавливающего ЦА фильтра и указывает на возможность появления межсемпловых пиков
Максимальный хедрум
Помимо возможности использования кодеков в реальном времени, Pro-Codec от Sonnox также позволяет определить нежелательные искажения сигнала до рендирования конечного файла. Конечно, при сжатии аудиоданных вы можете избежать нежелательного искажения путём увеличения хедрума или изменения объёма сжимаемых данных (при более высокой скорости передачи цифрового потока искажение уменьшается). Как и вышеупомянутый плагин X-ISM, Pro-Codec позволяет выбрать хедрум и, – по крайней мере, до некоторой степени, – объём ограничения сигнала, полагаясь не на интуицию, а на полученные данные, чтобы в дальнейшем не столкнуться с какими-то неожиданностями.
Помимо этого, также любопытно взглянуть на ряд новых продуктов, которые можно использовать для работы с межсемпловыми пиками. Например, Ozone от iZotope может функционировать в режиме обнаружения межсемпловых пиков (Intersample Detection mode) при использовании модуля Maximizer. При включении режима обнаружения межсемпловых пиков Maximizer эффективно ограничивает сигнал, принимая в расчёт уровни, полученные после ЦА преобразования, а не текущие уровни цифрового семпла. Вкратце можно сказать, что Maximizer представляет собой форму саморегулируемого ограничителя сигнала, использующего возможные уровни, что делает его простым, но эффективным инструментом для устранения межсемпловых пиков при сохранении максимальной громкости.
Допустимый хедрум
Проблема межсемпловых пиков является неизбежным следствием войны громкости и отсутствия регулирования и стандартизации в музыкальной индустрии. По большому счёту, проблемы межсемпловых пиков можно было бы избежать, приняв за стандарт уровень пиков в -3dBFS, следуя примеру киноиндустрии и телевидения, которые строго соблюдают установленные уровни конечных сигналов и стандарты громкости. Музыкальной индустрии свойственно гораздо более бесцеремонное отношение, громкость здесь считается самым важным достижением, при этом качество звука отодвигается на второй план. Ирония, конечно, в том, что пиковые уровни не являются основным компонентом громкости, но формируются среднеквадратичными (RMS) уровнями.
Всё больше и больше звукорежиссёров, музыкантов и слушателей понимают феномен межсемпловых пиков, и всё чаще при выборе звучания нашей музыки мы руководствуемся нужными для этого знаниями. Можно утверждать, что появление таких технологий, как «Mastered for iTunes», знаменует начало переосмысления отношения к громкости и сжатию данных. Таким образом, вполне возможно, что в будущем специалисты будут стремиться к меньшему искажению сигналов и будут чаще выбирать высокие скорости передачи цифрового потока, так что межсемпловые пики могут стать частью прошлого.
В этом видео от Fabfilter pro объясняются и исследуются межсемпловые пики: