Соотношения между пиковым уровнем цифрового аудиосигнала, истинным пиковым уровнем, громкостью, и обозначения¶
Когда говорят об уровне сигнала (точнее - о пиковом уровне), используется обозначение dBFS - dB Full Scale. Данная шкала имеет точку 0dB привязанную к полному диапазону представимого в используемой разрядности сигнала. Например, при 16-битных сэмплах звукового сигнала представимые значения от -32768 до +32767, поэтому значение уровня сигнала в dBFS вычисляется как 20lg(s/32768), где s- значение сэмпла в данном представлении или максимум абсолютной величины сэмплов на интересующем интервале. Шкала dBFS имеет смысл только в том случае, если для представления сэмплов используется арифметика с фиксированной точкой. В этой шкале уровень оцифрованного сигнала теоретически не может быть выше 0 dBFS, поскольку в заданные границы разрядной сетки большие или меньшие значения сэмплов не помещаются. В современных системах цифровой обработки представление c фиксированной точкой, как правило, используется только при записи или чтении оцифрованного звукового материала из звуковых файлов. При обработке звука после чтения из файла может использоваться арифметика с фиксированной точкой большей разрядности, или арифметика с плавающей точкой, поэтому значение уровня сигнала внутри обрабатывающего ПО может быть больше 0 dB в смысле шкалы dBFS, связанной с исходным представлением в файле.
Истинный пиковый уровень сигнала измеряется в тех же единицах, что и пиковый уровень, однако он теоретически может превышать значения 0dB даже при измерении прямо по материалу из файла вследствие интерполяции сигнала между точками сэмплирования. Хотя шкала та же самая, для этих единиц измерения используется обозначение dBTP, поскольку для одного и того же материала пиковый и истинный пиковый уровни не равны - второй, как правило, больше.
Громкость, в смысле определения в EBU R-128/ITU-R BS.1770, фактически измеряется в тех же единицах, и связана с уровнем линейно в следующем смысле: одна единица громкости 1LU равен одной единице уровня 1dB в линейном случае. То есть, если мы имеем сигнал с громкостью X LU и уровнем Y dB, и мы усиливаем его на +6 dB, то громкость и уровень нового сигнала будут соответственно X+6 LU и Y+6 dB. Это соотношение сохраняется до тех пор, пока в обработке сигнала не сказываются эффекты ограниченной разрядности, т.е. переполнение при усилении. При переполнении уровень ограничивается максимумом используемой шкалы, а громкость далее растёт - сначала практически линейно, потом также происходит ограничение. Шкала LU, в которой синусоидальный сигнал амплитудой в "полную разрядность" имеет громкость 0 LU, называется шкалой LUFS.
Рекомендация EBU R-128 и связанные документы вводят понятия стандартного "измерителя громкости", и перечисляют список измеряемых величин, режимы, и необходимую функциональность прибора, который может иметь такое название (и логотип) в соответствии с R-128. В частности, определяется рекомендуемая референсная точка громкости фонограмм для вещания и промышленной обработки - –23LUFS, и вводятся две стандартных шкалы. Подробности лучше посмотреть в оригинале (документы по громкости доступны свободно для скачивания с сайта EBU проекта).
Возможности индикаторов Дигиспот-2 с лихвой перекрывают требования R-128, хотя для удобства в Джине сделана более гибкая система шкал. Индикаторы в Дигиспот-2 могут измерять
- пиковый уровень сигнала
- истинный пиковый
- RMS уровень
- различные показатели громкости по R-128 (M/S/I/LRA/квантили LRA)
- корреляцию между двумя выбранными каналами
Все эти величины могут быть измерены и показаны на индикаторах в любом составе вместе или по отдельности (определяется настройками конкретного индикатора), для I-loudness и LRA выводятся числовые значения, для остальных - столбиковые индикаторы. Индикаторы доступны в аудиоредакторе Трек-2, панелях свойств элементов файловых панелей и панелей расписаний, редакторах склеек, панели видеопревью, и т.д.
Аномалии пикового уровня аудиоисточников с кодеком отличным от PCM с фиксированной точкой¶
При кодировании аудио MPEG кодеками, результат декодирования может не поместиться в ту разрядность, которую имел исходный сигнал. Пример: у вас есть аудиофайл в PCM кодировке с фиксированной точкой 16 бит, пиковый уровень материала в файле –6dB. Вы закодировали его MP3 кодеком, и при декодировании в ту же разрядность обнаруживается, что декодированный материал имеет максимум уровня –3дБ. То есть, цикл кодирование-декодирование добавляет +3дБ к уровню сигнала. Если бы ваш файл был нормализован под 0дБ, то при декодировании возникло бы переполнение и дефекты звучания (щелчки). В принципе, это явление можно счесть дефектом кодека, но, к сожалению, практика показывает, что подобных файлов довольно много.
В Джине декодирование MP2/MP3 материала выполняется таким образом, что безопасно обрабатываются довольно большие по амплитуде переполнения - примерно до +27дБ. У пользователей системы иногда вызывает недоумение, почему уровень материала прямо в файле-источнике превышает 0dBFS. Как объяснено выше на примере MPEG, такая ситуация возможна для кодеков, отличных от PCM c фиксированной точкой, и объясняется особенностями кодека или ПО, создавшего файл. Преимуществом системы Джин является то, что такие файлы безопасно декодируются, и имеется возможность автоматически нормализовать материал к заданному уровню в дБ или к заданной громкости в LU.