Project

General

Profile

Уровень звука, Громкость, Нормализация

Введение

В этой статье дается краткое пояснение терминов Громкость звука, Уровень звука, Нормализация, Усиление и некоторых других, и их взаимосвязи и использование применительно к системе автоматизации телерадиовещания Digispot.

Уровень звука

Под термином Уровень звука понимается уровень амплитуды звукового сигнала. Применительно к элементу расписания, элементу МБД или иному фрагменту звука речь идет о пиковом (максимальном) уровне сигнала на протяжении всего фрагмента. Данный уровень измеряется единицах dBFS и практически всегда является отрицательным числом. Этот уровень важен, т.к. от него зависит, насколько можно увеличить уровень, и следовательно, громкость звучания, не превысив теоретический порог 0 dBFS.

Для визуального наблюдения за текущим уровнем сигнала в реальном уровне предназначены индикаторы уровня сигнала.

Диаграмма изменения уровня сигнала во времени называется сигналограммой и используется для визуального отображения фонограмм и других звуковых элементов в различных окнах системы Digispot, например, окне редактирования склейки, при монтаже звука и пр.

В системе Digispot максимальный уровень элемента расписания и МБД рассчитывается однократно и запоминается для последующего использования, например, для нормализации.
Определение пикового сигнала совмещено с одновременным определением ее громкости, эти величины всегда рассчитываются совместно.

Истинный уровень звука

Термином Истинный уровень звука понимается гипотетический уровень амплитуды аналогового звукового сигнала, который является интерполяцией имеющейся оцифрованной фонограммы. Разница с просто "Уровнем" в том, что при сэмплировании точки взятия сэмплов на временной оси могут не попадать в точки максимума аналогового сигнала. Например, если у нас имеется синусоидальный сигнал частотой 11025 Гц и мы оцифровываем его с частотой 44100, то далее пиковое значение уровня по оцифрованной фонограмме может иметь значение от –3dBFS до 0dBFS в зависимости от того, с каким фазовым смещением точки сэмплирования на временной оси будут попадать на сигнал. При более высоких частотах сигнала пики могут быть ещё более недооценены.

В документе ITU-R BS.1770-3 (Annex 2) определяется алгоритм вычисления показателя "True Peak Level". Предлагаемая процедура сводится к повышению частоты дискретизации в 4 раза и фильтрации, затем по полученной интерполяции сигнала находится максимум амплитуды.

В системе Digispot пиковые индикаторы в редакторе, окнах свойств, склеек, имеют возможность отображать истинный уровень звука.

Громкость звука

Громкость - это оценочная величина, характеризующая насколько громко слушатель воспринимается материал. Данная величина рассчитывается по специальному алгоритму, учитывающему восприятие звука человеком, разработанному МСЭ\ITU - BS.1770.

Громкость измеряется в единицах LUFS, которые по физическому смыслу идентичны децибелам. Громкость прямо связана с уровнем сигнала - чем выше уровень сигнала, тем больше его громкость.
Численно эта связь линейная: если уровень сигнала увеличить на 6 dB, то и громкость увеличится на 6 LU. (Если быть математически точным, зависимость не линейная, но для большинства случаев практического применения отклонением от линейной зависимости можно пренебречь).

Контроль громкости в реальном времени происходит при помощи индикаторов громкости, их существует два: M - мгновенный (Momentary) и S - кратковременный (Short-term), они отличатся интервалами измерения: 0.4 сек и 3 сек соответственно.

Для оценки громкости интервала звука разработана специальная методика, вычисляющая величину громкости интервала, обозначаемую величиной I и называемую Интегральной громкостью (Integrated loudness). Именно эта величина имеется в виду, когда говорится о громкости элемента расписания или МБД.

В системе Digispot интегральная громкость элемента расписания и МБД рассчитывается однократно и запоминается для последующего использования, например, для нормализации.

В России методика измерения громкости программ определена приказом ФАС от 22 мая 2015 № 374/15. Громкость программ регламентируется федеральным законом 338.

Соотношения между пиковым уровнем цифрового аудиосигнала, истинным пиковым уровнем, громкостью, и обозначения

Когда говорят об уровне сигнала (точнее - о пиковом уровне), используется обозначение dBFS - dB Full Scale. Данная шкала имеет точку 0dB привязанную к полному диапазону представимого в используемой разрядности сигнала. Например, при 16-битных сэмплах звукового сигнала представимые значения от -32768 до +32767, поэтому значение уровня сигнала в dBFS вычисляется как 20lg(s/32768), где s- значение сэмпла в данном представлении или максимум абсолютной величины сэмплов на интересующем интервале. Шкала dBFS имеет смысл только в том случае, если для представления сэмплов используется арифметика с фиксированной точкой. В этой шкале уровень оцифрованного сигнала теоретически не может быть выше 0 dBFS, поскольку в заданные границы разрядной сетки большие или меньшие значения сэмплов не помещаются. В современных системах цифровой обработки представление c фиксированной точкой, как правило, используется только при записи или чтении оцифрованного звукового материала из звуковых файлов. При обработке звука после чтения из файла может использоваться арифметика с фиксированной точкой большей разрядности, или арифметика с плавающей точкой, поэтому значение уровня сигнала внутри обрабатывающего ПО может быть больше 0 dB в смысле шкалы dBFS, связанной с исходным представлением в файле.

Истинный пиковый уровень сигнала измеряется в тех же единицах, что и пиковый уровень, однако он теоретически может превышать значения 0dB даже при измерении прямо по материалу из файла вследствие интерполяции сигнала между точками сэмплирования. Хотя шкала та же самая, для этих единиц измерения используется обозначение dBTP, поскольку для одного и того же материала пиковый и истинный пиковый уровни не равны - второй, как правило, больше.

Громкость, в смысле определения в EBU R-128/ITU-R BS.1770, фактически измеряется в тех же единицах, и связана с уровнем линейно в следующем смысле: одна единица громкости 1LU равен одной единице уровня 1dB в линейном случае. То есть, если мы имеем сигнал с громкостью X LU и уровнем Y dB, и мы усиливаем его на +6 dB, то громкость и уровень нового сигнала будут соответственно X+6 LU и Y+6 dB. Это соотношение сохраняется до тех пор, пока в обработке сигнала не сказываются эффекты ограниченной разрядности, т.е. переполнение при усилении. При переполнении уровень ограничивается максимумом используемой шкалы, а громкость далее растёт - сначала практически линейно, потом также происходит ограничение. Шкала LU, в которой синусоидальный сигнал амплитудой в "полную разрядность" имеет громкость 0 LU, называется шкалой LUFS.

Рекомендация EBU R-128 и связанные документы вводят понятия стандартного "измерителя громкости", и перечисляют список измеряемых величин, режимы, и необходимую функциональность прибора, который может иметь такое название (и логотип) в соответствии с R-128. В частности, определяется рекомендуемая референсная точка громкости фонограмм для вещания и промышленной обработки - –23LUFS, и вводятся две стандартных шкалы. Подробности лучше посмотреть в оригинале (документы по громкости доступны свободно для скачивания с сайта EBU проекта).

Возможности индикаторов Дигиспот-2 с лихвой перекрывают требования R-128, хотя для удобства в Джине сделана более гибкая система шкал. Индикаторы в Дигиспот-2 могут измерять

  • пиковый уровень сигнала
  • истинный пиковый
  • RMS уровень
  • различные показатели громкости по R-128 (M/S/I/LRA/квантили LRA)
  • корреляцию между двумя выбранными каналами

Все эти величины могут быть измерены и показаны на индикаторах в любом составе вместе или по отдельности (определяется настройками конкретного индикатора), для I-loudness и LRA выводятся числовые значения, для остальных - столбиковые индикаторы. Индикаторы доступны в аудиоредакторе Трек-2, панелях свойств элементов файловых панелей и панелей расписаний, редакторах склеек, панели видеопревью, и т.д.

Аномалии пикового уровня аудиоисточников с кодеком отличным от PCM с фиксированной точкой

При кодировании аудио MPEG кодеками, результат декодирования может не поместиться в ту разрядность, которую имел исходный сигнал. Пример: у вас есть аудиофайл в PCM кодировке с фиксированной точкой 16 бит, пиковый уровень материала в файле –6dB. Вы закодировали его MP3 кодеком, и при декодировании в ту же разрядность обнаруживается, что декодированный материал имеет максимум уровня –3дБ. То есть, цикл кодирование-декодирование добавляет +3дБ к уровню сигнала. Если бы ваш файл был нормализован под 0дБ, то при декодировании возникло бы переполнение и дефекты звучания (щелчки). В принципе, это явление можно счесть дефектом кодека, но, к сожалению, практика показывает, что подобных файлов довольно много.

В Джине декодирование MP2/MP3 материала выполняется таким образом, что безопасно обрабатываются довольно большие по амплитуде переполнения - примерно до +27дБ. У пользователей системы иногда вызывает недоумение, почему уровень материала прямо в файле-источнике превышает 0dBFS. Как объяснено выше на примере MPEG, такая ситуация возможна для кодеков, отличных от PCM c фиксированной точкой, и объясняется особенностями кодека или ПО, создавшего файл. Преимуществом системы Джин является то, что такие файлы безопасно декодируются, и имеется возможность автоматически нормализовать материал к заданному уровню в дБ или к заданной громкости в LU.

Усиление звука

Усилением или коэффициентом усиления является величина, определяющая, насколько увеличивается или уменьшается амплитуда результирующего сигнала относительно исходного. Коэффициент усиления измеряется в децибелах, увеличению уровня сигнала соответствуют положительные значения коэффициента усиления, ослаблению - отрицательные. Результирующий уровень сигнала и громкость получаются простым сложением текущего уровня и громкости с коэффициентом усиления.

Применение коэффициента усиления, назначенного элементу расписания или иному элементу системы Digispot, происходит автоматически при воспроизведении или другом использовании звука элемента.

Операция расчета коэффициента усиления по требуемому результирующему уровню звука или его громкости называется нормализация звука.

Нормализация звука

Нормализацией называется операция, рассчитывающая коэффициент усиления для элемента так, чтобы в результате его громкость или пиковый уровень достиг желаемого значения. Коэффициент усиления рассчитывается как разница между желаемым и текущим уровнями.

  • Нормализация по пиковому уровню обычно необходима для соблюдения технического регламента и недопущения превышения определенного уровня для избегания искажения сигнала на выходном оборудовании или ПО радиостанции.
  • Нормализация по громкости служит для обеспечения сбалансированного звучания радиостанции, избегания резкого перепада громкости восприятия соседних элементов, а также для соблюдения требования законодательств в сфере радиовещания, например ФЗ 338.
    При нормализации по громкости нельзя допустить превышения пикового уровня, установленного регламентом или предельно допустимого уровня 0 dBFS, т.к. это может привести к искажению сигнала. Поэтому при нормализации по громкости, в случае усиления сигнала, коэффициент усиления может ограничивается из за пикового уровня и желаемый уровень громкости не будет достигнут.

Для нормализации необходимо знать текущий уровень и громкость нормализуемого элемента. Если они не известны, то при выполнении операции запускается процесс расчета громкости и уровня, в противном случае нормализация происходит мгновенно.

В системе Digispot существует специальное окно, для настройки параметров нормализации - Окно выбора параметров нормализации.

На выполнение нормализации в системе Digispot влияют Общие настройки\Доп\Базовые установки\Автоматически нормализовать аудио.

Автоматическая нормализация может выполняться при ручном или автоматическом добавлении материала в МБД и в других случаях.
Кроме этого, в некоторых случаях происходит автоматическое определение громкости и уровня, которые могут использоваться при последующей нормализации.

В более ранних версиях системы Digispot присутствовала только пиковая нормализация, начиная с 2.16.2.10 в системе есть нормализация по громкости.

Автоматическая нормализация звука

Автоматическая нормализация звука позволяет гарантировать, что звук, поступивший в систему "извне" будет приведен к требуемому уровню и громкости.
Автоматическая нормализация происходит в двух направлениях

  • Входная нормализация: когда материал поступает внутрь системы Digispot.
    Параметры определяются узлом общих настроек Базовые установки\Автоматически нормализовать аудио\Нормализовывать входящие звуковые данные
    Входная нормализация выполняется в следующих случаях
    • Вставка/бросок из модуля файлы в любой другой модуль системы
    • Вставка/замена аудио из буфера обмена Windows
    • Импорт файла в МБД приложением DB_Import
    • При явном назначении файла на закладке Файл окна свойств элемента.
    • При назначении файла элементу МБД перетаскиванием (по умолчанию - с прижатым Ctrl).
  • когда материал покидает систему Digispot
    Параметры определяются узлом общих настроек Базовые установки\Автоматически нормализовать аудио\Параметры нормализации исходящего материала
    • При публикации элемента МБД или расписания по умолчанию используются параметры выходной нормализации.

Кроме этого, существует возможность нормализовать элемент в процессе импорта к уровню, явно заданному в импортируемом файле и отличающемуся от указанных в общих настройках. Подробнее об этом:Установка_усиления_и_нормализация_при_импорте_в_расписание.

Материал, произведенный внутри системы, например, записанный в Трек 2 и сохраненный в МБД, автоматической нормализации не подвергается, т.к. предполагается, что необходимый уровень установлен средствами Трек2.
Также не происходит нормализации при перетаскивании/копировании-вставке материала внутри системы между различными модулями Папки/Расписание/МБД и пр.

При внесении материалов извне и автоматической нормализации нужно учитывать специфику добавляемого в систему материала, например, для подложек и других элементов оформления эфира автоматическая нормализация может установить неправильный уровень.

Ссылки

Add picture from clipboard (Maximum size: 742 MB)