Обзоры

Звуковой динамический процессор или телевизионный процессор громкости?

В этой статье речь вновь пойдет об уже ставшей притчей во языцех проблеме громкой рекламы на телевидении.

  • 10 сентября 2012
  • 2264

Проблема громкой рекламы

Кратко говоря, она заключается в том, что реклама субъективно ощущается более громкой, нежели передача или фильм, то есть отличается уровень воспринимаемой слухом громкости между различными программами одной станции (или следующими друг за другом фрагментами одной программы). Однако, в общем, различается также громкость различных станций – одна звучит громче, другая тише. Чтобы понять, как бороться с этой проблемой, сначала надо определить ее причину. Этому будет посвящен следующий раздел данной статьи, после чего приводится описание возможных решений и дается информация о существующих сегодня устройствах, в которых эти решения реализованы технически.

Немного теории – почему реклама звучит так громко?

Все мы неоднократно становились невольными участниками ситуации, когда рекламный ролик, внезапно прерывающий просмотр фильма, словно взрыв, бьет по ушам, заставляя судорожно хвататься за ручку громкости или пульт ДУ и уменьшать громкость звука. Аналогично по окончании рекламного блока приходится увеличивать громкость, чтобы вернуться к комфортному уровню прослушивания фильма или передачи. Эта животрепещущая тема муссируется далеко не первый год, телезрители упорно пишут жалобы и выражают недовольство. В настоящее время разговоры об этой проблеме заходят все чаще, и даже определенные действия предпринимаются, но и сегодня проблема громкости остается весьма актуальной. С чем же это связано?

Чтобы ответить на этот вопрос, необходимо обратиться к теории – аудиотехнике и психоакустике, а именно, ответить на вопросы о том, как громкость звука связана с электрическим уровнем звукового сигнала и как человеческий слух воспринимает звуковые сигналы. В этой статье не делается попытка забраться в дебри сухой теории с приведением формул и расчетов, но автор старается изложить в максимально простой и лаконичной форме саму суть. Итак, первое и самое главное различие между рекламным роликом и, например, трансляцией в прямом эфире футбольного матча заключается в существенном расхождении динамических диапазонов этих фрагментов звукового сигнала. Не вдаваясь в технические тонкости измерения параметров,динамический диапазон можно определить как отношение максимальной мощности звукового сигнала к минимальной. Для иллюстрации приведен рис. 1, где сведены три сигналограммы различных звуковых сигналов и графически, в условной форме, показаны величины их динамических диапазонов.

 

Рис. 1. Динамические диапазоны трех различных по плотности фрагментов

Слева расположен сигнал, имеющий наибольшие по величине выбросы (пиковые значения) относительно среднего уровня сигнала, справа – наименьшие. Таким образом, сигнал справа имеет наименьший динамический диапазон, слева – наибольший. Также из рисунка видно, что сигнал справа имеет наибольшую компрессию из трех. Это связано с еще одним важным параметром – пик-фактором сигнала, который определяется как отношение максимального уровня звукового сигнала к его среднеквадратическому значению. Таким образом, у звукового сигнала (сигнал слева), имеющего резкие выбросы (пики), значение пик-фактора будет больше, чем у сигнала с более ровной сигналограммой без значительных по величине выбросов (сигнал справа). Выражается динамический диапазон в децибелах относительно порога слышимости, суть которого поясняется на рис. 2

 

Рис. 2. Область слышимости слуховой системы человека

На рисунке изображена область слышимости слуховой системы человека – зависимость уровней громкости от частоты. Порог слышимости определяется как минимальное звуковое давление, при котором звук данной частоты воспринимается слуховой системой (начинает быть различимым). Порог слышимости представлен нижней со штриховой линией. Как видно, на разных частотах порог u1089 слышимости имеет разные значения. Тем не менее, за нулевой уровень принято считать звуковое давление 2х10−5 Па на частоте 1 кГц. Вообще говоря, порог слышимости субъективен, он зависит от индивидуальных свойств, возраста, физиологического состояния и т.д. Поэтому для проведения подобного рода субъективных измерений приглашаются молодые люди с хорошим слухом (без нарушений). Порог болевого ощущения (или самая верхняя линия на рисунке) определяется как величина звукового давления, при котором в слуховом органе возникает боль. Болевое ощущение определяет границу динамического диапазона слышимости человека, который в среднем составляет 140 дБ для тонального сигнала и 120 дБ для шумов со сплошным спектром. Для примера, динамический диапазон исполнения на гитаре составляет около 25 дБ, в случае рояля – 45…50 дБ, а динамический диапазон симфонического оркестра доходит до 80 дБ и больше. В рекламных роликах динамический диапазон за счет динамической компрессии может быть «втиснут» в 5…10 дБ с величиной пик-фактора в единицы дБ! Когда идет телетрансляция футбольного матча, то большую часть времени (в спокойные моменты игры) динамический диапазон достаточно велик – шум стадиона и болельщиков в среднем невысоки, и речь диктора на этом фоне имеет довольно большой пик-фактор. Картина резко меняется, когда стадион вместе с диктором взрывается криком «ГОООООЛ!» – или когда трансляция прерывается рекламой. Эта ситуация иллюстрируется с помощью рис. 3).

 

Рис. 3. Исходный сигнал без обработки. Прямая трансляция прерывается рекламным блоком (выделен красным)

На рисунке разными цветами показаны два разных фрагмента программы. Зеленым цветом отображены фрагменты «спокойной» части трансляции футбольного матча, красным – прерывающий ее рекламный блок (или бурная реакция на гол, забитый в ворота соперника – кому как больше нравится). На рисунке видно, что выделенный красным фрагмент обладает ощутимо u1084 меньшим по величине динамическим диапазоном и
пик-фактором, чем звуковой сигнал, обозначенный зеленым цветом – у него минимальные уровни звука незначительно отличаются от максимальных, а пиковые выбросы невелики относительно среднего уровня.
В связи с этим следует отметить немаловажный момент – существующий сегодня регламент относительно громкости звукового сопровождения телевизионных программ предписывает максимально допустимую
величину пикового значения сигнала (с настройкой по синусоидальному тону, обычно с частотой 1 кГц), и совершенно не учитывает величину динамического диапазона сигнала. Другими словами, если с одной стороны взять рекламный ролик с динамическим диапазоном 7 дБ и очень «плотной» сигналограммой, а с другой – фрагмент прямой трансляции футбольного матча, обладающий большим динамическим диапазоном, и, как предписывает регламент, нормализовать эти звуковые отрезки по максимальному пиковому уровню, то ролик будет восприниматься как значительно более громкий. Такую ситуацию мы и наблюдаем на рисунке – с точки зрения соответствия регламенту все корректно, а фактически, на слух, это приведет к ощутимому дискомфорту из-за различия в воспринимаемой громкости обозначенных звуковых фрагментов. Таким образом, следует отметить, что при нормализации по максимальному пиковому уровню сигналов с сильно разнящимися величинами динамических диапазонов тот сигнал, у которого динамический диапазон меньше, будет восприниматься субъективно как более громкий. Еще одна важная особенность, влияющая на восприятие громкости – спектральный состав звукового сигнала (или спектральная плотность мощности). Для иллюстрации приведен рис. 4.

 

Рис. 4. Спектральный состав: слева – речь, справа – современная электронная музыка

На рисунке представлены спектры речи (слева) и современной электронной музыки (справа). Для наглядности выбрана линейная шкала частот. Не углубляясь в детали процесса восприятия звука слуховой системой, можно привести в качестве наглядного примера различие в воспринимаемой громкости равны по амплитуде сигналов: одночастотного синусоидального тона и богатого по спектру звукового сигнала.

Касаемо связи громкости и спектрального состава сигнала, следует также отметить, что слух воспринимает звук нелинейно. Не утомляя читателя подробностями о психоакустических свойствах слуха, можно сказать, что слуховой аппарат человека не способен линейно ощущать воздействия звуков в значительном диапазоне интенсивностей. Эта особенность слуха проявляется в том, что при воздействии громких тонов с уровнем интенсивности более 40 дБ в слуховом аппарате образуются гармоники – 2-я, 3-я и т.д. При уровне интенсивности звука менее 40 дБ субъективные гармоники не образуются. И последний элемент теории из области психоакустики, без упоминания которого не обойтись – так называемые «изофоны», или кривые равной громкости, приведенные на рис. 5.

 

Рис. 5. Кривые равной громкости («изофоны»)

Изофоны отображают зависимость уровня звукового давления от частоты при заданном уровне громкости, измеренные на одночастотных синусоидальных сигналах. Таким образом, разрешающая способность слуха по ощущению изменений интенсивности звука имеет сильную частотную зависимость – она высока на средних частотах, заметно меньше на высоких и еще меньше на низких частотах. Кроме того, при больших уровнях громкости изофоны выравниваются, подъемна низких частотах становится менее крутым, происходит более быстрое нарастание громкости звуков низкой частоты, чем средне- и высокочастотных. Таким образом, при больших уровнях звуки низкой, средней и высокой частоты оцениваются по уровню громкости более равномерно. В англоязычной литературе встречается упоминание семейства кривых Флэтчера и Мансона, а также Робенсона и Дэдсона. По сути, все эти семейства кривых отражают одни и те же зависимости, хотя и имеют существенные различия, особенно в области низких частот. В данной статье приводится семейство кривых в соответствии с ISO 226 в редакции 2003 года. В рамках рассматриваемого здесь вопроса различия в форме кривых разных семейств несущественны.

 

Автор: Александр Сироткин

Источник: http://mediavision-mag.ru/



Комментарии

Напишите комментарий первым!


Необходимо исправить следующие ошибки:


    Смотрите также