Сайт о телевидении

Сайт о телевидении

» » Динамический звук в разрушаемых уровнях Rainbow Six: Siege. Часто задаваемые вопросы по динамической обработке аудио сигнала

Динамический звук в разрушаемых уровнях Rainbow Six: Siege. Часто задаваемые вопросы по динамической обработке аудио сигнала

Слушая музыку, очень часто можно столкнуться с засилием «басов» в записанной фонограмме. Такое положение сложилось в ходе эволюционного развития , когда стремились расширить спектр музыкального произведения как в сторону высоких частот, так и в сторону низких.

Для воспроизведения низкочастотных составляющих спектра звуковых частот нередко используются специальные громкоговорители сабвуферы. Жителям многоквартирных домов порой не дают покоя ритмичные удары, приходящие по стенам и перекрытиям: это «работают барабаны» ударных музыкальных инструментов.

Мы воспринимаем звуки благодаря органам слуха (ушам), а в области низких частот еще и всем телом (за счет так называемой «костной проводимости»). С возрастом диапазон воспринимаемых верхних частот сужается, а в области низких наблюдается подъем, поскольку кости становятся более потными и лучше проводят НЧ-колебания. В результате, пожилой чеповек воспринимает звукочастотный спектр музыкального произведения совсем по-другому, чем молодежь. «Барабаны» начинают раздражать.

Что же делать? Как снова сделать музыку нормальной и «душевной». Для этого можно использовать усилитель со специальной приставкой экспандером (расширителем динамического диапазона), которая, не умаляя значения низких частот в фонограмме, позволяет поднять уровень средних и высоких.

В отличие от темброблока, подъем уровня этих частот происходит в динамическом режиме: чем громче звук, тем больше усиление УМЗЧ. На качество звука несомненно влияет динамический диапазон тракта звукопередачи (отношение наибольшей звуковой мощности к наименьшей). Заявляемый для наиболее распространенных сейчас носителей (CD, DVD и пр.) динамический диапазон звука 96 дБ не совсем такой.

То есть, если рассматривать отношение самого громкого сигнала к уровню шумов в паузе цифра, безусловно, правильная. Однако это справедливо только для сигналов максимальной амплитуды.
Реальные же звуковые сигналы имеют довольно большой пик-фактор, так что от 96 дБ необходимо отнять примерно 15.. .20 дБ. Вот уже осталось менее 80 дБ. Затем необходимо учесть, что в цифровых трактах качество сигналов сильно ухудшается при уменьшении их амплитуды.

И сигнал с уровнем -60 дБ передается всего лишь 6 разрядами цифрового кода, а при этом говорить о сколько-нибудь приличном звучании уже не приходится. Таким образом, динамический диапазон CD реально составляет величину, существенно меньшую, чем 96 дБ. А динамический диапазон реальных сигналов может быть гораздо больше. Например, для симфонического оркестра он может доходить до 120 дБ.

И как его «впихнуть» в ограниченный диапазон тракта? Таким образом, при передаче или во время записи сжатие динамического диапазона необходимо. Оно производится автоматически с помощью специального устройства компрессора или вручную оператором-тонмейстером. Восстановление естественного динамического диапазона на воспроизводящей стороне можно осуществить, если взять устройство с характеристикой, обратной компрессору.Такое устройство называется «экспандером».

Для безыскаженной работы экспандера необходимо, чтобы расширение динамического диапазона осуществлялось по закону, обратному компрессированию. Сохранить эту закономерность трудно, если учесть, что компрессирование часто осуществляется вручную. Из-за этого экспандеры широкого применения не нашли.

Тем не менее, они позволяют расширить динамический диапазон усилителя на 10… 14 дБ при малом уровне искажений, особенно если выбрать кривую регулировки с учетом оптимального слухового восприятия. Такие экспандеры даже при ручном компрессировании заметно улучшают качество воспроизведения.

Структурная схема расширителя динамического диапазона (экспандер)

Принцип действия экспандера поясняет структурная схема на рис.1. Между первым (У 1) и вторым (У2) каскадами усилителя включается делитель, состоящий из постоянного резистора Rc и регулируемого Ri, функции которого выполняет лампа или транзистор (сопротивлением конденсатора Ск на средних и высоких частотах можно пренебречь).

При таком включении делителя коэффициент усиления усилителя зависит от сопротивления Ri, определяющего коэффициент передачи напряжения с первого каскада на второй. Изменение сопротивления Ri осуществляется схемой управления. Сигнал с выхода У1 через дифференцирующую цепочку ДЦ поступает на регулятор ширины динамического диапазона Rд, с него на каскад усиления УЗ экспандера.

Дифференцирующая цепочка предотвращает срабатывание экспандера при пиках напряжения в области басов, обладающих ярко выраженным ударным характером (барабан, контрабас и т.д.). С выхода УЗ сигнал подается на детектор Д, выделяющий постоянное управляющее напряжение, которое через интегрирующую цепочку ИЦ подается на управляющий элемент Ri.

Когда напряжение звуковой частоты на входе усилителя УЗ незначительно, управляющее напряжение близко к нулю, сопротивление Ri мало, и на вход второго каскада У2 сигнал практически не поступает, так как коэффициент передачи делителя Rc-Ri совсем мал. По мере возрастания входного сигнала управляющее напряжение и сопротивление Ri увеличиваются, что приводит к увеличению коэффициента передачи делителя Rc-Ri и коэффициента усиления усилителя.

При максимальных уровнях входных сигналов Ri=max, и коэффициент усиления усилителя достигает предельного значения, что соответствует максимальному расширению динамического диапазона. Регулятор громкости РГ часто устанавливается перед вторым каскадом усиления, чтобы регулирование громкости не вызывало изменения заданного динамического диапазона.

Конденсатор Ск обеспечивает тон- коррекцию в области низких частот при малых уровнях низкочастотного сигнала. Его действие аналогично действию конденсаторов в тон-компенсированных регуляторах громкости, поэтому частотная характеристика экспандера в области низких частот совпадает с кривой чувствительности уха.

АЧХ расширителя динамического диапазона (экспандер)

Постоянная времени нарастания управляющего напряжения на выходе интегрирующей цепочки составляет 0,2…0,3 с, времени спада - 0,5…0.6. Амплитудно-частотные характеристики экспандера, показывающие расширение динамического диапазона, приведены на рис.2.

На низких частотах имеется подъем частотной характеристики, соответствующий особенностям звукового восприятия. Естественно, при возрастании громкости в процессе расширения динамического диапазона уровень уже поднятых басов не должен подниматься в такой же мере, как уровень средних и высоких частот.

Физиологически правильное расширение динамического диапазона с увеличением частоты достигается за счет конденсатора Ск, емкостное сопротивление которого на низких частотах велико. Благодаря тому, что величина максимального расширения динамического диапазона зависит от частоты и быстро уменьшается на частотах ниже 300 Гц, при сравнительно небольшом запасе выходной мощности усилителя получается расширение динамического диапазона порядка 10…12 дБ.

Усилитель с экспандером, описанный я опробовал в нескольких конструкциях (в стереоварианте, в единой конструкции с приемником и пр.). В процессе экспериментов «родился» модернизированный вариант лампового УМЗЧ с экспандером (рис.3). Изменения схемы усилителя коснулись темброблока, оконечного каскада и цепей питания.

Параметры усилителя по отношению к изменились в лучшую сторону, хотя коэффициент усиления УМЗЧ незначительно снизился за счет ультралинейного включения ламп в оконечном каскаде и темброблока, работающего в цепи усиления сигнала. Частотный диапазон УМЗЧ расширен и составляет 20…20000 Гц с неравномерностью около 1,5…2 дБ. Глубина регулировки тембра в области НЧ и ВЧ ±20 дБ.

Лампы оконечного каскада следует выбирать из одной партии. Если есть возможность, лучше отобрать идентичные по параметрам экземпляры, используя измеритель параметров радиоламп. Выходной трансформатор должен быть с симметричными секциями первичной обмотки. Они наматываются на узких каркасах (каждая), которые затем одеваются на сердечник. Вторичные обмотки аналогично.

Можно применить и готовый трансформатор, например, от магнитофона «Дмпро-И» или другой ламповой техники, имеющей двухтактный выходной каскад, построенный по ультралинейной схеме. Такой трансформатор обеспечит удовлетворительное качество звучания, хотя и с немного повышенным коэффициентом искажений из-за неполной симметрии выходного каскада.

Вторичную обмотку обратной связи с большим количеством витков (в трансформаторе от магнитофона «Днтро-1Г) можно использовать, например, для работы с трансляционной линией. Выходные каскады на триодах имеют низкое выходное сопротивление (импеданс), что упрощает выходные трансформаторы и способствует хорошему демпфированию акустических систем.

Это влечет за собой увеличение межвитковой емкости в них и. как следствие, завал частотной характеристики в области высоких частот. Из-за большой разницы в количествах витков эффект демпфирования нагрузки в таких усилителях ослаблен. Попытка соединить положительные качества УМЗЧ с выходом на триодах и пентодах привела к ультралинейной схеме включения ламп.

Действительно, если соединить экранные сетки ламп VL4 и VL5 с их анодами, получим триоды, а с источником анодного питания пентоды. Подключая экранные сетки к части витков первичной обмотки выходного трансформатора Т2, получаем компромиссный вариант со всеми вытекающими последствиями.

Сигналы от различных источников (микрофона, телевизора, радиоприемника или трансляционной линии) выбираются переключателем SA1 и через разделительный конденсатор С1 поступают в цепь управляющей сетки левого (по схеме) триода лампы VL1. Резисторы R1 и R2 служат делителем напряжения, поступающего из трансляционной линии, R3 уменьшает щелчки при коммутации SA1, R4 обеспечивает утечку для управляющей сетки триода.

Резистор R8 определяет режим триода по постоянному току и одновременно является звеном отрицательной обратной связи по току 34, что уменьшает шумы и искажения каскада. Резисторы R5, R6 и R9 в анодной цепи левого триода лампы VL1 служат для согласования входов экспандера и последующего каскада. Конденсаторы С2 и С6 разделительные по постоянному току.

Конденсатор С12 и резистор R22 осуществпяют частотную коррекцию сигнала, необходимую для нормальной работы экспандера. Для уменьшения шорохов, тресков и наводок регулятор громкости перенесен со входа усилителя на вход его второго каскада: перемещением движка потенциометра R10 производится регулировка громкости.

С движка этого потенциометра сигнал поступает на управляющую сетку второго триода VL1, усиливается им и с анодной нагрузки (R12) через разделительный конденсатор С7 подается на темброблок для коррекции. Резистор R11 обеспечивает автоматическое смещение рабочей точки этого триода, а конденсатор С5 устраняет отрицательную обратную связь по току в области высоких частот.

Переменные резисторы R47 и R50 осуществляют изменение АЧХ в области высоких и низких звуковых частот соответственно. С темброблока скорректированный 34-сигнал поступает на управляющую сетку триода VL2a. Утечка сетки осуществляется через резисторы R48, R50, R51. Резистор R20 обеспечивает отрицательное смещение на управляющей сетке этого триода и отрицательную обратную связь по току 34.

Усиленный этим триодом сигнал с резистора анодной нагрузки R21 через конденсатор С17 подается в цепь управляющей сетки триода VL3. Резистор R30 обеспечивает утечку сетки этого триода. R32 и R33 автоматическое смещение на сетке этого триода, а также обратную связь по току 34 и согласование отрицательной обратной связи с выхода УЗЧ (через R44 со вторичной обмотки выходного трансформатора Т2).

Триод VL26 служит фазовращателем: сигналы на нагрузках R35 и R37 равны и противоположны по фазе для обеспечения поочередной работы ламп оконечного каскада, выполненного по так называемой «пушпульной» (англ. Push-pull) двухтактной схеме на пентодах VL4 и VL5. Противофазные сигналы подаются в цепи управляющих сеток пентодов через разделительные конденсаторы С19 и С20. Конденсаторы С21 и С22 устраняют отрицательную обратную связь по току 34 в оконечном каскаде.

Цепочки R42-C23 и R43-C24 выравнивают сопротивления секций первичной обмотки выходного трансформатора Т2 для токов 34 разных частот (при их отсутствии возможен даже междувитковый пробой в обмотках Т2). Ультралинейная схема включения выходных ламп промежуточная между триодным и пентодным включением. Симметричным перемещением отводов по секциям первичной обмотки можно установить наиболее желаемый режим работы каскада.

Чем ближе отводы к анодам ламп, тем качественней звук, но ниже выходная мощность. При самостоятельном изготовлении выходного трансформатора можно сделать ряд симметричных выводов от первичной обмотки Т2 и при настройке их переключать. Выходной трансформатор выполнен на сердечнике Ш 19×33. Обмотка 1-2 содержит 72 витка провода ПЭЛ 00,69 мм, обмотка 3-4 - 800 витков ПЭЛ 00,15 мм, обмотка 5-6-7 800+600 витков ПЭЛ 00,15 мм. обмотка 7-8-9 - 600+800 витков ПЭЛ 00,15 мм. Дроссель фильтра питания рассчитан на ток 150 мА (сердечник Ш 19×28, содержит 3000 витков ПЭЛ 00,2 мм).

Экспандер работает так. В режиме молчания, при замкнутых контактах SA2, между цепью прохождения сигнала и общим проводом включена последовательная цепочка C4-VL7. Эпектронно-оптический индикатор VL7 (лампа 6Е1П) выступает здесь в роли переменного резистора, управляемого амплитудой напряжения усиливаемого сигнала. Характеристика экспандера частотнозависимая.

В области высоких и средних звуковых частот увеличение громкости звука приводит к увеличению динамического сопротивления лампы VL7, что вызывает увеличение уровня усиливаемого сигнала, т.е. чем громче сигнал, тем больше коэффициент усиления УЗЧ. Максимальное расширение составляет 10… 14 дБ (VL7 практически закрыта).

На низких частотах экспандер фактически не работает за счет выбора параметров корректирующей цепочки C12-R22, которая пропускает на управляющую сетку левого (по схеме) триода VL6 только ВЧ и частично СЧ-составляющие (через С12), нижние частоты ослаблены большим сопротивлением R22.
Переменным резистором R46 регулируется глубина расширения динамического диапазона.

Конденсатор С13 разделительный, сравнительно небольшой емкости, чтобы снизить уровень НЧ-составляющих. Катод лампы соединен напрямую с общим проводом, и смещение рабочей точки осуществляется только за счет тока сетки. Правый триод VL6 работает как диод, осуществляя выпрямление переменного напряжения 34.

Следом идет интегрирующая цепочка для сглаживания пульсаций выпрямленного напряжения и обеспечения управления лампой VL7 с соответствующей динамикой. Резистором R29 производится начальная установка режима индикации лампы VL7 «узкий» светящийся сектор без сигнала и нижнем по схеме положении движка R46.

Питание усилителя от сети переменного тока осуществляется через трансформатор Т1 (от старых радиол I класса). Напряжения указаны на схеме, допустимо их отличие до ±10%. Поточнее лишь следует подобрать напряжение накала (6,3 В), особенно при самостоятельной намотке силового трансформатора. Лампа предварительных каскадов VL1 питается от отдельной обмотки накала, между проводами которой включен подстроечный балансировочный резистор R52.

В полностью собранном усилителе с подключенной акустической системой и отключенном экспандере устанавливают максимальную громкость, регуляторы тембра в положение максимальной полосы (подъем низких и высоких частот). Вращением движка R52 на выходе устанавливается минимальный уровень фона переменного тока и шумов.

Накал к другим лампам подводится скрученными между собой проводами (от другой обмотки 6,3 В). Соединение одного из проводов накала с общим проводом осуществляется непосредственно у одной из ламп (экспериментально, по минимуму фона). УЗЧ выполнен на таком же шасси, как в оригинале , с той же расстановкой ламп.Он позволяет почувствовать всю прелесть «мягкого лампового» звука.

Очень приятно звучат женские соло и дуэты, классическая музыка, эстрадные песни. Следует учитывать, что расширение динамического диапазона на 10 дБ означает увеличение мощности в 10 раз. Данный усилитель имеет выходную мощность порядка 12 Вт, поэтому не стоит пытаться «выдавить» из УЗЧ больше, чем он может дать. Кроме роста искажений, ничего «путного» не получится.

Внимание! Радиолюбителям, привыкшим к низковольтным транзисторным устройствам, следует быть особо осторожными при наладке этого усилителя, поскольку его цепи высоковольтные. Перепайку деталей можно осуществлять только при отключенном напряжении питания и спустя 20…30 с, чтобы успели разрядиться электролитические конденсаторы.

Что такое динамический диапазон?

Динамический диапазон можно определить как расстояние между уровнями самого тихого и самого громкого сигналов из возможных. К примеру, если в инструкции к процессору указано, что максимальный входной уровень сигнала до искажения равен +24 дБ, а шумовой порог на выходе равен -92 дБ, значит суммарный динамический диапазон процессора равен 24 + 92 = 116 дБ.

Динамический диапазон оркестра в среднем находится в пределах от -50 дБ до +10 дБ. Что в сумме даёт 60 дБ. Хотя вам может показаться, что динамический диапазон в 60 дБ - это мало, проведя простые расчёты, оказывается, что +10 дБ - это в 1000 раз громче, чем -50 дБ!

Динамический диапазон в рок музыке намного меньше, обычно от -10 dдБ до +10 Дб, или 20 дБ в сумме. Поэтому смешивание разных сигналов в рок музыке в единый микс довольно занудное занятие.

Для чего нам компрессия?

Допустим, вы работаете над сведением роковой записи, средний динамический диапазон у нее 20 дБ. И вы хотите добавить в микс необработанный компрессором вокал. Средний динамический диапазон у вокала равен примерно 40 дБ. Чем это чревато для микса? Слишком тихие вокальные куски будут просто не слышны, а слишком громкие будут выпирать из общей картины. В данной ситуации компрессор необходим для уменьшения (компрессии) динамического диапазона вокала в пределах 10 дБ.

В данном случае вокал будет находиться примерно на уровне +5 дБ. Диапазон - от 0 дБ до +10 дБ. Тихие фразы теперь будут выше самого низкого уровня сигнала в миксе, а громкие фразы не будут выпирать. Получается, что вокал занимает своё место в миксе.

Тот же самый принцип работает для любого инструмента в миксе. У каждого инструмента есть свое место в миксе, а хороший компрессор помогает звукорежиссеру правильно их смешать.

Разве компрессор нужен для всего?

Обычно в ответ на этот вопрос вы слышите: "Конечно же, нет! Перекомпрессированные треки звучат ужасно.” Это утверждение верно лишь в одном случае - если вы отчетливо слышите как работает компрессор на записи. Качественный дорогой компрессор, будучи правильно настроенным, звучит незаметно! Перекомпрессированный звук - это следствие ошибок в обработке конкретных инструментов, если конечно это не сделано умышленно с целью получить спецэффект.

Как вы думаете, зачем на всех дорогих микшерных пультах на каждом канале есть свой компрессор? Ответ прост - большинство инструментов нуждается в компрессии, пусть даже едва заметной. Это помогает им быть слышимыми в миксе.

Зачем нам нойз-гейты?

Давайте рассмотрим пример с вокалом. Допустим, вы установили для него диапазон в 20 дБ. Проблемы начинаются, когда компрессор усиливает самые тихие сигналы в вокальном треке. Всплывают всякие нежелательные шумы на заднем плане, куски фонограммы, попавшей в микрофон из наушников и т.п. Вы можете попробовать просто убрать громкость в паузах, но это обычно заканчивается полным провалом. Намного лучший способ - использовать нойз-гейт. Мы можем установить порог срабатывания нойз-гейта, к примеру, на -10 дБ, что соответствует нижней границе динамического диапазона вокала в нашем случае. Таким образом гейт будет автоматически убирать в ноль все нежелательные сигналы между фразами.

Если вы когда-либо пробовали сводить живую запись, вы знаете сколько проблем возникает с ударной установкой, а именно с железом, которое проникает в микрофоны, установленные на томах. Как только вы добавляете верхов на эквалайзере, чтобы сделать томы более яркими, начинают лезть наверх тарелки. И это особенно хорошо слышно через ВЧ громкоговорители в мониторах. Если же мы используем гейты на микрофонах, записывающих томы, так что железо больше не будет звучать через них в паузах, мы очень сильно прочистим общий микс и сделаем его в разы разборчивее.

Типы динамической обработки

Динамическая обработка - это процесс изменения динамического диапазона сигнала, позволяющий расширить возможности оборудования, через которое записывается или воспроизводится этот сигнал. Иными словами, мы получаем возможность записывать или проигрывать записанный сигнал без искажений и/или шума, тем самым упрощая себе задачу сведения.

Компрессор и лимитер

Пробивной, хорошо слышимый, с хорошим презенсом - это все описания звуковых сигналов, полученных при помощи их обработки компрессорами и лимитерами.

Компрессия и лимитирование - это формы управления динамическим диапазоном (громкостью) сигнала. Аудио сигналы имеют довольно большой разброс по уровням громкости. Пиковый сигнал может вызвать перегрузку в звукозаписывающей цепи, что в свою очередь вызовет искажение сигнала.

Компрессор/лимитер - это своего рода усилитель, в котором уровень громкости зависит от уровня проходящего через него аудиосигнала. Выбрав определённое значение компрессора/лимитера, сигнал будет автоматически ослабляться выше заданного уровня или порогового уровня.

В сущности, компрессия - это процесс ослабления входного сигнала в заданной пропорции. Используется для сужения динамического диапазона голоса или музыкального инструмента, позволяет производить запись без искажений. Также применяется при создании микса, уменьшая разницу частот каждой дорожки.

Вокалист, допустим, постоянно перемещается перед микрофоном и сигнал на выходе колеблется вверх-вниз, что звучит странно. В данном случае компрессор решит проблему, ослабив громкость отдельных фраз так, что в результате будет ровный вокал.

Степень ослабления сигнала зависит от соотношения компрессии и порогового уровня. Соотношение 2:1 или меньше считается слабой компрессией, при которой сигнал на выходе, превышающий пороговый уровень, уменьшается в два раза. Соотношения выше 10:1 можно называть сильным лимитированием.

Чем ниже пороговый уровень, тем большая часть сигнала подвергается компрессии (при определённом уровне входного сигнала). Важно знать меру, так как слишком сильная компрессия убивает динамику записи (при этом некоторые звукорежиссёры убивают её специально в качестве эффекта)!

Лимитирование - вид обработки сигнала, при котором подавляются всплески громкости (скачки амплитуды).

Компрессор/лимитер используется при выполнении многих задач при обработке звука, например:

Звук бочки ударной установки может затеряться среди электрогитар. И не важно, как громко звучит дорожка, бочка звучит “грязно”. Компрессия выправит звук бочки на фоне гитар.

Диапазон голоса на записи достаточно широк. Пики громкости могут сильно выпирать из общего звучания. Таких пиков может быть много, и они все разные, так что почти невозможно их выровнять через микшер. Компрессор/лимитер автоматически контролирует громкость, не искажая тонкостей вокала.

Соло гитара глушится ритмом. Не выкручивайте фейдер до предела, компрессия поставит ведущую гитару на своё место в миксе.

Бас-гитару сложно записывать. Ровный звук с хорошей атакой достигается за счёт правильной компрессии. И не нужно обрезать низы микса - компрессор/лимитер позволит басу проявиться на любых частота

Экспандер

Существует два основных вида экспансии: динамическая и нисходящая. Экспансия расширяет динамический диапазон сигнала, когда он выше порогового значения. Динамическая экспансия - это, по сути, компрессия наоборот.Динамическая экспансия применяется на ТВ и радио, чтобы отменить компрессию непосредственно до передачи аудио сигнала. Компрессию с последующей экспансией называют компандированием.На данный момент чаще всего применяют нисходящую экспансию. В отличие от компрессии, которая понижает сигнал выше порогового значения, экспансия понижает сигнал ниже порога экспансии. Степень понижения определяется соотношением экспансии. Например, соотношение 2:1 понижает сигнал вдвое (это значит, что если сигнал ниже порогового значения на 5дБ, экспандер понизит его до 10дБ).Экспансию часто используют для уменьшения шумов, это очень мощный и простой нойз-гейт. Главное различие между экспандером и нойз-гейтом в том, что экспансия зависит от того, насколько сильно сигнал ушёл “под порог”, тогда как при работе нойз-гейта это не имеет значения.

Шумоподавление

Шумоподавление - процесс устранения нежелательного шума из записи посредством ограничения сигнала ниже заданного порогового значения. Как было написано выше, работа нойз-гейта не зависит от уровня сигнала ниже порога. Выход устройства открыт, пока сигнал находится выше порога.

Длительность открытия выхода определяется скоростью атаки. Длительность работы устройства, когда сигнал ниже порогового называется временем удержания. Скорость закрывания выхода определяется временем возврата. Уровень подавления нежелательного сигнала в закрытом положении определяется диапазоном.

Краткий словарь терминов

Научно доказано, что если вы хотите быстро изучить какой-то предмет, вы должны для начала разобраться с основными понятиями. Тот же принцип действует и в звукозаписи и в дальнейшей работе со звуком. Большинство инструкций и учебников предполагают наличие базовых знаний, без которых читать их затруднительно. Надеюсь, что следующий раздел поможет вам навести порядок в голове и окончательно разобраться с основами.

Компрессоры

Атака (Attack).

Атака определяет скорость действия компрессора на входной сигнал. Долгая атака (регулятор по часовой стрелке до упора) вначале позволяет сигналу (т.н. начальный переходный процесс) проходить необработанным через компрессор, тогда как короткая атака (против часовой стрелки до упора) сразу же обрабатывает сигнал согласно соотношению компрессии и установленному пороговому уровню.

Авто (Auto).

Компрессор работает в режиме автоматической атаки и возврата. Регуляторы в этом случае не влияют на процесс, а используются запрограммированные значения параметров.

Боковой канал компрессора (Compressor Sidechain).

Вход бокового канала прерывает сигнал, с помощью которого компрессор определяет необходимой уровень компрессии. При отключенном боковом канале, входной сигнал идёт сразу на главную схему компрессора. При его включении, сигнал на главную схему не поступает. Теперь можно обрабатывать управляющий сигнал эквалайзером, например, применив де-эссинг (частотная коррекция голоса). После обработки управляющий сигнал поступает обратно в компрессор через выход канала. Типичное применение бокового канала - использование компрессора для приглушения фоновой музыки во время выступления ведущего или снижения громкости ритм-гитары на фоне вокала. Теперь голос легко различим. В этом случае голосовая дорожка идёт в боковой канал, в то время как фоновая музыка - на основную схему компрессора. Теперь компрессор понижает уровень фоновой музыки (процесс называется дакинг), когда вокалист начинает петь или говорить.

Жёсткая и мягкая компрессия (Hard/Soft Knee)

При жёсткой компрессии ослабление сигнала происходит максимально быстро в момент превышения пороговой величины. При мягкой, сигнал ослабляется более плавно, после того, как он превысил заданный порог, что обеспечивает более естественное для музыки звучание.

Лимитеры.

Лимитер - это компрессор, не допускающий увеличения сигнала выше уровня порога. Например, если порог установить на 0 дБ, параметр “Ratio” выкрутить полностью по часовой стрелке, то компрессор начнёт работу в режиме лимитера при 0 дБ, и выходной сигнал никогда не превысит этого значения.

Компенсирующее усиление (Makeup Gain).

При компрессии, сжатие сигнала обычно влияет на общий уровень громкости. Регулятор усиления позволяет восстановить утерянный при компрессии уровень.

Соотношение (Ratio).

Соотношение - это зависимость между выходным и входным сигналами, этот параметр устанавливает крутизну компрессии. Например, установив соотношение 2:1, любой сигнал выше порогового подвергнется компрессии в соотношении 2:1. На каждый децибел на входе компрессора приходится 0.5 дБ на выходе, таким образом образуется компрессия, сжимающая сигнал в два раза. При увеличении соотношения, компрессор постепенно переходит в режим работы лимитера.

Время возврата (Release).

Время возврата - это время, которое проходит между тем, как уровень входного сигнала упал ниже порога, и моментом, когда уровень компрессии вернулся на нулевой (компрессор перестал ослаблять сигнал). Короткий возврат создаёт неровный, “рубленый” звук, особенно у бас-гитары. Долгий возврат слишком “пережимает” звук, расплющивая его. Любому значению времени возврата найдётся применение - подбирайте на слух.

Threshold.

Пороговый уровень компрессии (порог компрессии) определяет значение, выше которого начинается ослабление сигнала. Обычно поворот регулятора порога влево увеличивает сигнал, который подвергается компрессии (при соотношении выше, чем 1:1).

Экспандеры

Нисходящая экспансия (Downward Expansion).

Нисходящая экспансия чаще всего применяется в профессиональной звукозаписи. Сигнал ослабляется ниже порогового значения. Это стандартный способ подавления шумов.

Соотношение (Ratio).

Соотношение экспансии определяет уровень ослабления сигнала, когда он опустился ниже порога. К примеру, при соотношении экспансии 2:1 каждый децибел ниже порогового значения ослабляется в два раза. При соотношении 4:1 и выше экспандер работает почти как нойз-гейт, только без возможности регулирования времени атаки, задержки и возврата.

Нойз гейты (Noise Gate)

Атака (Attack).

Параметр "время атаки" устанавливает величину, при которой открывается гейт. Быстрая атака подходит для перкуссивных инструментов, в то время как вокал и бас-гитара требуют плавного открытия. Применение к ним слишком быстрой атаки приведёт к появлению ощутимого “шёлкания” при сведении. Щелчок при открытии присущ любому гейту, но при правильной настройке его не слышно.

Время удержания (Hold).

Время удержания - фиксированный период времени, при котором гейт находится в открытом состоянии при уровне сигнала ниже порогового. Значение этого параметра играет роль при гейтировании, например, малого барабана - после удара по нему проходит определённое время, после которого гейт резко закрывается.

Диапазон (Range).

Диапазон гейта - величина ослабления сигнала, когда гейт закрыт. Таким образом, при значении этого параметра 0 дБ ослабления сигнала вообще не происходит. Значение -60 дБ означает, что при закрытом гейте сигнал будет ослаблен (гейтирован) на 60 дБ и т.д.

Время возврата (Release).

Время возврата гейта определяет скорость, с которой гейт переходит из открытого в полностью закрытое состояние. Время возврата обычно настраивают так, чтобы сохранить естественное затухание звука инструмента или вокала. Высокая скорость возврата убирает шумы, но может вызвать “заикание” ударных инструментов, которое устраняется низкой скоростью возврата. Внимательно настраивайте этот параметр для наиболее естественного эффекта.

Пороговый уровень (Threshold).

Пороговый уровень гейта устанавливает значение, при котором гейт открывается. Принцип прост - любой сигнал выше порогового проходит нетронутым, а сигнал ниже ослабляется на величину, зависящую от настроек диапазона. Если выкрутить регулятор влево до упора - гейт будет отключен (т.е. всегда открыт), и любой сигнал проходит без ослабления.

Ниже приведены пресеты компрессии, используемые в PreSonus BlueMax. Данные пресеты - стандартные установки, своего рода отправные точки для работы со звуком.

Вокал

Тёплый вокал. Это параметры для лёгкой компрессии с низким соотношением и расширенным диапазоном, в основном для лирических песен в живом исполнении. Вокал “на своём месте”.

Кричащий. Параметры для громкого вокала. Довольно жёсткая компрессия для вокалистов, которые не следят за расстоянием до микрофона. Голос сильно выступает из микса, создавая эффект присутствия.

Левый/правый (стерео) оверхэды. Параметры «соотношение» и «порог» здесь низкие, что даёт широкий диапазон, в который помещаются даже тарелки. Глубокие низы, общее звучание живое с невысокой реверберацией. Более пробивной звук, меньше эффекта комнаты.

Акустическая гитара. Пресет подчёркивает атаку акустической гитары и обеспечивает ровность звучания, что позволят гитаре оставаться слышимой.

Клавишные инструменты

Фортепиано. Особый пресет для выравнивания всего диапазона фортепиано - от нижнего звука до пятой октавы. Чётко слышны партии обеих рук.

Оркестр. Настройки подходят как для струнных, так и других оркестровых “наборов” синтезатора. Общий динамический диапазон снижен для удобного добавления в микс.

Контур. Настройки расширяют диапазон основного микса.

Threshold (порог) Ratio (соотношение) Attack (атака) Release (возврат)
-13.4 дБ 1.2:1 0.002 мс 182 мс

Все права в отношении данного документа принадлежат автору. Воспроизведение данного текста или его части допускается только с письменного разрешения автора.

Б иты, герцы... Что скрывается за этими понятиями? При разработке стандарта аудио компакт дисков были приняты значения 44 кГц, 16 бит. Почему именно столько? В чем причина выбора, а также - почему предпринимаются попытки повысить эти значения до, скажем, 96 кГц и 24 или даже до 32х битов...

Разберемся сначала с разрешением сэмплирования - то есть с битностью. Так уж получается, что выбирать приходится между числами 16, 24 и 32. Промежуточные значения были бы, конечно, удобнее в смысле звука, но слишком неприятны для использования в цифровой технике.

За что отвечает этот параметр? В двух словах - за динамический диапазон. Диапазон одновременно воспроизводимых громкостей - от максимальной амплитуды (0 дБ) до той наименьшей, которую позволяет передать разрешение, например - примерно -93 дБ для 16 битного аудио. Как не странно, это сильно связано с уровнем шумов фонограммы. В принципе, для, к примеру, 16 битного аудио вполне возможна передача сигналов мощностью и в -120 дБ, однако эти сигналы будет затруднительно применять на практике из-за такого фундаментального понятия как шум дискретизации . Дело в том, что при взятии цифровых значений мы все время ошибаемся, округляя реальное аналоговое значение до ближайшего возможного цифрового. Самая маленькая возможная ошибка - нулевая, максимально же мы ошибаемся на половину последнего разряда (бита, далее термин младший бит будет сокращаться до МБ). Эта ошибка дает нам так называемый шум дискретизации - случайное несоответствие оцифрованного сигнала оригиналу. Этот шум носит постоянный характер и имеет максимальную амплитуду равную 0.5МБ. Это можно рассматривать как случайные значения, подмешанные в цифровой сигнал. Иногда это называется шум округления или квантования.

Остановимся подробнее на том, что понимается под мощностью сигналов, измеряемой в битах. Самый сильный сигнал в цифровой обработке звука принято принимать за 0 дБ, это соответствует всем битам, поставленным в 1. Если старший бит (далее СБ) обнулить, получившееся цифровое значение будет в два раза меньше, что соответствует потере уровня на 6 дБ. Никакими другими битами кроме СБ нельзя добиться уровня выше -6 дБ. Соответственно - старший бит как бы отвечает за наличие уровня сигнала от -6 до 0 дБ, поэтому СБ - это бит 0 дБ. Предыдущий бит отвечает за уровень -6 дБ, ну а самый младший, таким образом - за уровень (число_бит-1) * 6 дБ. В случае 16 битного звука, МБ соответствует уровень в -90 дБ. Когда мы говорим 0.5МБ, мы имеем в виду не -90/2, а половину шага до следующего бита - то есть еще на 3 дБ ниже, -93 дБ.

Возвращаемся к выбору разрешения оцифровки. Как уже было сказано, оцифровка вносит шум на уровне 0.5МБ, это говорит о том, что запись, оцифрованная в 16 бит, постоянно шумит на -93 дБ. Она может передавать сигналы и тише, но шум все равно остается на уровне -93 дБ. По этому признаку и определяется динамический диапазон цифрового звука - там, где соотношение сигнал/шум переходит в шум/сигнал (шумов больше, чем полезного сигнала), находится граница этого диапазона снизу. Таким образом, главный критерий оцифровки - сколько шума мы можем себе позволить в восстановленном сигнале? Ответ на этот вопрос зависит отчасти от того, сколько шума было в исходной фонограмме. Важный вывод - если мы оцифровываем нечто с уровнем шумов -80 дБ - нет совершенно никаких причин цифровать это в более чем 16 бит, так как, с одной стороны, шумы -93 дБ добавляют очень мало к уже имеющимся огромным (сравнительно) шумам -80 дБ, а с другой стороны - тише чем -80 дБ в самой фонограмме уже начинается шум/сигнал, и оцифровывать и предавать такой сигнал просто не нужно.

Теоретически это единственный критерий выбора разрешения оцифровки. Больше мы не вносим совершенно никаких искажений или неточностей. Практика, как не странно, почти полностью повторяет теорию. Этим и руководствовались те люди, которые выбирали разрешение 16 бит для аудио компакт дисков. Шум -93 дБ - довольно хорошее условие, которое почти точно соответствует условиям нашего восприятия: разница между болевым порогом (140 дБ) и обычным шумовым фоном в городе (30-50 дБ) составляет как раз около сотни дБ, и если учесть, что на уровне громкости, приносящем боль, музыку не слушают - что еще несколько сужает диапазон - получается, что реальные шумы помещения или даже аппаратуры получаются гораздо сильнее шумов дискретизации. Если мы можем расслышать уровень под -90 дБ в цифровой записи - мы услышим и воспримем шумы дискретизации, иначе - мы просто никогда не определим, оцифрованное это аудио или живое. Никакой другой разницы в смысле динамического диапазона просто нет. Но в принципе, человек может осмысленно слышать в диапазоне 120 дБ, и было бы неплохо сохранить весь этот диапазон, с чем 16 бит, казалось бы, не справляются.

Но это только на первый взгляд: с помощью специальной техники, называемой shaped dithering , можно изменить частотный спектр шумов дискретизации, почти полностью вынести их в область более 7-15 кГц. Мы как бы меняем разрешение по частоте (отказываемся от воспроизведения тихих высоких частот) на дополнительный динамический диапазон в оставшемся отрезке частот. В сочетании с особенностями нашего слуха - наша чувствительность к выкидываемой области высоких частот на десятки дБ ниже чем в основной области (2-4 кГц) - это делает возможным относительно бесшумную передачу полезных сигналов дополнительно еще на 10-20 дБ тише, чем -93 дБ - таким образом, динамический диапазон 16 битного звука для человека составляет около 110 дБ. Да и вообще - одновременно человек просто не может слышать звуки на 110 дБ тише чем только что услышанный громкий звук. Ухо, как и глаз, подстраивается под громкость окружающей действительности, поэтому одновременный диапазон нашего слуха составляет и совсем сравнительно мало - около 80 дБ. Поговорим о dithring-е подробнее после обсуждения частотных аспектов.

Для компакт дисков выбрана частота дискретизации 44100 Гц. Бытует мнение, что это означает, что воспроизводятся все частоты до 22.05 кГц, однако это не совсем так. Однозначно можно сказать лишь то, что частот выше 22.05 кГц в оцифрованном сигнале нет. Реальная же картина воспроизведения оцифрованного звука всегда зависит от конкретной техники и всегда не настолько идеальна, как хотелось бы, и как соответствует теории. Все зависит от конкретного ЦАПа.

Разберемся сначала, что нам хотелось бы получить. Человек среднего возраста (скорее молодой) может чувствовать звуки от 10 Гц до 20 кГц, осмысленно слышать - от 30 Гц до 16 кГц. Звуки выше и ниже воспринимаются, но не составляют акустических ощущений. Звуки выше 16 кГц ощущаются как раздражающий неприятный фактор - давление на голову, боль, особо громкие звуки приносят такой резкий дискомфорт, что хочется покинуть помещение. Неприятные ощущения настолько сильны, что на этом основано действие охранных устройств - несколько минут очень громкого звука высокой частоты сведут с ума кого угодно, и воровать что либо в такой обстановке становится решительно невозможно. Звуки ниже 30 - 40 Гц при достаточной амплитуде воспринимаются как вибрация, исходящая от объектов (колонок). Вернее будет даже сказать так - просто вибрация. Человек акустически почти не определяет пространственное положение настолько низких звуков, поэтому в ход уже идут другие органы чувств - осязательные, мы чувствуем такие звуки телом.

Для передачи звука как он есть было бы неплохо сохранить весь хоть как либо воспринимаемый диапазон от 10 Гц до 20 кГц. С низкими частотами в теории в цифровой записи проблем совершенно никаких нет. На практике же - все ЦАПы, работающие по дельта-технологии, имеют потенциальный источник проблем. Таких устройств сейчас 99%, поэтому проблема так или иначе имеет место быть, хотя откровенно плохих устройств почти нет (лишь самые дешевые схемы). Можно считать, что с низким частотами все обстоит благополучно - в конце концов, это лишь вполне решаемая проблема воспроизведения, с которой успешно справляются хорошо сконструированные ЦАПы ценой более $1.
С высокими частотами все немного хуже, по крайней мере точно сложнее . Почти вся суть усовершенствований и усложнений ЦАПов и АЦП направлена как раз на более достоверную передачу высоких частот. Под "высокими" подразумеваются частоты сравнимые с частотой дискретизации - то есть в случае 44.1 кГц это 7-10 кГц и выше. Поясняющий рисунок:

На рисунке изображена частота 14 кГц, оцифрованная с частотой дискретизации 44.1 кГц. Точками обозначены моменты взятия амплитуды сигнала. Видно, что на один период синусоиды приходится около трех точек, и чтобы восстановить исходную частоту в виде синусоиды, надо проявить некоторую фантазию. Саму синусоиду рисовала программа CoolEdit, она и проявляла фантазию - восстанавливала данные. Аналогичный процесс происходит и в ЦАПе, этим занимается восстанавливающий фильтр. И если сравнительно низкие частоты представляют собой почти готовые синусоиды, то форма и, соответственно, качество восстановления высоких частот лежит целиком на совести восстанавливающей системы ЦАПа. В CoolEdit очень хороший восстанавливающий фильтр, но и он не справляется в экстремальном случае - например, частота 21 кГц:

Видно, что форма колебаний (синие линии) далека от правильной, да и свойства появились, которых ранее не было. Это и составляет основную проблему при воспроизведении высоких частот. Проблема, однако, не так страшна, как может показаться. Во всех современных ЦАП используется технология пересэмплирования (multirate), которая заключается в цифровом восстановлении до в несколько раз более высокой частоты дискретизации, и в последующем переводе в аналоговый сигнал на повышенной частоте. Таким образом проблема восстановления высоких частот перекладывается на плечи цифровых фильтров, которые могут быть очень качественными. Настолько качественными, что в случае дорогих устройств проблема полностью снимается - обеспечивается неискаженное воспроизведение частот до 19-20 кГц. Пересэмплирование применяется и в не очень дорогих устройствах, так что в принципе и эту проблему можно считать решенной. Устройства в районе $30 - $60 (звуковые карты) или музыкальные центры до $600, обычно аналогичные по ЦАПу этим звуковым картам, отлично воспроизводят частоты до 10 кГц, сносно - до 14 - 15, и кое-как остальные. Этого вполне достаточно для большинства реальных музыкальных применений, а если кому-то нужно большее качество - он найдет его в профессионального класса устройствах, которые не то чтобы сильно дороже - просто они сделаны с умом.

Вернемся к dithering-у - посмотрим, как можно с пользой увеличить динамический диапазон за пределы 16 бит.

Идея dithering-а заключается в том, чтобы подмешать в сигнал шум . Как не странно это звучит - для того чтобы уменьшить шумы и неприятные эффекты квантования, мы добавляем свой шум. Рассмотрим пример - воспользуемся возможностью CoolEdit-а работать в 32х битах. 32 бита - это в 65 тысяч раз большая точность, нежели 16 бит, поэтому в нашем случае 32х битный звук можно считать аналоговым оригиналом, а перевод его в 16 бит - оцифровкой. Изображение показывает 32х битый звук - музыка, записанная на таком тихом уровне, что самые громкие моменты достигают лишь -110 дБ:

Это с запасом гораздо тише динамического диапазона 16 битного звука (1МБ 16 битного представления равняется единице по шкале справа), поэтому если просто округлить данные до 16 бит - мы получим полную цифровую тишину.

Добавим в сигнал белый шум с уровнем в 1МБ - это -90 дБ (примерно соответствующий по уровню шумам квантования):

Преобразуем в 16 бит (возможны только целые значения - 0, 1, -1, ...):


(Не обращайте внимание на синюю линию, которая принимает и промежуточные значения - это фильтр CoolEdit моделирует реальную амплитуду после восстанавливающего фильтра. Точки же взятия амплитуд расположены только на значениях 0 и 1)

Как видно, какие-то данные остались. Там, где исходный сигнал имел больший уровень, больше значений 1, где меньший - нулей. Чтобы услышать то, что мы получили, усилим сигнал на 14 бит (на 78 дБ). Результат можно скачать и послушать (dithwht.zip , 183 кб).

Мы слышим этот звук с огромными помехами в -90 дБ (до усиления для прослушивания), тогда как полезный сигнал составляет всего -110 дБ. Мы уже имеем передачу звука с уровнем -110 дБ в 16 битах. В принципе, это и есть стандартный способ расширения динамического диапазона, получающийся часто чуть ли не сам собой - шума везде хватает. Однако само по себе это довольно бессмысленно - уровень шумов дискретизации так и остается на прежнем уровне, а передавать сигнал слабее шума - занятие не очень понятное с точки зрения логики...

Более сложный способ - shaped dithering . Идея в том, что раз мы все равно не слышим высоких частот в очень тихих звуках, значит следует основную мощность шума направить в эти частоты, при этом можно даже воспользоваться большим шумом - я воспользуюсь уровнем в 4МБ (это два бита шума). Усиленный результат после фильтрации высоких частот (мы не услышали бы их в нормальной громкости этого звука) - ditshpfl.zip , 1023 кб (к сожалению, звук перестал архивироваться). Это уже вполне хорошая (для запредельно низкой громкости) передача звука, шумы примерно равняются по мощности самому звуку с уровнем -110 дБ! Важное замечание: мы повысили реальные шумы дискретизации с 0.5МБ (-93 дБ) до 4МБ (-84 дБ), понизив слышимые шумы дискретизации с -93 дБ до примерно -110 дБ. Отношение сигнал/шум ухудшилось , но шум ушел в высокочастотную область и перестал быть слышимым, что дало существенное улучшение реального (воспринимаемого человеком) отношения сигнал/шум. Практически это уже уровень шумов дискретизации 20 битного звука. Единственное условие этой технологии - наличие частот для шума. 44.1 кГц звук дает возможность размещать шум в неслышимых на тихой громкости частотах 10-20 кГц. А вот если оцифровывать в 96 кГц - частотная область для шума (неслышимая человеком) будет настолько велика, что при использовании shaped dithering 16 бит реально превращаются и во все 24.

[На заметку: PC Speaker - однобитное устройство, с однако довольно высокой максимальной частотой дискретизации (включения/выключения этого единственного бита). С помощью процесса, сходного по сути с dithering-ом, называемым скорее широтно-импульсная модуляция, на нем игрался довольно качественный цифровой звук - из одного бита и высокой частоты дискретизации вытягивались 5-8 бит низкой частоты, а фильтром высокочастотного шума выступала неспособность аппаратуры воспроизводить столь высокие частоты, как впрочем и наша неспособность их слышать. Легкий высокочастотный свист, однако - слышимая часть этого шума - был слышен.]

Таким образом, shaped dithering позволяет существенно понизить и без того низкие шумы дискретизации 16 битного звука, спокойно расширив таким образом полезный (бесшумный) динамический диапазон на всю область человеческого слуха. Поскольку сейчас уже всегда при переводе из рабочего формата 32 бит в конечный 16 бит для CD используется shaped dithering - наши 16 бит совершенно достаточны для полной передачи звуковой картины.

Единственное что - эта технология действует только на последней стадии - подготовке материала к воспроизведению. Во время обработки качественного звука просто необходимо оставаться в 32х битах, чтобы не применять dithering после каждой операции, более качественно кодируя результаты обратно в 16 бит. Но если уровень шума фонограммы составляет более -60 дБ - можно без малейших зазрений совести вести всю обработку в 16 битах. Промежуточный dithering обеспечит отсутствие искажений округления, а добавленный им шум в сотни раз слабее уже имеющегося и поэтому совершенно безразличен.

Q:
Почему говорят, что 32-х битный звук качественнее 16 битного?
A1: Ошибаются.
A2: [Имеют в виду немного другое: при обработке или записи звука нужно использовать большее разрешение. Этим пользуются всегда . Но в звуке как в готовой продукции разрешение более 16 бит не требуется.]
Q: Имеет ли смысл увеличивать частоту дискретизации (например до 48 кГц или до 96)?
A1: Не имеет. При хоть сколь грамотном подходе в конструировании ЦАП 44 кГц передают весь необходимый частотный диапазон.
A2: [Имеют в виду немного другое: это имеет смысл, но лишь при обработке или записи звука.]
Q: Почему всё же идет внедрение больших частот и битности?
A1: Прогрессу важно двигаться. Куда и зачем - уже не столь важно...
A2: Многие процессы в этом случае происходят легче. Если, например, устройство собирается обработать звук - ему будет легче это сделать в 96 кГц / 32 бита. Почти все DSP используют 32 бита для обработки звука, и возможность забыть про преобразования - облегчение разработки и всё же небольшое увеличение качества. Да и вообще - звук для дальнейшей обработки имеет смысл хранить в большем разрешении, нежели 16 бит. Для hi-end устройств которые лишь воспроизводят звук это абсолютно безразлично.
Q: 32х или 24х или даже 18 битные ЦАП лучше чем 16 битные?
A: В общем случае - нет . Качество преобразования нисколько не зависит от битности. В AC"97 кодеке (современная звуковая карта до $50) используется 18 битный кодек, а в картах за $500, звук которых с этой ерундой даже сравнивать нельзя - 16 битный. Это не имеет абсолютно никакого значения для воспроизведения 16 битного звука .
Стоит также иметь в виду, что большинство ЦАПов обычно реально воспроизводят меньше бит, чем берутся. Например, реальный уровень шумов типичного дешевого кодека составляет -90 дБ, что составляет 15 бит, и даже если он сам 24х битный - вы не получите никакой отдачи от "лишних" 9 бит - результат их работы, даже если он имелся, потонет в их же собственном шуме. Большинство же дешевых устройств просто игнорируют дополнительные биты - они просто реально не идут в расчет в их процессе синтеза звука, хотя и поступают на цифровой вход ЦАПа.
Q: А для записи?
A: Для записи - лучше иметь АЦП большей разрядности. Опять же, большей реальной разрядности. Разрядность ЦАПа должна соответствовать уровню шумов исходной фонограммы, или просто быть достаточной для достижения желаемо низкого уровня шума .
Также удобно бывает иметь разрядность с запасом, чтобы использовать повышенный динамический диапазон для менее точной регулировки уровня записи. Но помните - вы должны всегда попадать в реальный диапазон кодека. В реальности 32х битный АЦП, к примеру, почти полностью бессмысленнен , так как младший десяток бит будут просто непрерывно шуметь - настолько малого шума (под -200 дБ) просто не бывает в аналоговом музыкальном источнике.

Требовать от звука повышенной разрядности или частоты дискретизации, по сравнению с CD, лучшего качества - не стоит. 16 бит / 44 кГц, доведенные до предела с помощью shaped dithering, вполне способны полностью передать интересующую нас информацию, если дело не идет о процессе звукообработки. Не стоит тратить место на лишние данные готового материала, также как не стоит ожидать повышенного качества звука от DVD-Audio с его 96 кГц / 24 бит. При грамотном подходе при создании звука в формате стандартного CD мы будем иметь качество, которое просто не нуждается в дальнейшем улучшении, а ответственность за правильную звукозапись конечных данных давно взяли на себя разработанные алгоритмы и люди, умеющие правильно их использовать. В последние несколько лет вы уже не найдете нового диска без shaped dithering и других приемов доведения качества звукопередачи до предела. Да, ленивым или просто криворуким будет удобнее давать готовый материал в 32х битах и 96 кГц, но по идее - стоит ли это в несколько раз больших аудио данных?...

Не так давно мне попался довольно качественный HDCD релиз альбома «Mark Knopfler - Sailing To Philadelphia». Впервые я отметил столь низкий уровень фонового шума и динамический диапазон для музыки с живыми инструментами и голосом. Результат сканирования всего альбома гласил:

Left Right
Peak Amplitude: 0,00 dB 0,00 dB
True Peak Amplitude: 0,64 dBTP 0,58 dBTP
Maximum Sample Value: 8388607 8387420
Minimum Sample Value: -8388608 -8388608
Possibly Clipped Samples: 3 1
Total RMS Amplitude: -15,12 dB -15,20 dB
Maximum RMS Amplitude: -5,75 dB -5,80 dB
Minimum RMS Amplitude: -120,64 dB -123,81 dB
Average RMS Amplitude: -18,90 dB -19,01 dB
DC Offset: 0,00 % 0,00 %
Measured Bit Depth: 24 24
Dynamic Range: 114,89 dB 118,02 dB
Dynamic Range Used: 83,15 dB 82,95 dB
Loudness: -13,48 dB -12,87 dB
Perceived Loudness: -10,61 dB -10,63 dB
ITU-R BS.1770-2 Loudness: -12,72 LUFS

0dB = FS Square Wave
Using RMS Window of 50,00 ms
Account for DC = true

Краткий ликбез

Динамический диапазон - это разница (или соотношение) между самым громким и самым тихим звуком, выраженная в децибелах. Для определения динамического диапазона используют RMS значения, т.е. Root Mean Square - среднеквадратичные, или же, как принято у нас - «действующие» или «эффективные». Действующее значение выбирается потому, что именно оно (в отличие от пикового) напрямую связано с уровнем звукового давления, и, как следствие, воспринимаемой громкости.

Для анализа вышеуказанных характеристик был использован Adobe Audition. В данном случае алгоритм анализа ДД примерно такой: всё аудио разбивается на небольшие участки, именуемые окнами (в данном случае их размер равен 50 мс), затем для каждого такого участка вычисляется среднеквадратичное значение (путем интегрирования). Далее полученное значение соотносится с одним из следующих: 1. Среднеквадратичное значение для синусоиды с максимальной амплитудой и такой же продолжительностью. 2. Меандр с максимальной амплитудой и такой же продолжительностью. Как известно, меандр имеет максимально возможное значение RMS за период (т.к. модуль его амплитуды в любой момент равен максимуму), синусоида же имеет коэффициент 1/(корень из 2), т.е. 0.707 от максимального (или же пикового) значения. Если вы еще раз взглянете на отчет, то увидите, что там за 0 dB RMS взят меандр (square wave). Таким образом, полученные децибелы среднеквадратичного значения имеют опорный уровень (0 dBFS) равный среднеквадратичному значению для меандра.

Также надо отметить, что при расчете RMS может учитываться или не учитываться постоянная составляющая (в некоторых случаях колебания происходят не относительно нулевого значения, а относительно некоторой константы, которая и равна постоянной составляющей). В нашем случае учет постоянной составляющей включен.

После получения RMS значения для каждого окна производится поиск наименьшего и наибольшего значений. Разница между двумя этими значениями - и есть динамический диапазон.

Кроме того, Audition определяет параметр «Dynamic Range Used», который рассчитывается без учета тишины в начале и конце трека, а также без учета других продолжительных участков с тишиной внутри дорожки. Собственно, этот параметр и является наиболее информативным и важным при анализе динамического диапазона.

DVD-Audio

Так вот, сегодня я наконец заполучил DVD-Audio релиз того самого альбома, о котором писал выше. Результаты меня удивили еще больше. Многоканальная дорожка содержала записи с динамическим диапазоном более 100 дБ, хотя значения для отдельных каналов были довольно разными (кстати говоря, Audition показал для фронтальных каналов актуальную разрядность 24 бита, а для остальных - 20). Я решил произвести более детальный анализ записей: вручную выполнил сведение каналов в стерео (с помощью Channel Mixer в foobar2000), а затем проанализировал динамический диапазон 5.1 записи, стерео даунмикса с DVD диска и моего собственного даунмикса.

Результаты для каждого трека/канала приведены в таблице Excel .

Интересно, что динамический диапазон даунмиксов получились совершенно различным (разной была и громкость - у моего даунмикса она была ниже на несколько децибел). Но, так или иначе, например, для 4-го трека во всех трех случаях отмечается широкий динамический диапазон, более 90 дБ.

Но это что касается отдельных параметров. Наиболее же информативной является гистограмма громкости. Она показывает распределение громкости по частоте появления. Т.е. это значения RMS для всех окон, представленные в виде диаграммы, где по вертикали частота появления, по горизонтали уровень громкости. Таим образом можно видеть, какой уровень громкости преобладает в дорожке, насколько велика суммарная продолжительность тихих участков и т.д.

Например, вот гистограммы громкости для моего и DVD стерео даунмикса четвертого трека (правый канал), соответственно:

Высокая частота для громкости с уровнем около ~110 говорит о том, что это скорей всего уровень шумов звукозаписывающего оборудования. В общем же, наиболее интересными являются дорожки с довольно высоким процентом тихих фрагментов. Например, вот диаграмма для моего микса 7-го трека:

Подобный материал гипотетически может помочь выявить различия между 24- и 16-битным аудио. Именно с целью определить возможность выявления таких различий, а также вообще резонность использования 24-битного формата, я искал столь качественные аудиозаписи.

О результатах моих проверок я сообщу в следующих записях.

Добавлено: судя по всему, широкий динамический диапазон - лишь результат обработки записи. Т.е. тихие участки являются либо участками работы шумоподавления, либо фрагментами затухающих звуков (fade-in/fade-out). Реальных же продолжительных во времени звуков со столь низким уровнем (

Динамическая обработка аудиосигналов на ПК

(c)Юрий Петелин
http://www.petelin.ru/

В предыдущей статье я рассказал о программных средствах устранения шума и искажений звука, в том числе перечислил те операции по "звукочистке", которые необходимо проделать с записью песни, начиная с исправления ошибок в установке микрофона и завершая мастерингом, выполненным так, чтобы группа композиций, записанная на диск, с эстетической точки зрения представляла собой единое целое. Данная тема настолько серьезна, что ей стоит посвятить несколько ближайших статей.

Начну, как и в прошлый раз, с основного тезиса: звук, записанный любителем в условиях домашней компьютерной студии, хотя, конечно, и не сравнится по качеству с результатами работы профессиональных студий, но может быть приближен к ним.

Пишу, а краем уха слушаю, что там бубнит телевизор. Вот фильм, отрекомендованный в анонсе, как "суперпроект". Царь Петр при смерти, борьба за престол. Страсти бушуют... По другим каналам следователь Турецкий отыскивает похищенные раритетные фолианты, знатоки тряхнули стариной и снова ведут свое следствие, потому что, оказывается, все еще "кто-то кое-где у нас порой честно жить не хочет"… Такие разные истории, но что-то общее в них есть. Это общее - звук. Плохой звук. Ужасный звук, записанный профессионалами в профессиональных студиях. Особенно в "суперпроекте": когда на мгновения стихают стоны умирающего царя и крики приближенных, отчетливо проступают фоновые звуки, даже становится слышно, как работают лентопротяжные механизмы камер.

Напрашиваются такие выводы:

1. Ясно, что в нашей стране фильмы давно уже не переозвучивают в звуковой студии. Наверное, денег на это нет. Каким записан звук на съемочной площадке, таким и идет в смонтированную ленту.

2. Некоторые профессионалы не применяют средства компьютерного шумоподавления. Не очень понятно, почему. Не знают о них? Некогда почитать специальную литературу? Но и элементарных сведений, что содержатся на пяти страницах моей предыдущей статьи, для начала хватило бы.

3. Некоторые из тех людей, кто занимаются записью звука для телефильмов, не умеют применять приборы динамической обработки.

Как раз о динамической обработке мы сейчас поговорим. Тема эта сложная, но если вы сосредоточитесь, то обязательно все поймете, и звук в ваших проектах станет профессиональным. Ну не профессиональным, а любительским, но таким, что все им заслушаются. Сомневающимся предлагаю оценить работы читателей, записанные на диске, который сопровождает новую книгу "Sonar. Секреты мастерства". Кстати, ничто не мешает вам попробовать свои силы. В музыкальном сборнике на следующем подобном диске вполне может оказаться и ваша композиция.



Итак, динамическая обработка. Формально она заключается в изменении динамического диапазона аудиосигналов. Но для применения ее во благо качеству звука этой фразы явно недостаточно. Поэтому начнем с начала.

Уровень и динамический диапазон звукового сигнала

Источник звуковых колебаний излучает в окружающее пространство энергию. Количество звуковой энергии, проходящей за секунду через площадь в 1 м2, расположенную перпендикулярно направлению распространения звуковых колебаний, называют интенсивностью (силой) звука.

Когда мы ведем обычный разговор, мощность потока энергии приблизительно равен 10 мкВт. Мощность самых громких звуков скрипки может составлять 60 мкВт, а мощность звуков органа - от 140 до 3200 мкВт.

Человек слышит звук в чрезвычайно широком диапазоне звуковых давлений (интенсивностей). Одной из опорных величин этого диапазона является стандартный порог слышимости - эффективное значение звукового давления, создаваемого гармоническим звуковым колебанием частоты 1000 Гц, едва слышимым человеком со средней чувствительностью слуха.

Порогу слышимости соответствует интенсивность звука Iзв0 = 10-12 Вт/м2 или звуковое давление pзв0 = 2Ч10-5 Па.

Верхний предел определяется значениями Iзв. макс. = 1 Вт/м2 или pзв. макс. = 20 Па. При восприятии звука такой интенсивности у человека появляются болевые ощущения.

В области звуковых давлений, существенно превышающих стандартный порог слышимости, величина ощущения пропорциональна не амплитуде звукового давления pзв, а логарифму отношения pзв/pзв0. Поэтому звуковое давление и интенсивность звука часто оценивают в логарифмических единицах децибелах (дБ) по отношению к стандартному порогу слышимости.

Диапазон изменения звуковых давлений от абсолютного порога слышимости до болевого порога составляет для разных частот от 90 дБ до 130 дБ.

Если ухо человека воспринимает одновременно два или несколько звуков различной громкости, то более громкий звук заглушает (поглощает) слабые звуки. Происходит так называемая маскировка звуков, и ухо воспринимает только один, более громкий, звук. Сразу после воздействия на ухо громкого звука снижается восприимчивость слуха к слабым звукам. Эта способность называется адаптацией слуха.

Таким образом, порог слышимости в значительной степени зависит от условий прослушивания: в тишине или же на фоне шума (или другого мешающего звука). В последнем случае порог слышимости повышается. Это свидетельствует о том, что помеха маскирует полезный сигнал.

Слуховой аппарат человека обладает определенной инерционностью: ощущение возникновения звука, а также его прекращения появляется не сразу.

Аудиосигнал является случайным процессом. Его акустические или электрические характеристики непрерывно изменяются во времени. Пытаться отследить случайные изменения реализаций этого хаоса - занятие, имеющее не много смысла. Обуздать его величество случай, придать ему черты детерминированности можно, используя усредненные параметры, такие, как уровень аудиосигнала.

Уровень аудиосигнала характеризует сигнал в определенный момент и представляет собой выраженное в децибелах выпрямленное и усредненное за некоторый предшествующий промежуток времени напряжение аудиосигнала.

Под динамическим диапазоном аудиосигнала понимают отношение максимального звукового давления к минимальному или отношение соответствующих напряжений. В таком определении нет сведений о том, какое давление и напряжение считается максимальным и минимальным. Наверное, поэтому определенный таким образом динамический диапазон сигнала, называется теоретическим. Наряду с этим динамический диапазон аудиосигнала можно определить и экспериментально как разность максимального и минимального уровней для достаточно длительного периода. Это значение существенно зависит от выбранного времени измерения и типа измерителя уровней.

Динамические диапазоны музыкальных и речевых акустических сигналов разных типов, измеренные с помощью приборов, составляют в среднем:

80 дБ для симфонического оркестра

45 дБ для хора

35 дБ для эстрадной музыки и солистов-вокалистов

25 дБ для речи дикторов

При записи уровни необходимо регулировать. Объясняется это тем, что исходные (необработанные) сигналы зачастую имеют большой динамический диапазон (например, до 80 дБ у симфонической музыки), а в домашних условиях аудиопрограммы прослушиваются в диапазоне порядка 40 дБ.

Ручной регулировке уровней присущ недостаток. Время реакции звукорежиссера составляет около 2 с даже если партитура композиции ему заранее известна. Это приводит к погрешности в поддержании максимальных уровней музыкальных программ до 4 дБ в обе стороны.

Усилители, акустические системы да и уши человека нужно защищать от перегрузок, вызванных резкими скачкообразными изменениями амплитуды аудиосигнала - ограничивать сигнал по амплитуде.

Динамический диапазон сигнала нужно согласовывать с динамическими диапазонами устройств записи, усиления, передачи.

Для увеличения дальности действия FM радиостанций динамический диапазон аудиосигнала нужно сжимать. Для снижения уровня шума в паузах динамический диапазон желательно увеличивать.

В конце концов, мода, диктующая свои условия во всех сферах человеческой деятельности, в том числе и в звукозаписи, требует насыщенного, плотного звучания современной музыки, которое достигается резким сужением ее динамического диапазона.

Звуковая волна (огибающая громкости) фрагмента оперы С. Рахманинова "Алеко",

и современной танцевальной музыки.

В классической музыке важны нюансы, танцевальная музыка должна быть "сильнодействующей".

Этим диктуется необходимость в применении устройств автоматической обработки уровней сигналов.

Устройства динамической обработки

Устройства автоматической обработки уровней сигналов можно классифицировать по ряду критериев, наиболее важные среди них: инерционность срабатывания и выполняемая функция.

По критерию инерционности срабатывания различают безинерционные (мгновенного действия) и инерционные (с изменяющимся коэффициентом передачи) авторегуляторы уровня:

Когда на входе безинерционного авторегулятора уровень сигнала превышает номинальное значение, на выходе вместо синусоидального сигнала получается трапецевидный. Хотя безинерционные авторегуляторы просты, их применение приводит к сильным искажениям.

Инерционным называется такой авторегулятор уровня, у которого коэффициент передачи автоматически изменяется в зависимости от уровня сигнала на входе. Эти авторегуляторы уровня искажают форму сигналов только в течение незначительного интервала времени. Подбором оптимального времени срабатывания такие искажения можно сделать малоощутимыми на слух.

В зависимости от выполняемых функций инерционные авторегуляторы уровня подразделяют на:

Ограничители квазимаксимальнных уровней

Автостабилизаторы уровня

Компрессоры динамического диапазона

Экспандеры динамического диапазона

Компандерные шумоподавители

Пороговые шумоподавители (гейты)

Устройства со сложным преобразованием динамического диапазона

Основной характеристикой устройства динамической обработки служит амплитудная характеристика - зависимость уровня выходного сигнала от уровня сигнала на входе.

Ограничитель уровня (лимитер) - это авторегулятор, у которого коэффициент передачи изменяется так, что при превышении номинального уровня входным сигналом уровни сигналов на его выходе остаются практически постоянными, близкими к номинальному значению. При входных сигналах, не превышающих номинального значения, ограничитель уровня работает как обычный линейный усилитель. Лимитер должен реагировать на изменение уровня мгновенно.


Амплитудная характеристика лимитера

Автостабилизатор уровня предназначен для стабилизации уровней сигналов. Это бывает необходимо для выравнивания громкости звучания отдельных фрагментов фонограммы. Принцип действия автостабилизатора аналогичен принципу действия ограничителя. Отличие заключается в том, что номинальное выходное напряжения автостабилизатора приблизительно на 5 дБ меньше номинального выходного уровня ограничителя.

Компрессор - такое устройство, коэффициент передачи которого возрастает по мере уменьшения уровня входного сигнала. Действие компрессора приводит к повышению средней мощности и, следовательно, громкости звучания обрабатываемого сигнала, а также к сжатию его динамического диапазона.


Амплитудная характеристика компрессора

Экспандер имеет обратную по отношению к компрессору амплитудную характеристику. Применяют его в том случае, когда необходимо восстановить динамический диапазон, преобразованный компрессором.


Амплитудная характеристика экспандера

Компандер - система, состоящая из последовательно включенных компрессора и экспандера. Она используется для снижения уровня шумов в трактах записи или передачи звуковых сигналов.

Пороговый шумоподавитель (гейт) - это авторегулятор, у которого коэффициент передачи изменяется так, что при уровнях входного сигнала меньше порогового амплитуда сигнала на выходе близка к нулю. При входных сигналах, уровень которых превышает пороговое значение, пороговый шумоподавитель работает как обычный линейный усилитель.

Авторегуляторы для сложного преобразование динамического диапазона, имеют несколько каналов управления. Например, сочетание ограничителя, автостабилзатора, экспандера и порогового шумоподавителя позволяет стабилизировать громкость звучания различных фрагментов композиции, выдерживать максимальные уровни сигнала и подавлять шумы в паузах.

Структура устройств динамической обработки

Инерционный регулятор уровня имеет основной канал и канал управления. Если сигнал подается в канал управления со входа основного канала, мы имеем дело с прямой регулировкой, а если с выхода - с обратной.

Основной канал в схеме с прямой регулировкой включает в себя усилители звуковых частот, линию задержки и регулируемый элемент. Последний под воздействием управляющего напряжения способен изменять свой коэффициент передачи. Основной канал в схеме с обратной регулировкой содержит в себе все перечисленные элементы за исключением линии задержки.

Принципиально важные элементы канала управления - детектор и интегрирующая (сглаживающая) цепь. До тех пор пока напряжение на входе схемы не превышает порогового (опорного), канал управления не вырабатывает управляющего сигнала, и коэффициент передачи регулируемого элемента не изменяется. При превышении порога детектор вырабатывает импульсное напряжение, пропорциональное разности текущего значения сигнала и опорного напряжения. Интегрирующая цепь усредняет разностное напряжение и вырабатывает управляющее напряжение, пропорциональное уровню сигнала на входе канала управления.

Линия задержки, имеющаяся в основном канале схемы с прямой регулировкой, позволяет каналу управления работать с некоторым упреждением. Всплеск уровня сигнала будет обнаружен им раньше, чем сигнал достигнет регулируемого элемента. Поэтому существует принципиальная возможность устранения нежелательных переходных процессов. Перепады уровня могут быть обработаны практически идеально. Однако фазочастотная характеристика аналоговой линии задержки отлична от линейной. Различие фазовых сдвигов для разных спектральных составляющих сигнала приводит к искажению формы широкополосного сигнала при прохождении линии задержки. Цифровые линии задержки лишены этого недостатка, но для их применения сигнал необходимо сначала оцифровать. В виртуальных устройствах обработки сигнал обрабатывается в цифровой форме, а проблемы с алгоритмической реализацией функциональных элементов отсутствуют.