Сайт о телевидении

Сайт о телевидении

» » Модуляционная обработка звукового сигнала. Фундаментальные исследования. Методы обработки голоса

Модуляционная обработка звукового сигнала. Фундаментальные исследования. Методы обработки голоса

Сэмплирование - это запись образцов звучания (сэмплов) того или иного реального музыкального инструмента. Сэмплирование является основой волнового синтеза (WT-синтеза) музыкальных звуков. Если при частотном синтезе (FM-синтезе) новые звучания получают за счет разнообразной обработки простейших стандартных колебаний, то основой WT-синтеза являются заранее записанные звуки традиционных музыкальных инструментов или звуки, сопровождающие различные процессы в природе и технике. С сэмплами можно делать все, что угодно. Можно оставить их такими, как есть, и WT-синтезатор будет звучать голосами, почти неотличимыми от голосов инструментов-первоисточников. Можно подвергнуть сэмплы модуляции, фильтрации, воздействию эффектов и получить самые фантастические, неземные звуки.

В принципе, сэмпл - это ни что иное, как сохраненная в памяти синтезатора последовательность цифровых отсчетов, получившихся в результате аналого-цифрового преобразования звука музыкального инструмента. Если бы не существовала проблема экономии памяти, то звучание каждой ноты можно было бы записать в исполнении каждого музыкального инструмента. А игра на таком синтезаторе представляла бы собой воспроизведение этих записей в необходимые моменты времени. Сэмплы хранятся в памяти не в том виде, в каком они получаются сразу же после прохождения АЦП. Запись подвергается хирургическому воздействию, делится на характерные части (фазы): начало, протяженный участок, завершение звука. В зависимости от применяемой фирменной технологии эти части могут делиться на еще более мелкие фрагменты. В памяти хранится не вся запись, а лишь минимально необходимая для ее восстановления информация о каждом из фрагментов. Изменение протяженности звучания производится за счет управления числом повторений отдельных фрагментов.

В целях еще большей экономии памяти был разработан способ синтеза, позволяющий хранить сэмплы не для каждой ноты, а лишь для некоторых. В этом случае изменения высоты звучания достигается путем изменения скорости воспроизведения сэмпла.

Для создания и воспроизведения сэмплов служит синтезатор. В наши дни синтезатор конструктивно реализован в одном-двух корпусах микросхем, которые представляет собой специализированный процессор для осуществления всех необходимых преобразовании. Из закодированных и сжатых с помощью специальных алгоритмов фрагментов он собирает сэмпл, задает высоту его звучания, изменяет в соответствии с замыслом музыканта форму огибающей колебания, имитируя либо почти неощутимое касание, либо удар по клавише или струне. Кроме того, процессор добавляет различные эффекты, изменяет тембр с помощью фильтров и модуляторов.

В звуковых картах находят применение несколько синтезаторов различных фирм.

Наряду с сэмплами, записанными в ПЗУ звуковой карты, в настоящее время стали доступными наборы сэмплов (банки), созданные как в лабораториях фирм, специализирующихся на синтезаторах, так и любителями компьютерной музыки. Эти банки можно найти на многочисленных лазерных дисках и в Internet.

Модуляционные эффекты:

Дилэй (Delay) в переводе означает "задержка". Необходимость в этом эффекте возникла с появлением стереофонии. Сама природа слухового аппарата человека предполагает в большинстве ситуаций поступление в мозг двух звуковых сигналов, отличающихся временем прихода. Если источник звука находится "перед глазами", на перпендикуляре, проведенном к линии, проходящей через уши, то прямой звук от источника достигает обоих ушей в одно и то же время. Во всех остальных случаях расстояния от источника до ушей различны, поэтому либо одно, либо другое ухо воспринимает звук первым.

Время задержки (разницы во времени приема сигналов ушами) будет максимальным в том случае, когда источник расположен напротив одного из ушей. Так как расстояние между ушами около 20 см, то максимальная задержка может составлять около 8 мс. Этим величинам соответствует волна звукового колебания с частотой около 1,1 кГц. Для более высокочастотных звуковых колебаний длина волны становится меньше, чем расстояние между ушами, и разница во времени приема сигналов ушами становится неощутимой. Предельная частота колебаний, задержка которых воспринимается человеком, зависит от направления на источник. Она растет по мере того, как источник смещается от точки, расположенной напротив одного из ушей, к точке, расположенной перед человеком.

Дилэй применяется, прежде всего, в том случае, когда запись голоса или акустического музыкального инструмента, выполненную с помощью единственного микрофона, встраивают в стереофоническую композицию. Этот эффект служит основой технологии создания стереозаписей. Дилэй может применяться и для получения эффекта однократного повторения каких-либо звуков. Величина задержки между прямым сигналом и его задержанной копией в этом случае выбирается большей, чем естественная задержка в 8 мс. Для коротких и резких звуков время задержки, при котором основной сигнал и его копия различимы меньше, чем для протяженных звуков. Для произведений, исполняемых в медленном темпе, задержка может быть больше, чем для быстрых композиций,

При определенных соотношениях громкостей прямого и задержанного сигнала может иметь место психоакустический эффект изменения кажущегося расположения источника звука на стереопанораме.

Этот эффект реализуется с помощью устройств, способных осуществлять задержку акустического или электрического сигналов. Таким устройством сейчас чаще всего служит цифровая линия задержки, представляющая собой цепочку из элементарных ячеек - триггеров задержки. Для наших целей достаточно знать, что принцип действия триггера задержки сводится к следующему: двоичный сигнал, поступивший в некоторый тактовый момент времени на его вход, появится на его выходе не мгновенно, а только в очередной тактовый момент. Общее время задержки в линии тем больше, чем больше триггеров задержки включено в цепочку, и тем меньше, чем меньше тактовый интервал (чем больше тактовая частота). В качестве цифровых линий задержки можно использовать запоминающие устройства.

Разумеется, для применения цифровой линии задержки сигнал должен быть сначала преобразован в цифровую форму. А после прохождения его копии через линию задержки происходит обратное, цифро-аналоговое преобразование. Исходный сигнал и его задержанная копия могут быть раздельно направлены в различные стереоканалы, но могут быть и смешаны в различных пропорциях. Суммарный сигнал может быть направлен либо в один из стереоканалов, либо в оба.

В звуковых редакторах дилэй реализуется программным (математическим) путем за счет изменения относительной нумерации отсчетов исходного сигнала и его копии.

В основу звуковых эффектов флэнжер (Flanger) и фэйзер (Phaser) также положена задержка сигнала.

Эффект повторного звучания может быть вызван и распространением звука от источника к приемнику различными путями (например, звук может приходить, во-первых, напрямую и, во-вторых, отразившись от препятствия, находящегося чуть в стороне от прямого пути). И в том, и в другом случаях время задержки остается постоянным. В реальной жизни этому соответствует маловероятная ситуация, когда источник звука, приемник звука и отражающие предметы неподвижны относительно друг друга. При этом частота звука не изменяется, каким бы путем и в какое бы ухо он не приходил.

Если же какой-либо из трех элементов подвижен, то частота принимаемого звука не может оставаться той же, что и частота звука переданного. Это есть ни что иное, как проявление эффекта Доплера.

И флэнжер, и фэйзер имитируют проявления взаимного перемещения трех элементов: источника, приемника и отражателя звука. По сути дела, и тот, и другой эффекты представляют собой сочетание задержки звукового сигнала с частотной или фазовой модуляцией. Разница между ними чисто количественная, флэнжер отличается от фейзера тем, что для первого эффекта время задержки копии (или времена задержек копий) и изменение частот, сигнала значительно большее, чем для второго. Образно говоря, флэнжер наблюдался бы в том случае, когда певец мчался бы к зрителю, сидящему в зале, со скоростью автомобиля. А вот для того, чтобы ощутить фэйзер в его, так сказать, первозданном виде, движущегося источника звука не требуется, зрителю достаточно часто-часто вертеть головой из стороны в сторону.

Упомянутые количественные отличия эффектов приводят и к отличиям качественным: во-первых, звуки, обработанные ими, приобретают различные акустические и музыкальные свойства, во-вторых, эффекты реализуются различными техническими средствами.

Значения времени задержек, характерных для флэнжера, существенно превышают период звукового колебания, поэтому для реализации эффекта используют многоразрядные и многоотводные цифровые линии задержки. С каждого из отводов снимается свой сигнал, который в свою очередь подвергается частотной модуляции.

Для фэйзера, наоборот, характерно очень маленькое время задержки. Оно столь мало, что оказывается сравнимо с периодом звукового колебания. При столь малых относительных сдвигах принято говорить уже не о задержке копий сигнала во времени, а о разности их фаз. Если эта разность фаз не остается постоянной, а изменяется по периодическому закону, то мы имеем дело с эффектом фейзера. Так что можно считать фейзер предельным случаем флэнжера.

Чтобы получить флэнжер, вместо одной акустической системы использовали несколько систем, размещенных на различных расстояниях от слушателей. В необходимые моменты производили поочередное подключение источника сигнала к акустическим системам таким образом, что создавалось впечатление приближения или удаления источника звука. Задержку звука выполняли и с помощью магнитофонов со сквозным трактом запись/ воспроизведение. Одна головка записывает, другая - воспроизводит звук с задержкой на время, необходимое для перемещения ленты от головки к головке. Для частотной модуляции особых мер можно было и не придумывать. Каждому аналоговому магнитофону присущ естественный недостаток, называемый детонацией, которая проявляется в виде "плавания" звука. Стоило чуть-чуть специально усилить этот эффект, изменяя напряжение, питающее двигатель, и получалась частотная модуляция.

Для реализации фэйзера методами аналоговой техники использовали цепочки фазовращателей, управляемых электрическим путем. А иногда можно было наблюдать и такую картину: в акустической системе, подключенной к ЭМИ или электрогитаре, вдруг начинало вращаться что-то вроде вентилятора. Звук пересекался с подвижными лопастями и отражался от них, получалась фазовая модуляция.

Реверберация относится к наиболее интересным и популярным звуковым эффектам. Сущность реверберации заключается в том, что исходный звуковой сигнал смешивается со своими копиями, задержанными относительно него на различные временные интервалы. Этим реверберация напоминает дилэй. Однако при реверберации число задержанных копий сигнала может быть значительно больше, чем для дилэя. Теоретически число копий может быть бесконечным. Кроме того, при реверберации, чем больше время запаздывания копии сигнала, тем меньше ее амплитуда (громкость). Эффект зависит от того, каковы временные промежутки между копиями сигналов и какова скорость уменьшения уровней их громкости. Если промежутки между копиями малы, то получается собственно эффект реверберации. Возникает ощущение объемного гулкого помещения. Звуки музыкальных инструментов становятся сочными, объемными, с богатым тембровым составом. Голоса певцов приобретают напевность, недостатки, присущие им, становятся малозаметными.

Если промежутки между копиями велики (более 100 мс), то правильнее говорить не об эффекте реверберации, а об эффекте "эхо". Интервалы между соответствующими звуками при этом становятся различимыми. Звуки перестают сливаться, кажутся отражениями от удаленных преград.

Основным элементом, реализующим эффект реверберации, является устройство, создающее эхо-сигнал.

Эхо-камера представляет собой комнату с сильно отражающими стенами, в которую помещен источник звукового сигнала (громкоговоритель) и приемник (микрофон). Преимущество эхо-камеры состоит в том, что затухание звука происходит в ней естественным путем (что очень трудно обеспечить другими способами). В то время как звук продолжает реверберировать в трех измерениях, исходная волна разбивается на множество отраженных, которые достигают микрофона за уменьшающиеся промежутки времени.

Наряду с эхо-камерами для имитации реверберации использовали стальные пластины, точнее, довольно большие по размеру листы. Колебания в них вводили и снимали с помощью устройств, по конструкции и принципу действия похожих на электромагнитные головные телефоны. Для получения удовлетворительной равномерности амплитудно-частотной характеристики толщина листа должна быть выдержана с точностью, которую не обеспечивают обычные технологии проката стали. Реверберация здесь была не трехмерной, а плоской. Сигнал имел характерный металлический оттенок.

В середине 60-х годов для получения эффекта реверберации стали применять пружинные ревербераторы. С помощью электромагнитного преобразователя, соединенного с одним из концов пружины, в ней возбуждались механические колебания, которые с задержкой достигали второго конца пружины, связанного с датчиком. Эффект повторения звука обусловлен многократным отражением волн механических колебаний от концов пружины.

На смену этим несовершенным устройствам пришли ревербераторы магнитофонные. Принцип формирования в них эхо-сигнала состоит в том, что исходный сигнал записывается на ленту записывающей магнитной головкой, а через время, необходимое для перемещения ленты к воспроизводящей головке, считывается ею. Через цепь обратной связи уменьшенный по амплитуде задержанный сигнал вновь подается на запись, что и создает эффект многократного отражения звука с постепенным затуханием. Качество звука определяется параметрами магнитофона. Недостаток магнитофонного ревербератора заключается в том, что при приемлемых скоростях протяжки ленты удается получить только эффект эха. Для получения собственно реверберации требуется либо еще сильнее сблизить магнитные головки (чего не позволяет сделать их конструкция), либо значительно увеличить скорость движения ленты.

С развитием цифровой техники и появлением интегральных микросхем, содержащих в одном корпусе сотни и тысячи цифровых триггеров (о которых мы уже говорили) появилась возможность создавать высококачественные цифровые ревербераторы. В таких устройствах сигнал может быть задержан на любое время, необходимое как для получения реверберации, так и для получения эха.

В звуковых картах реверберация, в конечном счете, основана именно на цифровой задержке сигналов.

Наблюдая этапы развития средств реверберации, можно предположить, что когда-нибудь появятся и математические модели пружинных и магнитофонных ревербераторов. Ведь не исключено, что есть люди, испытывающие ностальгические чувства по отношению к звукам музыки, окрашенным дребезгом пружин или шипением магнитной ленты.

Методы, используемые для обработки звука:

1. Монтаж. Состоит в вырезании из записи одних участков, вставки других, их замены, размножении и т.п. Называется также редактированием. Все современные звуко- и видеозаписи в той или иной мере подвергаются монтажу.

2. Амплитудные преобразования. Выполняются при помощи различных действий над амплитудой сигнала, которые в конечном счете сводятся к умножению значений сэмплов на постоянный коэффициент (усиление/ослабление) или изменяющуюся во времени функцию-модулятор (амплитудная модуляция). Частным случаем амплитудной модуляции является формирование огибающей для придания стационарному звучанию развития во времени.

Амплитудные преобразования выполняются последовательно с отдельными сэмплами, поэтому они просты в реализации и не требуют большого объема вычислений.

3. Частотные (спектральные) преобразования. Выполняются над частотными составляющими звука. Если использовать спектральное разложение - форму представления звука, в которой по горизонтали отсчитываются частоты, а по вертикали - интенсивности составляющих этих частот, то многие частотные преобразования становятся похожими на амплитудные преобразованиям над спектром. Hапример, фильтрация - усиление или ослабление определенных полос частот - сводится к наложению на спектр соответствующей амплитудной огибающей. Однако частотную модуляцию таким образом представить нельзя - она выглядит, как смещение всего спектра или его отдельных участков во времени по определенному закону.

Для реализации частотных преобразований обычно применяется спектральное разложение по методу Фурье, которое требует значительных ресурсов. Однако имеется алгоритм быстрого преобразования Фурье (БПФ, FFT), который делается в целочисленной арифметике и позволяет уже на младших моделях 486 разворачивать в реальном времени спектр сигнала среднего качества. При частотных преобразованиях, кроме этого, требуется обработка и последующая свертка, поэтому фильтрация в реальном времени пока не реализуется на пpоцессоpах общего назначения. Вместо этого существует большое количество цифpовых сигнальных пpоцессоpов (Digital Signal Processor - DSP), котоpые выполняют эти опеpации в pеальном вpемени и по нескольким каналам.

4. Фазовые пpеобpазования. Сводятся в основном к постоянному сдвигу фазы сигнала или ее модуляции некотоpой функцией или дpугим сигналом. Благодаpя тому, что слуховой аппаpат человека использует фазу для опpеделения напpавления на источник звука, фазовые пpеобpазования стеpеозвука позволяют получить эффект вpащающегося звука, хоpа и ему подобные.

5. Вpеменные пpеобpазования. Заключаются в добавлении к основному сигналу его копий, сдвинутых во вpемени на pазличные величины. Пpи небольших сдвигах (поpядка менее 20 мс) это дает эффект pазмножения источника звука (эффект хоpа), пpи больших - эффект эха.

6. Фоpмантные пpеобpазования. Являются частным случаем частотных и опеpиpуют с фоpмантами - хаpактеpными полосами частот, встpечающимися в звуках, пpоизносимых человеком. Каждому звуку соот- ветствует свое соотношение амплитуд и частот нескольких фоpмант, котоpое опpеделяет тембp и pазбоpчивость голоса. Изменяя паpаметpы фоpмант, можно подчеpкивать или затушевывать отдельные звуки, менять одну гласную на дpугую, сдвигать pегистp голоса и т.п.

На основе этих методов реализовано множество аппаратных и программных средств обработки звука. Ниже приведено описание некоторых из них.

1. Компрессор (от англ. «compress» - сжимать, сдавливать) - это электронное устройство или компьютерная программа, используемая для уменьшения динамического диапазона звукового сигнала. Понижающая компрессия уменьшает амплитуду громких звуков, которые находятся выше определённого порога, а звуки находящиеся ниже этого порога остаются неизменными. Повышающая компрессия наоборот увеличивает громкость звуков находящихся ниже определённого порога, в то время как звуки, превышающие этот порог остаются неизменными. Эти действия уменьшают разницу между тихими и громкими звуками, сужая динамический диапазон.

Параметры компрессора:

Threshold (порог) - это уровень, выше которого сигнал начинает подавляться. Обычно устанавливается в дБ.

Ratio (соотношение) - определяет соотношение входящего/выходящего сигналов, превышающих порог (Threshold). Например, соотношение 4:1 означает, что сигнал превышающий порог на 4 дБ, сожмётся до уровня 1 дБ выше порога. Самое высокое соотношение ∞:1 обычно достигается с помощью соотношения 60:1, и фактически означает, что любой сигнал, превышающий порог будет снижен до порогового уровня (за исключением коротких резких изменений громкости, называемых "атакой").

Attack и Release (атака и восстановление, рис. 1.3). Компрессор может обеспечить определенную степень контроля над тем, как быстро он действует. "Фаза атаки" это период, когда компрессор снижает громкость до уровня, который определяется соотношением. "Фаза восстановления" это период, когда компрессор увеличивает громкость до уровня определённого соотношением, или к нулю дБ, когда уровень падает ниже порогового значения. Продолжительность каждого периода определяется скоростью изменения уровня сигнала.

Рис. 1.3. Атака и восстановление компрессора.

Во многих компрессорах атака и восстановление регулируются пользователем. Однако в некоторых компрессорах они определяются разработанной схемой и не могут быть изменены пользователем. Иногда параметры атаки и восстановления являются "автоматическими" или "программно-зависимыми", это означает, что их время изменяется в зависимости от входящего сигнала.

Колено компрессии (Knee) управляет изгибом компрессии на пороговом значении, оно может быть острым или округлым (рис. 1.4). Мягкое колено медленно увеличивает соотношение сжатия, и в конечном итоге достигает сжатия заданного пользователем. При жёстком колене компрессия начинается и прекращается резко, что делает её более заметной.

Рис. 1.4. Мягкое и жёсткое колено.

2. Экспандер. Если компрессор подавляет звук после того как его уровень превышает определённое значение, - то экспандер подавляет звук после того как его уровень станет меньше определённого значения. Во всём остальном экспандер схож с компрессором (параметры обработки звука).

3. Дисторшн (англ. «distortion» - искажение) - это искусственное грубое сужение динамического диапазона с целью обогащения звука гармониками. При компрессии волны всё больше принимают не синусоидальные, а квадратные формы за счёт искусственного ограничения уровня звука, которые обладают самым большим количеством гармоник.

4. Дилэй (англ. delay) или эхо (англ. echo) - звуковой эффект или соответствующее устройство, имитирующее чёткие затухающие повторы исходного сигнала. Эффект реализуется добавлением к исходному сигналу его копии или нескольких копий, задержанных по времени. Под дилэем обычно подразумевается однократная задержка сигнала, в то время как эффект «эхо» - многократные повторы.

5. Реверберация - это процесс постепенного уменьшения интенсивности звука при его многократных отражениях. В виртуальных ревербераторах существует множество параметров, позволяющих получить нужное звучание, характерное для какого-либо помещения.

6. Эквалайзер (англ. «equalize» - «выравнивать», общее сокращение - «EQ») - устройство или компьютерная программа, позволяющая изменять амплитудно-частотную характеристику звукового сигнала, то есть корректировать его (сигнала) амплитуду избирательно, в зависимости от частоты. Прежде всего эквалайзеры характеризуются количеством регулируемых по уровню частотных фильтров (полос).

Существует два основных типа многополосных эквалайзеров: графический и параметрический. Графический эквалайзер имеет определённое количество регулируемых по уровню частотных полос, каждая из которых характеризуется постоянной рабочей частотой, фиксированной шириной полосы вокруг рабочей частоты, а также диапазоном регулировки уровня (одинаковый для всех полос). Как правило, крайние полосы (самая низкая и высокая) представляют собой фильтры «полочного» типа, а все остальные имеют «колоколообразную» характеристику. Графические эквалайзеры, применяемые в профессиональных областях, обычно имеют 15 или 31 полосу на канал, и нередко оснащаются анализаторами спектра для удобства корректировки.

Параметрический эквалайзер дает гораздо большие возможности корректировки частотной характеристики сигнала. Каждая его полоса имеет три основных регулируемых параметра:

Центральная (или рабочая) частота в герцах (Гц);

Добротность (ширина рабочей полосы вокруг центральной частоты, обозначается буквой «Q») - безразмерная величина;

Уровень усиления или ослабления выбранной полосы в децибелах (дБ).

7. Хорус (англ. chorus) - звуковой эффект, имитирующий хоровое звучание музыкальных инструментов. Эффект реализуется путём добавления к исходному сигналу его собственной копии или копий, сдвинутых по времени на величины порядка 20-30 миллисекунд, причём время сдвига непрерывно изменяется.

Сначала входной сигнал разделяется на два независимых сигнала, один из которых остаётся без изменений, в то время как другой поступает на линию задержки. В линии задержки осуществляется задержка сигнала на 20-30 мс, причём время задержки изменяется в соответствии с сигналом генератора низких частот. На выходе задержанный сигнал смешивается с исходным. Генератор низких частот осуществляет модуляцию времени задержки сигнала. Он вырабатывает колебания определённой формы, лежащие в пределах от 3 Гц и ниже. Изменяя частоту, форму и амплитуду колебаний низкочастотного генератора, можно получать различный выходной сигнал.

Параметры эффекта:

Глубина (depth) - характеризует диапазон изменения времени задержки.

Скорость (speed, rate) - быстрота изменения «плавания» звука, регулируется частотой низкочастотного генератора.

Форма волны генератора низкой частоты (LFO waveform) - бывает синусоидальной (sin), треугольной (triangle) и логарифмической (log).

Баланс (balance, mix, dry/wet) - соотношение необработанного и обработанного сигналов.

8. Фэйзер (англ. phaser), также часто называемый фазовым вибрато - звуковой эффект, который достигается фильтрацией звукового сигнала с созданием серии максимумов и минимумов в его спектре. Положение этих максимумов и минимумов варьируется на протяжении звучания, что создает специфический круговой (англ. sweeping) эффект. Также фэйзером называют соответствующее устройство. По принципу работы схож с хорусом и отличается от него временем задержки (1-5 мс). Помимо этого задержка сигнала у фэйзера на разных частотах неодинакова и меняется по определённому закону.

Электронный эффект фэйзер создается путем разделения звукового сигнала на два потока. Один поток обрабатывается фазовым фильтром, который изменяет фазу звукового сигнала, сохраняя его частоту. Величина изменения фазы зависит от частоты. После микширования обработанного и необработанного сигналов, частоты, находящиеся в противофазе, погашают друг друга, создавая характерные провалы в спектре звука. Изменение отношения оригинального и обработанного сигнала позволяет изменить глубину эффекта, причем максимальная глубина достигается при отношении 50%.

Эффект фэйзера подобен эффектам фланжера и хоруса, которые также используют добавление к звуковому сигналу его копий, подаваемых с определенной задержкой (т. н. линию задержки). Однако в отличие от фланжера и хоруса, где величина задержки может принимать произвольное значение (обычно от 0 до 20 мс), величина задержки в фэйзере зависит от частоты сигнала и лежит в пределах одной фазы колебания. Таким образом, фэйзер можно рассматривать как частный случай фланжера.

9. Фланжер (англ. flange - фланец, гребень) - звуковой эффект, напоминающий «летящее» звучание. По принципу работы схож с хорусом, и отличается от него временем задержки (5-15 мс) и наличием обратной связи (feedback). Часть выходного сигнала подается обратно на вход и в линию задержки. В результате резонанса сигналов получается фланжер-эффект. При этом в спектре сигнала некоторые частоты усиливаются, а некоторые - ослабляются. В результате частотная характеристика представляет ряд максимумов и минимумов, напоминая гребень, откуда и происходит название. Фаза сигнала обратной связи иногда инвертируется, тем самым достигается дополнительная вариация звукового сигнала.

10. Вокодер (англ. «voice coder» - кодировщик голоса) - устройство синтеза речи на основе произвольного сигнала с богатым спектром. Изначально вокодеры были разработаны в целях экономии частотных ресурсов радиолинии системы связи при передаче речевых сообщений. Экономия достигается за счёт того, что вместо собственно речевого сигнала передают только значения его определённых параметров, которые на приемной стороне управляют синтезатором речи.

Основу синтезатора речи составляют три элемента: генератор тонального сигнала для формирования гласных звуков, генератор шума для формирования согласных и система формантных фильтров для воссоздания индивидуальных особенностей голоса. После всех преобразований голос человека становится похожим на голос робота, что вполне терпимо для средств связи и интересно для музыкальной сферы. Так было лишь в самых примитивных вокодерах первой половины прошлого столетия. Современные связные вокодеры обеспечивают высочайшее качество голоса при существенно более сильной степени сжатия в сравнении с упомянутыми выше.

Вокодер как музыкальный эффект позволяет перенести свойства одного (модулирующего) сигнала на другой сигнал, который называют носителем. В качестве сигнала-модулятора используется голос человека, а в качестве носителя - сигнал, формируемый музыкальным синтезатором или другим музыкальным инструментом. Так достигается эффект «говорящего» или «поющего» музыкального инструмента. Помимо голоса модулирующий сигнал может быть и гитарой, клавишными, барабанами и вообще любым звуком синтетического и «живого» происхождения. Так же нет ограничений и на несущий сигнал. Экспериментируя с моделирующим и несущим сигналом можно получать совершенно разные эффекты - говорящая гитара, барабаны со звуком фортепиано, гитара, звучащая как ксилофон.

Адаптер

Поскольку линейный вход звукового адаптера является основным приемником внешнего сигнала при записи, каждый производитель стремится обеспечить на этом входе достаточное качество усиления сигнала. Чувствительность линейных входов большинства звуковых адаптеров примерно одинакова, а параметры качества пропорциональны общему качеству плат. Совершенно иначе обстоит дело с микрофонными входами: плата стоимостью 100 долл. может иметь гораздо худший по чувствительности и качеству вход, нежели ширпотребовская за 8 долл. Причина здесь в том, что микрофонный вход для звукового адаптера является второстепенным и его функциональность чаще всего ограничивается подключением простейшего дешевого микрофона для подачи голосовых команд, где уровень шума и АЧХ не столь критичны.

Микрофонные входы современных адаптеров рассчитаны, как правило, на подключение электретных микрофонов со встроенным усилителем, получающим питание от адаптера. Такой микрофон имеет высокое выходное сопротивление и развивает на выходе до 50-100 мВ, поэтому для усиления сигнала до уровня линейного входа (около 500 мВ) достаточно простейшего предусилителя . Некоторые адаптеры, согласно документации, позволяют подключать и динамические микрофоны, не нуждающиеся в питании, однако такой микрофон развивает на выходе всего 1-3 мВ и требует достаточно чувствительного и малошумящего усилителя, который на звуковых платах встречается довольно редко. Поэтому типовая плата в лучшем случае позволяет получить с такого микрофона недостаточно громкий, глуховатый звук, изобилующий шумами и наводками, а в худшем случае от динамического микрофона вы вообще не добьетесь звука. Предпочтение электретным микрофонам отдается вследствие того, что компьютер является источником множества электромагнитных излучений, создающих на чувствительном микрофонном входе ощутимые помехи, справиться с которыми довольно сложно. Создание малошумящего усилителя потребовало бы специальной компоновки платы, тщательной фильтрации питающих напряжений, экранирования области входных цепей и прочих сложных и дорогих ухищрений.

Разъем микрофонного входа большинства адаптеров - монофонический; в нем для передачи сигнала используется только концевой контакт (TIP) штекера, который в стереофоническом разъеме отвечает за сигнал левого канала. Средний контакт (RING), который в стереофоническом разъеме отвечает за правый канал, в микрофонном разъеме либо вообще не используется, либо служит для передачи питающего напряжения +5 В для электретного микрофона. Когда отдельный контакт для питания микрофона отсутствует, питающее напряжение подается прямо на сигнальный вход, а усилители в этом случае должны иметь емкостную развязку входа и выхода.

Микрофон

Как мы выяснили, для непосредственного подключения к адаптеру лучше всего подойдут электретные микрофоны, которые обычно выпускаются в достаточно миниатюрном исполнении: в виде «карандашей» с подставками либо «клипс», прикрепляемых к одежде или к корпусу монитора. Они недороги и продаются в магазинах компьютерных аксессуаров; если не требуется высокого качества записи, близкого к профессиональному, - таким микрофоном вполне можно обойтись. В противном случае необходим качественный профессиональный микрофон, за которым придется идти в магазин музыкальной аппаратуры, и цена его будет примерно на порядок выше.

С подключением профессионального микрофона обязательно возникнет некоторое количество проблем. Такие микрофоны чаще всего являются динамическими и выдают сигнал амплитудой в единицы милливольт, а микрофонный вход большинства звуковых адаптеров, как уже говорилось, не способен нормально воспринимать столь слабые сигналы. Выходов может быть два: либо купить в том же музыкальном магазине микрофонный предусилитель (который может оказаться довольно дорогой игрушкой) и подключить его выход уже не к микрофонному, а к линейному входу адаптера; либо использовать микрофон со встроенными предусилителем и питанием (батарейкой). При наличии радиотехнических навыков можно собрать несложный усилитель самостоятельно - варианты схем довольно часто встречаются в книгах и в Интернете.

Кроме того, профессиональные микрофоны обычно имеют разъемы типа XLR, а компьютерные звуковые адаптеры - mini-DIN, так что потребуется переходник; иногда такие переходники продаются в музыкальных магазинах, однако может статься, что придется паять его самостоятельно.

И наконец, вполне может так случиться, что любой профессиональный микрофон будет намного превосходить ваш звуковой адаптер по качественным параметрам и звук, который вы получите с помощью такого микрофона, в итоге будет не лучше того, что может обеспечить простой электретный. Поэтому если у вас есть сомнения в высоком качестве своего адаптера (а простые адаптеры ценой порядка 10 долл., тем более встроенные, имеют весьма посредственные параметры), то вам имеет смысл договориться в магазине о возможном возврате купленного микрофона, если не удастся получить с его помощью достаточно качественный звук.

Технология записи

В отличие от источников фиксированного сигнала, микрофон имеет ряд особенностей, которые необходимо учитывать при работе с ним. Прежде всего, он любит «фонить»: если усиленный сигнал с микрофона поступает на колонки, то микрофон воспринимает его, сигнал вновь усиливается и т.д., то есть образуется так называемая положительная обратная связь, которая «раскачивает» звуковой тракт, вводит его в режим самовозбуждения, что проявляется посредством громкого свиста, звона или рокота. Даже если тракт не войдет в режим самовозбуждения, положительная связь может давать звенящий или свистящий призвук, который заметно портит сигнал. При этом чувствительный микрофон может успешно ловить сигнал даже с наушников, если звук в них достаточно громкий, а наружная звукоизоляция слаба. Поэтому необходимо экспериментальным путем определить такое положение/направление микрофона и громкость усиленного звука, при котором положительная связь проявляется меньше всего. Окончательную запись рекомендуется производить при отключенных или хотя бы максимально приглушенных колонках.

Чувствительные микрофоны, особенно простые и дешевые, отлично воспринимают посторонние звуки вроде шороха пальцев по корпусу микрофона или легкого поскрипывания самого корпуса даже от незначительного сжатия (наверняка вам приходилось слышать подобные звуки при телефонных разговорах). Чтобы избежать таких помех, микрофон лучше установить на удобной подставке либо держать его свободно, не сдавливая пальцами.

Еще один неприятный момент в использовании микрофона - так называемое заплевывание потоком воздуха, которое особенно ярко проявляется на взрывных согласных, таких как «п», «б», «т» и им подобных. В результате попадания на мембрану интенсивного звукового импульса образуется резкий бросок амплитуды сигнала, перегружающий усилитель и/или АЦП. Профессиональные микрофоны имеют против этого ветрозащиту - сетку или мягкую прокладку, расположенную на некотором расстоянии от капсюля, но даже она не всегда спасает, поэтому к каждому микрофону приходится приноравливаться, привыкая держать его либо под правильным углом, чтобы прямые воздушные потоки проходили мимо, либо на достаточном расстоянии, чтобы они достигали микрофона в уже ослабленном состоянии.

Экспериментируя с микрофоном, вы обнаружите, что тембр записанного голоса довольно сильно зависит от расстояния ото рта до микрофона и от угла наклона микрофона относительно лица. Это вызвано тем, что низкочастотные составляющие голоса больше всего рассеиваются и ослабляются с расстоянием, тогда как высокочастотные ослабляются меньше, зато имеют более выраженную направленность. Наиболее сочный и бархатистый тембр голоса можно получить, расположив микрофон непосредственно у рта, но тогда придется изрядно повозиться с углом наклона и немало потренироваться, чтобы избежать «заплевывания».

Запись посредством внешних устройств

Последнее время появились весьма экзотические способы записи звука с микрофона и переноса его в компьютер. Так, Creative выпускает цифровой проигрыватель Jukebox, содержащий миниатюрный накопитель на жестком диске, автономный контроллер и интерфейс USB. Основная функция проигрывателя - воспроизведение звуковых файлов, которые перекачиваются в него из компьютера, однако встроенный микрофон позволяет использовать его в качестве автономного диктофона: звук записывается на жесткий диск, что обеспечивает непрерывную запись в течение нескольких часов, а впоследствии фонограмма может быть перенесена в компьютер. Другое изделие Creative - PC Cam представляет собой гибрид цифрового фотоаппарата, видеокамеры и диктофона и позволяет записывать звук во встроенную Flash-память, откуда он извлекается с помощью того же интерфейса USB.

Удаление шумов и помех

оскольку голосовой сигнал имеет достаточно узкий спектр (сотни герц - единицы килогерц), к нему можно применять операцию удаления шума с большей глубиной, чем в случае произвольного музыкального сигнала. При записи может также оказаться, что в наиболее удачно записанном фрагменте (с художественной точки зрения) микрофон все-таки оказался «заплеванным» в одном или в нескольких местах и попытки повторить фразу или куплет песни со столь же удачной расстановкой акцентов не дают желаемого результата. В таких случаях можно попробовать скруглить импульсы перегрузки, сохранив или уменьшив их амплитуду. При незначительном количестве импульсов это удобно делать вручную, укрупнив изображение до появления узловых точек, которые можно цеплять мышью.

Методы обработки голоса

ак мы уже говорили, сложный музыкальный сигнал содержит множество разнородных составляющих, на которые большинство методов обработки звука воздействует с различным эффектом, поэтому спектр универсальных методов обработки сигнала весьма узок. Наиболее популярен метод реверберации, имитирующий множественное отражение звуковых волн и создающий эффект пространства - комнаты, зала, стадиона, горного каньона и т.п.; реверберация позволяет придать «сухому» звуку сочность и объем. Остальные универсальные методы обработки сводятся к манипуляции АЧХ (эквалайзер), чистке фонограммы от шумов и помех.

В отношении же первичного, простого звукового сигнала может быть достаточно успешно применен весь спектр существующих методов обработки - амплитудных, частотных, фазовых, временных, формантных и т.п. Те методы, что на сложном сигнале рождают неблагозвучную какофонию, на простых сигналах нередко способны привести к созданию очень интересных и ярких эффектов, широко используемых в звуковой индустрии.

Монтаж

Компьютерный монтаж речевых фонограмм - типичное занятие журналиста после записи интервью - одновременно и прост, и сложен. Поначалу он кажется простым, благодаря удобной для визуального анализа структуре речи, наличию заметных пауз между словами, всплескам амплитуды в местах акцентов и т.п. Однако при попытке, например, переставить местами две фразы, разделенные буквально секундами, выясняется, что они не желают стыковаться - успели измениться интонация, фаза дыхания, фоновый шум, и на стыке отчетливо прослушивается сбивка. Такие сбивки легко различимы практически в любом радиоинтервью, когда записывается речь человека, не являющегося профессиональным радиожурналистом и, следовательно, не умеющего говорить только то, что должно пойти в эфир. Из речи вырезают лишнее, некоторые фрагменты переставляют местами для большего соответствия смыслу, в результате чего слух постоянно «удивляется», поскольку в потоке естественной человеческой речи таких интонационных и динамических переходов не бывает.

Для сглаживания эффектов перехода можно воспользоваться методом взаимоперекрытия (crossfade), хотя он позволит состыковать фрагменты речи лишь по амплитуде, но не по интонации и фоновым шумам. Поэтому считаем нужным предостеречь тех, кому компьютерный монтаж покажется удобным способом фальсификации записи, например, переговоров: экспертиза способна без труда выявить даже неразличимые ухом места склейки, как и в случае с подделкой документов при помощи сканера и принтера.

Амплитудная обработка

Простейший вид динамической амплитудной обработки голоса - модуляция его периодическим сигналом, когда амплитуды сигналов перемножаются и голос приобретает амплитудные характеристики модулирующего сигнала. Модулируя низкочастотным (единицы герц) синусоидальным сигналом, получаем «булькающий» голос, повышая частоту сигнала - вибрирующий. Используя вместо синусоидальной формы прямоугольную, треугольную или пилообразную, можно придать голосу металлические, искаженные, «роботизированные» интонации.

Амплитудная модуляция выделенного фрагмента фонограммы выполняется как часть операции генерации периодических сигналов Generate g Tones. В поле Base Frequency задается основная частота сигнала в герцах, в поле Flavor - вид импульса, в поле Duration - длительность в секундах. Регуляторы Volume задают уровень сигнала.

Группа движков Frequency Components определяет уровни гармоник основного сигнала с указанными при движках номерами. Частотную модуляцию сигнала можно получить, используя поля Modulate By - смещение от основной частоты в герцах - и Modulation Frequency - частота модуляции. При помеченном поле Lock... все эти параметры, включая основную частоту, стационарны; при снятии пометки можно задать их начальные/конечные значения в закладках Initial/Final Settings - они будут линейно изменяться в течение генерируемого отрезка.

Группа полей Source Modulation определяет, как будет использоваться сгенерированный сигнал. По умолчанию, когда ни одно из этих полей не отмечено, сигнал вставляется в фонограмму или заменяет собой выделенный фрагмент; в противном случае он используется для выполнения заданной операции с выделенным фрагментом: Modulate - обычная модуляция (перемножение), Demodulate - демодуляция (деление), Overlap (mix) - простое смешивание сигналов. Последовательные модуляция и демодуляция с одним и тем же сигналом восстанавливают исходный сигнал (возможно, с измененным общим уровнем). Эксперименты с различными сочетаниями параметров порой дают весьма забавные и неожиданные результаты.

Временная обработка

Этот вид обработки основан на сдвиге исходного сигнала во времени и смешивании результата с исходным сигналом, после чего снова могут применяться сдвиг и смешивание. При сдвигах на малые промежутки времени, сравнимые с длительностью периода исходного сигнала, возникают фазовые эффекты типа интерференции, отчего звук приобретает специфическую окраску; этот эффект получил название фленжера (flanger) и используется как с фиксированной величиной сдвига, так и с периодически изменяющейся или даже вовсе со случайной. При сдвигах на интервалы, превышающие длительность периода, но не более 20 мс, возникает хоровой эффект (chorus). Благодаря общности технологии, эти два эффекта нередко реализуются одним программным блоком с различными параметрами.

При множественных сдвигах с интервалами 20...50 мс возникает эффект реверберации (reverb) - гулкости, объема, оттого что слуховой аппарат трактует задержанные копии сигнала как отражения от окружающих предметов. При интервалах свыше 50 мс ухо перестает четко связывать отдельные копии между собой, вследствие чего возникает эффект эха (echo).

В Cool Edit 2000 эффекты, основанные на временных задержках, объединены в группу Transform g Delay Effects. Эффекты flanger и chorus создаются операцией flanger:

Движок Original/Delayed управляет соотношением исходного и задержанного сигналов (интенсивность, или глубина эффекта). Initial/Final Mix Delay - начальная и конечная задержка копии - изменяется в этих пределах циклически. Stereo Phasing - угол фазового сдвига между каналами - позволяет создать любопытный эффект «скручивания» звука, особенно в наушниках. Feedback - глубина обратной связи (количество результирующего сигнала, подмешиваемого к исходному перед применением операции) - позволяет управлять выраженностью, резкостью эффекта.

Группа Rate задает параметры цикличности эффекта. Period - интервал времени, за который фленжер проходит от начальной задержки до конечной и обратно; Frequency - обратная величина, частота проходов туда-обратно; Total Cycles - количество полных проходов по выделенному фрагменту. Задание любого параметра вызывает автоматический пересчет остальных.

Группа Mode управляет особенностями эффекта: Inverted - инверсия задержанного сигнала, Special EFX - дополнительная инверсия исходного и задержанного сигналов, Sinusoidal - синусоидальный закон изменения задержки от начальной до конечной (если он отключен - задержка изменяется линейно).

Набор пресетов позволяет наглядно изучить особенности операции. Попробуйте выбрать несколько пресетов, меняя в каждом из них предустановленные параметры и не забывая всякий раз «откатываться» (Undo), чтобы сравнить влияние на звук различных комбинаций параметров.

Эффект реверберации в Cool Edit 2000 может быть реализован двумя способами: с помощью Echo Chamber - имитатора комнаты с заданными размерами и акустическими свойствами, и Reverb - генератора эффекта объема на основе встроенного в редактор алгоритма имитации множественных отражений в пространстве. Поскольку данный вид обработки является универсальным и применяется к любому звуковому материалу, опишем кратко второй способ как наиболее популярный.

Поле/движок Total Reverb Length определяет время реверберации, в течение которого отраженные сигналы полностью затухают; оно косвенно связано с объемом пространства, в котором распространяется звук. Attack Time - время нарастания глубины реверберации до номинального уровня; служит для плавного проявления эффекта на протяжении обрабатываемого фрагмента. High Frequency Absorbtion Time - время поглощения объемом высокочастотных составляющих, пропорционально «мягкости» и «заглушенности» объема. Perception - степень разборчивости: меньшие значения (smooth) - слабые и мягкие отражения, не перебивающие основного сигнала, большие значения (echoey) - четкие и сильные, отчетливо слышимые отражения, способные ухудшить разборчивость речи.

Движки/поля Mixing определяют соотношение исходного (dry) и обработанного (wet) сигналов в результирующем.

Эффект эха реализуется операцией Echo и добавляет к сигналу его постепенно затухающие копии, сдвинутые на равные промежутки времени. Регулятор Decay задает величину затухания - уровень каждой очередной копии в процентах от уровня предыдущей. Initial Echo Volume - уровень первой копии в процентах от уровня исходного сигнала. Delay - задержка между копиями в миллисекундах. Группа регуляторов Successive Echo Equalization управляет эквалайзером, через который пропускается каждая очередная копия, что позволяет задавать различные акустические характеристики имитируемого пространства.

Поскольку эффект является «продолжающимся» во времени, он может создать звуковой фрагмент, по длительности превышающий исходный. Для этого предусмотрен пункт Continue echo beyond selection - разрешение подмешивать эхо-сигнал к участку фонограммы, продолжающемуся за границей выделенного фрагмента. При этом в качестве исходного сигнала будет взят только выделенный фрагмент, а оставшаяся часть фонограммы будет использована исключительно для размещения «хвоста». Если в фонограмме не хватает места для «хвоста» - будет выдано сообщение об ошибке и придется добавить в конец фонограммы участок тишины операцией Generate g Silence.

Эффект лучше всего воспринимается на относительно коротких звуках. На длинных словах или фразах, чтобы исключить возникновение «тарабарщины» - множественных повторений различных слогов или слов, перебивающих друг друга, эффект лучше делать «концевым», выбирая для повторения только короткий завершающий фрагмент фразы или даже последний ударный слог слова. Попробуйте поэкспериментировать с различными словами и фразами, чтобы почувствовать, какую завершающую часть лучше использовать для «размножения» в каждом конкретном случае.

Спектральная обработка

Наиболее ярким и интересным эффектом из этого класса, реализованным в Cool Edit 2000, является изменение высоты и скорости. Всем известен эффект повышения или понижения высоты сигнала при изменении скорости протяжки ленты в магнитофоне или вращения пластинки. С развитием цифровых методов обработки сигналов стало возможным правдоподобно реализовать каждый из этих эффектов по отдельности - изменение высоты при сохранении временных характеристик либо наоборот.

Обработку этого типа в Cool Edit 2000 осуществляет операция Transform g Time/Pitch g Stretch . Возможно два варианта - с постоянным (constant) либо со скользящим (gliding) коэффициентом. Коэффициенты задаются полями Initial/Final Ratio, которые связаны также с движками для удобства изменения. Коэффициент может, кроме того, задаваться косвенно полем Transpose в виде количества музыкальных хроматических полутонов вверх (диез) или вниз (бемоль). В режиме изменения длительности наряду с этим доступно поле Length, в котором можно задать требуемую длину результирующего фрагмента.

Переключатель Precision задает точность обработки: низкую (Low), среднюю (Medium) и высокую (High) - это необходимо потому, что операция спектральной обработки требует множества вычислений и снижение точности позволяет добиться ускорения обработки - хотя бы на этапе экспериментов. Переключатель Stretching Mode задает вид обработки: Time Stretch - ускорение/замедление во времени, Pitch Shift - сдвиг по высоте, Resample - простая передискретизация, аналогичная изменению скорости ленты/пластинки.

Группа параметров Pitch and Time Settings управляет особенностями операции. Обработка выполняется путем разбиения фрагмента на маленькие звуковые блоки; параметр Splicing Frequency задает количество таких блоков в одной секунде фрагмента. Увеличение этой «частоты дискретизации» делает блоки более мелкими, повышая натуральность обработки, но одновременно усиливается и эффект дробления, порождая неприятные призвуки. Параметр Overlapping задает степень перекрытия соседних блоков при сборке результирующего сигнала - небольшое взаимное перекрытие позволяет сгладить призвуки от их стыковки. Пункт Choose appropriate defaults служит для автоматической установки этих параметров в наиболее подходящие, с точки зрения редактора, значения.

Эта статья завершает краткий цикл, посвященный записи и обработке звука на домашнем компьютере.

КомпьютерПресс 12"2002

Среди обывателей существует устойчивое мнение, что устройства обработки звука позволяют улучшить качество работы профессиональной системы звуковоспроизведения. Это правда… Однако, не стоит этот тезис экстраполировать на качество звука, который этой системой воспроизводится.

При применении любых устройств обработки звука, его качество, в принципе, может только ухудшаться. Дело в том, что они вовсе не решают проблему самого звука, а позволяют звукооператорам и звукорежиссерам нивелировать шероховатости исполнения вокалистов и музыкантов, устранить неточности в звучании музыкальных инструментов, скомпенсировать дефекты, вызванные неправильным выбором оборудования и мест его размещения, а также уменьшить влияние на воспроизведение акустических свойств помещений. Но если, например, вокалист хорошо владеет своим голосом и умеет пользоваться микрофоном, то компрессор ему ни к чему.

Изначально, процессы, связанные со специальным искажением воспроизводимого сигнала, использовались только в коммерческих звуковых системах, таких как системы телефонной, радио- или громкоговорящей связи. Сейчас они нашли широкое применение в музыке и используются для придания инструменту или голосу необычности либо ненатуральности звучания. Главным образом, это делается для того, чтобы удивить публику и усилить воздействие от прослушивания произведения.

С научной точки зрения, любое звукотехническое устройство – микрофон, усилитель мощности или акустические системы – это тоже устройства обработки звука. Во-первых, они не идеальны и изменяют амплитуду и фазу сигналов, во-вторых, эти изменения на разных частотах происходят по-разному, а в-третьих, нелинейные искажения в них приводят к появлению в них новых спектральных составляющих. Кстати, первым устройством обработки звука был динамик Leslie, который применялся вместе с электрическим органом Хаммонда в 30-40-е годы XX века и придавал ему «рычащее» звучание.

Параметры и классификация устройств обработки звука

Работа со звуком может осуществляться как в цифровом, так и в аналоговом виде, а то и вовсе без электроакустического преобразования. В связи с этим, необходимо определиться: а что подразумевается под устройством обработки звука?

Итак, мы будем рассматривать программно-аппаратные средства, работающие с электрическими сигналами звуковой частоты (как в аналоговой, так и в цифровой форме) в режиме реального времени. Прежде чем качественно оценить каждый из способов работы с ними, необходимо разобраться, как и с какой целью осуществляется обработка звуковых сигналов.

Все устройства обработки звука можно достаточно условно разделить на 3 группы:

  • устройства, не вносящие в сигнал дополнительных составляющих (аудиопроцессорные блоки);
  • устройства, вносящие в сигнал дополнительные составляющие (звуковые эффекты);
  • устройства, синтезирующие новые сигналы на основе характеристик исходного сигнала (вокодеры).

Аудиопроцессорные блоки

К ним относятся блоки задержки , эквалайзеры , кроссоверы и компрессоры .

Необходимость в блоках задержки появилась в 40-х годах XX века, когда в кино стал использоваться стереозвук. Как известно, человек воспринимает звук как совокупность сигналов, поступающих к каждому из ушей. Анализируя задержку поступающей к каждому уху звуковой волны, наш мозг с легкостью определяет местоположение источника звука.

С помощью блока задержки, используемого, например, в одном из каналов, можно имитировать изменение местоположения источника звука относительно слушателя. Разумеется, что при формировании пространственных эффектов, слушатель охотно вовлекается в звуковую картину. Вообще, задержка звука – естественное природное явление, связанное с тем, что скорость распространения звуковой волны относительно невысокая. Наверняка всем знаком эффект эха, возникающий при отражении волны от препятствия и преодоления ею обратного пути. Отличие эффекта, реализованного с помощью блока задержки, заключается в том, что «отраженный» сигнал ничем не отличается от исходного. В реальных условиях спектр сигнала при отражении существенно изменяется, так как различные его составляющие по-разному отражаются от препятствий.

Рис. 1. Пример распространения звука в помещении

В настоящее время блоки задержки широко используются в составе аудиопроцессоров. Они служат для выравнивания звукового поля в больших и сложных помещениях, в конференц-залах, а также для создания звуковых эффектов, таких как Echo, Delay, Reverberation и др. Время задержки может регулироваться – от единиц микросекунд до десятков секунд. Аналоговые линии задержки довольно сложны и сейчас не используются. Принцип действия цифровых блоков заключается в записи двоичного представления сигнала в память и последующем воспроизведении этой информации, но с задержкой, которая программно регулируется и устанавливается.

Эквалайзеры (от англ. equalize - выравнивать) появились достаточно давно, и их история развития неразрывно связана с развитием электрических фильтров. Они предназначены для выравнивания амплитудно-частотных характеристик электрических сигналов. Фильтрующие свойства электрических цепей к 30-м годам XX века уже широко использовались для компенсации потерь в каналах передачи сигналов. Первым, кто внедрил эквалайзер в звукоусилительную систему, был Джон Волкман. Прибор EQ-251A использовался в кино для коррекции звука и имел всего два ползунка и переключатель выбора частоты для каждого из них. Уже тогда применение эквалайзеров было необходимо, учитывая низкое качество звукозаписывающей и звуковоспроизводящей техники. После Второй мировой войны были разработаны многополосные эквалайзеры, использующие фильтры с высокой добротностью. В настоящее время эти устройства широко используются как в бытовых, так и профессиональных системах. Простейший, всем известный эквалайзер – регулятор тембра, который включает 2 фильтра: НЧ и ВЧ.



Рис 2. Регулировка амплитудно-частотных характеристик при использовании регулятора тембра

Принцип действия эквалайзера заключается в раздельной регулировке уровней составляющих сигнала на различных частотах. Звуковой сигнал имеет богатый спектр, который с помощью полосовых фильтров разделяется на составляющие. Это дает возможность выделить определенные частоты, составляющие основу звучания музыкального инструмента, либо убрать высокочастотные составляющие, такие как звук касания пальцем струны, сделать тембровую окраску мягче или, наоборот, жестче.



Рис. 3. Функциональная схема эквалайзера


Рис. 4. Регулировка амплитудно-частотной характеристики полосового фильтра

Необходимо помнить, что эквалайзер никогда не добавит в звучание то, чего нет в исходном сигнале, а значит, он не решит проблемы самого сигнала. Поэтому профессионалы предпочитают такие устройства не использовать или используют их с очень большой осторожностью. Небрежное обращение с эквалайзером приводит к неестественности звучания. Например, удаление из сигнала, снимаемого с гитары, низких частот, может улучшить качество записи при сведении его с другими партиями (низкие частоты хоть и не присущи гитаре, но присутствуют в спектре ее сигнала и могут маскировать другие инструменты, влияя на их звучание). Однако, даже незначительное приглушение высокочастотных составляющих (от 1 до 5 кГц) в том же сигнале, приведет к потере четкости и яркости игры, исчезнут детали. Визуально это выражается в сглаживании сигнала, а на слух воспринимается как тусклость и излишняя тонкость звучания. Непрофессиональный подход к эквализации вокальной партии может вызвать не только потерю выразительности и энергичности голоса, но даже изменение букв и окончаний.



Рис. 5. Сглаживание сигнала при применении эквалайзера с настройками в соответствии с рисунком 6


Рис. 6. Пример настройки графического эквалайзера



Рис. 7. Принцип действия параметрического эквалайзера

Различают графические и параметрические эквалайзеры. Графические отличаются большей наглядностью, пользователь с помощью многочисленных ползунков (регуляторов), каждый из которых соответствует фиксированной частоте полосового фильтра, определяет уровень усиления или ослабления сигнала в узкой полосе частот. Центральные частоты фильтров в графических эквалайзерах обычно устанавливаются по октавам. Для выбора центральных частот, кстати, имеется стандарт ISO. При достаточно большом количестве полос на панели управления эквалайзера вполне отчетливо вырисовывается график его амлитудно-частотной характеристики. Поэтому такие эквалайзеры и называются графическими. Их недостаток заключается в том, что пользователь не имеет возможности самостоятельно настраивать полосовые фильтры, т.е. устанавливать их центральные частоты и добротность.

Параметрический эквалайзер позволяет регулировать параметры полосовых фильтров: центральную частоту, добротность (полоса пропускания) и собственно усиление (ослабление). Они просто незаменимы, когда надо вырезать узкий участок спектра сигнала, на котором, например, из-за акустической обратной связи, система звуковоспроизведения начинает возбуждаться. Каждый из нас наверняка слышал характерный свист из акустических систем при поднесении к ним микрофона. Параметрические эквалайзеры сложнее в настройке и несколько дороже. Количество полос в них, как правило, намного меньше, чем в графических.

В настоящее время используются графические и параметрические эквалайзеры, причем как цифровые, так аналоговые и гибридные. Эти устройства могут выполняться как в виде отдельных блоков, так и быть встраиваемыми в микшеры, предварительные усилители, программное обеспечение для работы со звуком.

Например, компания Inter-M широко применяет графические эквалайзеры в трансляционном и профессиональном звуковом оборудовании (IMX-416, PP-9213, PP-9214, PAM-510, PCT-620 и многих других), а также производит эквалайзеры в виде отдельных блоков EQ-2215 (графический, 2 канала, 15 полос), EQ-2131 (графический, 1 канал, 31 полоса), EQ-2231 (графический, 2 канала, 31 полоса) и MEQ-2000 (цифровой смешанного типа, 31 полоса + 8 полосовых фильтров).


Рис. 8. Двухканальный эквалайзер EQ-2215 Inter-M


Рис. 9. Эквалайзер смешанного типа MEQ-2000 Inter-M

Кроссовер предназначен для разделения сигнала на несколько спектральных составляющих. Устройство применяется для построения систем звукоусиления, раздельного по полосам частот. При этом для воспроизведения каждого выделенного кроссовером частотного диапазона (”сверхнизкие частоты”, "низкие частоты", "средние частоты", "высокие частоты") применяется отдельный канал усиления. Для построения систем большой мощности, применение принципа раздельного усиления по частотам является практически единственным решением, обеспечивающим высокое качество звука. История кроссоверов неразрывно связана с историей развития акустических систем. Когда стало очевидно, что с помощью одного электродинамического излучателя невозможно воспроизвести весь спектр звукового сигнала, появилась необходимость в фильтрах, разделяющих энергию между НЧ, СЧ и ВЧ излучателями. Первым кроссовером можно считать обычный пассивный разделительный фильтр.

Различают активные и пассивные кроссоверы. Пассивные отличаются тем, что в них все параметры разделения фиксированы и не могут изменяться пользователем. Активные кроссоверы выполняются или в виде отдельных блоков, или являются частью аудиопроцессорного модуля.



Рис. 10. Кроссовер DIV-9123 Inter-M

В линейке профессионального оборудования Inter-M кроссоверы представлены 19” блоком DIV-9123, который может работать в режиме «стерео» (разделение на 2 полосы в каждом канале + бас) и в режиме «моно» (разделение на 3 полосы + бас). К основным параметрам, регулируемым с помощью активного кроссовера относятся:

  • частота разделения (частота среза фильтра) для каждой полосы;
  • крутизна среза фильтров.


Рис. 11. Разделение полос при использовании кроссовера

Частота разделения для подключения сабвуфера обычно устанавливается в диапазоне от 60 до 250 Гц, а для разделения на средние и высокие – в диапазоне от 80 до 8000 Гц. Крутизна среза характеристик фильтров в зависимости от качества кроссовера составляет от 6 до 72 дБ на октаву. Типовое значение составляет 18-24 дБ на октаву, что соответствует третьему-четвертому порядку чувствительности. Например, DIV-9123 имеет крутизну среза не менее 24 дБ на октаву. Нередко кроссоверы оснащаются дополнительным отключаемым фильтром высоких частот с частотой среза 30 Гц, который позволяет защитить акустические системы от воздействия ультранизких частот.

Компрессор предназначен для сжатия (англ. compress) динамического диапазона сигнала. Иными словами, он уменьшает разницу между самыми громкими и самыми тихими звуками. В недавнем прошлом функции компрессора выполнял звукооператор, предугадывая изменения громкости, например, вокалиста и регулируя, соответствующим образом, громкость воспроизведения. История компрессоров началась во время Второй мировой войны. Тогда, из-за резких скачков уровня громкости в передаваемом сигнале, часто выходили из строя радиостанции. С тех пор компрессор используется практически во всех радиостанциях, в том числе и в широковещательных. Кроме того, устройство нашло применение в звуковых системах. Работа компрессоров помогает повысить разборчивость речи при работе с микрофонами, увеличить цифровое разрешение, а значит, и отношения сигнал/шум, придать «плотность» звучания голосу и инструментам. Результат обработки звука компрессором едва различим на слух. Но при правильной работе с ним тусклый звук можно сделать более острым и насыщенным, голос сделать более жестким, придать ему нехарактерные для исполнителя черты, а дешевые музыкальные инструменты выставить в более выгодном свете. Однако, из-за недостатка квалификации, звук можно непоправимо испортить.

Разновидностей компрессоров, как и других блоков обработки звука, великое множество – цифровые и аналоговые, аппаратные и программные, ручные и автоматические, оптико-электронные, ламповые, транзисторные и т.д.

Любой компрессор имеет 5 основных параметров:

В большинстве современных компрессоров предусмотрены дополнительные режимы, настройки и функции:

Компрессоры также могут быть частотно-зависимыми или многополосными. Многополосный компрессор, по сути, объединяет в себе кроссовер и многоканальный компрессор. Обработка сигнала осуществляется отдельно для различных частотных составляющих, что бывает полезно при сведении музыкальной композиции. Частотно-зависимый компрессор подвергает сигнал обработке только в заданном узком диапазоне частот. Частным случаем частотно-зависимого компрессора является de-esser.

В настоящее время в чистом виде компрессор не используется, он дополняется множеством перечисленных функций, связанных с динамической обработкой сигнала. Например, CN-9102 Inter-M, кроме функций 2-х канального компрессора, выполняет функции лимитера (limiter) и шумоподавителя (noise gate).



Рис. 15. Компрессор CN-9102 Inter-M

Лимитер является частным случаем компрессора с установленной степенью компрессии ∞:1.

Шумоподавитель используется для создания комфортных пауз между сигналами. Он также закрывает вход при падении уровня сигнала ниже порогового значения, которое устанавливается вручную или автоматически исходя из отношения сигнал/шум.

При установке слишком высокого порога noise gate threshold сигнал может существенно потерять информативность, что выражается в уменьшении продолжительности, обрывистости звучания.

Среди других устройств динамической обработки звука можно выделить повышающий компрессор и экспандер. Повышающий компрессор, в отличие от рассмотренного выше, усиливает сигнал при падении его уровня ниже установленного порогового уровня. Экспандер – это устройство, расширяющее динамический диапазон сигнала, то есть противоположное компрессору. Экспандер позволяет улучшить макродинамику произведения, придать живости некоторым инструментам, а также в ряде случаев, исправить перекомпрессию сигнала.

Звуковые эффекты

Устройства, реализующие звуковые эффекты, искажают исходный сигнал, привнося в него что-то новое. Прежде чем рассматривать такие устройства, стоит отметить, что оригинальность звучания музыкальных инструментов, появившихся в XX веке, достигалась не только за счёт мастерства, интересных находок со стороны исполнителей, а в большей степени за счет технических ухищрений. Звуковые эффекты подарили нам множество новых направлений в музыке, современная музыка, театр и кино сегодня без них просто немыслимы. С их помощью можно привнести интригу, изменить характер звучания до неузнаваемости, имитировать объем, движение и многое другое…

Поскольку звуковой сигнал можно характеризовать амплитудой, частотой, начальной фазой и временем его возникновения, то и звуковые эффекты можно разделить на процессы, искажающие амплитуду, частоту, фазу, время или несколько этих характеристик одновременно. Амплитудные преобразования реализуют такие эффекты как, например, distortion , over drive , fuzz , амплитудное vibrato и tremolo , panning , ADSR и др. К эффектам задержки относятся reverberation , delay , echo , flanger , chorus . К эффектам, искажающим фазу, например, относится phaser . Частотные преобразования реализует одна из разновидностей эффекта vibrato , а также эффект pitch .

Эффект delay , как уже упоминалось, связан с задержкой сигнала и последующего сложения его с исходным звуковым сигналом. Сам по себе delay используется редко, так как звук при этом получается неестественным. В основном данный эффект характеризуется временем задержки и соотношением амплитуд исходного сигнала и его копии. Если установить время задержки более 60-100 мс, то человеческое ухо будет воспринимать задержанную копию сигнала как отдельный сигнал, то есть, как эхо. Звуки перестанут сливаться, и покажутся отражениями от удаленных преград.

Эффект Echo характеризуется не только увеличенным до 100 мс и более временем задержки, но и изменением спектра сигнала. Это связано с тем, что в природе различные частотные составляющие звукового сигнала, отражаясь от преград, имеют различную степень затухания. Как известно, лучше всего отражаются низкочастотные составляющие.


Рис. 16. Спектр звукового сигнала при реверберации


Рис. 17. Акустическая комната для имитации реверберационных свойств помещений

Reverberation (англ. – повторение, отражение) в настоящее время относится к наиболее популярным звуковым эффектам. Реверберация – природное явление, и, как многие другие природные явления, широко используется человеком в его деятельности. Суть эффекта заключается в том, что исходный звуковой сигнал смешивается со своими копиями, задержанными относительно него на различные интервалы времени. Отличие от Delay состоит в том, что, во-первых, при реверберации количество копий сигнала значительно больше; во-вторых, с увеличением времени задержки сигнала, его амплитуда уменьшается; в-третьих, относительное время задержки нельзя установить большим.

Эффект Reverberation позволяет имитировать геометрию помещения, покрытие его стен, пола и потолка. С его помощью можно обеспечить иллюзию, превратив маленькую, заглушенную на сто процентов, комнату звукозаписи в огромный кафедральный собор или туннель. У слушателя возникает ощущение объемного гулкого помещения. Тембр музыкальных инструментов обогащается, голос приобретает напевность, а некоторые его недостатки удачно маскируются.

Для сравнения реверберационных свойств помещений было введен термин – время реверберации. Данное понятие можно сформулировать так: это время, за которое уровень воспроизводимого импульсного сигнала уменьшается на 60 дБ.

История устройств, реализующих эффект reverberation, началась с появлением эхо-камер. Позже использовались стальные листы, колебания в которых вызывались электромагнитным приводом. Реверберация получалась не трехмерная, а плоская, а сам сигнал имел характерный металлический призвук. В середине 60-х годов для получения эффекта реверберации стали применять пружинные ревербераторы (преимущественно в гитарных усилителях). С помощью электромагнитного преобразователя, соединенного с одним из концов пружины, возбуждались механические колебания, которые с задержкой достигали другого конца пружины, связанного с датчиком. Эффект повторения звука был обусловлен многократным отражением волн механических колебаний от концов пружины. Качество звука в пружинном ревербераторе было чрезвычайно низким. Пружина воспринимала любые колебания воздуха и пола. Кроме того, звук имел ярко выраженную "металлическую" окраску, а время реверберации не регулировалось. Позже на смену пружинным пришли магнитофонные ревербераторы. Механизм формирования эхо-сигнала в них был довольно прост: исходный сигнал записывался на ленту записывающей магнитной головкой, а затем считывался воспроизводящей магнитной головкой (через время, необходимое для перемещения ленты) и через цепь обратной связи вновь подавался на запись. В цепи обратной связи сигнал уменьшался по амплитуде, что обеспечивало постепенное затухание звука при реверберации. Недостаток магнитофонного ревербератора заключался в том, что при существовавших скоростях протяжки ленты удавалось получить только эффект эха. Для получения собственно реверберации требовалось либо еще сильнее сблизить магнитные головки (чего не позволяла сделать их конструкция), либо значительно увеличить скорость движения ленты.

С развитием цифровой техники и появлением интегральных микросхем появилась возможность реализовать высококачественные цифровые ревербераторы. В таких устройствах время задержки практически не ограничено, что позволяет на их основе реализовывать все эффекты, связанные с задержкой сигнала. В любом современном цифровом ревербераторе можно выбрать несколько программ, имитирующих как реальные, так и фантастические условия воспроизведения. Они реализуют различные математические модели, имеют различные настройки и параметры. Поэтому, чаще всего, производители создают ряд предустановок, позволяющих воссоздать объемные характеристики неких стандартных помещений. Это помогает звукооператорам быстро освоить новое устройство или программу.

Эффект Flanger можно услышать, например, на остановке общественного транспорта, слушая звук проезжающего мимо автомобиля. Всем известен эффект повышения тона гудка приближающегося поезда, который нам объясняли на уроках физики в школе (эффект Доплера). Естественно, это свойство можно использовать и в музыке. Механизм его реализации был совершенно случайно открыт в 1958 году звукорежиссером Филом Спектором. Он пытался «удвоить» голос, воспроизводя его на двух магнитофонах одновременно, и задел обод катушки с лентой. В результате получился эффект временной модуляции, который Фил назвал flanger (англ. – обод катушки).

Как уже говорилось, эффект delay имитирует неодновременное восприятие человеком звуковых сигналов. В реальности это вызвано различными путями распространения звука от источника к приемнику. При условии неподвижности относительно друг друга источника и приемника звука, а также предметов, от которых он отражается, частота колебания не изменяется, каким бы путем она не достигала наших ушей. Но в реальной жизни это условие редко выполнимо. Если какой-либо из трех элементов подвижен, то частота принимаемого звука не может оставаться той же, что и частота звука переданного. Это и есть проявление эффекта Доплера. Итак, реальные звуки при распространении претерпевают не только расщепление на несколько звуковых волн и различную для каждой из них задержку, но и неодинаковое изменение частот для разных спектральных составляющих. Flanger имитирует проявление взаимного перемещения трех упомянутых элементов: источника, приемника и отражателя звука. По сути, эффект представляет собой echo c изменяемым по определенному закону временем задержки. Поскольку время задержки при использовании flanger составляет 1 – 25 мс, то мы не воспринимаем исходный и задержанный сигнал раздельно.


Рис. 18. Функциональная схема блока реализующего эффект Flanger

В прошлом, чтобы получить эффект Flanger, вместо одной инженеры использовали несколько акустических систем, размещенных на различных расстояниях от слушателей. В определенные моменты производили поочередное подключение источника сигнала к акустическим системам таким образом, что создавалась иллюзия приближения или удаления источника звука.

Эффект Chorus (англ. – хор) превращает звучание одного инструмента или голоса в целый хор. Хоровое пение и одновременное звучание нескольких музыкальных инструментов украшает музыкальное произведение. В электронной музыке создание одинаковых сигналов не представляет сложности. Но, если их сложить вместе, то звучание будет слишком правильным, но безжизненным и тусклым. Дело в том, что хотя исполнители, при работе в оркестре, и стараются играть одинаково, но из-за индивидуальных особенностей источников, звук все равно получается разным. В пространстве, тракте звукоусиления и в слуховом аппарате человека, эти немного неодинаковые колебания взаимодействуют, образуя, так называемые, биения. За счет биений спектр звука обогащается. Считается, что предельным случаем chorus является унисон – одновременное звучание, слегка отличающихся по частоте, двух источников. Именно унисон лежит в основе звучания двенадцатиструнной гитары и аккордеона. В аккордеоне, например, звук каждой ноты генерируется узлом, которые содержат два язычка, специально настроенных с небольшой (в единицы герц) разницей в частотах. В двенадцатиструнной гитаре звук извлекается одновременно из пары струн, настроенных в октаву. Разница в частотах образуется естественным путем, из-за невозможности идеально одинаково настроить струны инструмента. Ничтожная разница в частотах голосов певцов или инструментов и служит причиной красивого звучания.

По сути, все алгоритмы реализации эффекта chorus сводятся к тому, что копии сигнала с небольшой задержкой складывается с исходным сигналом. Но, в отличие от механизма реализации эффекта echo, спектр каждой копии сигнала незначительно сдвигается по частоте, т.е. подвергается частотной модуляции. Частотные сдвиги и время задержки для каждой из копий сигнала могут изменяться во времени, что обеспечивает непрерывное изменение спектра. При этом период полного цикла этих изменений обычно настолько велик, что повторяемость свойств сигнала не ощущается. В настоящее время Chorus стал одним из эффектов, имеющихся практически в каждом синтезаторе и многих звуковых картах. Он имеет множество разновидностей. Необходимо отметить, что чрезмерное употребление данного эффекта может привести к ухудшению разборчивости звучания голоса и к "засорению" музыкального произведения.


Рис. 19. Принцип действия эффекта ADSR

К амплитудным преобразованиям, в принципе, относится такой процесс как усиление, при котором амплитуда сигнала увеличивается или уменьшается пропорционально некоторой постоянной величине. Если задаться целью, изменить коэффициент усиления или ослабления сигнала по определенному закону, то мы в итоге получим такие звуковые эффекты как, например, ADSR (A ttack, D ecay, S ustain, R elease). Данный эффект широко используется в синтезаторах и позволяет с помощью 4-х параметров описать функцию, по которой изменяется амплитуда воспроизводимого сигнала.

Это обеспечивает схожесть электронного музыкального инструмента с реальным, например, такого как синтезатор. Если орган звучит ровно, пока нажата клавиша, то звук, издаваемый гитарой, имеет максимальную громкость только в момент удара по струне, после чего он плавно затухает. Необходимо отметить, что ADSR является самым примитивным способом описания огибающей сигнала – современные синтезаторы гораздо сложнее. Эффект может применяться не только в отношении каждой ноты, но и в отношении некоторых участков музыкального произведения. В этом случае его принято называть Envelope . С помощью такого преобразования, сигнал, записанный с равномерной громкостью (интенсивностью) на всей его протяженности, можно сделать медленно нарастающим вначале и медленно спадающим в конце. В стереосистемах, изменением уровня громкости составляющих одного и того же сигнала в разных каналах, можно добиться эффекта перемещения источника звука по стереопанораме. Это реализуется с помощью таких эффектов, как Panning / Ping-pong .


Рис. 20. Амплитудная модуляция лежит в основе эффекта амплитудного Vibrato

Сущность амплитудного vibrato состоит в периодическом изменении уровня громкости звукового сигнала. Частота, с которой происходит изменение амплитуды, выбирается в диапазоне от долей герца до 10 Гц. При выходе за эти рамки необходимый эстетический эффект не достигается. По сравнению с тембром исходного сигнала, тембр сигнала с амплитудным вибрато богаче, и его широко используют, например, при пении. Степень проявления эффекта характеризуется глубиной вибрато: n = Sv/Si, где Sv – максимальное изменение амплитуды сигнала с вибрато, Si – амплитуда исходного сигнала. Глубина вибрато может устанавливаться от 0 до 1.

Особой разновидностью амплитудного вибрато является tremolo , отличительной чертой которого являются относительно высокая частота вибрации (10–12 Гц), глубина вибрато n = 1 и импульсная форма результирующего сигнала. Тремоло, например, является основным приемом игры на мандолине. Амплитудное vibrato и его частный случай tremolo используют достаточно редко, особенно для обработки вокала.

Такие эффекты, как Over drive , Distortion и Fuzz реализуются за счет нелинейных искажений, возникающих при перегрузке усилителя. Их история началась в середине прошлого века, когда тембру электрогитары стали уделять большее внимание. В конце пятидесятых годов, например, широко применяли пружинные ревербераторы, встроенные в комбо-усилители. Для большой громкости гитарные усилители нередко перегружались как по входу, так и по выходу.

При перегрузке по входу, то есть при подаче на вход усилителя сигнала слишком большого уровня, синусоидальная волна обрезается, и результирующей формой волны становится уже не синусоида, а квазитрапеция, имеющая иной характер звучания. Аккорды при этом звучат очень грязно, с хрипом и ревом, так как образующиеся в результате интермодуляции комбинационные частоты затрудняют интонационную разборчивость нот, составляющих аккорд. Отдельные мелодические ноты мало напоминают тембр гитары – но, удивительное дело, этот звук понравился и музыкантам, и публике.



Рис. 21. Нелинейные искажения при перегрузке усилителя по входу

Over Drive, Distortion и Fuzz реализуются с помощью лимитеров и отличаются только степенью вносимого искажения. Например, Over drive (англ. – перегрузка) используется для искажения только самых громких звуков. Когда гитарист начинает играть громче, сигнал попадает в область действия лимитера и верхушка сигнала обрезается. В результате, инструмент приобретает очень интересный характер, такой эффект украшает его звучание, как легкая хрипота украшает голос вокалиста. Distortion (англ. – искажение) и Fuzz искажают сигнал в значительно большей степени, приближая его форму к прямоугольной. Звук зачастую получается слишком грязный, поэтому используются дополнительные фильтры (эквалайзер) для сглаживания «острых углов» в звучании.

Эффект Phaser , как это следует из названия, реализуется за счет изменения мгновенного значения фазы сигнала. В принципе, этот эффект очень похож на Flanger и достигается таким же способом. Иногда его даже относят к группе звуковых эффектов задержки сигнала. Отличие заключается в том, что при времени задержки, сопоставимом с периодом колебания, что характерно для Phaser, принято говорить собственно не о временной задержке, а о фазовых сдвигах. И Flanger и Phaser имитируют проявления перемещения источника, приемника или отражателя звука. Чтобы понять их различия можно представить последствия применения этих эффектов. Образно говоря, если бы певец летел к слушателю в зале со скоростью поезда, то получился бы Flanger, а если бы слушатель часто-часто вертел головой из стороны в сторону, то получился бы Phaser. По своей сути Phaser – это эффект с применением фазового вибрато.

Кроме амплитудного и фазового существует частотное и тембровое vibrato. Суть частотного vibrato заключается в периодическом изменении частоты звукового колебания. Этот эффект использовался в музыке задолго до появления электронных музыкальных инструментов и реализовывался, кстати, более простыми способами. Например, скрипка в умелых руках потому и звучит так прекрасно, что едва заметными движениями пальцев вдоль грифа скрипач создает частотное вибрато. На электрогитаре этот эффект реализуется с помощью специального механизма: подвижной подставки для крепления струн и рычага. Реализация частотного вибрато в электронных инструментах и синтезаторах достаточно проста. В радиотехнике этот процесс называется частотной модуляцией. Если изменение частоты производится по периодическому закону, то в результате получается частотное вибрато. При этом спектр сигнала расширяется, тембр перестает быть постоянным и периодически изменяется во времени. Необходимо отметить, что эффект имеет эстетическую ценность только в том случае, если глубина частотного вибрато (относительное изменение частоты звука) невелика. В противном случае создается впечатление, что инструмент расстроен. Частотное вибрато используется само по себе, а также является составной частью в более сложных звуковых эффектах.


Рис. 22. Частотная модуляция лежит в основе эффекта частотного Vibrato

Сущность эффекта тембрового vibrato состоит в том, что исходный сигнал пропускается через полосовой фильтр, у которого периодически изменяется либо центральная частота, либо полоса пропускания, либо оба параметра вместе. При этом фильтр выделяет из всего спектра исходного сигнала только те частотные составляющие, которые попадают в "мгновенную" полосу его пропускания. Так как полоса пропускания "дышит" по ширине и "гуляет" по частоте, то тембр сигнала периодически изменяется. Тембровое вибрато может быть не только автоматическим, но и ручным. Вариант ручного тембрового вибрато известен под названием Wah-Wah. Тембровое вибрато звучит необычайно красиво, но для этого необходимо синхронизировать период изменения настроек полосового фильтра со скоростью игры.

Преобразования, связанные с перемещением спектра сигнала вверх или вниз по частоте, реализует такой эффект, как Pitch. При этом к исходному сигналу добавляется его копия, сдвинутая по частоте на определенное значение, обычно в пределах двух октав. Частным случаем Pitch является Octaver. При его использовании копия сигнала имеет частоту в два раза большую или меньшую частоты исходного сигнала. Иначе говоря, исходный сигнал и его копия составляют музыкальный интервал, именуемый октавой.

Звуковые эффекты в настоящее время реализуются как с помощью ПК, так и в виде отдельных программно-аппаратных комплексов. Они в огромном количестве присутствуют в каждом приложении для обработки звука, для сведения музыкальных композиций, таких как Cubase, Sound Forge, Vegas, Ableton и др. Из-за сложности алгоритмов реализации некоторые эффекты вызывают задержку сигнала, что затрудняет их использование в режиме реального времени. Процессорами звуковых эффектов оснащаются музыкальные центры, инструментальные усилители (особенно гитарные) и др. Среди производителей кроме именитых вендоров Ibanez, Marshall, Fender, Pioneer ежегодно появляется множество новых компаний. Каждый производитель реализует эффекты по своему, что несколько затрудняет их использование. С другой стороны любой специалист может подобрать устройство на свой вкус.

Вокодеры

Вокодер (англ. voice coder речевой кодер) был разработан для экономии частотных ресурсов в цифровой радиосвязи. При его использовании в канале связи транслируется не сам сигнал, а способ его синтеза. В результате удается очень существенно сжимать поток данных. Принцип его работы схож собственно с физическим принципом формирования речевого сигнала. Первым таким устройством был параметрический вокодер Дадли. При кодировании на каждом интервале времени (фрейм 20-30 мс) анализируется характеристика речи - "звонкая-глухая". В случае звонкой речи, определяется частота основного тона, а также параметры фильтра, образуемого голосовыми связками и ротовой полостью. Эти параметры вместе с общей оценкой громкости передаются в канале связи. Декодер по полученным параметрам восстанавливает речь – фильтры при воспроизведении гласных возбуждаются импульсами соответствующей величины, следующими с интервалами основного тона, а при воспроизведении глухих звуков – шумом. В результате спектр полученного звука похож на спектр исходной речи. Подобное кодирование обеспечивает высокую разборчивость речи и низкую скорость потока данных (до 2,4 кбит/с).

Естественно, о качестве вокодерной речи строго судить не следует. Резкие изменения спектральных параметров на границах интервалов, грубые переходы между глухими и звонкими звуками, неточная передача основного тона, а также неспособность воспроизводить частично приглушенные звуки и другие "свойства" значительно снизили возможности узнавания голоса и придавали речи неестественный характер. Чтобы повысить качество, низкочастотную часть спектра решили передавать обычным путем, без параметрического кодирования. Такие устройства назвали полувокодерами. Благодаря неискаженной передаче основного тона, достигалось более естественное звучание и качество речи.

Вокодер как многие другие способы обработки звука был заимствован из телефонии музыкантами и впоследствии стал полноценным устройством. Благодаря фирмам-изготовителям музыкального оборудования, ему придали форму и удобство музыкального эффекта. Вокодер как музыкальный эффект позволяет перенести свойства одного (модулирующего) сигнала на другой сигнал, который называют носителем. В качестве сигнала-модулятора используется голос человека, а в качестве носителя – сигнал, формируемый музыкальным синтезатором или другим музыкальным инструментом. Так достигается эффект «говорящего» или «поющего» инструмента. Помимо голоса модулирующий сигнал может быть и гитарой, клавишными, барабанами и вообще любым звуком. Здесь так же нет ограничений и для несущего сигнала. Экспериментируя с моделирующим и несущим сигналом можно получать совершенно разные эффекты – говорящая гитара, барабаны со звуком пианино, гитара звучащая как ксилофон и т.д.

Заключение

Научиться правильно использовать блоки обработки звука довольно сложно. Многие согласятся с тем, что, например, для художественной обработки звука, нужен, прежде всего, талант. Звукооператор и звукорежиссер – это профессия, а значит, работа со звуком – дело настоящих профессионалов. Поэтому мы не ставили перед собой цели – научить кого бы то ни было пользоваться перечисленными устройствами. Обработка звука – это творчество. Каждый мастер самостоятельно, основываясь на собственном опыте, решает поставленные задачи. Свой опыт всегда лучше. Поэтому, вместо того, чтобы давать советы по использованию оборудования, мы, прежде всего, решили познакомить читателя с физикой процессов, которые они реализуют, найти их природные естественные аналоги, перечислить их возможности. Это поможет начинающим звукооператорам заранее представлять – как изменится звук, если они повернут какую-либо ручку на устройстве обработки звука.


ВНИМАНИЕ! Данная статья подготовлена специалистами Группы компании «АРСТЕЛ» и является интеллектуальной собственностью «АРСТЕЛ». Любые публикации данной статьи, а равно ссылки на нее возможны только с разрешения правообладателя.

Кроме того, к цифровым фонограммам применяются различные математические методы, например, интерполяция отсчетов (Repair) или их пропорциональная коррекция (Normalize).

Спектральные преобразования воздействуют на тембр звука. К ним относятся различные фильтры: high pass, low pass или band pass (полосовой) и эквалайзеры - параметрические или графические.
Важным частным случаем спектральных преобразований являются формантные преобразования - манипуляции с формантами - характерными полосами частот, встречающимися в звуках, произносимых человеком. Изменяя параметры формант, можно подчеркивать или затушевывать отдельные звуки, менять одну гласную на другую, сдвигать регистр голоса и т.п.

Эффекты задержки основаны на временнóй задержке одной копии сигнала относительно другой. Такие эффекты могут создавать иллюзию пространства или помещения, как реверберация, эхо и т.п., иллюзию множественности источников звука (хорус) или иллюзию движения (фейзеры, фленжеры).

Модуляция параметров сигнала . В таких эффектах, как, например, фейзер, фаза сигнала модулируется низкочастотным колебанием (с частотой значительно ниже минимальной звуковой частоты 20 Гц). С помощью модуляции амплитуды реализуется эффект тремоло, а с помощью модуляции частоты - вибрато.

Звуковые редакторы

К этому типу программ относят ПО, позволяющее редактировать и генерировать аудиоданные. Звуковой редактор может быть реализован полностью или частично в виде библиотеки, приложения, веб-приложения или модуля расширения ядра ОС.

Программа типа Wave Editor это цифровой звуковой редактор, который обычно предназначен для записи и редактирования музыки, наложения эффектов и фильтров, назначения стереоканалов и т.п.

Digital Audio Workstation (DAW) это программа с более широкими возможностями, которая обычно состоит из множества компонентов, объединенных единым графическим интерфейсом. Практическим и самым очевидным отличительным признаком DAW является наличие полнофункционального MIDI-секвенсора. Во многих DAW имеются также инструменты видеомонтажа, предназначенные для создания музыкального видео.

Звуковые редакторы, предназначенные для работы с музыкой, как правило, позволяют пользователю:

  • импортировать и экспортировать аудиофайлы различных форматов,
  • записывать звук с одного или больше входов, и сохранять его в памяти компьютера в цифровом виде,
  • производить монтаж фонограмм на временной шкале (timeline) с применением переходов (fade in, fade out, crossfading),
  • смешивать несколько источников звука/треков с различными уровнями громкости, панорамы и т.п., и направлять на один или больше выходных каналов,
  • применять различные эффекты и фильтры, включая компрессию, экспансию, различные виды модуляции, реверберацию, подавление шума, эквализацию и т.д.
  • воспроизводить звук, направляя его на выходные устройства, такие как динамики, внешние процессоры или записывающие устройства,
  • конвертировать звук из одних аудиоформатов в другие и менять характеристики аналого-цифрового преобразования (разрядность и частоту дискретизации)

«Деструктивное» и «недеструктивное» редактирование

Звуковые редакторы позволяют осуществлять как «недеструктивное редактирование» в режиме реального времени, так и «деструктивное», т.е. как отдельный процесс преобразования, не связанный с воспроизведением или экспортом фонограммы, а также совмещать оба эти типа.

Деструктивное редактирование изменяет исходный аудиофайл, а недеструктивное лишь изменяет параметры его воспроизведения. Например, если в процессе деструктивного редактирования удалена часть трека, эти данные действительно удаляются. Если же используется недеструктивное или real-time редактирование, удаленные данные остаются, но не воспроизводятся.

Преимущества деструктивного редактирования:

  • В графическом редакторе все сделанные изменения можно наблюдать визуально.
  • Количество эффектов, которые могут быть применены, практически неограниченно (или ограничено только дисковым пространством, выделенным для History).
  • Редактирование обычно точное, в масштабе до отдельного сэмпла.
  • Эффекты могут применяться к строго определенному региону - с точностью до сэмпла.
  • Микширование и экспорт отредактированного звука происходит быстро, так как при этом не требуется расчета примененных эффектов.

Ограничения деструктивного редактирования:

  • После применения эффект нельзя изменить. Правда, есть возможность «отменить» последнее выполненное действие. Обычно редактор поддерживает множество уровней «истории отмены», так что несколько действий могут быть отменены в порядке, обратном тому, в котором они были применены.
  • Порядок отмены нельзя изменить (сначала отменяется последнее редактирование и т.д.).

Преимущества real-time редактирования (в реальном времени):

  • Эффекты обычно можно настраивать во время воспроизведения или в любое другое.
  • Редактирование может быть отменено или скорректировано в любой момент в любом порядке.
  • Несколько эффектов могут быть применены последовательно, при этом их последовательность может быть изменена, эффекты могут быть удалены из цепочки или добавлены.
  • Многие редакторы поддерживают автоматизацию эффекта, т.е. автоматическое изменения его параметров во время воспроизведения.

Ограничения real-time редактирования:

  • Форма сигнала, отображающаяся на Timeline остается прежней, примененные эффекты не влияют на нее.
  • Количество эффектов, которые могут быть применены, ограничено мощностью компьютера или устройства. В некоторых редакторах есть функция «замораживания» дорожки (разрушение стека эффектов).
  • Как правило, эффект не может быть применен только к части дорожки. Чтобы применить real-time эффект к части трека, эффект включается в одной точке и выключается в другой.
  • В многодорожечных редакторах, если аудио копируется или перемещается с одной дорожки на другую, звук на новом треке может отличаться от того, как он звучал на исходном треке, так как к каждому треку могут быть применены различные эффекты реального времени.
  • Микширование и экспорт происходит медленно, так как требуется дополнительно рассчитывать примененные эффекты реального времени.