Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 2142.pdf
Скачиваний:
74
Добавлен:
30.04.2022
Размер:
7.5 Mб
Скачать

2.4.3. Тембр

Высота звука характеризуется частотой, а его качество, индивидуальная окраска, узнаваемость — тембром. Тембр звука — это субъективная характеристика звука, позволяющая по его индивидуальной специфической окраске отличить конкретный звук от других звуков с той же высотой тона и громкостью. Тембровая окраска звука определяется его спектром, который содержит кроме основного тона ряд гармоник (обертонов) с частотами кратными частоте основного тона. Количество обертонов, их частоты и соотношение амплитуд, в основном, и определяют тембр звука. Немаловажным фактором является также скорость нарастания фронта сигнала и время его затухания, при этом различные гармонические составляющие имеют разное время нарастания фронта и затухания. Эти факторы тоже влияют на тембровую окраску звука и способствуют узнаваемости инструментов.

2.4.4. Восприятие по времени и фазе, нелинейность слуха

Еще до второй половины двадцатого века считалось, что человеческий слух не воспринимает фазовый сдвиг между частотными составляющими звукового сигнала. Это объяснялось тем, что слуховой анализатор не обладает механизмом реагирования на фазу колебаний. Тем не менее, фазовый сдвиг может быть воспринят, когда он преобразуется в задержку по времени, небольшие сдвиги по фазе могут быть замечены из-за нелинейности слуха.

Нелинейность слуха — это субъективное восприятие гармоник, отсутствующих в звуковом сигнале при высоких, порядка 100 дБ, уровнях интенсивности звука. Существенно, что интенсивность этих субъективных гармоник может превысить интенсивность основного тона, что позволяет воспринимать нижние частоты. По всей видимости, частоты ниже 100 Гц воспринимаются не непосредственно, а опосредованно из-за создаваемых ими более высоких гармоник, или из-за нелинейности слуха. Нелинейность слуха может быть связана с нелинейными явлениями в слуховом анализаторе из-за завихрений воздуха в нем. Если составляющие сигнала складывается со сдвигом фаз, приводящему к увеличению результирующей амплитуды, то из-за нелинейности слуха амплитуды субъективных гармоник также возрастают по сравнению с гармониками, воспринимаемыми при другом сдвиге фаз. Таким образом, фиксируется разница в их звучании.

При прекращении действия раздражающей силы происходит релаксация слухового ощущения, которое не исчезает мгновенно, а уменьшается до нуля за определ нное время. Такое явление называется слуховым впечатлением, а интервал времени, за который слуховое ощущение по уровню громкости уменьшается на 8,7 фон, называется постоянной времени слуха. Эта постоянная может зависеть от многих факторов, в первую очередь от характеристик звука, и составляет 145–190 мс. В случае прослушивания одним ухом, когда к нему

26

приходят два совершенно одинаковых звуковых импульса, сдвинутых во времени, то если время сдвига (запаздывания) превышает 50 мс, то они будут восприняты отдельно, если меньше 50 мс — слитно. С другой стороны, когда запаздывающий импульс имеет уровень громкости ниже первого, раздельного восприятия не будет, поскольку запаздывающий импульс будет маскироваться остаточным слуховым ощущением от первого. Это явление называется после-

маскировкой (самомаскировкой).

Если звуки исходят из одного источника, но один из них проходит больший путь, например, из-за отражения от какого-либо препятствия, то возможность раздельного восприятия этих звуков называется эхом.

Ещ одной временной характеристикой слуха является время установления высоты тональности звука, его частоты. Этот процесс также не происходит мгновенно, на низких частотах слуху необходимо на это 30–35 мс, на более высоких 15–25 мс.

2.4.5. Бинауральный эффект. Локализация источников звука

Бинауральный эффект — это эффект бинаурального (двуухового) прослушивания, ещ его называют стереоакустическим эффектом, по аналогии с оптикой. Он проявляется в том, что человек с высокой точностью определяет направление на источник звука, правда не на очень низких частотах. Кроме того, бинауральный режим прослушивания позволяется оценить поперечные размеры источника, его положение по глубине, т.е. «ощутить» акустическую перспективу. На точность локализации влияют частота и громкость звуков, расстояние между ушами и экранирующее действие головы.

Как указывалось выше (раздел 2.4.4), человек одним ухом слитно воспринимает два звука, если время их прихода отличается меньше, чем на 50 мс. Но если звук поступает в одно ухо со сдвигом во времени по отношению к другому уху, то слух воспринимает эти звуки раздельно, так как электрические импульсы, возбуждаемые звуковыми колебаниями, поступают в слуховой анализатор по независимым путям. Именно поэтому суммарная громкость таких звуков сильно зависит от сдвига по времени. Этим объясняется бинауральный эффект на низких частотах, на высоких частотах он объясняется разностью уровней звуков, поступающих в каждое из ушей, вследствие того, что размеры головы на этих частотах становятся соизмеримыми с размерами длинных звуковых волн.

Механизмы локализации в разных плоскостях и по глубине разные. Звуки низких частот, ниже 250 Гц, локализуются слабо, считается, что на частотах меньше 150 Гц локализация практически отсутствует, что нам представляется спорным. Точность локализации в горизонтальной плоскости значительно выше, чем в вертикальной. Минимальный угол восприятия отклонения от направления на источник звука называется разрешающей способностью слуха по направлению, в горизонтальной плоскости он составляет 3–4о, в вертикальной —

27

12–20о. Это объясняется тем, что в последнем случае звуковые волны приходят в оба уха с одинаковыми амплитудой и фазой.

Помимо локализации источников звука в горизонтальной и вертикальной плоскостях человек может определить спереди или сзади находится источник и оценить расстояние до него. Уверенная фиксация фронтального или тылового направления происходит при разнице уровней звукового давления переднего и заднего источников звука больше 1,5–2 дБ. Когда источник находится относительно близко, не более 3м, точность его локализации при смещении по глубине на 1м составляет 10–20%. При средних расстояниях (3–15 м) удаление или приближение источника приводит к изменению его интенсивности, на низких частотах увеличение расстояния в два раза сопровождается уменьшением уровня звукового давления на 6 дБ, расстояние до источника всегда кажется меньшим, чем оно есть на самом деле, при этом ошибка возрастает с увеличением расстояния. При больших расстояниях (более 15 м) сказывается затухание звука в воздухе, при этом ВЧ составляющие затухают сильнее, изменяя тембр, уменьшение ВЧ составляющих спектра воспринимается как удаление источника звука. Увеличение амплитуды НЧ составляющих сигнала воспринимается как приближение источника. В отличие от азимутальной глубинная локализация возможна и при моноуральном (одноухом) прослушивании, но при бинауральном восприятии точность локализации существенно повышается.

2.5. Искажения акустических сигналов

Первичный акустический сигнал, прошедший через тракт звуковоспроизведения, меняет свои параметры и испытывает различные искажения. В самом общем случае искажения бывают нелинейными и линейными. Нелинейные — это искажения, которые вызываются появлением в спектре выходного сигнала новых спектральных составляющих, отсутствующих в спектре первичного — входного сигнала. Эти новые составляющие-гармоники искажают временную структуру сигнала и зависят от его уровня и особенностей звуковоспроизводящего тракта. К нелинейным искажениям относятся: амплитудное ограничение,

интермодуляционные, частотно-разностные, искажения, вызванные эффектом Доплера.

Линейные искажения не характеризуются появлением новых составляющих спектра, но также изменяют временную структуру сигнала из-за изменения амплитудных и фазовых соотношений между спектральными составляющими. Эти искажения не зависят от уровня сигналов. Линейные искажения бывают

амплитудночастотными, фазочастотными, искажениями частотного и динамического диапазонов, переходными.

28

2.5.1. Линейные искажения

Если тракт звуковоспроизведения является инвариантной по времени, линейной системой, то его комплексная передаточная функция H(jω) и импульс-

ная характеристика g(t) связаны преобразованием Фурье:

H(jω)= +∞g(t)ejωtdt,

(2.10)

 

 

−∞

 

g(t)=

1

+∞H(jω)ejωtdω ,

(2.11)

 

 

2π −∞

 

где g(t) — отклик тракта на воздействие дельта-функции δ(t) при нуле-

вых начальных условиях;

H(jω) — отношение комплексных амплитуд сигнала на выходе и входе

тракта при гармонических воздействиях.

Условием отсутствия искажений кроме изменения масштаба сигнала и его задержки без изменения формы является выражение

y(t)= kx(t T),

(2.12)

где y(t) и x(t) — выходной и входной сигнал соответственно;

k— постоянная.

Спомощью интеграла свертки

y(t)= +∞g(τ)x(t τ)dτ ,

−∞

где τ — время запаздывания, и преобразования Фурье получим условие неискаженной передачи сигнала

H(jω)= K exp(jωT), или

(2.13)

H(jω)=

 

H(jω)

 

exp[jϕ(ω)],

(2.14)

 

 

где H(jω) — модуль комплексной передаточной функции или коэффици-

ент передачи тракта. Его частотная зависимость называется амплитудночастотной характеристикой (АЧХ) тракта;

ϕ(ω) — аргумент передаточной функции — фазо-частотная характери-

стика (ФЧХ).

Условием неискаженной передачи сигнала через тракт является постоянство АЧХ:

29

H(jω)

 

= K

(2.15)

 

и пропорциональность частоте ФЧХ, т.е.

ϕ(ω)= −ωT .

(2.16)

Амплитудно-частотные искажения определяются непостоянством АЧХ во всем воспроизводимом диапазоне частот и воспринимаются как изменение тембра звучания, особенно на крайних участках спектра — спад АЧХ на НЧ и ВЧ оцениваются по величине неравномерности частотной характеристики в

некоторой полосе частот fВ fн .

Mu = Kмакс /Kмин ,

(2.17)

где Kмакс и Kмин — максимальный и минимальный коэффициент передачи

в заданном диапазоне частот.

Обычно АЧХ представляется в виде зависимости уровня звукового давления, дБ в линейном масштабе от частоты, Гц в логарифмическом. Типичная АЧХ звукового тракта представлена на рис. 2.6 [7].

Рис. 2.6. Типичная АЧХ звукового тракта

Неравномерность АЧХ в логарифмических единицах

E = 20lg(Mu )= Eмакс Eмин , дБ,

(2.18)

где Eмакс и Eмин — максимальный и минимальный уровни звукового дав-

ления.

Пороговая величина различаемых на слух пиков и провалов АЧХ составляет 3 дБ. Субъективные экспертизы показали, что чувствительность восприятия пиков значительно выше, чем провалов. При этом существенным является частотное положение и ширина интервала частот, который занимает участок

30

АЧХ с пиком-провалом. Чувствительность слуха к спектральным неравномерностям максимальна в полосе частот 500–3000 Гц. Обнаружено, что вследствие наличия широких критических полос слуха, пики-провалы АЧХ не воспринимаются, если они занимают полосу уже 1/8 октавы. Установлено, что в низкочастотной области искажения АЧХ более заметны чем на высоких частотах, для субъективного восприятия также важен характер спада АЧХ на границах частотного диапазона.

Фазочастотные искажения определяются смещением составляющих спектра выходного сигнала друг относительно друга во времени. Действительно, фазовый сдвиг ϕ между входным и выходным сигналами означает, что они

сдвинуты на временной интервал

τ = dϕ /dω =τ (ω).

(2.19)

Если ϕ пропорционален частоте (условие (2.16)), то,

очевидно, фазоча-

стотные искажения отсутствуют, поскольку при этом τ = const (если ϕ = const ,

τ = 0).

Системы, в которых АЧХ и ФЧХ однозначно связаны преобразованием Гильберта:

1

 

ln

 

)

 

 

 

 

 

 

 

 

 

+∞

 

 

 

 

 

 

 

 

ϕ(ω)= π

 

 

 

 

 

 

dω ,

(2.20)

 

 

 

ω′−ω

 

 

 

 

−∞

 

 

 

 

 

 

 

 

называются минимально-фазовыми. В них отсутствие искажений АЧХ предполагает отсутствие искажений ФЧХ, а линейные искажения, вносимые трактом звуковоспроизведения, полностью определяются его АЧХ.

Как показали исследования, акустические системы (АС) не являются ми- нимально-фазовыми, и поэтому измерение и нормирование ФЧХ для них обязательно.

В таких системах для оценки искажений ФЧХ используют выражение

(2.19), в котором τ называют групповым временем задержки (ГВЗ). В отличие от фазовой задержки τϕ (ω)=ϕ(ω)/ω , которая характеризует опережение (отста-

вание) по фазе отдельных составляющих сигнала, ГВЗ определяет время прохождения максимума (минимума) сигнала через систему. Если ввести понятие «искажения ГВЗ» как τ(ω)=τ(ω)T , то отсутствие искажений такого типа

будет:

τ (ω ) = 0 .

(2.21)

Экспериментальные исследования показали, что чувствительность слуха к сдвигу фаз зависит от уровня сигналов, их спектров, условий прослушивания,

31