Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3-158.doc
Скачиваний:
37
Добавлен:
08.12.2018
Размер:
4.64 Mб
Скачать

Цифровая обработка звука

Метод натуральной цифровой записи звука [2] называется PCM (Pulse Code Modulation — импульсно-кодовая модуляция). Он заключается в том, что в ходе записи в течение каждой секунды многократно регистрируется текущая амплитуда звуковой волны. Некоторое значение амплитуды принимается как максимально возможное в данной звукозаписи. В соответствии с выделенным для оцифровки единичным элементом данных максимальному значению присваивается самое большое целое число. Далее текущее значение амплитуды масштабируется относительно максимального числа и округляется до ближайшего целого. В результате получается единичный снимок (кадр) звуковой волны. Цифровая звукозапись представляет собой последовательность таких кадров.

Частоту, с которой делают снимки, называют частотой дискретизации, или шагом квантования, или частотой оцифровки. Очевидно, что чем выше частота дискретизации, тем более точно цифровая запись будет соответствовать аналоговому образцу. По теореме Котельникова (за рубежом она известна как правило Найквиста) частота дискретизации должна не менее чем вдвое превышать максимальную частоту записываемого звука.

Сильно влияет на точность записи и величина единичного массива данных (иногда называемая глубиной оцифровки или разрядностью представления), определяющая число различимых уровней записываемого звукового сигнала. От разрядности зависит отношение максимально воспроизводимой громкости звука по отношению к громкости шумового фона. Слуховая система человека способна различать звуки в диапазоне до 120 дБ. При 8-битной записи диапазон составит 48 дБ (всего 255 значений). При 16-битной записи диапазон составит 96 дБ. На практике запись хорошего качества получается при частоте дискретизации 44100 Гц и глубине оцифровки 16 бит. Именно такие параметры приняты для записи музыки на лазерных дисках, называемых аудио компакт-дисками (Audio CD).

Оцифровка аналогового сигнала производится цифро-аналоговыми преобразователями (ЦАП). Аналого-цифровые преобразователи (АЦП) выполняют обратную задачу. Часто оба устройства объединяют в одном блоке, называемом кодеком (кодировщик-декодировщик).

Цифровые преобразования вносят специфические искажения в аналоговый сигнал. Из-за того, что в цифровом представлении доступен только ряд целых дискретных значений сигнала, появляется практически непрерывный паразитный сигнал, называемый шумом дискретизации.

Динамический диапазон

Повышение разрядности позволяет расширить динамический диапазон звукового устройства. При разрядности 16 бит теоретически возможно охватить диапазон от 0 дБ до –96 дБ. Однако сигналы с уровнем, близким к минимально возможному, практически сливаются с шумом дискретизации. При ошибке в половину младшего разряда теоретически диапазон составит 93 дБ. Соотношение сигнал/шум (Signal Noise Ratio — SNR) при уровне шумов ниже –93 дБ также составит не менее 93 дБ. Обычно близкие к этому значению величины указывают производители звуковых плат для компьютеров. На практике дело обстоит далеко не так радужно.

К сожалению, в устройствах бытового класса при оцифровке аналогового сигнала при превышении максимального порогового значения в лучшем случае (в хороших кодеках) происходит ограничение «по насыщению». То есть все значения амплитуды выше определенного порога приводятся к максимально допустимой устройством величине. Но часто кодек не выравнивает сигнал, а просто обнуляет старший разряд, и SNR снижается до 75–77 дБ. Именно таким реальным диапазоном обладает большая часть цифровой звуковой аппаратуры бытового класса, даже с маркировкой Hi-Fi.

Однако в компьютерных устройствах злоключения SNR на этом не заканчиваются. Тракт обработки сигнала большинства звуковых плат вносит шумовые искажения не менее чем в три младших разряда, что отнимает еще 12 дБ. Объясняется это тем, что внутри корпуса компьютера циркулирует слишком много паразитных электрических сигналов. В итоге на выходе качественной звуковой карты мы получаем SNR не лучше 60–65 дБ. Более дешевые изделия обеспечивают SNR порядка 55–58 дБ.

Критично ли такое сужение диапазона с точки зрения обычного пользователя, который желает не сочинять, а слушать звук? Обычно в звуковой картине всегда присутствуют посторонние шумы, «отъедающие» от теоретического диапазона слышимости 120 дБ не менее 30–50 дБ. Поэтому реально воспринимаемый человеком диапазон составляет 70–90 дБ, причем вторая цифра характерна для уединенного прослушивания через наушники в закрытом помещении. Вряд ли кто способен разобрать быстрый переход от уровня –6 дБ к –90 дБ. Заметная часть записи не будет услышана, так как слуховые органы обладают некоторой инерционностью. То же самое, но в еще большей степени справедливо и для обратного случая — оглушения громким звуком после тихого. Для меломанов заметим, что цифровая аппаратура стоимостью 200–400 долларов не обеспечит лучшего качества, чем звуковая карта ценой около сотни. Как показывает практика, разницу более чем в половине случаев замечает только эксперт.