Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика — курс лекций.pdf
Скачиваний:
540
Добавлен:
11.03.2015
Размер:
2.18 Mб
Скачать

количество записываемых цветовых каналов — (зависит от использованной модели);

принятой глубиной цвета (определяет количество бит данных на каждый канал).

Итоговая формула имеет следующий вид:

( )

Кодирование звукозаписей

Характерная черта мультимедийной информации состоит в том, что в ходе её кодирования и записи образуются огромные массивы данных. Так, в частности, если не предпринять специальных мер, то звукозапись высшего качества способна за минуту образовать столько же данных, сколько их содержится в ста тысячах машинописных страниц. Ещё больше данных образуется при видеозаписи. Одна минута записи высококачественного видео образует такой же объём данных, как пять миллионов страниц машинописного текста.

Вот почему человечеству потребовалось полвека развития средств вычислительной техники, чтобы лишь приблизиться к возможности цифровой записи и воспроизведения звука и видео в реальном времени. Для этого пришлось создать высокопроизводительные устройства, разработать новые принципы и стандарты для кодирования мультимедийной информации с одновременным сжатием данных. Средства, позволяющие работать со звукозаписями и видеозаписями, вошли в повседневную практику сравнительно недавно. Это произошло во второй половине 90-х годов XX века.

Звук — это ощущение. Оно вызвано локальными изменениями давления воздуха, распространяющимися в виде упругих волн. Органы слуха регистрируют перепады давления и передают сигналы в головной мозг. В мозгу происходит реконструкция источника звука: он идентифицируется и определяется его положение в пространстве.

Органы слуха человека способны регистрировать не все звуковые волны. Ограничения имеются как по частоте, так и по амплитуде. Условно считается, что люди различают звуковые сигналы с частотами от 20 Гц до 20 кГц, хотя реальный диапазон немного уже. Звуковые колебания низкой частоты, неразличимые для слуховой системы, называют инфразвуком, а неразличимые колебания высокой частоты — ультразвуком.

Разница в амплитуде давления на фронте звуковой волны воспринимается людьми как разница в громкости звуковых сигналов. Звуковое давление измеряют в паскалях (Па). Считается, что органы слуха человека способны без повреждения регистрировать перепады давления от 0,00002 Па до 20 Па (относительный диапазон равен 1 : 1000000).

При таком широком диапазоне выражать громкость единицами давления очень неудобно. Поэтому применяют относительные логарифмические единицы — децибелы (дБ). Шаг логарифмической шкалы, равный 20 дБ, соответствует увеличению звукового давления в 10 раз. Этот приём позволяет выразить весь диапазон слышимой громкости одной шкалой со значениями от 0 до 120 дБ.

При звуке громкостью 140 дБ (близкий разрыв артиллерийского снаряда) происходит физическое поражение органов слуха, а звук громкостью более 180 дБ смертелен. По энергетике это уже не звуковая волна, а ударная.

87

Цифровое кодирование сигнала

Из физической природы звука вытекает наиболее очевидный способ звукозаписи. Он состоит в непрерывной регистрации изменения звукового давления. Действие большинства звукозаписывающих устройств, от первых фонографов Эдисона до современных магнитофонов, основано на этом принципе.

Чтобы использовать для работы со звуком вычислительную технику, необходимо перейти от аналогового кодирования к цифровому, то есть выполнить аналого-цифровое преобразование. После него непрерывный аналоговый сигнал преобразуется в последовательность числовых данных — так называемую выборку данных.

Аналого-цифровое преобразование происходит в два этапа. Сначала выполняется дискретизация сигнала: непрерывный сигнал представляется последовательностью дискретных импульсов. Потом выполняется квантование сигнала: величина каждого импульса представляется целым числом, которое и заносится в выборку данных.

Дискретизация сигнала

Дискретизация — это один из стандартных приемов моделирования физических процессов.

Дискретизация состоит в разбиении модели процесса на различимые элементы, такие, из которых всегда можно восстановить первичную модель с некоей наперёд известной погрешностью.

Погрешность, о которой идёт речь, имеет принципиальный и неизбежный характер. Она называется погрешностью дискретизации.

Прокомментируем данное здесь определение. Во-первых, речь не идёт о том, чтобы разбить на части процесс или явление, а лишь о разбиении его модели. Если нам надо рассмотреть, как изменялось давление воздуха на органы слуха в различные моменты времени, мы разбиваем не воздух и не время, а модель процесса, например его график.

Во-вторых, элементы сигнала должны быть различимы, а это значит, что их минимальная продолжительность определяется используемым оборудованием.

В-третьих, речь идёт не о любом разбиении, а только о таком, после которого из полученных элементов можно восстановить первоначальную модель. Это значит, что у каждого элементарного объекта должно быть определенное положение в общей группе, то есть вся группа дискретных элементов представляет собой коллекцию. Полученная коллекция может отличаться от исходной модели, но не более чем на величину, известную заранее.

Природа погрешности дискретизации связана с тем, что каждый дискретный импульс имеет определённую продолжительность , отличную от нуля. В течение этого времени давление звуковой волны изменяется от начального ( ) до конечного ( ). Принимая на этом участке некоторую усреднённую величину ( ), мы и вносим погрешность. Она предопределена шириной дискретного импульса .

Уменьшить погрешность дискретизации можно, уменьшив ширину выборки .

С другой стороны, принимать слишком малые значения тоже не всегда практично, ведь при этом увеличивается общее количество различимых импульсов, что ведёт к увеличению резуль-

88

тирующей выборки данных. Таким образом, расплатой за увеличение точности дискретной модели становятся повышенные расходы на хранение данных и операции с ними.

Квантование импульсов сигнала

Дискретизация непрерывного сигнала позволяет измерить и записать параметры звуковой волны , , , … для каждого импульса. Напомним, что измерение физической величины состоит в её сравнении с предварительно заданной мерой. Результат измерения — действительное число.

Действительные числа можно кодировать двоичными разрядами. Однако это не очень эффективное кодирование. Если есть возможность, желательно действительными числами не пользоваться. Избежать их можно, если перейти к таблично-цифровому кодированию. Этот переход выполняют преобразованием, которое называется квантованием по уровню.

Квантование состоит в преобразовании непрерывной по значениям величины в величину, способную иметь ограниченный набор фиксированных значений, принадлежащих конечному множеству.

Те «разрешённые» значения, которые может принимать регистрируемая величина, называ-

ются уровнями квантования.

Как и дискретизация, квантование — это один из приёмов, используемых при моделировании. Фактически, при квантовании происходит подмена шкалы, по которой измеряются параметры моделируемого процесса или явления. Вместо непрерывной используется дискретная шкала, в результате чего вместо действительного числа, характеризующего значение измеряемой величины, получается целое число, характеризующее уровень величины.

При целочисленном кодировании различимость результатов физических измерений тем выше, чем больше уровней содержит используемая шкала. Удобной характеристикой числа уровней является количество двоичных разрядов, которым записываются замеренные значения. Оно выражает разрядность кодирования.

Так, например, 8-разрядное кодирование при звукозаписи позволяет различать 256 значений амплитуд звуковых волн. При таком кодировании удаётся записать сравнительно узкий диапазон громкостей шириной всего лишь в 48 децибел, например от 20 до 68 дБ. Данная величина называется динамическим диапазоном и обозначается буквой . Она в большой степени характеризует качество звукозаписи.

Динамический диапазон размером 48 децибел — вполне достаточен для адекватного воспроизведения речи в диапазоне от тихого шёпота до шума толпы. Такое кодирование можно использовать в цифровых диктофонах и в мобильной телефонной связи, но для записи более широкого диапазона звуков, например для записи музыкальных произведений, 8-разрядного кодирования недостаточно.

Для музыкальной записи используют как минимум 16-разрядное кодирование. Это позволяет регистрировать 65536 различных уровней громкости. Общий диапазон громкостей при этом составляет 96 децибел, например от 20 до 116 дБ. Такая запись сможет адекватно передать как тихий шёпот, так и рёв взлетающего самолёта.

89

Если судить только по диапазону громкостей сигналов, то шестнадцатиразрядного кодирования вполне достаточно для записи и воспроизведения звука. Однако звукозаписи обычно проходят сложную технологическую обработку. Звукорежиссёры сводят вместе звуки, взятые из разных источников, многократно их записывают и переписывают. При этом накапливаются технологические погрешности (шумы). Для борьбы с ними в профессиональных системах используют более глубокое кодирование звука (24- и 32-разрядное).

С квантованием сигнала связана вторая принципиальная погрешность аналого-цифрового преобразования — погрешность квантования. Как и погрешность дискретизации, погрешность квантования неизбежна, потому что образуется из-за самого принципа числового кодирования.

Природа погрешности квантования связана с тем, что реальное замеренное значение физической величины округляется до ближайшего значения уровня квантования. Максимально возможная величина ошибки квантования равна шагу квантования. Так, например, если уровни квантования соответствуют звуковым давлениям 5,0 Па; 5,5 Па; 6,0 Па; 6,5 Па, то замеренное значение 5,6378 Па будет «округлено» до 6,0 Па.

Неизбежность ошибки квантования не означает, что с нею нельзя или не нужно бороться. Её нельзя устранить окончательно, но бороться с нею можно увеличением разрядности кодирования. При этом повышается различимость соседних уровней, уменьшается шаг квантования, а вместе с ним уменьшается и предельная величина ошибки. Расплатой за это, как всегда, выступает увеличение общего объёма данных, полученных в результате кодирования.

Оценка размера звуковой выборки данных

Выборка данных — это числовая последовательность. Она получается после применения методов дискретизации и квантования к непрерывно изменяющейся физической величине. Выборка данных — это ещё не результат записи данных на носителе, но уже технологическая заготовка для будущей записи. Методы и средства, используемые для записи, зависят от размера полученной выборки, поэтому важно уметь оценить его заранее.

Размер выборки данных ( ), образующейся при кодировании звука, определяется следующими факторами:

продолжительностью звукозаписи (измеряется в секундах);

частотой выборки (измеряется в герцах); чем чаще производится замер громкости, тем меньше погрешность дискретизации;

количеством звуковых каналов ( );

разрядностью квантования (определяет разрядность двоичной записи); чем выше разрядность, тем больше различается уровней, тем меньше погрешность квантования.

Итоговая формула выглядит так:

( )

Здесь частота выборки — это частота дискретизации — столько раз в секунду производится замер амплитуды сигнала. Обратная величина ( ) равна ширине дискретного импульса .

90