12.6 Алгоритм Лемпела-Зива-Уэлча (lzw)

В настоящее время алгоритм LZW используется в большом количестве программ-архиваторов. Главная особенность алгоритма состоит в том, что метка включает в себя только указатель на место в словаре. Работа алгоритма начинается с инициализации словаря всеми символами исходного алфавита. Если имеется текстовый файл в формате ASCII, то первые 256 записей (отдельные символы с ASCII-кодами от 0 до 255) заносятся в словарь до поступления сжимаемых данных. Поскольку словарь уже частично заполнен, первые поступившие символы всегда будут обнаружены в словаре, поэтому метка может состоять только из указателя, и нет надобности дополнительно хранить код символа, как в алгоритме LZ77.

Метод LZW накапливает поступающие на вход символы в строке I. После каждого нового символа, добавленного в строку I, кодер ищет I в словаре. Если строка обнаружена, то процесс удлинения I продолжается. В некоторый момент добавление некоторого символа x приводит к тому, что строка Ix не обнаруживается в словаре. Тогда кодер записывает в выходной файл указатель на строку I и сохраняет строку Ix в словаре на следующей допустимой позиции и инициализирует строку I значением x. Для примера снова рассмотрим сжатие строки sir_sid_eastman_easily_teases_sea_sick_seals. Получим следующие шаги.

Инициализируем словарь записями с номерами 0..255, содержащими все 8-битовее символы.
Первый входной символ s обнаруживается в словаре под номером 115 (это его ASCII-код). Следующий входной символ – i, но строки si нет в словаре. Кодер выдаёт на выход ссылку 115, сохраняет si в следующей доступной позиции словаря (позиция номер 256) и инициализирует I строкой i.
На вход поступает символ r, но строки ir нет в словаре. Кодер записывает на выход 105 (код символа i), сохраняет в словаре ir (запись 257) и инициализирует I строкой r.

Аналогичные шаги повторяются до тех пор, пока не закончится входной файл.

Декодер LZW также начинает свою работу с заполнения словаря первыми символами алфавита. Затем он читает входной файл, который состоит из указателей на записи в словаре, использует каждый указатель для того, чтобы восстановить несжатые символы из словаря и записать их в выходной файл. Кроме того, он строит словарь тем же способом, что и кодер.

На первом шаге декодирования декодер вводит первый указатель и использует его для восстановления словарного элемента I. Эта строка символов записывается декодером в выходной файл. Далее следует записать в словарь строку Ix, однако символ x ещё неизвестен; это будет первый символ следующей строки, извлечённой из словаря.

На каждом шаге декодирования после первого декодер вводит следующий указатель, извлекает следующую строку J из словаря, записывает её в выходной файл, извлекает её первый символ x и заносит строку Ix в словарь на свободную позицию (предварительно проверив, что строки Ix нет в словаре). Затем декодер записывает значение J в I. Теперь он готов к следующему шагу декодирования.

<<< < Предыдущая 1 2 3 4 56 / 66

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.02.2015136.19 Кб20Лекция 09 - Системы массового обслуживания.doc
#
12.02.201594.72 Кб24Лекция 1 Microsoft Word.doc
#
19.09.2019135.68 Кб4Лекция 1 Информация.doc
#
12.02.2015240.64 Кб20Лекция 10 - Агрегативное описание систем.doc
#
12.02.2015437.25 Кб10лекция 11 .doc
#
12.02.2015183.3 Кб43Лекция 12 - Кодирование и сжатие информации.doc
#
21.04.201952.74 Кб2Лекция 12.doc
#
12.02.2015210.94 Кб52Лекция 13 - Помехоустойчивое кодирование.doc
#
09.11.20191.25 Mб8Лекция 13-15.docx
#
12.02.2015188.42 Кб53Лекция 15 - Транспортная задача.doc
#
12.02.2015260.61 Кб92Лекция 16 - Методы принятия решений.doc