книги / Электронная информация и электронные ресурсы
..pdfОпределение традиционного и электронного документов
держащий информацию в зафиксированном виде и специально предназначенный для ее передачи во времени и пространстве. Носителем информации может быть бумага, перфокарта, фото пленка, магнитофонная лента и т. п.» В этом определении для нас очень важно обобщенное упоминание использования доку мента.
В Политехническом словаре [14J это определение практиче ски повторяется: «Документ — материальный объект, содержа щий закрепленную в нем информацию и предназначенный для ее передачи во времени и в пространстве».
Очень важным для осмысления и усвоения является опреде ление понятия «документ», приведенное в Федеральном законе «О библиотечном деле» № 78-ФЗ от 29 декабря 1994 г.: «Доку мент — материальный объект с зафиксированной на нем ин формацией в виде текста, звукозаписи или изображения, пред назначенный для передачи во времени и пространстве в целях хранения и общественного использования» [32]. Если отвлечься от ненужного ограничения по составу информации (ясно, что в документе может быть зафиксирована абсолютно любая по типу информация, а не только перечисленная в определении) и от не совсем понятного сопряжения (что, собственно, передается че рез пространство и время — сам документ или зафиксированная на нем информация?), то ключевое слово в этом определении — «объект». Документ — это объект, вот суть понятия, а наличие в нем информации является основным определяющим признаком.
Мы считаем наиболее существенной связь документа с ин формацией и предлагаем следующее определение документа, близкое как к определению Политехнического словаря и БСЭ, так и к позиции профессора Ю. Н. Столярова.
Документ — это преднамеренно (искусственно) созданный и ограниченный во времени и в пространстве (то есть имеющий нача ло и конец) массив информации, зафиксированный на материаль ном носителе.
В английском языке, в том числе в проведенном по поруче нию ИФЛА специальном научном исследовании, касающемся выработки и формулирования функциональных требований к библиографической записи (Functional Requirements to
131
Глава 4. Электронные документы
Bibliographical Records, FRBR), для обозначения предмета, под лежащего библиографическому описанию, вводится близкое к нашему понятие, определяемое словом «сущность» (entity) и в некоторых случаях — словом «объект» (object).
Итак, сославшись еще раз на единство документа и элек тронного документа, даем определение:
Электронный документ — это преднамеренно (искусственно) созданный и ограниченный во времени и в пространстве (то есть имеющий начало и конец) массив информации, зафиксированный на машиночитаемом носителе.
Наиболее детальный анализ всех подходов к понятиям «до кумент» и «электронный документ» сделала, на наш взгляд, Т. В. Майстрович в своей монографии [33] и последующей за ней докторской диссертации. Вместе с тем Т. В. Майстрович — приверженец жесткого следования всем догмам и понятиям традиционного библиотековедения, несмотря на явные и необ ратимые вторжения информационных технологий в эту «за стывшую гавань»*, как, впрочем, и в другие науки и сферы дея тельности человека. Странно — ведь даже такие науки, как ма тематика и физика, склонны отходить от ранее признанных классических канонов (вспомним геометрию Лобачевского или теорию относительности Эйнштейна), если время вносит свои коррективы. В библиотековедении, особенно в части базовых определений и понятий, упорно держится ортодоксальная план ка, а попытки как-то научно обосновать и пересмотреть ка кие-то концептуальные моменты сразу называются радикализ мом [33, с. 6]. Тем не менее нарастающий уровень информати зации общества, резкое увеличение электронной составляющей в документном пространстве и становление библиотек как фор постов нарождающегося информационного общества неизбеж но вызывают необходимость ревизии базовых понятий библио тековедения и их насущной трансформации. Определение
* Под этой фразой мы понимаем те разделы трад иц ионного библиоте коведения, представители которых все еше упорно цепляю тся за старые подходы и не соглашаются никоим образом изменить и уточнить н еко то рые застарелые и неработающие сегодня определения и методы.
132
Определение традиционного и электронного документов
«электронный документ» — одно из таких явлений, на наш взгляд, главные его трактовки показывают преемственность традиционной науки и современность предлагаемых термино логических понятий и определений.
Определение Т. В. Майстрович, что «электронный доку мент — это форма документа, созданного в целях передачи со общения, зафиксированного средствами компьютерных техно логий, позволяющих адекватно воспроизводить его содержа ние», в принципе не противоречит нашему, хотя и содержит избыточную, не несущую уточняющей нагрузки информацию в последней своей части.
В конечном счете можно ограничиться и таким, самым про стым и доступным определением, которое мы приводили в сво ем учебнике: «Электронный документ — это документ, создан ный на электронном носителе информации» [1, с. 55].
Определения «электронный документ» и «электронная пуб ликация» («электронное издание») всегда даются с акцентом на автоматически подразумеваемую машиночитаемость данного вида ресурсов. Повсюду в дальнейшем тексте, если специально не оговорено иное, мы в целях краткости будем использовать слова «документ», понимая под этим электронный машиночи таемый документ, и «публикация» («издание»), понимая под этим электронное издание (иногда вместо «электронное» упо требляем «цифровое» — это синонимы).
Очень близким, но не идентичным к определению «элек тронный документ» и к его сути, является понятие «компью терный файл». Пожалуй, самое серьезное различие в том, что документ видится рукотворным продуктом, а файл может соз даваться автоматически, для решения каких-то внутри про граммных задач. В этом смысле понятие «файл» несколько ши ре понятия «электронный документ», хотя, например, зачастую сетевой документ может состоять из многих файлов, но при этом сам сетевой документ, безусловно, также является много компонентным файлом*.
* Все это сегодня достаточно условно, так ка к автоматический пере водчик создает переводной файл без вмешательства человека и этот файл м ожет считаться д окум ентом , особенно если он используется самостоя тельно.
133
Глава 4. Электронные документы
4.2. Типология электронных документов
4.2.1.Фундаментальные свойства электронных документов
Перечислим фундаментальные свойства, которые характе ризуют именно электронные документы.
1.М ашиночитаемое. Это свойство заложено в определении
исамоочевидно. Сегодня часто заменяют этот термин словами «электронный», «цифровой».
2.Д искретное и конечность. Свойство дискретности, по су
ти, вытекает из машиночитаемости. Печатные документы могут быть аналоговыми (например, живопись), либо дискретными и состоять из отдельных символов (букв и цифр) или даже из то чек (как газетное изображение). Любой электронный документ обязательно состоит из отдельных очень простых элементов — битов информации. Количество их конечно: оно может быть сколь угодно большим, но, по сути, обязательно имеет оконча ние, поскольку документ всегда считается законченным на ка кой-то момент времени и ограниченным в пространстве. На пример, при любом разумном размере сканируемого изображе ния, при определенном пространственном разрешении — 300, 600 или 1200 точек на дюйм, при заданном характере цветопере дачи — в итоге количество битов будет конечным. Теоретиче ское свойство конечности количества битов в документе озна чает важное по практической значимости свойство счетности. Это, в общем-то, непросто воспринимаемое свойство имеет принципиальные и важные последствия. Зная количество битов информации в документе и тактовую частоту процессора, вы можете рассчитать время для обработки документа, а зная про пускную способность линии передачи данных, — рассчитать минимальное время связи с клиентом.
3. Однородность массива цифровых данных независимо от характеристик отражаемого объекта. Не имеет значения, скани руется ли текст, черно-белое или цветное изображение, одно мерный или многомерный объект, берутся ли образцы (сэмплы) звука или видео и т. п. — в каждом случае выходной продукт, за писанный в двоичной системе, будет состоять только из 1 и 0.
134
Типология электронных документов
4. Зависимость от программно-аппаратного обеспечения (в том числе от наличия электропитания, самого компьютера, обще системных и специальных программ, монитора, динамиков и т. д.) для использования и раскрытия содержания электрон ных документов. Это свойство оказалось очень важным для практического применения цифровых документов. Внезапное отключение электроэнергии может привести к потере какой-то части содержания электронных документов, поэтому для пита ния стационарных персональных компьютеров, серверов и се тевого оборудования широко используются устройства беспере бойного питания. Конструкция переносных компьютеров учи тывает потребности экономии электроэнергии. В идеале конструкторы пытаются обеспечить автономную работу ноут бука при перелете через Атлантику из США в Европу или из Японии в СШ А (более 6—8 часов). Борьба за экономию потреб ления привела к разработке и внедрению технологии Centrino, в которой несколько ключевых идей связаны с выключением не работающих в данный момент элементов структуры процессо ра. Аппаратно-программная зависимость породила проблему обеспечения долговременной сохранности электронных доку ментов, при этом наибольшую тревогу библиотекарей вызывает не столько физическая целостность и сохранность носителей информации для определенных видов документов, сколько их быстротечность, изменчивость.
5.Способность к совмещению разнородной информации (муль тимедийные документы). Это свойство тесно связано со свойст вом 3 — любая разнородная информация в формате электрон ного документа становится однородной, а значит, и легко со вместимой.
6.Способность к клонированию, то есть к созданию абсолют но идентичных копий документов. Это свойство является след ствием свойства 2: при копировании электронных документов абсолютно точно повторяется число битов информации, поря док и число байтов. Повторяем, речь идет не о высококачест венной копии, а о точном воспроизведении оригинала, иначе говоря — оригинал и копия становятся принципиально нераз
личимыми.
7. Принципиальная неиссякаемость при копировании. Это свойство вытекает из свойств 2 и 6. Если самый прочный меха
135
Глава 4. Электронные документы
нический штамп при производстве деталей неизбежно истира ется, состаривается, то при копировании информации ее перво начальное количество и качество не убывают нисколько (прось ба не путать с износом самого копирующего оборудования). Это свойство приводит к трудности обнаружения воровства или не санкционированного копирования электронного документа, а значит, и к возможному нарушению авторских прав на доку мент, на его содержание. Если у вас украли автомобиль, то вам, к сожалению, придется идти пешком или покупать новую ма шину. Если у вас скопировали без разрешения информацию, то у вас осталось все как прежде, только добавилось число людей, располагающих этой же информацией.
8.Возможность дистанционного управления электронными ресурсами (обработка, копирование, пересылка и т. д.). Вовсе не обязательно находиться рядом с компьютером, в котором хранится или обрабатывается электронный документ, все опе рации можно производить с любой дистанции, лишь бы была обеспечена связь. Это свойство может оказать колоссальное влияние на работу будущих библиотек, в которых со временем большинство библиотечных технологических процессов — от комплектования электронными публикациями до их обработ ки, индексирования, доставки и хранения, по-видимому, будет осуществляться по индивидуальному заказу либо отдельного лица, либо конкретной организации-пользователя и без необ ходимости захода в помещение библиотеки.
9.Неодинаковая чувствительность к появлению ошибок в за писи. Можно говорить о некоей заведомой избыточности дан ных ряда информационных массивов (например, в музыкаль ных файлах стандарта ISO 9660, в некоторых форматах записи изображений и т. п.). Конечно, точнее говорить не об избыточ ности, а о нацеленности на достижение максимально высокого качества изображения или воспроизведения, что не всегда нуж но в обыденной жизни, когда на первый план выступают такие параметры, как практичность, удобство пользования, стои мость, скорость передачи по сетям, длительность воспроизведе ния и т. п. В то же время при пользовании и обработке цифро вых документов наблюдается уязвимость к появлению ошибок в некоторых критических местах (например, в компьютерных программах, в системах управления базами данных и т. п.). Про
136
Типология электронных документов
пущенный пробел между словами программы или в интер нет-адресе, неточно поставленная запятая могут оказаться не преодолимым препятствием для работы программы.
10.Возможность самоконтроля и устранения ошибок в масси вах данных. Это свойство используется, например, в оптиче ских дисках CD-ROM стандарта ISO 9660, в которых специаль ные программы детектирования (Error Detection Code, EDC) и исправления ошибок (Error Correction Code, ECC) считывают и сравнивают параметры описания отдельных пакетов, из кото рых составлен файл.
11.Уязвимость многих видов электронных документов по отношению к непосредственным зловредным действиям других документов (в данном случае, например, к вирусам). В мире традиционных документов такое «каннибальство» невозможно представить, приказ на изъятие из библиотек трудов ставшего опальным политического деятеля или на сожжение еретической литературы всегда проходил через руки людей. А в мире сетевых документов уничтожение одного документа другим может осу ществляться дистанционно, в самом компьютере в результате действия зловредных программ, и это довольно типичный слу чай.
12.Составной характер многих электронных документов имеет в ряде случаев принципиальное значение. Вообще гово ря, составной характер традиционных документов у нас не вы зывает удивления. Понятно, что книга может состоять из томов, разделов, глав, параграфов, страниц, абзацев, предложений, слов и букв и т. д. — и все это встречается при работе с электрон ными документами. Но есть и свои особенности:
•во-первых, некоторые протоколы обработки данных — например, стандарт оптических дисков ISO 9660 или про токол передачи данных через Интернет TCP/IP — прину дительно разбивают любой имеющийся файл (текст, изо бражение, звук, видео) на одинаковые по объему куски (пакеты, блоки), и в таком виде уже обрабатывают и пере дают их от компьютера к компьютеру или на воспроизво дящее устройство;
•во-вторых, свойство 5 из вышеприведенного списка зна чительно расширяет диапазон совместимости различных
137
Глава 4. Электронные документы
видов документов в одном, позволяя создавать так назы ваемые мультимедийные документы;
•в-третьих, формирование электронных документов, со ставление сводного или составного документа может про исходить «на лету», в процессе их передачи по сетям, без прямого участия посредника (но, конечно, по заранее со ставленной программе-предписанию). Точно также не уловимо может совершаться пополнение или изменение содержания документа.
Официально утвержденный в 1985 г. видовой состав печат ных документов дается в ГОСТе 7.19—85 «Система стандартов по информации, библиотечному и издательскому делу. Комму никативный формат для обмена библиографическими данными на магнитной ленте. Содержание записи». Ввиду его громоздко сти мы предлагаем желающим ознакомиться с ним в приложе нии 2.
4.2.2. Виды электронных документов по сравнению с печатными
Электронные и традиционные документы очень тесно свя заны, зачастую на этапе раскрытия содержания электронный документ трансформируется в традиционный. Всем известный Билл Гейтс утверждает, что, если объем документа превышает несколько страниц, он, конечно, его распечатает, а не будет чи тать с самого современного экрана. Как всегда, образно и кра сиво высказывается директор компании Springer («Шпрингер») г-н Арно де Кемп (Arno de Kemp): «Компьютерный экран — не для чтения, точно так же, как аквариум не для плавания. Чита тель — наименее гибкий элемент в технологической цепочке обработки электронной информации». Однако время берет свое, и постепенно количество электронных документов увели чивается. Например, библиотека университета Сент Джонс (США) имеет в настоящее время подписку (лицензии на дос туп) на 12 тыс. наименований электронных журналов и на 4 тыс. наименований печатных журналов, то есть соотношение 1 пе чатный журнал на 3 электронных. Подобное или близкое соот
138
Типология электронных документов
ношение (1:2 или 1:3) выдерживается в среднем и в других уни верситетских или научно-технических библиотеках США. А в публичной, очень типичной для Америки, городской библиоте ке им. Фергюссона города Стэмфорда, штат Коннектикут, тоже за последние несколько лет отмечается резкий рост электрон ных документов (журналов), а вот число электронных книг ос тается стабильным. «400 названий вполне достаточно для на ших читателей, — утверждает президент библиотеки Эрнст Ди Маттиа, — спрос на электронные книги, в отличие от журналов, более стабилен» (из беседы при личной встрече с авторами в по мещении библиотеки им. Фергюссона в марте 2004 г.). Обследо вание британских университетских библиотек показало, что в зависимости от типа университета от 52 до 67% наименований периодики имеется в электронном формате наряду с печатным.
В то же время существуют некоторые свойства электронных документов, отличающие их от традиционных. Можно с доста точной степенью условности выделить следующие группы:
•электронные документы, не имеющие печатных аналогов (электронная почта, домашние страницы и другие мате риалы веб-сайтов, дискуссионные группы в Интернете, некоторые научные и популярные журналы, базы данных, мультимедийные материалы, специфические виды рекла мы, вирусы и т. п.);
•электронные документы, созданные для поддержки имеющихся печатных ресурсов, например для обеспече ния сохранности или расширения и улучшения обслужи вания пользователей (в частности, организация мультидо ступа для спрашиваемых изданий путем предоставления в множественный доступ их электронных аналогов), и под лежащие долговременному хранению (электронные кни ги, цифровые версии печатных документов и т. п.);
•электронные документы, создаваемые на короткий срок в технологических целях на основе печатных ресурсов и не предназначенные для долговременного хранения или подлежащие уничтожению после однократного использо вания (копии материалов, используемых в системе МБА и доставки документов, электронные справки, квитанции и т. д.).
139
Глава 4. Электронные документы
Особый интерес при анализе типологии вызывает сравнение двух групп.
Во-первых, имеется обширный класс печатных (или даже рукописных) документов, соответствующих своему определе нию в узком, юридическом, смысле слова. Это удостоверения личности и паспорта различного назначения, водительские права, читательские билеты, выдаваемые библиотекой, записи актов гражданского состояния, Почетные и иные грамоты, бла годарности, наградные документы, свидетельства о регистра ции и нотариально заверенные копии, акции, векселя и облига ции, оттиски различных печатей и т. п. Это бумажные деньги и документы как основа законодательства, судопроизводства и директивного управления: законы, постановления, распоряже ния, декреты, приказы и т. д.
В электронном формате это список пока значительно коро че. Можно лишь с некоторой долей условности отнести к элек тронным такого рода документы:
•средства проверки аутентичности (логины),
•средства авторизации (пароли),
•электронные (цифровые) подписи.
Неким симбиозом печатного и электронного документа яв ляются кредитные карты, карточки с магнитной полосой для проезда на авиа- и наземном транспорте, дисконтные карточки, некоторые технологически продвинутые виды пропусков и удо стоверений личности и т . п., содержащие машиночитаемые за писи.
И, во-вторых, снова придется напомнить о вирусах, спаме и других нехороших выдумках. В мире печатных (рукописных) документов также с определенной условностью к схожим сред ствам можно было бы отнести так называемые письма счастья, которыми некоторые наши сограждане увлекались лет два дцать — тридцать тому назад. Сама логика этих «писем счастья», настроенная на бесконечное саморазмножение («прочти и на пиши 10 писем своим друзьям и знакомым, и тебе будет хоро шо») споткнулась о людское недоверие, скептицизм и попросту лень. А вот аналог назойливому электронному спаму, к сожале нию, имеется — это так называемые системы direct mail, а если называть вещи своими именами — наглая реклама, обезобра
140