Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4 курс / 1 семестр / ГИС / Лурье И.К. - Геоинформационное картографирование - М., КДУ - 2008.pdf
Скачиваний:
1264
Добавлен:
23.07.2018
Размер:
14.5 Mб
Скачать

8 4

Глава 2. Представление и организация географической информации

поступающим с серии ИСЗ: Глобальной навигационной спутниковой системы (ГЛОНАСС, Россия) и Global Positioning Systeir. (GPS, США) — Глобальной спутниковой системы (ГПС) — с точностью от метров до нескольких сантиметров [Серапинас, 2002]. Она сопоставима с точностью самых крупномасштабных карт Основное достоинство спутниковых систем — их глобальность оперативность, оптимальная точность; в отличие от традиционных геодезических измерений видимость между определяемыми пунктами не нужна. ГЛОНАСС работает в системе координат ПЗ-90,

аГПС - в WGS-84.

2.6.Качество данных и контроль ошибок

2.6.1. Типы ошибок в данных и их источники

Вполне резонно предположить, что множество пространственных данных содержит ошибки разного рода. Они могут вытекать из-за неточностей в источниках данных, лимитированной точности устройств цифрования или используемых компьютерных систем.

На весь набор данных влияют: ошибки регистрации и определения контрольных точек, преобразования координат, особенно когда неизвестна проекция исходного документа; ошибки обработки данных, неправильный логический подход, генерализация и интерпретация; математические погрешности; потеря точности представления из-за невысокой точности вычислений; перевод векторных данных в растровый формат и наоборот.

Основную информацию для ГИС поставляют разные карты, существенное значение имеет использование тематических карт созданных по данным дистанционного зондирования. Однако при использовании карт в ГИС нужно постоянно помнить их важные особенности:

изображение на картах абстрактно и генерализовано, что требует весьма осторожной его интерпретации;

карты показывают статичную картину, некий временной срез и часто устаревают;

от масштаба карты зависит не только «как», но и «какие* объекты изображены, а большая часть ГИС не учитывает

2.6. Качество данных и контроль ошибок

85

различий между наборами данных, полученных с разномасштабных карт;

при показе сферической поверхности Земли на карте неизбежны искажения.

Почти каждый этап создания БД чреват внесением ошибок. Свойства карт, заложенные при их создании, при цифровании автоматически переносятся в базу данных: из-за генерализации они не всегда точно фиксируют информацию о местоположении объекта, а несоответствия на границах листов могут обусловить несоответствия в базе данных, которые обнаруживаются часто лишь при последующей обработке.

Ошибки характерны для данных, взятых из некартографических источников. Они могут появиться и при проведении инвентаризации по аэрофотоснимкам, если изображения дешифрированы неверно, или потому, что слишком велико доверие к базовым картам. Другие ошибки связаны с проблемой границ и погрешностями классификации. Многие ошибки обусловлены особенностями сбора данных. Ручной ввод цифровых данных весьма утомителен и трудно сохранять качество работы на протяжении долгого времени.

Представления о качестве данных, их точности и оценке погрешности становятся чрезвычайно важными при создании баз и банков данных ГИС. Существует практически всеобщая тенденция забывать об ошибках в данных, если последние представлены в цифровой форме. Все пространственные данные до некоторой степени неточны, но в цифровой форме они обычно представляются с высокой точностью, определяемой параметрами памяти компьютера. Поэтому вопросы анализа и оценки качества данных приобретают еще большую актуальность, чем в традиционной картометрии. Необходимо каждый раз рассматривать два вопроса:

насколько правильно представляемые в БД цифровые структуры отражают реальный мир;

насколько точно алгоритмы позволяют рассчитать истинное значение результата.

Важно выявить и оценить следующие показатели качества данных: полнота материалов, их актуальность, происхождение, достоверность, геометрическая точность, составляющие математической

8 6 Глава 2. Представление и организация географической информации

основы, влияние деформации бумаги и искажений при цифровании и сканировании, влияние генерализации.

Основные из этих показателей — позиционная точность и точность атрибутов объектов, а также логическая непротиворечивость, полнота, происхождение — относятся к базе данных в целом.

Методы расчета точности определений по картам рассматриваются в курсе картографии, показатели качества данных определяются стандартами [ГОСТ, 1995]. Актуальны вопросы контроля измерений данных. Их желательно выполнять разными способами по разным источникам.

Определенные типы ошибок, возникающие, например, вследствие неточности оригинальной съемки данных, картографических источников, ошибочных действий оператора при ручном цифровании графических объектов, не могут быть исправлены без привлечения других источников. Ошибки позиционирования часто даже не обнаруживаются без комбинирования данных разных источников. Большинство ошибок цифрования устраняется на основе визуального контроля и интерактивных действий оператора.

Успех применения ГИС для выделения и изучения геосистем разных рангов в большой степени зависит также от качества информационной взаимоувязки слоев базы данных. Разнотипные цифровые данные — их позиционная и семантическая составляющие — должны быть согласованы на основе учета взаимосвязей объектов и явлений. Эти вопросы рассматриваются в параграфе 5.1.6.

2.6.2. Позиционная точность данных

Позиционная точность определяется как величина отклонения измерения данных о местоположении (обычно координат) от истинного значения.

При ее определении, как правило, исходят из масштаба исследования или первичного материала, например, в данных о природных ресурсах стремятся достичь точности карты заданного масштаба. Обеспечение большей точности требует более качественных исходных материалов, но всегда следует задаться вопросом, оправданы ли дополнительные затраты задачами исследования.

Точность координат определяется по-разному в векторном и растровом представлении, а ее компьютерное представление зависит от выбранной точности вычислений.

2.6. Качество данных и контроль ошибок

87

Координаты в векторном формате могут кодироваться с любой мыслимой степенью точности; она ограничивается возможностями внутреннего представления координат в памяти компьютера. Обычно для представления используется 8 или 16 десятичных знаков (одинарная или двойная точность), что соответствует ограничению по точности соответственно до 1/108 и 1/1016 измерения на местности. Таким образом, математическая точность представления координаты основывается на возможном числе значащих цифр, которые могут храниться для каждой координаты. При одинарной точности сохраняется до семи значащих цифр, при двойной — до 15 цифр, что позволяет сохранять математическую точность значений координат, намного меньших 1 м. Этого достаточно, чтобы закодировать любую точку земной поверхности с точностью, превышающей 1 мм. Поскольку компьютер в зависимости от установленной точности может различать только ограниченное число десятичных позиций, то для координат одинарной точности значения 1.2345678 и 1.23456789 эквивалентны, т. е. представляют одно и то же местоположение, так как цифры, выходящие за пределы седьмой позиции, игнорируются.

Математическая точность сама по себе не может обеспечить картографическую точность, однако она является главным фактором в определении разрешающей способности пространственных данных.

Точность вычислений описывается числом знаков, используемых для представления одной единицы измерения, и определяет степень детальности, поддерживаемой при хранении значений данных в базе данных. Так, при точности пространственной привязки, равной 1, координаты будут храниться в целых числах, в то время как точность 1,000 требует хранения трех десятичных знаков. Если координаты в базе данных хранятся как 4-байтовые целые числа, то они могут принимать максимальное значение 2 147 483 648 (231). Тогда при вычислениях с метровой точностью такое представление дает возможность работать с числами, не превышающими 2,1 млрдм. Соответственно при единицах измерения в сантиметрах диапазон чисел ограничен 2,1 млрд см. Эти единицы называют единицами хранения,

иустанавливают их на основе задаваемой точности всей БД.

ВГИС-пакетах вводится еще показатель «единицы карты», но он не имеет никакого отношения к точности. Эти единицы представляют

88 Глава 2. Представление и организациягеографическойинформации

размеры или измерения по карте. Например, метр — стандартная единица для карт в проекциях Гаусса-Крюгера, UTM, а фут — стандартная единица для плановой государственной системы координат США.

В некоторых картографических проекциях используются большие значения координат, например, в проекции UTM координаты принимают значения в диапазоне от 2 до 6 млн. Для того чтобы поддержать картографическую точность, составляющую менее одной единицы измерения и выражающуюся разрядами, расположенными за десятичной запятой, нужно использовать двойную точность. Двойная точность требует дополнительного дискового пространства для хранения координат.

Точность растра зависит от размера ячеек сетки. Для избежания потери информации можно использовать ячейки меньшего размера с тем, например, чтобы показать искусственные объекты, но следует оценить, что будет представлять выбранная ячейка в заданном масштабе. В большинстве случаев неясно, относятся ли координаты, представленные в растровом формате, к центральной точке ячейки или к одному из ее углов; точность привязки, таким образом, составляет 1/2 ширины и высоты ячейки.

Для получения точности растра, аналогичной математической точности представления данных в компьютере, необходимо, соответственно, 108х 108 или 1016х1016 ячеек, что невозможно даже при специальном сжатии данных. Однако и в векторном представлении только некоторые классы данных соответствуют такой точности: данные, полученные точной съемкой, карты небольших участков, составленные на основе крупномасштабных топографических карт лишь для немногих природных явлений характерны четкие границы которые можно представить в виде математически определенных линий. Поэтому можно утверждать, что тонкие линии в векторном формате дают ложное ощущение точности. Обычно на карте толщина линии отражает неопределенность положения объекта. Поэтом} в векторной системе фиксируется неопределенность положений векторного объекта, а не точность координат. В растровой системе эта неопределенность автоматически выражается размером ячейки который и дает действительное представление о точности.

Помимо ошибок в указании местоположения ошибки проявляются в нарушении топологических отношений объектов. Существуют

2.6. Качество данных и контроль ошибок

89

объекты, для которых на карте некоторые типы отношений недопустимы, например, наложение, пересечение и т. д. Так, не могут пересекаться горизонтали, дом не может попасть в пределы водоема.

Большая часть данных о местоположении берется с аэроснимков, при этом точность зависит от правильного размещения контрольных точек. Данные космической съемки труднее расположить с большой точностью — не позволяет разрешение снимка.

Часто возникают искусственные признаки ошибок (артефакты) — это нежелательные последствия применения высокоточных процедур для обработки пространственных данных, имеющих небольшую точность. Использование растровых данных позволяет застраховаться от артефактов до тех пор, пока размер элемента растра больше или равен позиционной точности данных. При работе с векторными данными артефакты возникают при кодировании (цифровании) и наложении полигонов.

Чтобы проверить позиционную точность, нужно использовать:

независимый, более точный источник, например, карту более крупного масштаба;

данные спутникового позиционирования;

первичные («сырые») данные съемки.

Для контроля используют и внутренние признаки: незамкнутые полигоны, линии, проходящие выше или ниже узловых точек, и т. п. Величина этих погрешностей может служить мерой позиционной точности.

2.6.3 .Точность атрибутивных данных

Точность атрибутов определяется как близость их к истинным показателям (на данный момент времени).

В зависимости от природы данных точность атрибутов может быть проанализирована разными способами.

Для непрерывных атрибутов, представляющих модель поверхности, например, ЦМР, точность определяется как погрешность измерений по этой модели.

Атрибуты представляют семантическую составляющую данных, и ее проверка в большинстве случаев возможна только путем визуального просмотра цифровой карты. Проверка правильности интерпретации условных знаков проводится путем сравнения исходного

9 0 Глава2. Представление и организация географической информации

оригинала и цифровой карты. Синтаксический контроль включает проверку на синтаксические ошибки, описки, лишние пробелы в текстовых атрибутах, соответствие кодов характеристик или их расшифровок классификатору или тексту легенды и т. п. Иногда существенную помощь в поиске ошибок и редактировании оказывают правильно построенные SQL запросы с операциями группировки по контролируемому полю.

Для атрибутов объектов, выделяемых в результате классификации, точность выражается в оценках соответствия, опреде-

ленности или правдоподобия. В случае двух объектов

ситуация,

в которой они представлены сочетанием 70 % атрибута

объекта А

и 30 % атрибута В, лучше, чем когда объекты Ли В недостаточно определены, что не позволяет четко разграничить их. В общем случае для оценки точности атрибутов полезно составить матрицу ошибок классификации. Для этого нужно взять несколько случайных точек, определить их категорию по базе данных, затем на местности определить истинный класс и заполнить матрицу классификации (соответствия). В приведенном примере число классов 4, а число обследованных точек 100, из них на местности определено 25 точек класса Л, 18 точек - Я, 24 - С и 33 - D (табл. 2.3).

Таблица 2.3. Матрица ошибок классификации

Класс на местности

 

 

Класс в БД

 

 

А

В

С

D

А

12

7

3

3

В

3

10

3

2

С

3

5

15

1

D

4

4

4

21

Всего

22

26

25

27

Всего

го ел

18

24

33

100

В идеале все точки должны располагаться по диагонали матрицы; это показывает, что на местности и в базе данных зафиксирован один и тот же класс. Ошибка пропуска возникает тогда, когда точки класса на местности неправильно зафиксированы в базе

2.6. Качество данных и контроль ошибок

91

данных. В матрице число ошибочных точек класса В равно сумме записей в столбцах Л, CwD строки В (числу точек, относящихся на местности к классу В, а в базе данных — к другим классам). Ошибка добавления (ложного класса) имеет место в случаях, когда в базе данных зафиксирован класс, которого нет на местности, например, для класса А — это сумма записей в строках В, С и D столбца Л (соответствует числу точек, неправильно отнесенных к классу Л в базе данных).

Для обобщения матрицы соответствия используют такой показатель достоверности классификации, как количество правильно классифицированных точек, расположенных по диагонали матрицы (в %). На самом деле это число может быть случайным. Чтобы учесть этот факт, часто при обобщении результатов используют так называемый индекс к каппа Коэна, вносящий поправку на случайность.

Он вычисляется по формуле

 

к = (d-q)/(N-q),

(2.1)

где rf— число случаев правильного получения результата (сумма значений, стоящих на диагонали матрицы соответствия); q — число случайных результатов, вычисляемое через число случайных результатов в столбцах пс и истинных в строках пг матрицы соответствия как q = X n r i J N , N — общее число точек. Для абсолютно точных результатов (все N точек на диагонали) каппа равна 1, а при чисто случайном попадании — 0. В приведенном примере

q - (22x25/100 + 26x18/100 + 25x24/100 + 27x33/100) = 25,09;

к = (58—25)/( 100—25) = 0,44;

показатель достоверности классификации равен 44 %, что меньше значения, полученного по диагональным элементам (58 %).

Неопределенность атрибутов каждого элемента растра постоянна для каждого из представленных классов объектов, а позиционная неопределенность постоянна для всего растра — фиксируется один раз для всей карты.

Для социальных данных основной источник неточности в атрибутах — недоучет данных. Например, при проведении переписи в некоторых районах и по некоторым социальным группам недоучет может быть очень высоким (>10 %).

9 2

Глава2. Представление и организация географической информации

 

2.6.4. Логическая непротиворечивость, полнота,

 

происхождение

 

 

Эти элементы качества данных относятся к базе данных в целом

а не к объектам, атрибутам или координатам.

 

Логическая непротиворечивость

связана с внутренней

непротиворечивостью структуры данных, с топологическим представлением данных, что означает наличие исчерпывающего списка взаимоотношений между связными геометрическими представлениями данных без измерения хранимых координат пространственных объектов. Она обычно заключается в ответах на вопросы замкнуты ли полигоны, нет ли полигонов без меток или с несколькими метками, есть ли узлы на всех пересечениях дуг. Логические противоречия могут быть связаны с проблемами согласования информации и географических границ при совмещении данных из разных источников.

Полнота связана со степенью охвата данными множества объектов, необходимых для представления реальности или отображения на результирующей карте (все ли соответствующие объекты включены в базу данных?). Она зависит от правил отбора объектов или явлений, генерализации и масштаба.

Происхождение включает сведения об источниках данных, времени сбора данных, точности источников и цифровых данных, организации, которая их собирала, об операциях по созданию базы данных (как кодировались данные и с какого исходного материала, как происходила их обработка). Обычно эта информация содержится

вспециальных файлах метаданных.

2.7.Особенности интеграции разнотипных

данных

Интеграционные свойства ГИС проявляются в использовании разных видов и типов цифровых данных, полученных из разньп источников, возможно с разной точностью. Такие данные требуют разработки методов их совместного применения, оценки пригодности для пространственно-временного анализа в ГИС.

Проблемы интеграции данных особенно остро встали в связг с широким использованием уже существующих цифровых карт содержащихся в разнообразных базах пространственных ланньп

2.7. Особенности интеграции разнотипных данных

93

и распространяемых по телекоммуникационным сетям. Они могут быть слоями проблемно-ориентированных ГИС, представлять результаты компьютерного дешифрирования аэро- и космических снимков, цифрового моделирования объектов или явлений. Информация относительно их происхождения, методов создания, точности и достоверности часто отсутствует или недоступна.

Современное техническое и программное обеспечение позволяет на основе любых доступных данных создавать сколь угодно сложные по содержанию карты и делать их легко доступными для использования и модификаций. Но часто это делается без учета картографических традиций, в то время как доверие к цифровым картам велико.

Технология создания цифровых карт часто определяется временными, не устоявшимися, разрозненными и не всегда профессионально составленными инструкциями и техническими заданиями производителя или заказчика работ, ведомственными инструкциями. Все чаще появляются в публикациях сообщения об ошибках цифровых карт, а иногда об их полной непригодности или недостоверности как источников данных.

Совокупность цифровых данных о пространственных объектах, составляющих содержание баз географических данных ГИС, по существу, еще не является цифровой картой. На картах, созданных на основе данных дистанционного зондирования, «пиксельные» разрешение и генерализация могут не соответствовать показателям картографической точности и генерализации для выбранных масштаба и проекции. Особенно сложна интеграция данных, представляемых на карте условными знаками, из-за их внемасштабности и уникальности.

В БД обычно используются данные из разных источников с разной степенью точности. При наложении множества карт точность результирующего материала может оказаться очень низкой. Однако больший интерес представляет показатель пригодности полученной карты. Для некоторых типов операций степень пригодности карт определяется точностью наименее точного слоя БД. Показатель пригодности можно оценить также по его устойчивости при смене порядка ввода данных или изменении веса атрибута.

Преимущество геоинформационных методов заключается в возможности оценить пригодность данных для совместного

9 4

Глава 2. Представление и организация географической информации

использования и осуществить их интеграцию на основе выполнения пространственного анализа с помощью ГИС-технологий (см. раздел 4.5). Однако основное правило при интеграции информации таково: качество данных должно быть определено скорее вс время получения данных, чем при попытке применить эти данные Тогда указанные технологии могут существенно облегчить их корректировку для поставленной задачи.

Основные проблемы, возникающие при совместном использовании разнотипных данных: отображение положения границ в разных цифровых источниках, временные параметры данных и способ отражения структуры геосистем, а при интеграции данных о природных компонентах и окружающей среде — разные принципы классификации объектов на снимках и картах, не очень частое обновление, а также различия генерализации и согласования.

Разные принципы представления пространственной информации в БД, применение разных моделей и форматов данных, разных типов СУБД требует наличия различных технических и программных средств манипулирования совмещаемыми данными. Этим объясняется расширение наборов обменных форматов и процедур импорта-экспорта данных, которыми сейчас снабжаются наиболее распространенные ГИС-пакеты, и стремление к открытости ГИС.

Использование систем, в которых растровый и векторный анализ могут выполняться параллельно, позволяет осуществлять наложение векторной карты на растровую или на космический снимок. Интеграция векторных и растровых данных не приводит к конфликтным ситуациям, если разрешение растра (параметров съемки или сканирования) согласовано с точностью картографи- рования в данном масштабе. Неправильный выбор разрешения при сканировании космических снимков может привести к потер*" информации. С другой стороны, уменьшение размера пиксела (увеличение разрешения при сканировании) не всегда повышает точность и информативность данных, зачастую только значительно увеличивая объемы хранимой информации. Знание этих параметров особенно важно при совместном использовании растровых и векторных карт, поскольку большинство операций с растровыми данными осуществляется с точностью до пиксела. Это относится

2.7. Особенности интеграции разнотипных данных

95

и к совмещению разнотипных дискретных данных для построения математико-картографической модели и ее использования в качестве источника непрерывно распределенной цифровой информации. Как правило, модели строятся с использованием различного типа сеток. Совмещение данных с разным размером сеток, характеризующим уровень дискретизации и, следовательно, обобщения информации, искажает передачу взаимосвязей объектов и явлений, имеющих пространственное распространение. Подобные искажения могут возникнуть при попытке создания моделей динамики объектов на основе использования оригинальных космических снимков и цифровых снимков, называемых Quicklook, распространенных в Интернете.

Разные принципы генерализации изображений на картах и снимках, в автоматизированном режиме зачастую реализуемые в интерактивном режиме отдельно для позиционных и атрибутивных данных, создают особую проблему совместного использования данных. Без знания методов и уровня генерализации совмещаемых данных их применение становится невозможным, необходимы также сведения, в каком диапазоне масштабов следует использовать тематические слои БД.

Разнотипные цифровые данные должны быть согласованы на основе учета взаимосвязей исследуемых явлений. Методы обеспечения единства карт — их согласования — один из главных принципов комплексного картографирования, а соответственно и ГИС. Поэтому выбор ГИС-технологий интеграции определяется также типом самих природных, социально-экономических, экологических данных, а также данными географической привязки.

К данным географической привязки предъявляют особенно высокие требования по точности и достоверности еще на этапе сбора исходной информации. Их применение в качестве основы для интеграции данных в известных оригинальных масштабах и проекциях не вызывает затруднений. Во всех других случаях требуется преобразование информации, которое должно выполняться по правилам картографической генерализации и согласования.

Создание проблемно-ориентированных банков географических

икартографических данных и знаний способствует не только накоплению и обмену информацией, но и повышению качества

идостоверности ГИС-анализа и картографирования. Особенно

9 6 Глава2. Представление и организация географической информации

возрастает роль таких банков для интеграции, пространственного и тематического согласования информации при использовании карт в ГИС, создании цифровых карт, комплексных электронных атласов.

Решение проблем интеграции данных при создании и использовании цифровых карт заключается в разработке инфраструктуры пространственных данных (на национальном, межгосударственном уровнях), четкой структуры метаданных и картографически обоснованного применения ГИС-технологий при работе с разнотипными

данными.

 

 

Инфраструктура

пространственных

данных (ИПД) —

«информационно-коммуникационная система, обеспечивающая доступ пользователей (граждан, хозяйствующих субъектов, органов государственной и муниципальной власти) к национальным распределенным ресурсам пространственных данных, а также распространение и обмен ими в сети Интернет или иной общедоступной глобальной сети в целях повышения эффективности их производства и использования. ИПД включает четыре необходимых компонента: базовые пространственные данные, стандартизацию, базы метаданных и механизм обмена данными, а также институциональную основу их реализации» [Геоинформатика, 2005].

Под формированием инфраструктуры пространственных данных подразумевается разработка механизма их обмена и накопления (доступность, стоимость, система стандартов), а также определение единой — базовой — пространственной информации; этой составляющей ИПД уделяется особое внимание.

Базовые пространственные данные — общедоступная часть ресурсов пространственных данных, включающая информацию об их геодезической основе, избранных пространственных объектах и их наборах, необходимых для позиционирования любых иных данных. Критериями для отнесения данных к базовым служат: их всеобщая востребованность, возможность многократного и многоцелевого использования, наличие готовых цифровых наборов пространственных данных и технологий их массового производства, обеспечивающих повышенные требования к качеству, включая позиционную точность и актуальность.

Базовый пространственный объект — пространственный объект в составе базовых пространственных данных, идентифи-

2.7. Особенности интеграции разнотипных данных

97

цируемый в соответствии с установленными правилами, отличающийся устойчивостью пространственного положения во времени и служащий основой позиционирования других пространственных объектов.

В Руководстве по созданию ИПД, изданном Ассоциацией глобальной инфраструктуры пространственных данных (GSDI), к набору элементов базовых данных отнесены: геодезические сети, ортоизображения, рельеф в виде ЦМР, транспортные сети, гидрография, границы административных единиц, кадастровая информация и национальные газеттиры (особые БД, позволяющие соотносить топонимы с местоположением на базовой карте). Этот набор рекомендован и для Российской ИПД [ГОСТ, 2006].

Классическим источником базовой пространственной информации служат топографические карты. Во многих странах данные этого типа представлены и в цифровой форме, обычно в разных масштабах. Но составляются они, как правило, с соблюдением национальных стандартов. В России, часто в силу высокой стоимости цифровых карт или отсутствия карты нужного масштаба, появились цифровые топографические основы, полученные «пользовательским» цифрованием топографических карт на различные районы или регионы. Это ведет к появлению многочисленных цифровых дублей неопределенного качества, широкое использование которых, несмотря даже на их доступность, проблематично.

Наиболее надежным путем создания качественной БД, особенно для ее многократного и многопользовательского применения, является хранение информации о точности в самой БД в виде атрибутов или метаданных, что требует стандартизации их описания.

Метаданные должны содержать информацию о проекции, географической основе и базовой карте, уровне генерализации, цензе и норме отбора объектов картографирования, дизайне, времени создания или переиздания карты и давать дополнительную информацию о процедурах сбора и компиляции данных, системах кодирования и точности приборов и др. Например, общий список характеристик метаданных стандарта CSDGM (Content Standarts for Digital Geospatial Metadata), США, насчитывает более 300 позиций. В метаданных необходимо указывать все примененные способы преобразования данных и их точности. Наличие метаданных

9 8

Глава2. Представление и организация географической информации

позволяет пользователю получить представление о достоверности информации, а их отсутствие часто ведет к неправильной трактовке и ложным представлениям о точности самих данных. Заполнение файлов метаданных обеспечивает контроль качества БД при ее обновлении.

Механизм обмена данными включает не только стандарты на пространственные данные и метаданные, но и правила доступа к ним через национальные информационные центры, поиск на основе каталогов метаданных через Интернет.

Для обеспечения поиска пространственных данных, в том числе базовых, в сети Интернет создаются различные поисковые системы (например, Googl Earth, Geography Network) и каталоги на Web-cepeepax.