Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Для УМК БД.doc
Скачиваний:
52
Добавлен:
19.08.2019
Размер:
1.35 Mб
Скачать

3.1.1. Оценка работы и поддержка б.Д. Производится оценка с точки зрения выполнения требований пользователей. В случае необходимости в систему вносятся изменения.

Типология БД. Документальные БД. Фактографические БД. Гипертекстовые и мультимедийные БД. XML-серверы. Объектно-ориентированные БД. Распределенные БД, Коммерческие БД.

В 60х гг. появились АИС предназначенные для хранения и обработки информации фактического характера.

По мере интеллектуализации АИС появилась возможность обработки текстовых документов на естественном языке, изображения и другие виды и формы представления данных.

Принципы хранения данных в системе обработки фактической и документальной информации схожи, но алгоритмы их обработки различаются. Таким образом выделяют 2 крупных класса информационных систем:

- Документальные

- Фактографические

Документальные системы служат для работы с документами на естественном языке, это монографии, публикации, сообщениями, различными текстами. Они обеспечивают их смысловой анализ при неполном представлении смысла. Наиболее распространенный тип документальных систем - это информационно поисковые системы (ИПС), предназначенные для накопления, поиска по разным критериям документов на естественном языке.

Другой большой класс - фактографические системы, они оперируют фактическими сведениями, представлены специальным образом в виде организованных совокупностей формализованных записей данных. Фактографические системы используются не только для реализации справочных функций, но и для решения задач обработки данных и предоставление итоговых данных пользователям в табличной форме.

3.1.1.1. Документальные системы

 

Назначение - чаще всего информация представляется в виде простых текстовых документов. За такими системами укоренилось название информационно-поисковые системы (ИПС).

Документальные информационно-поисковые системы (ДИПС) должны отвечать на запросы пользователей на основе проведения информационного поиска документов. Пользователь формирует информационный запрос к ДИПС на естественном языке (ЕЯ). В теории ДИПС введены 2 фундаментальных понятия:

1. пертинентность - соответствие смыслового содержания документа информационной потребности пользователя

2. релевантность - соответствие содержания документа информационному запросу в том виде, в котором он сформирован.

Автоматизация процесса информационного поиска требовала формализации представлений смыслового содержания информационных запросов и документов в виде поисковых предписаний (ПП) и поискового образа документа (ПОД).

Для записи ПП и ПОД применяют специализированные языки - информационно-поисковые языки (ИПЯ). Поиск осуществляется на основе сопоставления поискового образа документа и поискового предписания ПП и применяется решение о выдачи документа

3.1.1.2.Обобщенная функциональная структура дипс.

 

В состав типичной ДИПС входят основные подсистемы

1. ввод и регистрация

2. обработка

3. хранение

4 . поиск

Рисунок 3.1 Основные подсистемы типичной ДИПС.

ПП - поисковые предписания

ПОД - поисковый образ документа

КСС - критерий смыслового соответствия

Текстовые документы, поступающие на вход в системы могут быть представлены как в бумажном, так и в электронном виде. Поэтому подсистема ввода и регистрации решает следующие задачи:

1. создание электронных копий бумажных документов, сканирование с последующим распознаванием или ввод с клавиатуры

2. обеспечение подключения к каналам, доставляющие электронные документы

3. распознавание, а при необходимости, преобразование формата электронных документов

4. присвоение электронным документам уникальных идентификаторов (регистрация)

Все поступающие документы поступают в подсистему хранения для сохранения в базе документов. Подсистема хранения представляет собой  совокупность стандартных и специализированных средств архивации, обеспечивающих возможность доступа к данным по предъявляемому идентификатору. Хранение осуществляется в файлах, распределяясь по каталогам жесткого диска. Далее документы поступают в подсистему обработки, задачей которой является программирование для каждого документа поискового образа документа ПОД. ПОД сохраняется в индексе, индекс представляет таблицу, строки которой соответствуют документам, а столбцы - информационным признакам, на основе которых стоится поисковый образ документа ПОД. При поступлении на вход системы запрос пользователя он преобразуется в поисковое предписание и подается на вход подсистемы поиска, задачей которой является описание в индексе поискового образа документа ПОД, удовлетворяющего поисковому предписанию ПП.

Идентификаторы релевантных документов подаются с выхода подсистемы поиска на вход подсистемы хранения, которая осуществляет выдачу пользователю самых релевантных документов.

В организации ДИПС существует проблема иформационного представления содержания текста:

1. недостатки естественного языка:

многообразие средств передачи

2. семантическая неоднозначность:

- синонимия, т.е. тождественность или общность значению слов, выражающих одно и тоже понятие

- многозначность, характеризует неоднозначность понимания отдельных слов, делится на полисемию - совпадение названий различных предметов и антонимию - совпадение названий различных предметов, не имеющих между собой общих свойств

лексичность - пропуск подразумеваемых слов

Поэтому внедрили информационно-поисковые языки (ИПЯ).

ИПЯ - специализированный искусственный язык, предназначенный для описания основного смыслового содержания, поступающих в систему сообщений, с целью обеспечения возможности последующего их поиска.

ИПЯ создается на базе ЕЯ, но более компактен, имеет четкие грамматические правила, отсутствие семантической неоднозначности.

ИПЯ делиться на:

- классификационные

- дескрипторные

Классификационные, в них наравне со славами, выражениями в простые понятия включены словосочетания и фразы, выражающее сложное понятие.

Например

Политика. Внутренняя. Федеральная

Политика. Внутренняя. Региональная.

Политика. Внутренняя.

Следовательно, производится классификация сообщений. Частный случай классификации языка является рубрикатор.

Дескрипторные, в них сложное предложение создаются путем объема лексических единиц во время работы. Готовых предложений или фраз нет из-за небольшого числа лексических единиц такие языки позволяют строить предложения иного смысла, в них отсутствует грамматика

Например:

Владеть Иванов автомобиль

Иванов Владеть автомобиль