Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

8251

.pdf
Скачиваний:
0
Добавлен:
24.11.2023
Размер:
1.48 Mб
Скачать

91

ориентированных, является Смолток. Он предназначен для решения нечисловых задач и находит широкое применение при проектировании систем искусственного интеллекта. Программа на этом языке состоит из множества функциональных автономных объектов и средств взаимодействия между ними. Каждый объект содержит некоторую структуру данных и процедуры манипулирования ими. Внешние свойства объекта проявляются в функциях, которые объект выполняет для других объектов. В современных реализациях этого языка широко используется многооконный режим.

К функциональным языкам программирования можно отнести языки Лисп, Пролог и СНОБОЛ. Язык Лисп является прекрасным инструментальным средством для построения программ с использованием методов искусственного интеллекта. Имеется несколько реализаций Лисп-трансляторов для ПЭВМ различных классов. Особенность этого языка заключается в удобстве динамического создания новых объектов. В качестве порождаемых программой объектов могут фигурировать и сами программы, которые внешне ничем не отличаются от данных. Это обусловливает возможность построения адаптирующихся и самоизменяющихся программ. Память в языке Лисп используется динамически — когда создается новый объект, то для него из незанятой памяти берется столько ячеек, сколько нужно для хранения всех элементов. При этом не требуется никакого заблаговременного резервирования памяти, как в других языках (например, в Паскале). При уничтожении объекта занятая им память автоматически освобождается. Если язык Лисп известен давно, то язык Пролог получил широкую известность в связи с японским проектом создания вычислительных систем пятого поколения. Одной из первых реализаций был интерпретатор микро-Пролог фирмы Programming Logic Associates для машин фирмы IBM. Затем появилась мощная система программирования Турбо-Пролог, разработанная фирмой Borland International для этих же машин. Она предназначалась для создания широкого класса систем искусственного интеллекта, в том числе персональных экспертных систем. Версия Турбо-Пролог значительно отличается от стандартного Пролога. Отличия, прежде всего, касаются наличия в нем встроенных средств типизации данных и большей структурированности исходных текстов программ.

Язык СНОБОЛ располагает мощными средствами манипулирования строками и сравнения с образцом. Главным образом СНОБОЛ используется для обработки текстов на естественном языке и применяется в экспертных системах. Известны некоторые версии языка, реализованные для персональных компьютеров, но применение языка ограничено сферой искусственного интеллекта.

Нетрудно заметить, что АЯВУ, который был бы идеальным для всех случаев, не существует. Наиболее важная задача программного обеспечения заключается в том, чтобы определить, какой язык является «наилучшим» в каждой конкретной ситуации. Во многих случаях такой выбор диктуется очень простыми причинами — доступностью того или иного транслятора и умением составлять программы на данном языке. Если, однако, в распоряжении пользователя имеется достаточно большой выбор языков программирования,

92

то необходимо учитывать следующие обстоятельства:

назначение разрабатываемой программы (будет ли она использоваться временно или постоянно, будет ли она модернизироваться и развиваться);

время выполнения программы (имеется в виду соотношение вычислительных процедур и процедур ввода-вывода);

ожидаемый размер программы (хватит ли памяти для реализации целиком всей программы или следует ее разделить на отдельные взаимодействующие модули);

необходимость сопряжения разрабатываемой программы с другими пакетами или программами, в том числе составленными на других языках программирования;

предусматривается ли возможность переноса программы на другие типы ЭВМ;

основные типы данных, с которыми будет работать программа (целые и вещественные числа, строки, списки и другие типы структур);

характер и уровень использования аппаратных средств (дисплея, клавиатуры, НМД и др.);

возможность и целесообразность использования имеющихся стандартных библиотек программ, процедур, функций.

С учетом этих критериев возможности языков могут весьма сильно

различаться, поэтому правильный выбор АЯВУ является непростой задачей. Для программиста или даже коллектива программистов характерно начинать использование ПЭВМ с языка Бейсик или Паскаль. На Бейсике (и его разновидностях) реализовано довольно много хороших прикладных систем. Появление компиляторов для Бейсика делает этот язык еще более привлекательным, так как позволяет быстро переходить от экспериментальной, интерпретируемой версии программы к ее окончательной версии. В последнее время появились разработки программ на этом языке для систем искусственного интеллекта и экспертных систем. Графические интерфейсы пользователя, или GUIs, революционизировали микрокомпьютерную индустрию. Они продемонстрировали, что выражение «Лучше один раз увидеть, чем сто раз услышать» не потеряло своего смысла для большинства пользователей компьютеров. Вместо загадочной командной строки «С:>», которую так долго наблюдали пользователи DOS (автор также относится к их числу), теперь они смотрят на «рабочий стол» (desktop), заполненный значками программ, управляя ими про помощи мыши или посредством меню.

Появление информационных и вычислительных сетей и распределенных баз данных вызвано появление специализированных языков программирования, обслуживающих эти области использования ЭВМ. Потребовалось создание специальных средств организации человекомашинного взаимодействия, диалога человека с ЭВМ (QBE, SQL).

Контрольные вопросы:

1.Классификация языков программирования.

93

2.Перечислите основные языки программирования и их ориентированность на определенные проблемные области.

8.Базы данных

8.1.Документальные и фактографические информационные системы

В60-х годах была осознана необходимость применения средств компьютерной обработки хранимой информации там, где были накоплены значительные объемы полезных данных – в военной промышленности, в

бизнесе. Появились автоматизированные информационные системы (АИС) –

программно-аппаратные комплексы, предназначенные для хранения, обработки информации и обеспечения ею пользователей. Первые АИС работали преимущественно с информацией фактического характера, например, характеристиками объектов и их связей. По мере «интеллектуализации» АИС появилась возможность обрабатывать текстовые документы на естественном языке, изображения и другие виды и форматы представления данных.

Несмотря на то, что принципы хранения данных в системах обработки фактической и документальной (текстовой) информации схожи, алгоритмы обработки в них заметно различаются. Поэтому в зависимости от характера информационных ресурсов, которыми оперируют такие системы, принято различать два крупных их класса – документальные и фактографические.

Документальные системы служат для работы с документами на естественном языке – монографиями, публикациями в периодике, сообщениями пресс-агентств, текстами законодательных актов. Они обеспечивают их смысловой анализ при неполном, приближенном представлении смысла. Наиболее распространенный тип документальных систем – информационно-поисковые системы (ИПС), предназначенные для накопления и поиска по различным критериям документов на естественном языке.

Другой большой класс автоматизированных систем – фактографические системы. Они оперируют фактическими сведениями, представленными в виде специальным образом организованных совокупностей формализованных записей данных. Центральное функциональное звено фактографических информационных систем – системы управления базами данных (СУБД). Фактографические системы используются не только для реализации справочных функций, но и для решения задач обработки данных. Под обработкой данных понимается специальный класс решаемых на ЭВМ задач, связанных с вводом, хранением, сортировкой, отбором и группировкой записей данных однородной структуры. В большинстве случаев эти задачи предусматривают предоставление пользователям итоговых результатов обработки в виде отчетов табличной формы.

Задачи, связанные с обработкой данных, широко распространены в любой сфере деятельности. Они ведут учет товаров в супермаркетах и на складах, начисляют зарплату в бухгалтериях и т.д. Невозможно представить

94

себе деятельность современного предприятия или учреждения без использования АИС. Эти системы составляют фундамент информационной деятельности во всех сферах, начиная с производства, управления финансами и телекоммуникациями и заканчивая управлением семейным бюджетом.

Массивы информации, накопленные в АИС, должны быть оптимальным образом организованы для их компьютерного хранения и обработки, должна обеспечиваться их целостность и непротиворечивость. Используя функции стандартных файловых систем, невозможно добиться нужной производительности при решении подобных задач, поэтому все автоматизированные информационные системы опираются на СУБД – системы управления базами данных.

8.2. Системы управления базами данных

Любая АИС оперирует той или иной частью реального мира – предметной областью. Предметная область рассматривается как некоторая совокупность реальных объектов (сущностей) и связей между ними. Каждый объект обладает определенным набором свойств (атрибутов). Например, в системе автоматизации бухгалтерии организации требуется хранить сведения о сущностях – ее служащих. К признакам (атрибутам) сущностей, которые будут актуальны для этой информационной системы, можно отнести: личный номер, имя сотрудника, его должность, стаж работы и т.д. Каждый признак объекта имеет конкретное значение, например, значение атрибута «стаж работы» объекта «служащий» может быть равно «10». Это отражает факт, что стаж работы конкретного служащего составляет 10 лет. Предметная область может включать не только физические объекты, но и сведения о процессах, абстракциях.

Между сущностями могут существовать связи разного рода. Так, любой служащий принадлежит некоторому отделу организации, поэтому в число атрибутов сотрудника может потребоваться включить атрибут «отдел».

Предметная область АИС «материализуется» в форме хранимой в памяти ЭВМ структурированной совокупности данных, которые характеризуют состав объектов предметной области, их свойства и взаимосвязи. Такое отражение предметной области принято называть базой данных (БД).

Системы управления базами данных появились в конце 60-х – начале 70-х годов. СУБД первого поколения были ориентированы на мэйнфрэймы, доминировавшие в то время. Возможности первых СУБД были ограниченными, они имели много недостатков, однако АИС на их базе используются до сих пор. СУБД постоянно совершенствовались - возникали новые подходы к хранению и обработке данных, организации процесса разработки баз данных и приложений на их основе. Сегодня системы управления базами данных представляют собой совершенные инструменты, которые могут быть успешно применены в различных областях человеческой деятельности.

95

8.3. Модели данных

Способ отображения сущностей, атрибутов и связей на структуры данных определяется моделью данных. Принято выделять иерархическую, сетевую, реляционную модели данных и иногда модель на основе инвертированных списков. Соответственно говорят об иерархических, сетевых, реляционных СУБД или СУБД на базе инвертированных списков.

Иерархическая модель позволяет строить базы данных с иерархической древовидной структурой. Эта структура определяется как дерево, образованное попарными связями. На самом верхнем уровне дерева имеется один узел, называемый корнем. Все другие узлы, кроме корня, связываются только с одним узлом на более высоком по отношению к ним самим уровне (см. рис. 8.1). Например, на рис. 8.1 объект «Организация» – предок для объектов «Отделы» и «Филиалы».

Основное достоинство иерархической модели – простота описания иерархических структур реального мира.

Если в модели каждый порожденный элемент может иметь более одного исходного, то такая модель называется сетевой. В ней элемент может быть связан с любым другим, без каких-либо ограничений. Сетевая БД состоит из набора записей, соответствующих каждому экземпляру объекта предметной области, и набора связей между ними. Так, например, информация об участии сотрудников в проектах организации может быть представлена в сетевой БД (см. рис. 8.2). В данном примере сетевая модель хорошо отражает то, что в проекте могут участвовать разные сотрудники и в то же время сотрудник может участвовать в различных проектах.

Организация

 

Отделы

 

 

 

Филиалы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Начальник Сотрудники Оборудование

Компьютеры

 

Факсимильные

 

аппараты

 

 

Рис. 8.1. Пример иерархической древовидной структуры БД

96

Рис. 8.2. Пример сетевой структуры БД

В реляционных базах данных вся информация представляется в виде прямоугольных таблиц. Реляционная модель была разработана Коддом в начале 70-х годов. С ее созданием был начат новый этап в эволюции СУБД. Простота и гибкость модели привлекли к ней внимание разработчиков и снискали ей множество сторонников. Несмотря на некоторые недостатки, реляционная модель данных стала доминирующей, а реляционные СУБД стали промышленным стандартом «де-факто».

Реляционная модель опирается на систему понятий реляционной алгебры, важнейшие из которых: таблица, отношение, строка, столбец, первичный ключ. Все операции над реляционной базой данных сводятся к манипуляциям с таблицами. Таблица состоит из строк и столбцов и имеет имя, уникальное внутри базы данных. Таблица отражает тип объекта реального мира (сущность), а каждая ее строка (кортеж) - конкретный объект (см. рис. 8.3). Например, таблица «Сотрудники отдела» содержит сведения обо всех сотрудниках отдела, каждая ее строка - набор значений атрибутов конкретного сотрудника. Значения конкретного атрибута выбираются из домена (domain) – множества всех возможных значений атрибута объекта. Имя столбца должно быть уникальным в таблице. Столбцы расположены в таблице в соответствии с порядком следования их имен при ее создании. Любая таблица должна иметь по крайней мере один столбец. В отличие от столбцов строки не имеют имен. Порядок их следования в таблице не определен, а количество логически не ограничено. Так как строки в таблице не упорядочены, невозможно выбрать строку по ее позиции - среди них не существует «первой» и «последней».

97

Название таблицы

Атрибуты

 

 

Сотрудники отдела

 

 

 

 

 

 

 

 

 

 

 

 

Номер

ФИО

Доверенность

Телефон

 

 

 

пропуска

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2357

Уваров Михаил Николаевич

начальник

53-22

Кортежи

 

 

 

 

 

 

 

 

2398

Сидоров Петр Алексеевич

главный инженер

53-12

(строки)

 

 

 

 

 

 

 

 

 

 

 

2315

Петренко Роман Иванович

инженер

53-33

 

 

 

 

 

 

 

 

 

 

2365

Николаев Борис Михайлович

инженер

53-33

 

 

 

 

 

 

 

Первичный

ключ

Рис. 8.3. Отношение реляционной ВЦ

Любая таблица имеет один или несколько столбцов, значения в которых однозначно идентифицируют каждую ее строку. Такой столбец (или комбинация столбцов) называется первичным ключом. В таблице «Сотрудники отдела» первичным ключом служит столбец «Номер пропуска». В таблице не должно быть строк, имеющих одно и то же значение первичного ключа. Если таблица удовлетворяет этому требованию, она называется отношением.

Взаимосвязь таблиц в реляционной модели поддерживается внешними ключами. Внешний ключ - это столбец, значения которого однозначно характеризуют сущности, подставленные строками некоторого другого отношения, то есть задают значения их первичного ключа. Говорят, что отношение, в котором определен внешний ключ, ссылается на соответствующее отношение, в котором такой же атрибут является первичным ключом.

Таблицы невозможно хранить и обрабатывать, если в базе данных отсутствуют «данные о данных» (метаданные), например, описатели таблиц, столбцов и т.д. Метаданные также представлены в табличной форме и хранятся в словаре данных. Помимо таблиц в БД могут храниться и другие объекты, такие как экранные формы, шаблоны отчетов и прикладные программы, работающие с информацией базы данных.

Для пользователей информационной системы важно, чтобы база данных отражала предметную область однозначно и непротиворечиво. Если она обладает такими свойствами, то говорят, что БД удовлетворяет условию целостности. Чтобы добиться выполнения условия целостности, на базу данных накладываются некоторые ограничения, которые называют ограничениями целостности. Выделяют два основных типа ограничений целостности: целостность сущностей и целостность ссылок. Ограничение первого типа состоит в том, что любой кортеж отношения должен быть отличим от любого другого его кортежа, т.е., другими словами, любое отношение должно обладать первичным ключом. Это требование

98

удовлетворяется автоматически, если в системе не нарушаются базовые свойства отношений. Ограничение целостности по ссылкам заключается в том, что внешний ключ не может быть указателем на несуществующую строку в таблице.

Доминирование реляционной модели в современных СУБД обусловлено рядом причин, в числе которых:

1)наличие развитой теории реляционной модели данных, которая поддержана теоретическими исследованиями в большей степени по сравнению

сдругими моделями;

2)наличие аппарата сведения к реляционной других моделей данных;

3)поддержка реляционной моделью специальных средств ускоренного доступа к информации;

4)возможность манипулирования данными без необходимости знания конкретной физической организации БД во внешней памяти;

5)наличие стандартизованного высокоуровневого языка запросов к базам данных.

Базы данных, организованные с помощью инвертированных списков, похожи на реляционную БД. Отличия заключаются в следующем:

1)хранимые таблицы и индексы для ключей поиска напрямую доступны пользователям;

2)строки таблиц упорядочены системой в некоторой физической последовательности.

8.4. Операции над отношениями реляционных БД

Для манипулирования отношениями используют операции реляционной алгебры. Эти операции - мощное средство выделения необходимых данных из большой совокупности разнородной информации. Отношения реляционной алгебры - это множества, поэтому средства работы с отношениями базируются на традиционных операциях теории множеств, которые дополняются некоторыми специальными операциями, специфичными для баз данных.

Чаще всего выделяют следующие операции реляционной алгебры:

1)объединение отношений;

2)пересечение отношений;

3)разность отношений;

4)произведение отношений;

5)деление отношений;

6)ограничение отношения;

7)проекция отношения;

8)соединение отношений.

Кроме перечисленных выше, в СУБД, как правило, реализуются также операция присваивания, позволяющая сохранять в базе данных результаты обработки, и операция переименования атрибутов.

Не вдаваясь в детали, операции реляционной алгебры могут быть описаны следующим образом.

99

1)Операция объединения двух отношений позволяет создать отношение, включающее все строки отношений-операндов. Отношенияоперанды должны иметь одинаковый набор атрибутов.

2)Результат операции пересечения отношений - отношение, содержащее строки, которые входят одновременно в оба отношения-операнда. Отношения-операнды должны иметь одинаковый набор атрибутов.

3)Разность отношений используется для выделения строк, которые входят в первое отношение-операнд и не входят во второе. Операнды должны иметь одинаковый набор атрибутов.

4)При выполнении произведения двух отношений каждая строка первого отношения-операнда сцепляется (конкатенируется) с каждой строкой второго отношения-операнда. Сцепленные строки образуют отношениерезультат. Число строк в отношении-результате равно произведению числа строк в отношениях-операндах. Множества атрибутов отношений-операндов не должны пересекаться.

5)Операция деления «обратна» операции умножения.

6)Операция ограничения (выбора) отношения по некоторому условию позволяет выбрать те строки отношения-операнда, которые этому условию удовлетворяют.

7)Операция проекции позволяет выбрать из отношения-операнда определенные столбцы.

8)Операция соединения - одна из наиболее важных операций реляционной алгебры. Она имеет большое практическое значение. Существует 2 типа операций соединения: операция соединения по условию и операция естественного соединения. При выполнении операции соединения по условию двух отношений происходит конкатенация строк отношений-операндов, затем полученная сцепленная строка проверяется на соответствие заданному условию. Если строка удовлетворяет условию, она включается в отношениерезультат. Если отношения-операнды обладают общим атрибутом (возможно, составным), то условие соединения может быть опущено, при этом подразумевается, что сравнение производится на равенство значений общих атрибутов. В этом случае говорят о естественном соединении отношений.

9)Операция переименования изменяет имена атрибутов отношения.

10)Операция присваивания позволяет сохранить результат вычисления реляционного выражения в отношении базы данных.

Строгое определение операций реляционной алгебры можно найти в литературе, посвященной теории баз данных. Пользователи, как правило, имеют дело с этими операциями в виде конструкций языков программирования, например, языка SQL-запросов.

8.5. Нормализация отношений

При проектировании базы данных стараются, чтобы отображение объектов предметной области в структуры модели данных не противоречило семантике предметной области. Оно должно быть эффективным, то есть должно обеспечивать минимальное дублирование данных, удобство их

100

обработки и обновления. Для удовлетворения этих требований необходимо определить, из каких отношений должна состоять БД и какие атрибуты должны входить в эти отношения. Теория реляционных баз данных обладает мощным инструментом, который способен помочь разработчику оптимальным образом спроектировать структуру отношений базы данных. Этот инструмент - метод нормализации отношений.

Нормализация отношений - пошаговый процесс разложения (декомпозиции) исходных отношений БД на более простые. Каждая ступень этого процесса приводит схему отношений БД в последовательные «нормальные формы». Каждая следующая нормальная форма обладает «лучшими» свойствами, чем предыдущая.

В теории реляционных баз данных принято выделять следующую последовательность нормальных форм:

1)первая нормальная форма (1NF);

2)вторая нормальная форма (2NF);

3)третья нормальная форма (3NF);

4)нормальная форма Бойса-Кодда (BCNF);

5)четвертая нормальная форма (4NF);

6)пятая нормальная форма (5NF).

Каждой нормальной форме соответствует некоторый набор ограничений. Отношение находится в определенной нормальной форме, если оно удовлетворяет набору ограничений этой формы. Переводя структуру отношений БД в формы более высокого порядка, мы добиваемся удаления из таблиц избыточной неключевой информации.

Процесс нормализации основан на понятии функциональной зависимости атрибутов. Говорят, что атрибут В функционально зависит от атрибута А, если в любой момент времени каждому значению атрибута А соответствует не более одного значения атрибута В. Термин «функциональная зависимость» соответствует понятию функции в математике. Если неключевой атрибут зависит от всего составного ключа и не зависит от его частей, то говорят о полной функциональной зависимости атрибута от составного ключа. Если атрибут А зависит от атрибута В, а В зависит от атрибута С, но обратная зависимость отсутствует, то говорят, что атрибут С зависит от А транзитивно.

Отношение находится в первой нормальной форме (1NF), если значения атрибутов атомарны, то есть в каждом столбце находится только одно значение, и все неключевые атрибуты функционально зависят от ключа.

Отношение находится во второй (2NF) нормальной форме, если выполняются ограничения первой нормальной (1NF) формы, и каждый неключевой атрибут функционально полно зависит от первичного ключа (первичный ключ может быть составным).

Отношение находится в третьей нормальной форме (3NF), если выполняются ограничения второй нормальной формы (2NF), и если все неключевые атрибуты отношения взаимно независимы и полностью зависят от первичного ключа. Можно дать и другое определение. Отношение находится в третьей нормальной форме (3NF), если выполняются ограничения второй

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]