- •4 Курс, 7 семестр, специальность 080802
- •Общее понятие информационной системы. Компоненты информационных систем.
- •Отличия систем управления базами данных и информационных систем. Сфера применения информационных систем.
- •Аппаратное и программное обеспечение как ресурсы информационных систем.
- •Лингвистические, информационные, человеческие ресурсы информационных систем.
- •Понятие «пользователь» информационных систем.
- •Понятие модели в информационных системах. Понятие предметной области, сущности предметной области.
- •Слабоструктурированные модели реальности в информационных системах.
- •Формальные модели реальности. Формальные языки.
- •Неструктурированные модели реальности. Средства описания неструктурированных моделей.
- •Понятие модели данных. Назначение моделей данных, область применения.
- •Материализация моделей предметной области в информационных системах.
- •Сбор и регистрация данных как функции информационных систем.
- •Хранение как функция информационных систем. Управления ресурсами памяти.
- •Вспомогательные структуры хранения данных в информационных системах. Индексирование, хеширование.
- •Актуализация информационных ресурсов информационных систем.
- •Обработка информационных ресурсов информационных систем.
- •Pull-технологии предоставления информационных ресурсов информационных систем.
- •Push-технологии предоставления информационных ресурсов информационных систем.
- •Особенности взаимодействия конечных пользователей с информационной системой.
- •Особенности взаимодействия прикладных программ с информационной системой.
- •Критерии сравнения характеристик информационных систем.
- •Свойства Web как глобальной информационной системы.
- •Общая архитектура Web. Компоненты системы, модели взаимодействия.
- •Понятие структурирования информации. Языки разметки. Гипертекст. Назначение. Общие принципы. Область применения.
- •Язык разметки гипертекстовых документов html. Назначение. Область применения. Основные понятия.
- •Организация простейших web-приложений. Схема взаимодействия в web-приложениях.
- •Расширение функциональности на стороне клиента в технологии web.
- •Расширение функциональности на стороне сервера в технологии web.
- •Метод передачи данных от клиента серверу get. Общие принципы. Область применения. Достоинства и недостатки.
- •Метод передачи данных от клиента серверу post. Общие принципы. Область применения. Достоинства и недостатки.
- •Назначение и общие форматы записи универсального указателя ресурсов (url). Назначение элементов. Форматы записи.
- •Интерфейс взаимодействия cgi. Область применения. Достоинства и недостатки.
- •Интерфейс взаимодействия api. Область применения. Достоинства и недостатки.
- •Организация web-приложений с использованием баз данных. Схема взаимодействия web-приложения и баз данных.
- •Основные положения языка xml. Сфера применения, история языка xml.
- •Описание типа документа. Состав, назначение.
- •Описание элементов в языке xml.
- •Описание атрибутов элементов в языке xml.
- •Общие сведения о системах текстового поиска. История развития. Область применения.
- •Терминология систем текстового поиска. Документ, коллекция документов, релевантность, критерии поиска, методы создания документов.
- •Общие принципы текстового поиска. Проблемы текстового поиска.
- •Структурированное представление документов. Задачи и методы структурирования.
- •Индексирование документов. Способы организации индексов документов.
- •Представление пользовательских запросов. Критерии релевантности.
- •Функционирование систем текстового поиска. Методы работы в системах текстового поиска.
- •Средства лингвистической поддержки в системах текстового поиска. Словари и тезаурусы.
Индексирование документов. Способы организации индексов документов.
Представления док-ов обычно конструируется на основе мн-ва каких либо св-в.В простых СТП эти св-ва(атрибуты) вообще не являются какими либо компонентами текста док-та.
В качестве атрибута в таких док-ах использ. какие либо внешние характер. Причем они не обязат. должны индефицировать его уникальным образом.
В системах контекстного полнотекстового поиска атрибуты представления док-ов - это термы извлеченные из его текста-слова или словосочетания либо значение специально подобранной функций вычисленные на основе этих извлеченных тэгов.Любые ассоциированные с док-ом атрибуты иденцифицируемые док-т или характеризующие его содержимое называются его индексирующими св-вами.
На основе индексирующих св-в док-та стп строится вспомогательная структура данных позволяющая по их значению или по значению некоторой функций использ. их в качестве аргументов,эффективным образом обнаружить в системной коллекций док-т или док-ты которым эти атрибуты соответствуют и по необходимости осуществляют быстрый доступ к ним.
Такая вспомог структура называется индексом,а процесс назначения док-та указанных атрибутов индексированием док-та.
В ранних СТП использовалось простейшие представления док-ов.в качестве такого представления служило совокупность слов,либо словосочетаний лексики предметной области системы,характеризуюшие содержания данного док-та. Эти слова называются дискрипторами.Индексирование док-ов в таких системах сводится к назначению док-ту совокупности дискрипторов.
Индексирование док-ов в СТП может осуществлятся на основе их названий ,анатаций или полного текста.Оно может производится авторами док-ов,экспертами в предметной области системы или автоматически,системными механизмами на основе анализа текста док-та.
В современных все трудоемко поэтому автоматически.
Представление пользовательских запросов. Критерии релевантности.
Формирование структуры представлений пользовательских запросов является другой важной задачей СТП.точно также как в процессе поиска система апперирует структурой представлений док-ов,вместо самих док-ов,вместо заданного пользователем запроса в ней используется структура представлений конструирования в процессе обработки запроса.Представление запроса строится на основе тех же принципов ,что и представления док-ов.Иначе эти представлния невозможно сопоставить.
В дискрипторных СТП в качестве представления запроса также используется совокупность дискрипторов,характеризующих содержания запроса.
В таких системах представления запроса называется поисковым образом запроса.В процессе обработкт пользовательского запроса системе необходимо оценивать реливантность очередного рассматриваемого документа.
Для решения этой задачи его представление должно сопоставится по некоторому критерию реливантности с представлением запроса.
Вид критерия реливантности зависит от подхода используемого в системе для формирования предст.док-ов и запросов.
В дискрипторных системах обычно используется теоретико мн-венные критерий.Например док-т признается релив. Если мн-во дискрипторов поискового мн-ва запроса является подмножеством множества дискрипторных представлений док-та.