Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
[7 семестр] Расписанные вопросы к экзамену.pdf
Скачиваний:
9
Добавлен:
05.06.2015
Размер:
1.52 Mб
Скачать

21. Понятие стратегии и технологии поиска информации.

Стратегия поиска - общий план (концепция) поведения пользователя для выражения и удовлетворения информационной потребности. План обусловлен характером цели и типом поиска, архитектурой БД, а также

методами и средствами поиска(см.ниже) конкретной АИПС.

Выбор стратегии в общем случае – оптимизационная задача. На практике это достижение компромисса между практическими потребностями и возможностями имеющихся средств.

С точки зрения способа задания условия соответствия информационной потребности информационным ресурсам говорят о 2-х стратегиях:

вербальной и кластерной.

Вербальная аналог функционального задания. Традиционная стратегия, ее поддерживают большинство промышленных АИПС.

Отличительная черта - обязательное построение завершенного, логически и синтаксически правильного выражения, посредством которого может быть получена выдача формально релевантных запросу документов.

Кластерная – отражает особенности перечислительного способа. Обобщающает понятие "документ"(или совокупность документов) до уровня запроса. Подход основывается на предположении, что документ, его фрагмент или группа документов могут рассматриваться не только как результат поиска, но и как некоторый поисковый образ.

Технологии, поддерживающие кластерные стратегии, в значительной мере позволяют сократить объем просматриваемой при поиске информации.Это происходит за счет определения на основе знаний пользователя групп документов для эффективной идентификации его потребностей.

Связь стратегии и типа поисковой задачи: каждому типу поиска соответствует свой тип запроса, форма его выражения, характер результата.

Вербальные стратегии ориентированы на структурные методы построения запроса.Это когда ищущему известен аналог или предмет поиска хорошо определен в предметной области.

Кластерные стратегии тяготеют к построению собирательного образа части предметной области, границы которой или предопределены при создании БД или определяются в процессе поиска.

Технология поиска –последовательности использования в процессе взаимодействия пользователя с системой отдельных средств поиска для получения устойчивого и эффективного конечного и промежуточных

результатов. Поисковые технологии унифицированы и оптимизированы в рамках конкретной АИПС.

Технологии поиска объединяют два процесса:

-процесс объявления пользователем информационной потребности; -процесс построения системой информационного массива. Информационный массив - множество документов, выдаваемых пользователю в ответ на поисковое требование.

Технология генерации выдачи определяется архитектурой программного и информационного обеспечения конкретной системы. Выделяются два класса систем: диалоговые и пакетные.

Диалоговые ориентированы на работу в реальном масштабе времени, а условие отбора по одному запросу соотносится со всеми поисковыми образами документов Пакетные:каждый поисковый образ документа (при поступлении в систему)

соотносится с поисковыми образами всех запросов.

Выражение запроса:

непосредственного набор булевоподобного выражения; формирование булевоподобного выражения с помощью “конструктора запросов” форматно-ориентированные формы генерации “запроса по образцу”.

Методы поиска – совокупность моделей и алгоритмов реализации отдельных технологических этапов (таких, как построение ПОЗ, сопоставление ПОД и ПОЗ, расширение или реформулирование запросов и.т.д)

Средства поиска – комплекс ИПЯ и языков определения/управления данными, а также средства управления.

Языки обеспечивают представление и структурно-семантические преобразования основных и технологических объектов:словарей, документов, совокупностей результатов поиска.

Средства управления обеспечивают доступ к функциям конкретной АИПС (с помощью пользовательского интерфейса).

22. Логика поиска. Критерий смыслового соответствия. Теоретикомножественное представление.

Технология обработки информации – упорядоченная последовательность взаимосвязанных действий, выполняемых с момента восприятия информации до момента получения заданных результатов. Информационная технология – это система методов, способов и средств для сбора, регистрации, хранения, поиска, накопления, обработки [..] информации.

Поиск информации – одна из основных функций ИТ.

Поиск – это процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве.

Особенности поиска: сравниваются не сами объекты, а поисковые образы сам процесс поиска является неодноактным и многоитерационным Алгоритм поиска: -выборка очередного объекта из массива для выполнения сравнения с запрашиваемым; -процесс сравнения; -принятие решения о соответствии;

-переход к следующему объекту или завершение процесса. Выделяют два вида поиска:

-поиск целостного объекта (выдается весь документ)

-поиск информации по содержанию (некоторой части содержания) Технология поиска может осуществляться по массиву двух видов:

-с прямой организацией – документы расположены в произвольном порядке (по мере занесения)

-с инвертированной организацией – имеется дополнительное разбиение на категории, обозначенные идентификаторами (с инвертированным справочником)

Критерий смыслового соответствия(или критерий выдачи)– это правило, позволяющее решать вопрос о выдаче или не выдаче документа при организации поиска.

КСС-основа алгоритма поиска информации в ИПС.

Виды КСС: условие выдачи – полное вхождение ПОЗ в ПОД, т.е документ выдается, если множество дескрипторов, образующее ПОЗ полностью входит в множество дескрипторов, содержащихся в ПОД

Документ выдается, если ПОД и ПОЗ совпадают частично.

Если для каждого дескриптора запроса в ПОД встретился либо сам дескриптор, либо дескриптор, связанный с ним (базисными отношениями)

Сучетом весовых коэффициентов. Каждому информативному слову в запросе приписывается весовой коэфф.Весовые коэфф-ы в ПОЗ определяются пользователем и нормируются.Документ выдастся, если сумма весовых коэффициентов совпавших дескрипторов больше заранее установленной величины.

Сучетом синтаксических отношений.(такие, как объединение, пересечение). Теоретико-множественное представление.

Теоретико-множественные представления базируются на понятиях: множество, элементы множества и отношения на множествах.

Систему можно отобразить в виде совокупности разнородных множеств и отношений между ними.

Множества могут задаваться: Перечислением, например {ai}, где i=1…n

Путем указания некоторого характеристического свойства А, например «множество натуральных чисел»

Воснове теоретико-множественных преобразований лежит принцип перехода от одного способа задания множества к другому: А=<a1,…,an>

Вмножестве м.б вделены подмножества.

Пустое множество-то, в котором на данный момент нет ни одного элемента. При использовании теоретико-множественных представлений можно вводить отношения:

Множество А, дополнение множества А, объединение А и В, пересечение( на диаграммах Эйлера-Венна)

23.Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.

Обрабатываемые (преобразуемые) объекты (в частности и сама среда) имеют преимущественно абстрактную природу (идеальное, а не материальное происхождение).

Для процесса постановки–решения задачи (как ситуации определенного выбора) характерно наличие следующих четырех компонентов:

-субъект, осуществляющий выбор;

-среда решения – принятые в качестве рабочих понятия, гипотезы, законы, парадигмы и т.п.;

-доступные средства решения и практических действий;

-возможные результаты.

Типы информационных компонентов (сообщений):

− фактографическая информация, фиксирующуая ситуацию (состояние взаимодействия системы со средой) как результат преобразования; − систематическую информацию, определяющую прагматические условия (принципы, законы, критерии) применения преобразования и/или построения системы.

для систем управления информационными потоками (информационной деятельности) – это метаинформация: тезаурусы, классификаторы и т.д.

Начало поиска

Формирование запроса

Поиск

Просмотр

Оценка

Удовлетворительно?

да

Завершение поиска

24.Уровн евая модель информ ационно го взаимод ействия "Пользо ватель - АИПС". Основны е этапы (общая схема) поиска информ ации.

Реформулировка запроса

нет