- •Информация является динамическим объектом, образующимся в момент взаимодействия объективных данных и субъективных методов.
- •Информация (первоначальное) – это сведения, сообщения о каком-либо событии, деятельности и т.п.
- •Информация (по Шеннону): I = - ∑pi*log(pi), где pi – вероятность i-ого сигнала
- •Информация – это продукт научного познания, средство изучения реальной действительности в рамках, допустимым одним из информационных подходов.
- •Информация(по ГОСТу) – сведения, воспринимаемые человеком и(или) специальными устройствами как отражение фактов материального и духовного мира в процессе коммуникации.
- •Прагматические свойства – характеризуют степень полезности информации для пользователя.( т.е проявляются в процессе использования информации)
- •Эмерджентность – эмерджентные те свойства, что порождаются взаимодействием элементов,но не наблюдаются у элементов, если рассматривать их отдельно.
- •Старение- устаревает, когда не имеет ценности для потребителя, понять, что устарела, можно только в сравнении с новой.
- •2. Свойства концентрации и рассеяния. Характер закономерностей.
- •Формы концентрации в сфере инф-й деятельности
- •3. Понятия «информационный объект», «информационное взаимодействие».
- •4. Определение понятия информации с точки зрения информационного взаимодействия.
- •5.Свойства информации с точки зрения модели информационного взаимодействия.
- •11. Назначение и классификация информационных систем. Конкретная и абстрактная ИПС. Отличия документальных и фактографических ИПС.
- •12. Структурная схема процессов в абстрактной АИПС. Режимы ретроспективного поиска и ИРИ.
- •Предкоординированные — перед поиском устанавливаются координатные связи между лексическими единицами.
- •Кодирование информации
- •18 Типологии информационных потребностей.Реальная информационная потребность.
- •Уровневая модель взаимосвязи информационных объектов
- •20.Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •21. Понятие стратегии и технологии поиска информации.
- •Третий - взаимодействие пользователя с предоставляемой системой информацией; является самым сложным и практически не формализуемым уровнем общения.
- •25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •Физическая реализация ключа – индекс. Он обеспечивает доступ к записям, соответствующим отдельным значениям ключа.
- •26.Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •Контекстные операторы
- •НАДО: технологии (алгоритмы) поиска основываются на двух типах организации массива объектов поиска – прямой и инвертированной.
- •28. Типы обратной связи в технологии информационного поиска.
- •ИДЕЯ: Это делается с помощью изменения весовых коэффициентов терминов. Варианты их изменения предлагаются системой на основании данных о релевантности выданных ранее документов.
- •30. Линейная модель механизма поиска по логическому выражению.
- •31. Линейная модель механизма поиска документов-аналогов.
- •32. Линейная модель механизма эвристического поиска.
- •33.Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
- •34.Матрицы ассоциации документов, терминов и их свойства.
- •35. Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ИПС.
- •36. Основные частные и интегральные критерии оценки АИПС.
- •Показатель полезной работы η
- •37. Понятие рабочей характеристики АИПС.
- •38. Матрицы "термин-документ", "термин-термин" и их свойства.
- •39.Диаграмма Эйлера-Венна (диаграмма <L>). Критерии оценки АИПС в координатах <L>.
- •Критерии оценки АИПС в координатах <L>
- •40.Таблица сопряжённости. Критерии оценки АИПС в координатах <a,b,c,d>.
- •Таблица сопряженности <a,b,c,d>
- •Критерии оценки АИПС в координатах <a,b,c,d>
- •41. Диаграмма <n,x>. Критерии оценки АИПС в координатах < n,x>.
- •Критерии оценки АИПС в координатах <n,x>:
- •42.Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •43.Назначение, состав и структура лингвистического обеспечения ИС.
- •44.Основные методы идентификации объектов.
- •45. Классификация. Определение и формально-логические правила построения.
- •47. Типы классификаций. Фасетные классификации. Примеры.
- •48. Сравнительная характеристика иерархических и фасетных классификаций.
- •49. Кодирование объектов. Системы кодирования. Примеры.
- •50. Назначение, структура и использование информационно-поисковых тезаурусов
- •51.Обобщенная технологическая схема и компоненты информационного поиска.
- •Навигация (процесс поиска по запросу в выбранной БД) – целенаправленная последовательность использования методов, средств и технологий конкретной АИПС, определяемая стратегией, для получения и оценки результата.
- •52. Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
21. Понятие стратегии и технологии поиска информации.
Стратегия поиска - общий план (концепция) поведения пользователя для выражения и удовлетворения информационной потребности. План обусловлен характером цели и типом поиска, архитектурой БД, а также
методами и средствами поиска(см.ниже) конкретной АИПС.
Выбор стратегии в общем случае – оптимизационная задача. На практике это достижение компромисса между практическими потребностями и возможностями имеющихся средств.
С точки зрения способа задания условия соответствия информационной потребности информационным ресурсам говорят о 2-х стратегиях:
вербальной и кластерной.
Вербальная –аналог функционального задания. Традиционная стратегия, ее поддерживают большинство промышленных АИПС.
Отличительная черта - обязательное построение завершенного, логически и синтаксически правильного выражения, посредством которого может быть получена выдача формально релевантных запросу документов.
Кластерная – отражает особенности перечислительного способа. Обобщающает понятие "документ"(или совокупность документов) до уровня запроса. Подход основывается на предположении, что документ, его фрагмент или группа документов могут рассматриваться не только как результат поиска, но и как некоторый поисковый образ.
Технологии, поддерживающие кластерные стратегии, в значительной мере позволяют сократить объем просматриваемой при поиске информации.Это происходит за счет определения на основе знаний пользователя групп документов для эффективной идентификации его потребностей.
Связь стратегии и типа поисковой задачи: каждому типу поиска соответствует свой тип запроса, форма его выражения, характер результата.
Вербальные стратегии ориентированы на структурные методы построения запроса.Это когда ищущему известен аналог или предмет поиска хорошо определен в предметной области.
Кластерные стратегии тяготеют к построению собирательного образа части предметной области, границы которой или предопределены при создании БД или определяются в процессе поиска.
Технология поиска –последовательности использования в процессе взаимодействия пользователя с системой отдельных средств поиска для получения устойчивого и эффективного конечного и промежуточных
результатов. Поисковые технологии унифицированы и оптимизированы в рамках конкретной АИПС.
Технологии поиска объединяют два процесса:
-процесс объявления пользователем информационной потребности; -процесс построения системой информационного массива. Информационный массив - множество документов, выдаваемых пользователю в ответ на поисковое требование.
Технология генерации выдачи определяется архитектурой программного и информационного обеспечения конкретной системы. Выделяются два класса систем: диалоговые и пакетные.
Диалоговые ориентированы на работу в реальном масштабе времени, а условие отбора по одному запросу соотносится со всеми поисковыми образами документов Пакетные:каждый поисковый образ документа (при поступлении в систему)
соотносится с поисковыми образами всех запросов.
Выражение запроса:
непосредственного набор булевоподобного выражения; формирование булевоподобного выражения с помощью “конструктора запросов” форматно-ориентированные формы генерации “запроса по образцу”.
Методы поиска – совокупность моделей и алгоритмов реализации отдельных технологических этапов (таких, как построение ПОЗ, сопоставление ПОД и ПОЗ, расширение или реформулирование запросов и.т.д)
Средства поиска – комплекс ИПЯ и языков определения/управления данными, а также средства управления.
Языки обеспечивают представление и структурно-семантические преобразования основных и технологических объектов:словарей, документов, совокупностей результатов поиска.
Средства управления обеспечивают доступ к функциям конкретной АИПС (с помощью пользовательского интерфейса).
22. Логика поиска. Критерий смыслового соответствия. Теоретикомножественное представление.
Технология обработки информации – упорядоченная последовательность взаимосвязанных действий, выполняемых с момента восприятия информации до момента получения заданных результатов. Информационная технология – это система методов, способов и средств для сбора, регистрации, хранения, поиска, накопления, обработки [..] информации.
Поиск информации – одна из основных функций ИТ.
Поиск – это процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве.
Особенности поиска: сравниваются не сами объекты, а поисковые образы сам процесс поиска является неодноактным и многоитерационным Алгоритм поиска: -выборка очередного объекта из массива для выполнения сравнения с запрашиваемым; -процесс сравнения; -принятие решения о соответствии;
-переход к следующему объекту или завершение процесса. Выделяют два вида поиска:
-поиск целостного объекта (выдается весь документ)
-поиск информации по содержанию (некоторой части содержания) Технология поиска может осуществляться по массиву двух видов:
-с прямой организацией – документы расположены в произвольном порядке (по мере занесения)
-с инвертированной организацией – имеется дополнительное разбиение на категории, обозначенные идентификаторами (с инвертированным справочником)
Критерий смыслового соответствия(или критерий выдачи)– это правило, позволяющее решать вопрос о выдаче или не выдаче документа при организации поиска.
КСС-основа алгоритма поиска информации в ИПС.
Виды КСС: условие выдачи – полное вхождение ПОЗ в ПОД, т.е документ выдается, если множество дескрипторов, образующее ПОЗ полностью входит в множество дескрипторов, содержащихся в ПОД
Документ выдается, если ПОД и ПОЗ совпадают частично.
Если для каждого дескриптора запроса в ПОД встретился либо сам дескриптор, либо дескриптор, связанный с ним (базисными отношениями)
Сучетом весовых коэффициентов. Каждому информативному слову в запросе приписывается весовой коэфф.Весовые коэфф-ы в ПОЗ определяются пользователем и нормируются.Документ выдастся, если сумма весовых коэффициентов совпавших дескрипторов больше заранее установленной величины.
Сучетом синтаксических отношений.(такие, как объединение, пересечение). Теоретико-множественное представление.
Теоретико-множественные представления базируются на понятиях: множество, элементы множества и отношения на множествах.
Систему можно отобразить в виде совокупности разнородных множеств и отношений между ними.
Множества могут задаваться: Перечислением, например {ai}, где i=1…n
Путем указания некоторого характеристического свойства А, например «множество натуральных чисел»
Воснове теоретико-множественных преобразований лежит принцип перехода от одного способа задания множества к другому: А=<a1,…,an>
Вмножестве м.б вделены подмножества.
Пустое множество-то, в котором на данный момент нет ни одного элемента. При использовании теоретико-множественных представлений можно вводить отношения:
Множество А, дополнение множества А, объединение А и В, пересечение( на диаграммах Эйлера-Венна)
23.Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.
Обрабатываемые (преобразуемые) объекты (в частности и сама среда) имеют преимущественно абстрактную природу (идеальное, а не материальное происхождение).
Для процесса постановки–решения задачи (как ситуации определенного выбора) характерно наличие следующих четырех компонентов:
-субъект, осуществляющий выбор;
-среда решения – принятые в качестве рабочих понятия, гипотезы, законы, парадигмы и т.п.;
-доступные средства решения и практических действий;
-возможные результаты.
Типы информационных компонентов (сообщений):
− фактографическая информация, фиксирующуая ситуацию (состояние взаимодействия системы со средой) как результат преобразования; − систематическую информацию, определяющую прагматические условия (принципы, законы, критерии) применения преобразования и/или построения системы.
для систем управления информационными потоками (информационной деятельности) – это метаинформация: тезаурусы, классификаторы и т.д.
Начало поиска
Формирование запроса
Поиск
Просмотр
Оценка
Удовлетворительно?
да
Завершение поиска
24.Уровн евая модель информ ационно го взаимод ействия "Пользо ватель - АИПС". Основны е этапы (общая схема) поиска информ ации.
Реформулировка запроса
нет