- •Информация является динамическим объектом, образующимся в момент взаимодействия объективных данных и субъективных методов.
- •Информация (первоначальное) – это сведения, сообщения о каком-либо событии, деятельности и т.п.
- •Информация (по Шеннону): I = - ∑pi*log(pi), где pi – вероятность i-ого сигнала
- •Информация – это продукт научного познания, средство изучения реальной действительности в рамках, допустимым одним из информационных подходов.
- •Информация(по ГОСТу) – сведения, воспринимаемые человеком и(или) специальными устройствами как отражение фактов материального и духовного мира в процессе коммуникации.
- •Прагматические свойства – характеризуют степень полезности информации для пользователя.( т.е проявляются в процессе использования информации)
- •Эмерджентность – эмерджентные те свойства, что порождаются взаимодействием элементов,но не наблюдаются у элементов, если рассматривать их отдельно.
- •Старение- устаревает, когда не имеет ценности для потребителя, понять, что устарела, можно только в сравнении с новой.
- •2. Свойства концентрации и рассеяния. Характер закономерностей.
- •Формы концентрации в сфере инф-й деятельности
- •3. Понятия «информационный объект», «информационное взаимодействие».
- •4. Определение понятия информации с точки зрения информационного взаимодействия.
- •5.Свойства информации с точки зрения модели информационного взаимодействия.
- •11. Назначение и классификация информационных систем. Конкретная и абстрактная ИПС. Отличия документальных и фактографических ИПС.
- •12. Структурная схема процессов в абстрактной АИПС. Режимы ретроспективного поиска и ИРИ.
- •Предкоординированные — перед поиском устанавливаются координатные связи между лексическими единицами.
- •Кодирование информации
- •18 Типологии информационных потребностей.Реальная информационная потребность.
- •Уровневая модель взаимосвязи информационных объектов
- •20.Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •21. Понятие стратегии и технологии поиска информации.
- •Третий - взаимодействие пользователя с предоставляемой системой информацией; является самым сложным и практически не формализуемым уровнем общения.
- •25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •Физическая реализация ключа – индекс. Он обеспечивает доступ к записям, соответствующим отдельным значениям ключа.
- •26.Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •Контекстные операторы
- •НАДО: технологии (алгоритмы) поиска основываются на двух типах организации массива объектов поиска – прямой и инвертированной.
- •28. Типы обратной связи в технологии информационного поиска.
- •ИДЕЯ: Это делается с помощью изменения весовых коэффициентов терминов. Варианты их изменения предлагаются системой на основании данных о релевантности выданных ранее документов.
- •30. Линейная модель механизма поиска по логическому выражению.
- •31. Линейная модель механизма поиска документов-аналогов.
- •32. Линейная модель механизма эвристического поиска.
- •33.Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
- •34.Матрицы ассоциации документов, терминов и их свойства.
- •35. Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ИПС.
- •36. Основные частные и интегральные критерии оценки АИПС.
- •Показатель полезной работы η
- •37. Понятие рабочей характеристики АИПС.
- •38. Матрицы "термин-документ", "термин-термин" и их свойства.
- •39.Диаграмма Эйлера-Венна (диаграмма <L>). Критерии оценки АИПС в координатах <L>.
- •Критерии оценки АИПС в координатах <L>
- •40.Таблица сопряжённости. Критерии оценки АИПС в координатах <a,b,c,d>.
- •Таблица сопряженности <a,b,c,d>
- •Критерии оценки АИПС в координатах <a,b,c,d>
- •41. Диаграмма <n,x>. Критерии оценки АИПС в координатах < n,x>.
- •Критерии оценки АИПС в координатах <n,x>:
- •42.Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •43.Назначение, состав и структура лингвистического обеспечения ИС.
- •44.Основные методы идентификации объектов.
- •45. Классификация. Определение и формально-логические правила построения.
- •47. Типы классификаций. Фасетные классификации. Примеры.
- •48. Сравнительная характеристика иерархических и фасетных классификаций.
- •49. Кодирование объектов. Системы кодирования. Примеры.
- •50. Назначение, структура и использование информационно-поисковых тезаурусов
- •51.Обобщенная технологическая схема и компоненты информационного поиска.
- •Навигация (процесс поиска по запросу в выбранной БД) – целенаправленная последовательность использования методов, средств и технологий конкретной АИПС, определяемая стратегией, для получения и оценки результата.
- •52. Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
28. Типы обратной связи в технологии информационного поиска.
ОПР: Обратная связь по релевантности для отдельных терминов позволяет пользователю менять важность терминов в поиске не вникая в тонкости составления запроса.
ИДЕЯ: Это делается с помощью изменения весовых коэффициентов терминов. Варианты их изменения предлагаются системой на основании данных о релевантности выданных ранее документов.
В поиске «по обратной связи» в ИПС IRBIS после каждого шага пользователь может управлять дальнейшим процессом формирования результата, т.е.
последовательность шагов в диалоговой модели дискретна и реализуется в зависимости от предпочтений пользователя.
Шаг 1. Построение и ранжирование словника релевантных документов. W=(wi,i=(l,k)), где k – количество терминов релевантных документов, а wi – значение весового коэффициента для i-го термина, удовлетворяющее неравенству wi≥wi+1. пользователь в данном случае получает оценку всех терминов релевантных документов, которые находятся в частотном словаре, т.е. в ПОТ (поисковой образ темы) попадают все термины без исключения. Затем пользователь самостоятельно отмечает термины, способные улучшить поисковой запрос. Отмеченные термины он может добавить в запрос для поиска по совпадению терминов или по логическому выражению или сделать второй шаг поиска по обратной связи. Шаг 2. Формирование матрицы поисковых результатов. Термины, отобранные пользователем на предыдущем шаге, рассматриваются как исходные для поиска по совпадению терминов. Модель этого механизма поиска реализуется в данном случае построением подматрицы запроса Lq, в которой отдельные строки могут быть нулевыми.
b – термин.Для каждого ненулевого столбца матрицы Lq = построим вектор Qi – результат поиска аналогов с
максимальным порогом близости. Полученные векторы рассмотрим как строки матрицы поисковых результатов: Q Theme=(qij, i=l,n, j=l,n0), где n – количество ненулевых
столбцов матрицы.Каждая строка сформированной таким образом матрицы снабжается контекстом – перечислением конкретных терминов, присутствующих в документах конкретного результата. Удалив из матрицы строки с одинаковым контекстом, получим кластеризованное пространство документов, где каждый кластер задаётся не только количеством терминов запроса, но и составом самих терминов. Матрица поисковых результатов Q Theme даёт возможность обеспечить доступ к каждому отдельному результату
для его просмотра и последовательного формирования нового множества релевантных документов.
29. Линейная модель механизма поиска по совпадению терминов.
При поиске по условию совпадения терминов в паре запрос-документ задается требование полного и/или частичного совпадения терминов (ключевых слов) для отбора документов, содержащих эти ключевые слова. Условие частичного совпадения можно задать, используя в терминах поискового образа несущественный символ – символ маскирования (обычно это знаки «*», «?» и «%»). Такие символы могут быть в любом месте термина(начало, середина, конец), причём их м.б. фиксированное или переменное число.
Формирование ПОЗа – это выбор из матрицы L0 строк, соответствующих терминам, указанным в запросе. Если некоторый термин не найден в словаре D, ему ставится в соответствие строка из одних нулей. => Для k терминов получаем подматрицу запроса (Lq). Отдельные строки м.б. нулевыми.
По матрице Lqстроится результирующий вектор запроса
Q
|
k |
|
k |
|
|
k |
|
i |
1 |
i |
2 |
|
i n |
b |
|
b |
|
b |
||
|
l |
|
l |
|
|
l 0 |
l 1 |
|
l 1 |
|
|
l 1 |
.
Окончательный поисковый результат м.б. сформирован по двум правилам: 1)документ формально релевантен запросу, если содержит все k терминов 2 )- // - ,если содержит хотя бы часть из k терминов
При реализации (1):
Q |
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
1, если |
|
b |
|||
|
|
|
|
|
|
|
i i |
|
|
q q |
q |
|
, где q |
l 1 |
l |
|
|||
1 2 |
n |
|
i |
|
|
|
|
|
|
|
0 |
|
|
|
0 - в противном случае |
||||
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
Для (2) надо задать порог m – min требуемое кол-во терминов (m<k).
|
|
|
k |
|
|
|
|
|
|
|
|
b |
|
³m |
|
|
1, если |
|
|||||
|
|
|
|
i i |
|
||
q = |
|
|
|
|
|||
|
|
l=1 |
|
l |
|
||
i |
|
|
|
||||
|
|
0 - в противном случае |
|||||
|
|
||||||
|
|
|
|
|
|
|
|