- •Информация является динамическим объектом, образующимся в момент взаимодействия объективных данных и субъективных методов.
- •Информация (первоначальное) – это сведения, сообщения о каком-либо событии, деятельности и т.п.
- •Информация (по Шеннону): I = - ∑pi*log(pi), где pi – вероятность i-ого сигнала
- •Информация – это продукт научного познания, средство изучения реальной действительности в рамках, допустимым одним из информационных подходов.
- •Информация(по ГОСТу) – сведения, воспринимаемые человеком и(или) специальными устройствами как отражение фактов материального и духовного мира в процессе коммуникации.
- •Прагматические свойства – характеризуют степень полезности информации для пользователя.( т.е проявляются в процессе использования информации)
- •Эмерджентность – эмерджентные те свойства, что порождаются взаимодействием элементов,но не наблюдаются у элементов, если рассматривать их отдельно.
- •Старение- устаревает, когда не имеет ценности для потребителя, понять, что устарела, можно только в сравнении с новой.
- •2. Свойства концентрации и рассеяния. Характер закономерностей.
- •Формы концентрации в сфере инф-й деятельности
- •3. Понятия «информационный объект», «информационное взаимодействие».
- •4. Определение понятия информации с точки зрения информационного взаимодействия.
- •5.Свойства информации с точки зрения модели информационного взаимодействия.
- •11. Назначение и классификация информационных систем. Конкретная и абстрактная ИПС. Отличия документальных и фактографических ИПС.
- •12. Структурная схема процессов в абстрактной АИПС. Режимы ретроспективного поиска и ИРИ.
- •Предкоординированные — перед поиском устанавливаются координатные связи между лексическими единицами.
- •Кодирование информации
- •18 Типологии информационных потребностей.Реальная информационная потребность.
- •Уровневая модель взаимосвязи информационных объектов
- •20.Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •21. Понятие стратегии и технологии поиска информации.
- •Третий - взаимодействие пользователя с предоставляемой системой информацией; является самым сложным и практически не формализуемым уровнем общения.
- •25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •Физическая реализация ключа – индекс. Он обеспечивает доступ к записям, соответствующим отдельным значениям ключа.
- •26.Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •Контекстные операторы
- •НАДО: технологии (алгоритмы) поиска основываются на двух типах организации массива объектов поиска – прямой и инвертированной.
- •28. Типы обратной связи в технологии информационного поиска.
- •ИДЕЯ: Это делается с помощью изменения весовых коэффициентов терминов. Варианты их изменения предлагаются системой на основании данных о релевантности выданных ранее документов.
- •30. Линейная модель механизма поиска по логическому выражению.
- •31. Линейная модель механизма поиска документов-аналогов.
- •32. Линейная модель механизма эвристического поиска.
- •33.Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
- •34.Матрицы ассоциации документов, терминов и их свойства.
- •35. Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ИПС.
- •36. Основные частные и интегральные критерии оценки АИПС.
- •Показатель полезной работы η
- •37. Понятие рабочей характеристики АИПС.
- •38. Матрицы "термин-документ", "термин-термин" и их свойства.
- •39.Диаграмма Эйлера-Венна (диаграмма <L>). Критерии оценки АИПС в координатах <L>.
- •Критерии оценки АИПС в координатах <L>
- •40.Таблица сопряжённости. Критерии оценки АИПС в координатах <a,b,c,d>.
- •Таблица сопряженности <a,b,c,d>
- •Критерии оценки АИПС в координатах <a,b,c,d>
- •41. Диаграмма <n,x>. Критерии оценки АИПС в координатах < n,x>.
- •Критерии оценки АИПС в координатах <n,x>:
- •42.Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •43.Назначение, состав и структура лингвистического обеспечения ИС.
- •44.Основные методы идентификации объектов.
- •45. Классификация. Определение и формально-логические правила построения.
- •47. Типы классификаций. Фасетные классификации. Примеры.
- •48. Сравнительная характеристика иерархических и фасетных классификаций.
- •49. Кодирование объектов. Системы кодирования. Примеры.
- •50. Назначение, структура и использование информационно-поисковых тезаурусов
- •51.Обобщенная технологическая схема и компоненты информационного поиска.
- •Навигация (процесс поиска по запросу в выбранной БД) – целенаправленная последовательность использования методов, средств и технологий конкретной АИПС, определяемая стратегией, для получения и оценки результата.
- •52. Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
36. Основные частные и интегральные критерии оценки АИПС.
|
выданные |
невыданные |
Релев. |
a |
b |
Нерелев. |
c |
d |
Частные: |
|
|
Полнота r=a/(a+c)= x/x0=|LИ ∩LC|/|LИ|
Точность p=a/(a+b)=x/n=|LИ ∩LC|/|LC|
Специфичность σ=d/(b+d)=1- (n-x)/(n0 – x0)=|L0\ (LИ ULC)| / |L0\LИ|
Общность p0- характеризует качество комплектования поискового массива ( доля релев. документов в информационном массиве): p0=(a+c)/(a+b+c+d)=n/n0=|LИ|/|L0|
Относительный объем выдачи: v=(a+b)/(a+b+c+d)=n/n0=|LC|/|L0|
Интегральные. (используются, когда невозможно сравнить <r1,p1> <r2,p2> где p1<p2, r1>r2)
Коэффициент линейной корреляции R выдачи и релевантности документов – это корреляционный момент случайных величин С – «быть выданным доком» и И – «быть релев. док-ом». Принимают значения 0,1.
M[C]=P(C=1)= |
+ |
|
M[И]= |
|
+ |
(мат. ожидания) |
|
||||||
+ + + |
+ + + |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|||||
σ2с= |
+ |
(1 − |
|
+ |
) = |
|
(+)(+) |
σ2и= |
(+)(+) |
(дисперсии) |
|||
+ + + |
+ + + |
|
(+ + +)2 |
(+ + +)2 |
|||||||||
|
|
|
|
|
|
|
|
− covси=М[C*И]-M[C]*M[И]=√(+)(+)(+)(+)
R(0)=0, R(p0)=0, R(И)=+1, R(Д)=-1, R(1)>0, R(2)>0, R(3)<0. Обозначим |LИ ∩LC=L, |LИ|=LИ, |LC|=LC, |L0|=L0
0−И
R=
√И (0−И)(0−С)
Показатель полезной работы η
При непосредственном просмотре L0 трудозатраты: С`=n`=x/p0
При просмотре массива Lc имеющего точность р, затраты C``=n``=x/p Работа АИПС равна разности данных величин или высвобожденной информационной деятельности потребителя: Сис=n`-n``=x(1/p0 –
1/p)=0− 0 = − = ( + − 1)( 0 − 0)
0 +
η=CИС/(n0-x0)=r+σ-1
данная мера полезной работы изменяется от +1 до -1.