Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
[7 семестр] Расписанные вопросы к экзамену.pdf
Скачиваний:
9
Добавлен:
05.06.2015
Размер:
1.52 Mб
Скачать

15. Предкоординированные и посткоординированные информационнопоисковые языки.

Координированные ИПЯ — языки, в которых лексические единицы связывается, координируются между собой или в процессе индексирования или в процессе использования.

Предкоординированные — перед поиском устанавливаются координатные связи между лексическими единицами.

Посткоординированные — когда связи между лексическими единицами устанавливаются только при поиске.

Лексические единицы (слова и словосочетания) подразделяются на классы. По словарному составу языка проводится деление документов на классы.

ИПЯ

Предкоординируемые

 

Посткоординируемые

 

 

 

Перечислительные

Аналитико-

Языки

классификации

синтетические

дескрипторного типа

 

классификации

 

16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ИС.

Кодирование информации Код – условное обозначение объекта в виде одного или нескольких знаков. Набор

методов и правил условного обозначения — система кодирования. Классификационная схема — систематизированный перечень наименований объектов, каждому из которых в соответствие дан уникальный код.

Кодирование — это процесс присвоения условных обозначений (кодов) объектам и классификационным группам в соответствии с определенной системой кодирования. Код в системе кодирования задается тройкой: с=(А, L, S), где

А — алфавит (множество символов, используемых при записи кода)

L — длина (число позиций в коде);

S — структура кода (порядок расположения в коде символов). Индексирование – на специальном формализованном языке отражаются соответствующие выбранной тематике признаки.

Координатное индексирование состоит в том, что суть документа и необходимой потребности может быть отражена с помощьюх ключевых слов, содержащихся в тексте. Под ключевыми словами понимаются наиболее существенные для этой цели слова и словосочетания.

Вфактографических ИС регистрируются факты – конкретные значения данных об объектах реального мира. Основная идея таких систем заключается в том, что все сведения об объектах (фамилии людей и названия предметов, числа, даты) сообщаются компьютеру в каком-то заранее обусловленном формате (например, дата – в виде комбинации ДД.ММ.ГГГГ). Поэтому фактографическая система способна давать однозначные ответы на поставленные вопросы.

Документальные ИС обслуживают принципиально иной класс задач, которые не предполагают однозначного ответа на поставленный вопрос. Базу данных таких систем образует совокупность неструктурированных текстовых документов (статьи, книги и т.д.), снабженная тем или иным формализованным аппаратом поиска. Цель системы, как правило, – выдать в ответ на запрос пользователя список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям (может выдать ненужное и может не выдать нужное).

17.Обобщенная схема воспроизводства информации. Характеристика информационных компонент.

Рассмотрим обобщенную схему воспроизводства информации,.С точки зрения задач управления потоками можно различить две совокупности процессов: формирование потока информации (документов) в соответствии с заданными характеристиками и распределение входных и выходных потоков и их составляющих в соответствии с информационными потребностями. По характеру преобразований информации в совокупной системе можно выделить три следующих уровня.

Первый уровень это основная деятельность, где объектами являются предметы реального мира, а результатами — новое знание. Носителем информации этого уровня является человеческое сознание, для которого характерны системность организации и ассоциативность выборки, а коммуникационным объектом является сообщение — знание, адресно отраженное на систему понятий предполагаемого приемника-потребителя информации.

Второй уровень — создание общественно-полезной информации — одна из форм овеществления знаний через обобществление результатов, обычно, в документальной форме. Средством представления знаний здесь является язык, а носителем — документ как функционально ориентированное сообщение, структурирующее информацию и идентифицирующее ее.

Третий уровень собственно информационная деятельность — управление потоками информации для обеспечения основной деятельности. Здесь информация (поисковый образ документа) — это хорошо структурированный материал, компактно и системно отражающий содержание документа, а также обеспечивающий идентифицируемость документа как в целом, так и на уровне отдельных элементов данных.