Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
comp_design ИА.doc
Скачиваний:
2
Добавлен:
27.08.2019
Размер:
1.09 Mб
Скачать
  1. Метаданные

Метаданные – это информация об информации. Они являются основой всех организационных систем, от простой системы поиска до иерархических систем типа «Yahoo!». Это основные элементы для ИА.

Информация может поступать в различных форматах – статья, электронная книга, фотография, каталог. Некоторые ее виды не содержат слов: например, flash-ролик, звуковой файл в формате wav или mp3, фотография. Таким образом, поиск информации в том виде, как она хранится, либо затруднен либо вовсе невозможен. Здесь и помогают метаданные. Соответственно, поиск идет обычно именно по метаданным.

Метаданные включают в себя всю информацию о каждом объекте. В настоящее время для информационных систем используются три основных типа метаданных /3/:

  • описательные - метаданные о природе объекта, наиболее важные для наших целей и чаще всего применяются в Сети. «Это - статья? По какой теме? Каковы родственные темы?»

  • собственные - метаданные о построении объекта. «Является ли он текстовым документом, имеет ли он формат JPEG, равен ли его объем 20 КВ, является ли он архивом?»

  • административные - метаданные о способах обращения с объектом. «Временный ли это объект или его нужно заархивировать? Кто его создавал? Допущен ли он к публикации?»

  1. Словарь

Другим способом повышения эффективности поиска является создание так называемого управляемого словаря (controlled vocabulary) /3/. Дело в том, что один и тот же термин может обозначаться разными словами. Да и бывает иногда, что люди при вводе слова для поиска совершают грамматические ошибки.

    1. Управляемый словарь

Весь смысл понятия «управляемый словарь» заключен в самих этих словах. Это способ управления значениями словаря, используемый для отслеживания родственных терминов.

Существует много типов управляемых словарей, от простого словаря, по­строенного на отношениях эквивалентности (список эквивалентных терминов), до сложных тезаурусов (вводится полное определение).

Отношения эквивалентности

Простейший тип управляемого словаря состоит из списка отношений эквивалентности: «жидкокристаллический монитор» и «LCD-монитор», «ЖК-монитор» являются одним и тем же для цели поиска. В таблице 2 приведен пример.

Предпочтительный термин

Варианты

Жидкокристаллический монитор

ЖК-монитор, LCD-монитор, LCD-Monitor, монитор на жидких кристаллах

Таблица 2. - Пример отношения эквивалентности

Такое отношение может быть между двумя названиями одной и той же вещи: кошка и котенок. Это - синонимы.

Оно также может быть между разными вариантами написания названия од­ной и той же вещи или между названием и его акронимом. Есть два варианта написания слова «лев»: «lion» и «lyon». Это варианты.

Это во многом похоже на предметный указатель в конце книги - вы ищете слово «луна» в книге о Солнечной системе и читаете: «Смотри спутники». Для этой книги спутник и луна являются одним и тем же. В другой книге (вероятно, более толстой) их, может быть, будут различать. Главное - нужно понять, что люди ищут и какие слова для этого используют, а затем дать им ссылку на имеющийся у вас контент /3/.

Отношения иерархии

Более сложным типом управляемого словаря является таксономия. Она пока­зывает иерархические отношения наряду с отношениями эквивалентности. Это полезно не только для поиска, но и для эффективного просмотра Сети, а также для связывания их воедино. В таблице 3 приведен пример.

Предпочтитель­ный термин

Варианты

Родительский (широкий термин)

Дочерний (узкий термин)

Жидкокристаллический монитор

ЖК-монитор, LCD-монитор, LCD-Monitor, монитор на жидких кристаллах

Монитор, средство отображения информации, экран

Тряпочка для протирки экрана монитора, DVI-кабель для монитора

Таблица 3. - Пример отношений иерархии

Ассоциативные отношения

Самый мощный среди управляемых словарей - тезаурус. В Сети тезау­русы являются не только инструментом для обогащения нашей речи, но также средством создания системы взаимосвязанных слов, помогающей людям найти вещи, для которых они даже не могут подобрать названия. Тезаурус демонстри­рует отношения как иерархические, так и ассоциативные. В таблице 4 приве­ден пример.

Предпоч­тительный термин

Варианты

Родственные термины

Ассоцииро­ванные тер­мины

Родительские

Термины - сестры

Дочерние

Жидкокристаллический монитор

ЖК-монитор, LCD-монитор, LCD-Monitor, монитор на жидких кристаллах

Монитор, средство отображения информации, экран

ЭЛТ-монитор, монитор с электро-лучевой трубкой

Тряпочка для протирки экрана монитора, DVI-кабель для монитора

Компьютерная техника, компьютер, вычислительная техника, периферийные устройства, мышь, клавиатура, модем, модуль памяти

Таблица 4. - Первый набросок тезауруса

Ассоциированные термины - это такие термины, которые связаны друг с дру­гом, но не обозначают одно и то же понятие и не являются терминами, расширяю­щими или сужающими понятие (то есть не имеют иерархической связи друг с дру­гом). Они только сопутствуют друг другу.

Все эти типы управляемого словаря предназначены для доставки людей к то­му, что они разыскивают, какую бы чепуху они ни вводили в окно поиска.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]