Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

901

.pdf
Скачиваний:
0
Добавлен:
21.11.2023
Размер:
160.72 Кб
Скачать

корпораций и исследованию их функциональных и временных характери­ стик при обработке поисковых запросов пользователей.

В первом разделе второй главы «Российские разработки порталов на основе использования протокола Z39.50» рассматриваются интерфейсы и анализируется функциональность ведущих российских библиотечных кор­ поративных порталов: Корпоративной сети московских библиотек (КСМБ), Омского корпоративного библиотечного консорциума, распределенного корпоративного каталога библиотек Сибири, Научной библиотеки Томского государственного университета, распределенного каталога LIBWEB ЦНСХБ (г. Москва), Ассоциации российских библиотечных консорциумов (АРБИКОН), Научной библиотеки МГУ им. М.В. Ломоносова (портал СИГЛА), Российского информационно-библиотечного консорциума (РИБК). Сделан вывод о том, что для рядового пользователя использование поисковых интерфейсов российских библиотечных корпораций во многих случаях может вызывать затруднения, связанные с необходимостью задания большого числа исходных параметров поиска: списка серверов, выбора по­ исковых атрибутов и указания ряда дополнительных параметров.

Во втором разделе второй главы «Анализ производительности поис­ ковых запросов в КСМБ» рассматриваются функциональные характеристики и исследуются временные задержки, возникающие в результате поиска по каждому из 14 отобранных серверов КСМБ, а также при поиске по группам серверов, состоящим из работающих и неактивных серверов Z39.50 на мо­ мент проведения эксперимента. Делается вывод о том, что при наличии хотя бы одного неработающего сервера Z39.50 суммарная задержка обработки поискового запроса на портале КСМБ может достигать 17 секунд.

В третьем разделе второй главы «Моделирование вычислительного комплекса, созданного на основе протокола Z39.50 с целью определения путей его совершенствования» исследуется математическая модель систе­ мы, созданной с использованием положений теории сетей массового обслу­ живания и включающей шлюз HTTP-Z39.50, а также несколько групп сер­ веров Z39.50. На этой модели проведены расчеты по алгоритму Бузена, вы­ числены значения величин средней длины очереди Li(K) в узлах модели (г - узел, К - число запросов в системе) для двух вариантов обслуживания: при наличии в поисковой группе неактивных серверов и при предварительном исключении неактивных серверов из числа опрашиваемых. Сделаны выводы о том, что с увеличением числа неактивных серверов пропорционально воз­ растает средняя длина очереди заданий, выполняющихся с большими за­ держками. При втором варианте обслуживания, предусматривающем пред-

11

варительное исключение неактивных серверов, характеристики системы существенно лучше. С ростом числа заданий в системе К значения средней длины очереди Li(i=1..4) увеличиваются пропорционально и линейно. От­ сюда следует, что число заданий в системе не влияет на задержки обработки запросов, связанных с поиском в распределенной информационной среде. При большом числе заданий в системе возрастают требования к производи­ тельности центрального узла — шлюза HTTP-Z29.50.

В третьей главе «Решения на основе использования протокола Z39.50 в проектах Корпоративной сети московских библиотек (КСМБ) и электронной библиотеки МГУКИ» предложены подходы и описаны алгоритмы, разработанные для решения ряда проблем, рассмотренных в предыдущих главах исследования.

В первом разделе третьей главы «Решения на основе протокола Z39.50 при разработке портала корпоративной сети московских библио­ тек» описаны цели создания КСМБ и изложены решенные при её проекти­ ровании и реализации следующие основные задачи:

-создана общая организационная, программно-технологическая и техническая среда, обеспечивающая объединение информационных

итрудовых ресурсов библиотек Москвы в корпоративную систему для совместного их использования в интересах повышения качества библиотечно-информационного обслуживания различных категорий пользователей;

-разработана и внедрена технология корпоративной каталогизации;

-достигнута информационная и лингвистическая совместимость электронных каталогов КСМБ на основе реализации требований российского библиотечного коммуникативного формата RUSMARC:

-разработана и внедрена система электронной доставки документов

(ЭДД).

Одной из главных причин использования решений на основе протоко­ ла Z39.50 в КСМБ является наличие у ее участников разнородных АБИС. Поисковый портал КСМБ функционирует как шлюз HTTP-Z39.50, основу которого составляет аналогичный программный модуль из состава WEBИРБИС. Для достижения функциональной полноты решений ИРБИС и удобства пользователей АБИС ИРБИС в ГПНТБ России был разработан сервер Z32/Z64. Оба программных решения предложены автором данной работы с учетом выводов и рекомендаций, сделанных на основе проведен­ ного исследования.

12

Во втором разделе третьей главы «Шлюз HTTP-Z39.50 портала КСМБ» описаны алгоритмы и программные решения, использованные в модифицированном портале КСМБ, Для минимизации задержек при обра­ ботке поисковых запросов разработан алгоритм фонового мониторинга сер­ веров Z39.50 библиотечной корпорации, позволяющий исключить неактив­ ные серверы из числа опрашиваемых. Пользователь формирует поисковый запрос с помощью WEB-формы. При простом поисковом запросе использу­ ется строка ввода, в которую пользователь записывает слово или фразу. В процессе обработки шлюзом HTTP-Z39.50 введенный запрос приводится к форме, использующей набор атрибутов bib-1 протокола Z39.50 в формате польской инверсной записи следующего вида:

@or @and @and ...@and @attr 1=1035 @attr 5=1 <слово_1> @attr 1=1035 @attr 5=1 <слово_2>...@аttr 1=1035 @attr 5=1 <слово_ n> @attr 1=4 @attr 5=1 <слово_1 слово_2... слово_n>

В данном случае используется дизъюнкция двух групп атрибутов набора bib-1: 1035 (поиск по любому полю) и 4 (поиск по заглавию), а также установлено усечение окончаний (значение 1 для атрибутов пятой группы набора bib-1). В свою очередь группа атрибутов 1035 (поиск по любому полю) образуется из конъюнкции слов (слово_1... слово_п), составляющих введенную поисковую фразу. Использование комбинации двух вариантов поисковых атрибутов позволяет находить записи на серверах Z39.50, не поддерживающих поиск по любому полю (attr 1=1035), а также на серверах, где поиск такого вида не выдает полных результатов. Конъюнкция ключе­ вых слов, формируемая при обработке поискового запроса, позволяет искать записи, в которых встречаются все слова, присутствующие в поисковой фразе. Расширенный поисковый запрос позволяет пользователю произво­ дить поиск по автору, заглавию, рубрике и году издания. В этом случае пользователь применяет для ввода соответствующие строки поисковой формы. При обработке запроса выполняется конъюнкция введенных эле­ ментов запроса и используются атрибуты набора bib-1, соответствующие используемым поисковым полям.

Представлены и подробно описаны алгоритм передачи поискового за­ проса серверам Z39.50 и алгоритм обработки ответов от серверов Z39.50 с использованием асинхронного режима опроса. Необходимо отметить сле­ дующие особенности формата вывода результатов поиска:

-из списка исключаются серверы, на которых не были найдены запи­ си по введенному запросу, а также все недоступные (неактивные) серверы на момент выполнения запроса;

13

-пользователь может перейти по гиперссылке (число найденных за­ писей) к просмотру записей, не дожидаясь окончания вывода ре­ зультатов от всех серверов;

-результаты поиска выводятся группами, образованными из резуль­ татов, полученных от всех баз данных на отельном сервере Z39.50.

Основными особенностями разработанного алгоритма является приме­ нение последовательной поисковой навигации с использованием региональ­ ной целевой группы серверов и тематической целевой группы каталогов, доступных на выбранном сервере. При этом региональная целевая группа формируется из серверов, входящих в состав КСМБ, с программным ис­ ключением неактивных серверов на момент выполнения запроса. Тематиче­ ская целевая группа формируется пользователем самостоятельно путем вы­ бора баз данных, участвующих в поиске.

Втретьем разделе третьей главы «Использование решений на основе протокола Z39.50 при разработке электронной библиотеки МГУКИ» рас­ сматриваются вопросы применения программных решений ИРБИС и корпо­ ративной технологии на базе использования протокола Z39.50 для создания электронной библиотеки вуза. Подробно описаны требования и стадии про­ ектирования вузовской электронной библиотеки (ВЭБ). Сделан вывод о том, что ВЭБ может рассматриваться как подсистема вузовской АБИС.

Вчетвертом разделе третьей главы «Пример концептуального про­ ектирования программно-аппаратного комплекса ВЭБ на примере элек­ тронной библиотеки МГУКИ» изложены вопросы создания электронной библиотеки вуза, представлены блок-схемы алгоритма работы модели элек­ тронной библиотеки МГУКИ, использующей программные решения ИРБИС

икорпоративную технологию на основе протокола Z39.50. В разработанном программном пакете представлены два способа поиска информации по пол­ ному тексту документов, основанных:

-на загрузке полнотекстовых документов в базу данных ИРБИС-64 с последующим обращением к этой базе данных через сервер Z64 и выводом результатов через шлюз HTTP-Z39.50;

-на индексации массива документов, находящихся на файловом сер­ вере, с последующим доступом к ним через шлюз HTTP-Z39.50.

Взависимости от целей использования и полноты имеющегося биб­ лиографического описания возможно использование первого или второго способа создания полнотекстовых баз. При наличии библиографических описаний индексируемых документов целесообразнее использовать их раз­ мещение в базе данных ИРБИС-64, что позволит пользователю выводить

14

как описание документов, так и их полные тексты. При отсутствии внешних библиографических описаний документов, а также при наличии в HTMLдокументах полей метаданных, содержащих сведения Dublin Core, возмож­ но использование второго способа, предусматривающего индексацию про­ извольного набора документов.

В пятом разделе третьей главы «Реализация опытной модели ЭБ МГУКИ» изложены особенности проектирования портала электронной биб­ лиотеки МГУКИ, подробно описаны возможности пользовательского ин­ терфейса и особенности навигации при проведении поиска. Кроме того, описана структура информационных ресурсов МГУКИ и особенности их обработки для загрузки в электронную библиотеку.

Одним из основных направлений развития корпоративных библиотеч­ ных порталов в ближайшее время будет интеграция поиска по электронным каталогам и полнотекстовым коллекциям документов, а также повышение производительности поиска и удобства пользовательского интерфейса. В этой связи разработанная технология интегрированного поиска для элек­ тронных библиотек и предложенный алгоритм исключения неактивных сер­ веров из поисковой группы являются важным результатом диссертационно­ го исследования.

В заключении диссертации отмечается, что развитие библиотечных корпоративных технологий на современном этапе неразрывно связано с ис­ пользованием программных и технологических решений на основе протоко­ ла Z39.50. На основе проведенного анализа современных библиотечных корпоративных порталов сформулирован вывод о необходимости повыше­ ния их функциональности за счёт сокращения временных задержек, а также интеграции поиска по электронным каталогам и полнотекстовым коллекци­ ям документов. Для решения этой задачи разработана математическая мо­ дель информационной системы, состоящей из шлюза HTTP-Z39.50 и группы серверов, проведено моделирование с использованием математического аппарата теории массового обслуживания и вычислены значения средней длины очереди в зависимости от числа заданий в системе для каждого узла рассматриваемой модели. На основании результатов моделирования сдела­ ны выводы о том, что с увеличением числа неактивных серверов пропор­ ционально возрастает средняя длина очереди заданий, выполняющихся с большими задержками, а с увеличением числа поисковых запросов в корпо­ ративной сети возрастают требования к производительности шлюза НТТРZ39.50. С учетом выводов результатов моделирования разработаны новые программные и технологические решения: шлюз HTTP-Z39.50, обеспечи-

15

вающий поддержку фонового мониторинга серверов корпоративной сети и исключение неактивных серверов из числа опрашиваемых при обработке поисковых запросов пользователей; сервер Z32/Z64 с провайдером данных для АБИС ИРБИС.

Показано, что использование целевых поисковых групп, создаваемых на основе географических и тематических критериев, а также применение средств навигации и уточнения пользовательских запросов позволяют повы­ сить результативность поиска. Предложен алгоритм первоначального вы­ полнения поискового запроса с групповым обращением ко всем базам дан­ ных, поддерживаемым на каждом из опрашиваемых серверов Z39.50. Даль­ нейшая навигация и уточнение поискового запроса связана с формировани­ ем тематической целевой группы, создаваемой пользователем из отобран­ ных баз данных на одном сервере Z39.50 корпоративной библиотечной се­ ти. Опыт создания портала Корпоративной сети московских библиотек по­ зволяет выявить эффективность предложенных решений для повышения качества обслуживания пользователей.

Предложено типовое решение электронной библиотеки на основе ис­ пользования технологии Z39.50 и программных средств полнотекстового поиска ИРБИС, что позволяет повысить функциональность поисковых пор­ талов на основе шлюза HTTP-Z39.50 за счет увеличения числа подключае­ мых информационных источников и обеспечения интегрированного поиска по электронным каталогам и полнотекстовым коллекциям документов.

В результате проведенного исследования разработан программный комплекс, включающий шлюз HTTP-Z39.50 и сервер Z32/Z64, являющийся типовым решением при внедрении корпоративной технологии на основе протокола Z39.50 для библиотек, использующих АБИС ИРБИС.

Результаты исследования были использованы при создании портала Корпоративной сети московских библиотек (http://corporate.gpntb.ru), порта­ ла Научной электронной библиотеки ГПНТБ России (в сети интранет ГПНТБ России) и портала пилотной версии электронной библиотеки МГУКИ (http://library.gpntb.ru/mguki).

16

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

Отдельные издания

1.Гончаров М.В. Практическая реализация библиотечного Интернеткомплекса: науч.-практич. пособие / М.В. Гончаров, К.А. Колосов. - М.: ФАИР-ПРЕСС, 2005. - 192 с.

Публикация в журнале, рекомендованном ВАК

2.Воройский Ф.С. Основные технологические принципы разработки элек­ тронных библиотек гуманитарных вузов России / Ф.С. Воройский, К.А. Колосов // Науч. и техн. б-ки. - 2008 . - № 2. - С. 20-32.

Статьи и тезисы докладов

3.Колосов К.А. Система электронной доставки документов (ЭДД) и меж­ библиотечного абонемента (МБА) в корпоративной сети публичных биб­ лиотек Москвы (КСПБМ) / К.А. Колосов // Проблемы развития вузов­ ских сетевых информационно-библиотечных систем: тез. докл. межву­ зов. совещ. - М.: РХТУ им. Д.И. Менделеева, 2000. - С. 16-21.

4.Колосов К.А. Электронная доставка документов в корпоративном про­ екте публичных библиотек г. Москвы / К.А. Колосов // Вторая междуна­ родная конференция «ИОЛ-2000»: тез. докл. - СПб.: Институт «Откры­ тое общество», 2000. - С. 366-367.

5.Колосов К.А. Особенности реализации системы электронной доставки документов на втором этапе разработки корпоративной сети публичных библиотек Москвы / К.А. Колосов // Библиотеки и ассоциации в меняю­ щемся мире: новые технологии и новые формы сотрудничества: мате­ риалы конф. «Крым-2001». - М.: ГПНТБ России, 2001. - Т. 2. - С. 721723.

6.Колосов К.А. Принципы реализации и развитие технологии электронной доставки документов в корпоративной сети публичных библиотек г. Мо­ сквы / К.А. Колосов // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: материалы конф. «Крым-2002». - М.: ГПНТБ России, 2002. - Т. 2. - С. 721-723.

7.Колосов К.А. Особенности реализации шлюза HTTP-Z39.50 в новой версии WEB-IRBIS [Электронный ресурс] / К.А. Колосов // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы со­ трудничества: материалы конф. «Крым-2003». - М.: ГПНТБ России, 2003. - Режим доступа: http://www.gpntb.ru/win/inter-events/crimea2003/ trud/toml/sec/Doc63.HTML

17

8. Колосов К.А. Новые возможности на основе протокола Z39.50 для поль­ зователей ИРБИС [Электронный ресурс] / К.А. Колосов // Библиотеки и информационные ресурсы в современном мире науки, культуры, образо­ вания и бизнеса: материалы конф. «Крым-2004». - М: ГПНТБ России, 2004. - Режим доступа: http://www.gpntb.ru/win/mter-events/ crimea2004/disk/doc/45.pdf

9.Колосов К.А. Учебно-образовательный портал по библиотечному делу: партнерский проект ВГБИЛ - ГПНТБ [Электронный ресурс] / К.А. Ко­ лосов, Е.Л. Крепкова // Информационные технологии, компьютерные системы и издательская продукция для библиотек: докл. и тез. докл. междунар. конференции «Libcom-2004». - ML: ГПНТБ России, 2004. - Ре­ жим доступа: http://www.gpntb.ru/libcom4/index3.cfm?n= tez/doc3/doc6

Ю.Колосов К.А. Новые возможности поисковых средств портала ВГБИЛ [Электронный ресурс] / К.А. Колосов // Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса: материалы конф. «Крым-2005». - М.: ГПНТБ России, 2005. - Режим дос­ тупа: http://www.gpntb.rU/win/inter-events/crimea2005/disk/l83.pdf

П.Колосов К.А. Оптимизация обработки поисковых запросов на WEBпортале ВГБИЛ [Электронный ресурс] / К.А. Колосов, Е.Л. Крепкова // Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса: материалы конф. «Крым-2006». М., 2006. - Режим доступа: http://www.gpntb.ru/win/inter-events/crimea2006 /disk2/215.pdf

12.Гончаров М.В. Перспективы развития Интернет-комплекса ГПНТБ Рос­ сии / М.В. Гончаров, К.А. Колосов // Электронные ресурсы и электрон­ ные библиотеки: ежегод. межвед. сбор. науч. тр. - М.: ГПНТБ России, 2006.-С. 18-25.

13.Колосов К.А. Модернизированный портал корпоративной сети москов­ ских библиотек [Электронный ресурс] / К.А. Колосов // Информацион­ ные технологии, компьютерные системы и издательская продукция для библиотек: докл. и тез. докл. междунар. конференции «Libcom-2007». - М.: ГПНТБ России, 2007. - Режим доступа: http://www.gpntb.ra /libcom7/disk/47.pdf

14.Колосов К.А. К вопросу об уменьшении задержек при обработке широ­ ковещательных поисковых запросов с использованием шлюзов НТТРZ39.50 / К.А. Колосов // Современные направления развития библиотек: ежегод. межвед. сбор. науч. тр. - М.: ГПНТБ России, 2007. - С. 10-14.

18

Кирилл Анатольевич Колосов

СОЗДАНИЕ И ПРИМЕНЕНИЕ В БИБЛИОТЕЧНОЙ ПРАКТИКЕ КОРПОРАТИВНОЙ ТЕХНОЛОГИИ НА БАЗЕ ПРОТОКОЛА Z39.50

Автореферат диссертации на соискание ученой степени

кандидата технических наук

ЛР № 020536

Подписано в печать 17.04.08

Формат 60x84 1/16

Печать офсетная

Усл. печ. л. 1,16

Уч. изд. л. 1

Заказ 19

Тираж 120 экз.

Издательско-репрографический Центр ГПНТБ России 107996, Москва, К-31, ГСП-6, Кузнецкий мост, 12

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]