Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Электронная информация и электронные ресурсы

..pdf
Скачиваний:
2
Добавлен:
20.11.2023
Размер:
20.88 Mб
Скачать

Комплекс поисковых интернет-систем компании Google

пользуется часть массива, всего лишь 2 млн библиографических записей из общего количества 67 млн, которыми располагает WorldCat.

Google Toolbar получил в 2003 г. приз Ассоциации независи­ мых профессионалов по информации как лучший программ­ ный инструмент года. Компания Google проявила себя и на рынке научного поиска, открыв бета-версию сайта Google Scholar (www.scholar.google.com). Система в первую очередь предоставляет доступ к статьям и рефератам, опубликованным в рамках технологии открытых систем и институциональных репозитариев. При ранжировании выдачи система учитывает в виде отдельного списка индекс цитирования каждого из най­ денных документов. Как утверждает главный инженер проекта, г-н Аннураг Ачарья (Anurag Acharya), «мы охватываем всех ос­ новных издателей научной литературы». Кое-кто высказывает опасение, что эта система превратит библиотекаря научно-тех­ нической библиотеки в «ящик для мусора». «Ничего подобного, — парирует Ян Велетроп (Jan Veletrop), издатель нового журнала Biomed Central, — создание репозитарных систем при развитии Google Scholar становится императивом, а функции репозита­ рия и библиотеки очень близки, это организации, занятые рас­ пространением информации». Скорее Google Scholar является конкурентом таких новых систем, как Web of Knowledge компа­ нии ISI или Scopus, поставляемый издательством Elsevier, по­ скольку Google Scholar лучше названных систем, предоставля­ ется бесплатно и может извлекать информацию, расположен­ ную очень «глубоко» в Сети. Позиция Велетропа не может быть нейтральной, ибо его журнал представляет собой в чистом виде элемент системы открытого доступа (автор оплачивает публи­ кацию, а доступ к ней бесплатен). По мнению редактора журна­ ла «Информация сегодня» (Information World Review, v 208, Dec 04, p.2) Боба Пикеринга (Bobby Pickering), «появление Google Scholar для прежних лидеров информационной индустрии, компаний “Томсон” или “Эльзевир” — это как столкновение “Титаника” с айсбергом. Представители старой гвардии еще танцуют в бальном зале, передвигают стулья поближе к сидя­ щим дамам, не понимая, что происходит на самом деле и что их ждет». И тем не менее все к лучшему: напор Google заставит тра­

251

Глава 6. Работа по составлению и использованию вторичных документов.

диционных издателей пересмотреть цены и условия в сторону, благоприятную для пользователей. Авторы по мере набора ма­ териала в системе репозитариев станут перекочевывать туда. «Время на стороне Google» считает г-н Пикеринг.

Феномен Google — одной из самых быстрорастущих и мно­ гоплановых интернет-компаний — заставляет говорить о ней всех, кто так или иначе работает с Интернетом, а для библиотек, обслуживающих многочитаемых пользователей веб-ресурсов и электронных библиотек, знание инициатив, проектов да и про­ сто работа с этой системой очень важны и поучительны. Анали­ зируя программу ежегодной крымской конференции, видишь, что системе Google посвящен целый ряд докладов, и возникает уверенность, что многие новации и сюрпризы этот феномен нам еще преподнесет. Ясно одно — сегодня трудно себе пред­ ставить Интернет без Google, а Рунет — без активно набираю­ щего обороты русского Гугла.

6.5. ONIX как новый формат метаданных для электронных документов

ОНИКС (ONIX), новый формат информации о продукте, — это международный коммуникативный формат для обмена рас­ ширенными метаданными о книгах, равно как и о других мате­ риалах, используемых в библиотеках и в книготорговле. Руко­ водство по применению формата охватывает спецификацию содержания, элементы данных, разметку, список кодов и XML DTD.

ONIX включает:

полное библиографическое описание;

текстовый материал: описания, литературные обзоры, биографии авторов, выдержки из основного текста доку­ мента;

изображения: обложки, фотографии авторов;

аудио- и видеоматериалы, ссылки в Интернете;

территориальные права собственности;

цены и доступность продукта на различных рынках;

информацию рекламного характера.

252

Идентификатор цифрового объекта DOI

ON IX задумывался вначале как традиционный, нацеленный на нужды книготорговли формат, фактически стандарт на фор­ мирование и передачу книготорговых транзакций, однако со­ временное развитие значительно более многогранно. Выпуще­ на версия 1.3, формулирующая требования к описанию мульти­ медийного продукта с потенциалом охвата также электронных книг, видео, музыкальных записей. Заметен спрос на стандарт ON IX для периодических изданий, имеется в виду создание структурированной многоуровневой библиографической ин­ формации, которую можно было бы использовать и в качестве полного каталожного описания, давать возможность следить за процессом передачи документа, регистрации и службы опове­ щения о задержке — тем самым совершенствуя технологию ра­ боты с библиотечными фондами.

6.6. Идентификатор цифрового объекта DOI

Ссылки на сетевые документы сейчас широко используются как метод цитирования при подготовке профессиональных и научных публикаций. Даже если в момент подготовки сетевой ссылки сетевой адрес был составлен правильно, нет никаких га­ рантий того, что интернет-страница останется завтра на том же месте. Даже самая незначительная реорганизация веб-сайта мо­ жет сделать уникальный сетевой адрес документа (URL) невер­ ным. В лучшем случае администратор сайта проставит новый сетевой адрес документа. Помощь в установлении постоянной и неизменной ссылки на нужный документ окажет Идентифика­ тор цифрового объекта (Digital Object Identifier — DOI) — конеч­ но, только в том случае, если вашей электронной публикации был присвоен соответствующий уникальный идентификатор тем издателем, который входит в систему присвоения иденти­ фикаторов, так называемый Фонд ДОИ (DOI Foundation).

Новая волна разнообразных систем цитирования и реко­ мендаций пришла вместе с введением уникального сетевого ад­ реса URL, но все они пользуются худой репутацией по причине ненадежности и непостоянства. Создание цифровых архивов,

253

Глава 6. Работа по составлению и использованию вторичных документов...

доступных через Сеть, подтолкнуло издателей к поискам прак­ тического решения, дающего возможность идентификации не только отдельных работ, но и каких-то частей работы или их комбинаций, например библиографических ссылок, рефератов, справок, полных текстов, иллюстраций. Практическая сторона дела для издателей состоит в том, что им необходимо отличать те элементы архива, которые будут доступны зарегистрирован­ ным пользователям (тем, кто подписался на определенный том и номер журнала), от тех, кто пользуется не подпиской, а систе­ мой отдельных заказов на доставку отобранных документов (pay per view). Идентификатор цифрового объекта DOI состоит из двух частей приставки и суффикса. Приставка идентифици­ рует издателя, который в свою очередь проставляет суффикс. Суффикс идентифицирует отдельную работу или ее часть (или части). Каждый идентификатор цифрового объекта DOI имеет хотя бы один сетевой адрес URL, но зачастую таких сетевых ад­ ресов у данного документа несколько. Синтаксис суффикса яв­ ляется прерогативой издателя. Различные URL соответствуют разным комбинациям частей документа (или целому докумен­ ту, зафиксированному в различных форматах). Как мы уже от­ мечали, такими частями документа могут быть либо чисто биб­ лиографические описания, либо какие-то элементы дополни­ тельной информации о документе: реферат, дескрипторы, предметные коды, цитированные ссылки и т. п. Издатели реги­ стрируют каждый идентификатор DOI в Международном фон­ де через какое-либо регистрационное агентство. Такого рода операция связывает DOI с сетевым адресом URL того сайта, где находится цифровой документ. Если по какой-либо причине URL изменится, например, из-за реорганизации сайта или пе­ репродажи журнала другому владельцу, его цифровой иденти­ фикатор DOI при этом сохранится прежним. При смене перво­ начального сайта у документа изменяется только URL (если владельцы не забыли обновить URL в репозитории DOI). Такая схема служит гарантией того, что все отсылочные связи, вло­ женные в библиографию и списки цитирования, записи рефе­ рирования и индексирования и все другие источники, упомяну­ тые в данной работе, не потеряют актуальности и значения. Ос­ новные издательские компании поддержали идею DOI. Более

2 5 4

Идентификатор цифрового объекта DOI

250 издательских компаний закупили приставки DOI. Что еще более важно, уже зарегистрировано более 5 млн статей, и этот список далеко не полон. Компания CORBIS, имеющая одну из крупнейших сетевых коллекций изображений (60 млн штук), присоединилась к Фонду D01 и сразу внесла более 2 млн сете­ вых изображений. Служба CrossRef является одним из центров регистрации для Международной организации документации. Эта кооперативная справочная система позволяет непосредст­ венно входить в полные тексты или в рефераты тех статей, на которые имеются ссылки в основной (исходной) изучаемой ва­ ми работе; при этом различия в наименовании журналов и даже в издательствах, выпускающих журналы, не имеет значения для пользователя системы. Система CrossRef использует D01 для создания связи с действующим URL данного документа. Уро­ вень доступа пользователя определяется, как правило, объемом и составом журнальной подписки той библиотеки, в которой он сейчас работает. Конечно, играют роль и те привилегии или возможности, которые издатель посчитал необходимым пре­ доставить данному лицу или данной библиотеке.

В настоящее время около 150 издательств входят в состав системы, а число зарегистрированных статей превосходит 5 млн. Особенно полно в системе представлены издатели журналов по библиотечно-информационной тематике, в том числе МСВ University Press, Elsevier, Wiley и др. Имена компаний, появив­ шихся среди членов системы, достаточно интересны и показа­ тельны — так же как и имена тех, кто пока не присоединился. Система, позволяющая читателю мгновенно просматривать ра­ боты (полные тексты или рефераты), на которые даются ссыл­ ки, обладает огромным потенциалом развития (фактически это микробиблиотека по тематике данной статьи на вашем чита­ тельском столе). При этом чем больше будет накоплено в Сети электронных ресурсов, тем богаче может стать мир ссылок и тем эффективнее вся система. В электронном окружении традици­ онные журналы в электронном формате дополняются теми журналами, которые имеют исключительно цифровую форму, например журналы «Цифровая библиотека» (D-Lib), «Первый понедельник» (First Monday), «Проблемы научно-технических библиотек» (Issues on Science & Technology Librarianship), «Жур­

255

Глава 6. Работа по составлению и использованию вторичных документов...

нал электронных публикаций» (The Journal of Electronic Publishing). Чтение или просмотр соответствующих статей, на которые ссылается автор, — очень полезное дело.

Издательство Wiley проставляет DOI в таблице содержания ко всем своим оцифрованным статьям; однако же на первой странице какой-либо отдельной статьи DOI проставляется только начиная с выпусков журнала после 2000 г. Удобная про­ грамма для работы с идентификатором имеется в браузерах Netscape, а также Internet Explorer, с помощью которой вы мо­ жете напрямую пользоваться этой ссылкой.

 

Таблица 37

Настоящее и будущее поиска

Поиск сегодня

Поиск завтра

Поиск по термину

П ои ск по концепции

Историческое индексирование

Индексирование в реальном вре­

 

мени

Процесс осуществляется вручную — ставятся точные инструкции на сайте поисковой машины

Показ с помощью машины: H T M L = представление содержания

Демонстрация результатов так, как они опубликованы на странице

Простые списки — взаимоотношения данных никак не представлены

Определенные типы данных — например, H T M L или P D F

Созвездие компьютеров, объединен­ ных системой клиент/сервер

Процесс автоматизирован — ставят­ ся цели высокого уровня с помо­ щью персональных компьютеров или другими средствами

Обработка данных с помощью ма­ шины: X M L = смысл содержания

Результаты выбираются из многих источников

Визуализация пространства концеп­ ций — представлены взаимоотно­ ш ения данных

Множество типов данных и файлов

Все, что угодно, и в любое время — распределенные мощ ности, работа­ ет принцип «равный с равными» (peer to peer, P2P)

Полезные для продолжения изучения этой темы адреса: www.semanticweb.org;www.ontoweb.org; предложения консор-

256

Реферирование и цитирование публикаций

циума (W3 Consortium) по семантической обработке сете­ вых материалов можно найти по адресу www.w3.org/2001/sw; а разработки Минобороны США — по адресу www.daml.org; статьи в журнале Scientific American доступны по адресу www.scientificamerican.com/2001/ 0501 issue/0501berners-lee.html.

6.7. Реферирование и цитирование публикаций

Аннотирование, реферирование и каталогизация относятся к аналитико-синтетическим методам переработки документов.

Согласно ГОСТ 7.9—95, аннотация — краткая характеристика первичного документа, его части или совокупности документов с точки зрения содержания, назначения, формы и других особенно­ стей. Аннотация носит пояснительный или рекомендательный характер и служит в качестве средства информирования или по­ иска документов.

Реферат — краткое изложение содержания первичного доку­ мента, его части или совокупности, включающее основные сведе­ ния и выводы, а также количественные и качественные данные об объектах описания. Реферат предназначен для непосредствен­ ного обеспечения пользователя краткой информацией без обра­ щения к первоисточнику, а также для информационного поис­ ка документов и данных.

Значимость процессов реферирования и цитирования для библиотечной практики колоссальна. Реферативные базы дан­ ных — один из столпов библиотечно-информационной дея­ тельности. Огромные массивы рефератов, богатейшие компа­ нии — поставщики информации, изощренные системы поиска документов — это все типовые компоненты индустрии инфор­ мации.

Особый вид рефератов — авторефераты. Автореферат дис­

сертации — научное издание в виде брошюры, содержащее состав­ ленный автором реферат проведенного им исследования, пред­ ставленного на соискание ученой степени (ГОСТ 7.60—90). Особо важное место в библиотечно-информационной работе, в ис­ пользовании документа занимает цитирование документа или его частей. Не менее важным оказался и процесс анализа цити­

2 5 7

Глава 6. Работа по составлению и использованию вторичных документов...

рования документов, вернее, статистический анализ результа­ тов цитирования, который вошел составной частью в специфи­ ческую отрасль науки — библиометрию.

Реферирование и цитирование достаточно близки: при ре­ ферировании ставится задача как можно полнее и кратко отра­ зить содержание документа, а при цитировании может ставить­ ся несколько разных задач, например:

дать подтверждение собственной мысли;

указать источник сведений;

проявить уважение к работам основоположников данного научного направления;

проявить собственную квалификацию и знание предмета.

Доступные в наше время огромные объемы данных библио­ течной статистики в цифровом формате легко поддаются ком­ пьютерной обработке, и они оказались полностью востребова­ ны. Дело в том, что наука и органы управления наукой и ее фи­ нансирования сейчас остро нуждаются в надежной, доступной для измерения и сравнения информации о научных результатах, об эффективности вложений в науку и в конкретные научные исследования.

Практически повсеместное внедрение новых методик фи­ нансирования науки — программно-ориентированных методов финансирования, которые предполагают поддержку важных исследований (а не просто содержание научных учреждений), может быть полезным только при наличии способов оценки эф­ фективности результатов научных исследований. Именно по­ этому практические приложения библиометрии сейчас приоб­ рели столь важное значение. Можно смело сказать, что библио­ метрия переживает второе рождение — и не только как объект построения математических моделей и проверки правильности теоретических положений, но и, главным образом, как инстру­ мент управления наукой. Стремление чиновников от науки (в зарубежной литературе их чаще называют policy maker — «тот, кто делает политику» или decision maker — «тот, кто принимает решения») перейти от финансирования институтов к финанси­ рованию научных программ, не ново.

258

Библиометрический анализ научной активности

6.8. Библиометрический анализ научной активности

Интерес к библиометрическим данным и разработка анали­ тических методов впервые явственно обозначились в 80-е гг. XX столетия. На первых порах математики, специалисты по ин­ формации и социологи занялись математическим моделирова­ нием в библиометрии. Затем интерес к библиометрии пропал, но в конце 90-х гг. профессионалы библиотечно-информацион­ ной индустрии снова обратились к библиометрии.

Иллюзия нейтральности, понятности библиометрических показателей привлекает администраторов: вместо того чтобы вникать в путаные и трудные для восприятия доказательства ценности той или иной работы, представленные тем или иным специалистом, намного проще и универсальнее прибегнуть к цифровым оценкам. Если работа печатается в уважаемом науч­ ном журнале — значит, она полезная. Если на эту работу много ссылаются в других публикациях — значит, ее качество высо­ кое. В этом смысле попытка опереться на нечто объективное, не зависящее от взаимной поддержки и поруки узкого круга знако­ мых лиц, безусловно, интересна.

Финансирование научных исследований «напрямую», через систему грантов — хорошо знакомая российским ученым про­ цедура, достаточно вспомнить о грантах Российского фонда фундаментальных исследований (РФФИ) или грантах Институ­ та «Открытое общество» (Фонд Сороса).

И ранее такой подход к финансированию науки был широко распространен, достаточно напомнить о существовании Госу­ дарственного комитета по науке и технике (ГКНТ СССР), кото­ рый фактически не имел в своем подчинении крупных институ­ тов, но осуществлял поддержку наиболее перспективных и важ­ ных программ через систему адресной финансовой поддержки (тогда слово «грант» еще не было принято). И в настоящее вре­ мя подготовленные проекты очередного реформирования рос­ сийской науки также предлагают стимулировать проведение конкретных исследований, а не финансировать существование исследовательских институтов вообще.

259

Глава 6. Работа по составлению и использованию вторичных документов...

РФФИ и другие фонды при определении качества заявки на получение гранта или при оценке проведенного исследования опираются на мнение экспертов — специалистов в данной об­ ласти. Однако узкая специализация науки приводит к тому, что «все о всех знают» и в силу несовершенства человеческой при­ роды рано или поздно появляется эффект привыкания, субъек­ тивизма.

С этих позиций понятно и вызывает уважение, например, решение немецких администраторов пригласить для составле­ ния методологических рекомендаций по использованию раз­ личных технологий оценки научных исследований независимое частное консультационное агентство KPMG, а к работе в соста­ ве экспертной группы привлечь группу зарубежных ученых.

Специалисты по информации сегодня оказались централь­ ным элементом той системы, в которой накапливаются колос­ сальные объемы данных, полученных в ходе научных исследо­ ваний по всему миру. Их профессиональная обязанность — об­ рабатывать эти массивы данных. Именно библиотеки и информационные центры являются независимыми и междис­ циплинарными учреждениями, способными взять на себя по­ ставку библиометрических данных, необходимых для управле­ ния наукой вне зависимости от ведомственной принадлежности

иот собственных научных интересов.

Вряде стран были созданы национальные институты по сбору и обработке данных об эффективности работы научных учреждений данной страны; в других странах предпочитают по­ лагаться на независимые, университетские или коммерческие, организации либо исследовательские группы, специализирую­ щиеся на библиометрических исследованиях, как плановых, так и по заказу.

Заметим, что библиометрией в России также интенсивно за­ нимаются, понимая ее всего лишь как раздел библиотечной ста­ тистики, а не как основу для реализации научно обоснованных методов управления, и опираясь на данные индексов научного цитирования Института научной информации (Ц Н И ), извест­ ного также как Институт Гарфильда, по имени основателя Юд­ жина Гарфильда (Institute of Scientific Information, ISI, создан в 1958 г.). Из нескольких нам известных организаций назовем От­

2 60

Соседние файлы в папке книги