книги / Электронная информация и электронные ресурсы
..pdfКомплекс поисковых интернет-систем компании Google
пользуется часть массива, всего лишь 2 млн библиографических записей из общего количества 67 млн, которыми располагает WorldCat.
Google Toolbar получил в 2003 г. приз Ассоциации независи мых профессионалов по информации как лучший программ ный инструмент года. Компания Google проявила себя и на рынке научного поиска, открыв бета-версию сайта Google Scholar (www.scholar.google.com). Система в первую очередь предоставляет доступ к статьям и рефератам, опубликованным в рамках технологии открытых систем и институциональных репозитариев. При ранжировании выдачи система учитывает в виде отдельного списка индекс цитирования каждого из най денных документов. Как утверждает главный инженер проекта, г-н Аннураг Ачарья (Anurag Acharya), «мы охватываем всех ос новных издателей научной литературы». Кое-кто высказывает опасение, что эта система превратит библиотекаря научно-тех нической библиотеки в «ящик для мусора». «Ничего подобного, — парирует Ян Велетроп (Jan Veletrop), издатель нового журнала Biomed Central, — создание репозитарных систем при развитии Google Scholar становится императивом, а функции репозита рия и библиотеки очень близки, это организации, занятые рас пространением информации». Скорее Google Scholar является конкурентом таких новых систем, как Web of Knowledge компа нии ISI или Scopus, поставляемый издательством Elsevier, по скольку Google Scholar лучше названных систем, предоставля ется бесплатно и может извлекать информацию, расположен ную очень «глубоко» в Сети. Позиция Велетропа не может быть нейтральной, ибо его журнал представляет собой в чистом виде элемент системы открытого доступа (автор оплачивает публи кацию, а доступ к ней бесплатен). По мнению редактора журна ла «Информация сегодня» (Information World Review, v 208, Dec 04, p.2) Боба Пикеринга (Bobby Pickering), «появление Google Scholar для прежних лидеров информационной индустрии, компаний “Томсон” или “Эльзевир” — это как столкновение “Титаника” с айсбергом. Представители старой гвардии еще танцуют в бальном зале, передвигают стулья поближе к сидя щим дамам, не понимая, что происходит на самом деле и что их ждет». И тем не менее все к лучшему: напор Google заставит тра
251
Глава 6. Работа по составлению и использованию вторичных документов.
диционных издателей пересмотреть цены и условия в сторону, благоприятную для пользователей. Авторы по мере набора ма териала в системе репозитариев станут перекочевывать туда. «Время на стороне Google» считает г-н Пикеринг.
Феномен Google — одной из самых быстрорастущих и мно гоплановых интернет-компаний — заставляет говорить о ней всех, кто так или иначе работает с Интернетом, а для библиотек, обслуживающих многочитаемых пользователей веб-ресурсов и электронных библиотек, знание инициатив, проектов да и про сто работа с этой системой очень важны и поучительны. Анали зируя программу ежегодной крымской конференции, видишь, что системе Google посвящен целый ряд докладов, и возникает уверенность, что многие новации и сюрпризы этот феномен нам еще преподнесет. Ясно одно — сегодня трудно себе пред ставить Интернет без Google, а Рунет — без активно набираю щего обороты русского Гугла.
6.5. ONIX как новый формат метаданных для электронных документов
ОНИКС (ONIX), новый формат информации о продукте, — это международный коммуникативный формат для обмена рас ширенными метаданными о книгах, равно как и о других мате риалах, используемых в библиотеках и в книготорговле. Руко водство по применению формата охватывает спецификацию содержания, элементы данных, разметку, список кодов и XML DTD.
ONIX включает:
•полное библиографическое описание;
•текстовый материал: описания, литературные обзоры, биографии авторов, выдержки из основного текста доку мента;
•изображения: обложки, фотографии авторов;
•аудио- и видеоматериалы, ссылки в Интернете;
•территориальные права собственности;
•цены и доступность продукта на различных рынках;
•информацию рекламного характера.
252
Идентификатор цифрового объекта DOI
ON IX задумывался вначале как традиционный, нацеленный на нужды книготорговли формат, фактически стандарт на фор мирование и передачу книготорговых транзакций, однако со временное развитие значительно более многогранно. Выпуще на версия 1.3, формулирующая требования к описанию мульти медийного продукта с потенциалом охвата также электронных книг, видео, музыкальных записей. Заметен спрос на стандарт ON IX для периодических изданий, имеется в виду создание структурированной многоуровневой библиографической ин формации, которую можно было бы использовать и в качестве полного каталожного описания, давать возможность следить за процессом передачи документа, регистрации и службы опове щения о задержке — тем самым совершенствуя технологию ра боты с библиотечными фондами.
6.6. Идентификатор цифрового объекта DOI
Ссылки на сетевые документы сейчас широко используются как метод цитирования при подготовке профессиональных и научных публикаций. Даже если в момент подготовки сетевой ссылки сетевой адрес был составлен правильно, нет никаких га рантий того, что интернет-страница останется завтра на том же месте. Даже самая незначительная реорганизация веб-сайта мо жет сделать уникальный сетевой адрес документа (URL) невер ным. В лучшем случае администратор сайта проставит новый сетевой адрес документа. Помощь в установлении постоянной и неизменной ссылки на нужный документ окажет Идентифика тор цифрового объекта (Digital Object Identifier — DOI) — конеч но, только в том случае, если вашей электронной публикации был присвоен соответствующий уникальный идентификатор тем издателем, который входит в систему присвоения иденти фикаторов, так называемый Фонд ДОИ (DOI Foundation).
Новая волна разнообразных систем цитирования и реко мендаций пришла вместе с введением уникального сетевого ад реса URL, но все они пользуются худой репутацией по причине ненадежности и непостоянства. Создание цифровых архивов,
253
Глава 6. Работа по составлению и использованию вторичных документов...
доступных через Сеть, подтолкнуло издателей к поискам прак тического решения, дающего возможность идентификации не только отдельных работ, но и каких-то частей работы или их комбинаций, например библиографических ссылок, рефератов, справок, полных текстов, иллюстраций. Практическая сторона дела для издателей состоит в том, что им необходимо отличать те элементы архива, которые будут доступны зарегистрирован ным пользователям (тем, кто подписался на определенный том и номер журнала), от тех, кто пользуется не подпиской, а систе мой отдельных заказов на доставку отобранных документов (pay per view). Идентификатор цифрового объекта DOI состоит из двух частей — приставки и суффикса. Приставка идентифици рует издателя, который в свою очередь проставляет суффикс. Суффикс идентифицирует отдельную работу или ее часть (или части). Каждый идентификатор цифрового объекта DOI имеет хотя бы один сетевой адрес URL, но зачастую таких сетевых ад ресов у данного документа несколько. Синтаксис суффикса яв ляется прерогативой издателя. Различные URL соответствуют разным комбинациям частей документа (или целому докумен ту, зафиксированному в различных форматах). Как мы уже от мечали, такими частями документа могут быть либо чисто биб лиографические описания, либо какие-то элементы дополни тельной информации о документе: реферат, дескрипторы, предметные коды, цитированные ссылки и т. п. Издатели реги стрируют каждый идентификатор DOI в Международном фон де через какое-либо регистрационное агентство. Такого рода операция связывает DOI с сетевым адресом URL того сайта, где находится цифровой документ. Если по какой-либо причине URL изменится, например, из-за реорганизации сайта или пе репродажи журнала другому владельцу, его цифровой иденти фикатор DOI при этом сохранится прежним. При смене перво начального сайта у документа изменяется только URL (если владельцы не забыли обновить URL в репозитории DOI). Такая схема служит гарантией того, что все отсылочные связи, вло женные в библиографию и списки цитирования, записи рефе рирования и индексирования и все другие источники, упомяну тые в данной работе, не потеряют актуальности и значения. Ос новные издательские компании поддержали идею DOI. Более
2 5 4
Идентификатор цифрового объекта DOI
250 издательских компаний закупили приставки DOI. Что еще более важно, уже зарегистрировано более 5 млн статей, и этот список далеко не полон. Компания CORBIS, имеющая одну из крупнейших сетевых коллекций изображений (60 млн штук), присоединилась к Фонду D01 и сразу внесла более 2 млн сете вых изображений. Служба CrossRef является одним из центров регистрации для Международной организации документации. Эта кооперативная справочная система позволяет непосредст венно входить в полные тексты или в рефераты тех статей, на которые имеются ссылки в основной (исходной) изучаемой ва ми работе; при этом различия в наименовании журналов и даже в издательствах, выпускающих журналы, не имеет значения для пользователя системы. Система CrossRef использует D01 для создания связи с действующим URL данного документа. Уро вень доступа пользователя определяется, как правило, объемом и составом журнальной подписки той библиотеки, в которой он сейчас работает. Конечно, играют роль и те привилегии или возможности, которые издатель посчитал необходимым пре доставить данному лицу или данной библиотеке.
В настоящее время около 150 издательств входят в состав системы, а число зарегистрированных статей превосходит 5 млн. Особенно полно в системе представлены издатели журналов по библиотечно-информационной тематике, в том числе МСВ University Press, Elsevier, Wiley и др. Имена компаний, появив шихся среди членов системы, достаточно интересны и показа тельны — так же как и имена тех, кто пока не присоединился. Система, позволяющая читателю мгновенно просматривать ра боты (полные тексты или рефераты), на которые даются ссыл ки, обладает огромным потенциалом развития (фактически это микробиблиотека по тематике данной статьи на вашем чита тельском столе). При этом чем больше будет накоплено в Сети электронных ресурсов, тем богаче может стать мир ссылок и тем эффективнее вся система. В электронном окружении традици онные журналы в электронном формате дополняются теми журналами, которые имеют исключительно цифровую форму, например журналы «Цифровая библиотека» (D-Lib), «Первый понедельник» (First Monday), «Проблемы научно-технических библиотек» (Issues on Science & Technology Librarianship), «Жур
255
Глава 6. Работа по составлению и использованию вторичных документов...
нал электронных публикаций» (The Journal of Electronic Publishing). Чтение или просмотр соответствующих статей, на которые ссылается автор, — очень полезное дело.
Издательство Wiley проставляет DOI в таблице содержания ко всем своим оцифрованным статьям; однако же на первой странице какой-либо отдельной статьи DOI проставляется только начиная с выпусков журнала после 2000 г. Удобная про грамма для работы с идентификатором имеется в браузерах Netscape, а также Internet Explorer, с помощью которой вы мо жете напрямую пользоваться этой ссылкой.
|
Таблица 37 |
Настоящее и будущее поиска |
|
Поиск сегодня |
Поиск завтра |
Поиск по термину |
П ои ск по концепции |
Историческое индексирование |
Индексирование в реальном вре |
|
мени |
Процесс осуществляется вручную — ставятся точные инструкции на сайте поисковой машины
Показ с помощью машины: H T M L = представление содержания
Демонстрация результатов так, как они опубликованы на странице
Простые списки — взаимоотношения данных никак не представлены
Определенные типы данных — например, H T M L или P D F
Созвездие компьютеров, объединен ных системой клиент/сервер
Процесс автоматизирован — ставят ся цели высокого уровня с помо щью персональных компьютеров или другими средствами
Обработка данных с помощью ма шины: X M L = смысл содержания
Результаты выбираются из многих источников
Визуализация пространства концеп ций — представлены взаимоотно ш ения данных
Множество типов данных и файлов
Все, что угодно, и в любое время — распределенные мощ ности, работа ет принцип «равный с равными» (peer to peer, P2P)
Полезные для продолжения изучения этой темы адреса: www.semanticweb.org;www.ontoweb.org; предложения консор-
256
Реферирование и цитирование публикаций
циума (W3 Consortium) по семантической обработке сете вых материалов можно найти по адресу www.w3.org/2001/sw; а разработки Минобороны США — по адресу www.daml.org; статьи в журнале Scientific American доступны по адресу www.scientificamerican.com/2001/ 0501 issue/0501berners-lee.html.
6.7. Реферирование и цитирование публикаций
Аннотирование, реферирование и каталогизация относятся к аналитико-синтетическим методам переработки документов.
Согласно ГОСТ 7.9—95, аннотация — краткая характеристика первичного документа, его части или совокупности документов с точки зрения содержания, назначения, формы и других особенно стей. Аннотация носит пояснительный или рекомендательный характер и служит в качестве средства информирования или по иска документов.
Реферат — краткое изложение содержания первичного доку мента, его части или совокупности, включающее основные сведе ния и выводы, а также количественные и качественные данные об объектах описания. Реферат предназначен для непосредствен ного обеспечения пользователя краткой информацией без обра щения к первоисточнику, а также для информационного поис ка документов и данных.
Значимость процессов реферирования и цитирования для библиотечной практики колоссальна. Реферативные базы дан ных — один из столпов библиотечно-информационной дея тельности. Огромные массивы рефератов, богатейшие компа нии — поставщики информации, изощренные системы поиска документов — это все типовые компоненты индустрии инфор мации.
Особый вид рефератов — авторефераты. Автореферат дис
сертации — научное издание в виде брошюры, содержащее состав ленный автором реферат проведенного им исследования, пред ставленного на соискание ученой степени (ГОСТ 7.60—90). Особо важное место в библиотечно-информационной работе, в ис пользовании документа занимает цитирование документа или его частей. Не менее важным оказался и процесс анализа цити
2 5 7
Глава 6. Работа по составлению и использованию вторичных документов...
рования документов, вернее, статистический анализ результа тов цитирования, который вошел составной частью в специфи ческую отрасль науки — библиометрию.
Реферирование и цитирование достаточно близки: при ре ферировании ставится задача как можно полнее и кратко отра зить содержание документа, а при цитировании может ставить ся несколько разных задач, например:
•дать подтверждение собственной мысли;
•указать источник сведений;
•проявить уважение к работам основоположников данного научного направления;
•проявить собственную квалификацию и знание предмета.
Доступные в наше время огромные объемы данных библио течной статистики в цифровом формате легко поддаются ком пьютерной обработке, и они оказались полностью востребова ны. Дело в том, что наука и органы управления наукой и ее фи нансирования сейчас остро нуждаются в надежной, доступной для измерения и сравнения информации о научных результатах, об эффективности вложений в науку и в конкретные научные исследования.
Практически повсеместное внедрение новых методик фи нансирования науки — программно-ориентированных методов финансирования, которые предполагают поддержку важных исследований (а не просто содержание научных учреждений), может быть полезным только при наличии способов оценки эф фективности результатов научных исследований. Именно по этому практические приложения библиометрии сейчас приоб рели столь важное значение. Можно смело сказать, что библио метрия переживает второе рождение — и не только как объект построения математических моделей и проверки правильности теоретических положений, но и, главным образом, как инстру мент управления наукой. Стремление чиновников от науки (в зарубежной литературе их чаще называют policy maker — «тот, кто делает политику» или decision maker — «тот, кто принимает решения») перейти от финансирования институтов к финанси рованию научных программ, не ново.
258
Библиометрический анализ научной активности
6.8. Библиометрический анализ научной активности
Интерес к библиометрическим данным и разработка анали тических методов впервые явственно обозначились в 80-е гг. XX столетия. На первых порах математики, специалисты по ин формации и социологи занялись математическим моделирова нием в библиометрии. Затем интерес к библиометрии пропал, но в конце 90-х гг. профессионалы библиотечно-информацион ной индустрии снова обратились к библиометрии.
Иллюзия нейтральности, понятности библиометрических показателей привлекает администраторов: вместо того чтобы вникать в путаные и трудные для восприятия доказательства ценности той или иной работы, представленные тем или иным специалистом, намного проще и универсальнее прибегнуть к цифровым оценкам. Если работа печатается в уважаемом науч ном журнале — значит, она полезная. Если на эту работу много ссылаются в других публикациях — значит, ее качество высо кое. В этом смысле попытка опереться на нечто объективное, не зависящее от взаимной поддержки и поруки узкого круга знако мых лиц, безусловно, интересна.
Финансирование научных исследований «напрямую», через систему грантов — хорошо знакомая российским ученым про цедура, достаточно вспомнить о грантах Российского фонда фундаментальных исследований (РФФИ) или грантах Институ та «Открытое общество» (Фонд Сороса).
И ранее такой подход к финансированию науки был широко распространен, достаточно напомнить о существовании Госу дарственного комитета по науке и технике (ГКНТ СССР), кото рый фактически не имел в своем подчинении крупных институ тов, но осуществлял поддержку наиболее перспективных и важ ных программ через систему адресной финансовой поддержки (тогда слово «грант» еще не было принято). И в настоящее вре мя подготовленные проекты очередного реформирования рос сийской науки также предлагают стимулировать проведение конкретных исследований, а не финансировать существование исследовательских институтов вообще.
259
Глава 6. Работа по составлению и использованию вторичных документов...
РФФИ и другие фонды при определении качества заявки на получение гранта или при оценке проведенного исследования опираются на мнение экспертов — специалистов в данной об ласти. Однако узкая специализация науки приводит к тому, что «все о всех знают» и в силу несовершенства человеческой при роды рано или поздно появляется эффект привыкания, субъек тивизма.
С этих позиций понятно и вызывает уважение, например, решение немецких администраторов пригласить для составле ния методологических рекомендаций по использованию раз личных технологий оценки научных исследований независимое частное консультационное агентство KPMG, а к работе в соста ве экспертной группы привлечь группу зарубежных ученых.
Специалисты по информации сегодня оказались централь ным элементом той системы, в которой накапливаются колос сальные объемы данных, полученных в ходе научных исследо ваний по всему миру. Их профессиональная обязанность — об рабатывать эти массивы данных. Именно библиотеки и информационные центры являются независимыми и междис циплинарными учреждениями, способными взять на себя по ставку библиометрических данных, необходимых для управле ния наукой вне зависимости от ведомственной принадлежности
иот собственных научных интересов.
Вряде стран были созданы национальные институты по сбору и обработке данных об эффективности работы научных учреждений данной страны; в других странах предпочитают по лагаться на независимые, университетские или коммерческие, организации либо исследовательские группы, специализирую щиеся на библиометрических исследованиях, как плановых, так и по заказу.
Заметим, что библиометрией в России также интенсивно за нимаются, понимая ее всего лишь как раздел библиотечной ста тистики, а не как основу для реализации научно обоснованных методов управления, и опираясь на данные индексов научного цитирования Института научной информации (Ц Н И ), извест ного также как Институт Гарфильда, по имени основателя Юд жина Гарфильда (Institute of Scientific Information, ISI, создан в 1958 г.). Из нескольких нам известных организаций назовем От
2 60