Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Сетевой информационный поиск

..pdf
Скачиваний:
1
Добавлен:
12.11.2023
Размер:
15.52 Mб
Скачать

Поиск журнальных статей и отчетов о НИР. Работа с базами данных,...

271

тности, доступна через главные страницы подавляющего большинства поисковых машин, различных справочников и т. п., а здесь мы кратко остановимся на методах поиска информации на специализированных новостных сайтах (естественно, что речь будет идти только о русско­ язычной информации).

В РУ Н Е Т е имеется обширный набор новостных сайтов. Для при­ мера назовем http://www.lenta.ru, http://www.gazeta.ru, http://www. nerosru.com, http://www.grani.ru, http://www.strana.ru и т. д. Многие га­ зеты, например, Известия, Аргументы и факты, Новая газета, Комсо­ мольская правда также имеют свои специальные сайты. Они, конечно, не являются точными копиями этих газет, но повторяют, а иногда с опережением дают тексты важнейших статей. Адреса таких сайтов кон­ струируются обычно по принципу использования во втором домене полного или сокращенного названия газеты: http://www.izvestia.ru, http://www.af.ru, http://www.ng.ru и т. д. Имеются и специальные сете­ вые газеты, например, http://www.utro.ru. Периодичность выхода сете­ вых газет разная — это и ежедневные газеты, с выходными днями и без них, и газеты, выходящие раз в два дня. Сравнительно недавно в Санкт-Петербурге появилась чисто электронная газета, которая из­ дается одним из 111 муниципальных образований города — «Пискаревка» (http://www.mo22.spb.ru).

В российской сети есть новостные сайты с информацией о других странах. Так, сайт http://zemw.ukraine.ru посвящен событиям на Украи­ не. Хотя в нем принимают участие и украинские авторы, сам сайт — чисто российское творчество. Сайт же Центральный еврейский ресурс {http://www.sem40.ru) создается израильскими авторами. Есть сайты, где в переводе дается оперативная перепечатка наиболее интересных газетных статей западной прессы. Одним из таких сайтов является сайт http://www.inosmi.ru.

Получение новостной информации на всех перечисленных и им по­ добных сайтах строится по стандартной схеме. На домашней странице каждого сайта приводится систематический указатель с главными те­ мами, например, Ближний Восток, Спорт, Мир религий и пр. Имеется (обычно вверху) строчка с темами важнейших новостей. Имеются и названия статей, с которыми обычно связано краткое резюме или на­ чальные фразы конкретного ресурса. Активизируя названия или специ­ альные значки, можно ознакомиться с полным текстом. Иногда такую активизацию следует проводить два раза. На многих сайтах можно при­ нять участие в дискуссии или в голосовании по теме прочитанного ре­ сурса. Во многих случаях, введя в соответствующее окошко адрес своей электронной почты, можно сразу же подписаться на получение рассыл­

272

Глава 7

ки новостей с данного новостного сервера. В верхней части главной стра­ ницы сайта довольно часто размещают графические материалы с назва­ ниями ресурсов, размещенных на других новостных серверах, и активи­ зация изображений позволяет совершить соответствующий переход. Так как загрузка графического материала отнимает довольно много вре­ мени, многие новостные сайты имеют кнопку для отключения графики. Ряд новостных серверов имеют окно для формирования поискового запроса по темам, а также небольшие архивы публикаций. В общем, ме­ тодика поисковой работы с новостным сервером остается практически неизменной во всех случаях. В то же время серверы разнятся между собой по частоте появления новостей, их надежности и политической ориентации. Иногда новостные серверы дают список новостей в виде стандартной таблицы с темами, названия которых следует активизиро­ вать для дальнейшего ознакомления с содержанием. Такой новостной сервер находится, в частности, по адресу http://www.rol.ru.news.

В заключение несколько слов о новостном сервере Немецкая волна, Deutsche Welle (http://dw-world.de), который предоставляет посетите­ лю подчеркнуто неполитизированные обзоры прессы на нескольких языках, в том числе и на русском. Работу следует начинать с выбора языка, для чего надо активизировать флажок справа от единственного окошка на главной странице. В раскрывающемся меню в алфавитном порядке сверху вниз расположены названия большого числа языков. Если быть не очень внимательным, то создается впечатление о том, что русский язык в этом списке отсутствует, но это не так — просто важней­ шие языки — немецкий, английский и русский, расположены в самом верху списка, еще до буквы А. После выбора языка на схематической карте чуть выше появится стилизованное изображение человеческого глаза. Щелкнув по нему, вы войдете в список предлагаемых статей. К их полному тексту переходят, активизируя соответствующие названия. Тематика и содержание статей на каждом языке разные — они именно те, которые, по мнению модераторов программы, наилучшим образом учитывают интересы посетителей той или иной языковой группы. Авто­ ры не раз убеждались в этом, читая в один и тот же день новости на не­ мецком, английском, русском, украинском и белорусском языках, так что владея несколькими языками, можно получить много информации, которая на обычных новостных сайтах нередко недоступна.

ГЛАВА 8

ОСОБЕННОСТИ РАБОТЫ ЭЛЕКТРОННЫХ ПОИСКОВЫХ СИСТЕМ И ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ

/Новые возможности сетевого поиска

^Если внимательно посмотреть на главную страницу Открытой русской электронной библиотеки OREL (http://orel.rsl.ru), то в верхнем

правом углу можно заметить информацию о том, какое число «скачиваний» текстов было произведено и о том, какая из книг была «скача­ на» последней. Эти строки дают возможность осознать те новые воз­ можности, которые открывает работа с электронными системами. Действительно, при использовании таких систем не возникает ника­ ких затруднений в определении того, сколь часто обращались посетите­ ли к тому или иному ресурсу и, более того, узнать много дополнитель­ ной информации. Например, можно определить периоды наибольших обращений к тому или иному ресурсу, можно также узнать, какие дру­ гие материалы заинтересовали посетителей того ресурса, который при­ влек ваше внимание, и многое другое. Некоторые поисковые системы запоминают ваши запросы и на их основании «предлагают» вам новые потенциально интересные материалы. Некоторые подобные возмож­ ности, связанные с особенностями электронных систем, уж е обсуж ­ дались нами в разделе, посвященном работе Библиотеки конгресса. Обычному пользователю может показаться, что подобная информация никакой особой ценности не представляет, но это неверно.

Так, определение читаемости тех или иных материалов важно от­ нюдь не только для определения тиражной политики издательств или оценки запросов читателей. Динамика изменения читаемости — одна из важнейших социологических характеристик общества, и изучением этих вопросов занимались всегда, хотя в «докомпьютерную эру» это была трудоемкая и тяжелая работа. Ныне же вычислительная техника позволяет оперативно выяснять очень многие, ранее считавшиеся вто­ ричными, показатели читаемости, которые дают возможность делать интересные и полезные выводы. Достаточно сослаться на то, что воз­ можности изучения цитируемости научных и технических публикаций открыли новые пути анализа информационных потоков, развития на­ учных связей и многого другого.

Этими проблемами занимается специальный Институт научной информации, InstitutforScientific Information (ISI), зачастую называемый по имени своего основателя и многолетнего директора Институтом Гарфилда. Институт расположен в г. Филадельфия (С Ш А ) и имеет представительства во многих странах мира. Основной сайт институ­ та находится по URL-адресу http://www.isinet.com. Институт научной информации — независимая коммерческая организация, но многие

Особенности работы электронных поисковых систем и заключительные замечания 275

интересные материалы и издания этого институтадоступны бесплатно. Ряд сетевых материалов, в частности, знаменитые выпуски Current contents, доступны в течение 7 дней в режиме Freetrial. Для начала рабо­ ты в этом режиме следует войти на http://connect.isihost.com. Продук­ ция института выпускается в традиционной печатной и в электронной форме в виде подписки и CD -дисков. Практическое пользование мате­ риалами института возможно при достаточно высокой квалификации пользователя. Мы же здесь кратко отметим, что использование вычис­ лительной техники позволяет Институту определять индексы цитиро­ вания статей (такая платная услуга с ценой около $10 за обработку одной статьи доступна через Интернет). Можно определять и узнавать адреса наиболее цитируемых работ за последний период времени, оп­ ределять так называемые индексы влияния журналов или их импактиндексы. Многие результаты, предлагаемые институтом, можно ис­ пользовать и в квалифицированной поисковой работе.

Авторы проекта «Генеративная энциклопедия Брокгауза и Ефрона»

планируют изучать статистику посещений статей энциклопедии и ста­ тистику запросов, на которые энциклопедия не смогла дать ответа. Эти данные предполагается использовать для корректировки содержания и объема статей энциклопедии. При желании можно изучать статисти­ ку чтения и поисковых операций любого пользователя, отслеживая его по логину или номеру компьютера. Именно так поступает поисковая машина Пингвин. Анализируя типовые запросы и «интересы» пользо­ вателя, эта машина пытается «подсказать» ему адреса «полезных» ре­ сурсов. Этим, конечно, создается некоторая дополнительная комфорт­ ность в работе. В то же время роль посредника (им в данном случае является автор программного обеспечения поисковой машины), резко возрастает. «Машинная помощь» может привести и к пропуску пользо­ вателем ряда полезных материалов.

Иными словами, новые возможности, представляемые электронны­ ми системами, связаны и с некоторыми опасностями. Тем не менее пользователь, по возможности, должен учитывать все эти обстоятель­ ства в своей практической работе. Мы также хотим обратить внимание еще на одно обстоятельство. Электронные системы позволяют даже рядовому пользователю получить во время работы много дополнитель­ ной полезной информации, которую традиционными приемами полу­ чить трудно. Так, войдя в хороший электронный каталог любой биб­ лиотеки, можно без особого труда определить число книг по той или иной теме по годам. Для этого можно использовать индекс УДК или ключевое слово. То же самое можно сделать и по патентной литерату­ ре, и по журнальным публикациям. В результате легко исследовать

276

Глава 8

динамику развития вопроса, что очень полезно для начинающих иссле­ дователей, оценивающих перспективность проблемы на начальной ста­ дии своей работы. Известно, что анализ ссылок на публикации позволя­ ет легко выделить внешне незаметные научные связи и аналогии.

Знакомство с CD Encyclopedia Britannica позволяет на основе встро­ енной программы сравнивать цифровые показатели разных статей, ав­ томатически строить таблицы и графики, которые опираются на тек­ сты разных статей энциклопедии. Традиционными методами такие результаты могут быть получены только в результате длительной и кропотливой работы. Часть таких результатов можно получить и не­ посредственно при сетевой работе, если вы уже овладели необходимы­ ми базовыми навыками. Тем не менее наш жизненный опыт подсказы­ вает, что освоение этих приемов и знакомство с принципиальными их возможностями лучше всего выполнять, пользуясь или CD, или же специальными тренировочными программами (если таковые вам дос­ тупны). Во всяком случае электронные поисковые системы обладают богатейшими дополнительными возможностями по сравнению с тра­ диционными методиками. Серьезное ознакомление с ними безусловно полезно, если вы всерьез собираетесь посвятить себя творческой рабо­ те с использованием современных поисковых систем.

/Автоматическое цитирование, составление личных библиографических каталогов и цитирование электронных документов

Даже при не очень большом опыте работы с различными видами источников информации становится очевидным, что нахождение нуж­ ного документа (электронного ресурса) зачастую не решает всех прак­ тических задач. Сведения о ресурсе необходимо сохранить, а основное его содержание —описать. Иными словами, материал, говоря библио­ течным языком, надо каталогизировать. Эта работа важна не только для крупных хранилищ информации — библиотек, БД и т. п. Неболь­ шая библиотека, группа исследователей и индивидуальный пользова­ тель также нуждаются в соответствующих «памятных записях». Говоря об индивидуальных пользователях, чаще всего используют не понятие «персональный каталог», а понятие «личная картотека». В библиотеч­ ной практике каталог включает в себя описание документов, которые заведомо хранятся в библиотеке. Картотека же включает в себя и све­ дения (обычно этоописания статей), которые в собрании отсутствуют. В практике исследовательской работы пользователи хранят записи о прочитанных и просмотренных документах и их адреса. Сами же доку­

Особенности работы электронных поисковых систем и заключительные замечания 277

менты-первоисточники или их копии у владельца личной картотеки обычно отсутствуют — отсюда и широкое употребление термина «кар­ тотека» , который используется и тогда, когда речь идет о каталоге лич­ ного собрания книг и журналов.

Естественно, каждый волен вести свои записи так, как ему более удобно. Тем не менее в этих записях во избежание лишней работы дол­ жны отражаться не только личные оценки содержания материала, но и те формальные стороны описания, которые могут впоследствии пона­ добиться при написании статей и других документов. Короче говоря, в любые, даже сугубо личные записи, нужно включать определенные обязательные элементы библиографического описания. Они, конечно, должны в основном повторять элементы традиционного библиографи­ ческого описания, которое используется в библиотеках. Желательно, по возможности, в личных записях сохранять и стандартный библио­ течно-библиографический стиль, и соответствующий порядок. Этих правил следует придерживаться, даже если многие из сохраняемых данных непосредственно в вашей практической работе не будет ис­ пользоваться.

Любой исследователь-практик знает, как сложна и длительна акку­ ратная работа по оформлению записей о найденной информации. При использовании традиционных бумажных картотек со временем стано­ вятся необходимы карточки-дубликаты для размещения их в различ­ ных разделах картотеки. Объем подобной «оформительской» работы со временем существенно возрастает. Появление электронных БД по­ зволяет упростить подобную работу. Персональные БД экономят вре­ мя и силы любого исследователя. Основная трудность здесь — это вы­ бор в начале своей практической деятельности подходящей системы каталогизации, так как опыт показывает, что неудачные системы хра­ нения информации практически никогда не переделываются. В луч­ шем случае их бросают и начинают ведение новых систем, зачастую теряя при этом накопленные ранее сведения.

Разработчики программных продуктов предлагают пользователям ряд программ, которые позволяют упростить работы по составлению личных и групповых каталогов. В настоящее время не представляет большого труда купить CD -диск с серией однотипных программ, кото­ рые, в частности, предназначены для составления каталога личных и групповых библиотек. Так, на одном из CD -дисков, наряду с другими программами, можно встретить группу из трех программ, названных

Address Organizer De Luxe, Collectibles OrganizerDe Luxe и Book Organizer De Luxe. Последняя из этих программ представляет собой каталожную библиотечную программу, которую можно разбить на несколько неза­

278

Глава 8

висимых подпрограмм, предназначенных для разных пользователей. Две другие программы — это расширенная БД личных сведений (типа записной книжки) и программа для составления каталога коллекций разных материалов. Все три программы опираются на одну и ту же математическую базу и используют Windows. Чисто библиотечная программа позволяет вести поиск внесенной в каталог информации по нескольким дескрипторам и допускает шесть уровней дробления описания, что вполне достаточно не только для индивидуального пользователя, но и для небольшой учрежденческой библиотеки. Со­ ставители программы ориентировались на личную библиотеку, состо­ ящую только из книг. Тем не менее не представляет большого труда приспособить одну из трех программ диска и для картотеки (каталога) с записями о статьях. Внесение записей в такой каталог — достаточно трудоемкое дело, и поэтому основными достоинствами программы яв­ ляется отсутствие необходимости заполнения карточек-дубликатов, стандартизация формы записей, возможность их простого электрон­ ного копирования и, наконец, отсутствие необходимости самому рас­ ставлять карточки в определенном порядке. Последняя операция при использовании традиционных картотек является одной из самых тру­ доемких.

Известны и другие программы подобного типа, однако основные преимущества электронных систем проявляются в том случае, если сам каталог начинает составляться автоматически. В западной библиотеч­ ной практике описано несколько подобных программ, и примером мо­ жет служить программа Athena CD Cataloger(http://www.sagebrushco7p. com/dataservices/cdcatalog.cfm), предназначенная для составления ин­ дивидуальных каталогов в MARC-формате. Программа составляет ка­ талог по принципу каталогов Библиотеки конгресса США.

Все программы такого типа предназначены для библиотек, так что даже употребляется выражение «Программы, составленные библиоте­ карями для библиотекарей». Приобретение всех этих программ плат­ ное, и широкому российскому индивидуальному пользователю они пока реально недоступны. Поэтому их очень краткое описание мы даем но основе рекламы, которая имеется в Интернете и в ряде рекламных объявлений книжных магазинов.

Одной из таких программ является программа QuickBib. Она про­ дается фирмой Infoork Technology Company (http://www.itcompany.com. quickbib.htm). Как видно из записи, мы привели линк той страницы, где содержится информация именно об этой программе. Для ориентиров­ ки стоимость каждой одноразовой инсталляции программы составля­ ет $49 за копию. Покупка этого продукта с правом неограниченного

Особенности работы электронных поисковых систем и заключительные замечания 279

числа инсталляций обойдется уже в $149. Техника работы с програм­ мой основана на использовании традиционных запросных окон (темплетов). Вводимый материал группируется в соответствии с американс­ кими библиографическими стандартами.

Имеются и более совершенные программы, стоимость покупки ко­ торых настолько высока, что мы ее просто не обсуждаем. Одна из та­ ких программ самостоятельно, ориентируясь на заданные пользова- телем-библиотекарем ключевые слова, обходит каталоги ведущих библиотек и сама составляет карточки на подходящие (релевантные) материалы в МЛЯС-формате. Программы такого типа являются до­ вольно перспективными, и рано или поздно они появятся и в России. Вне всякого сомнения, такие программы очень хорошо используют преимущества электронного поиска, но для реальной оценки качества и полноты отбора материалов такими программами нужны специаль­ ные исследования. Вне всякого сомнения, создание таких программ представляет интерес для работы с каталогами журнальных статей. Для их реального использования необходима достаточно жесткая стан­ дартизация словаря ключевых слов, которая может быть выполнена на основе какой-либо системы библиотечно-библиографической класси­ фикации. Огромное количество информации о программах подобного типа, различных для библиотек разной величины, имеется на сайте

AutomaticalJournalLibrary (http://wwwjtate.me.us/msl/asilis.htm). Преимущества электронных систем можно использовать и при ин­

дивидуальной работе, связанной с написанием различного рода доку­ ментов. Хорошо известны упрощения, которые позволяют ускорить создание пристатейных списков литературы и согласование их с внут­ ритекстовыми отсылками, характерными для текстового процессора Word. Аналогичные возможности представляются и редакционно-из­ дательской системой LaTex. Еще большие возможности дает пользова­ телю версия этой системы LaTex-2e. Связанная с ней система BibTex

позволяет пользователю составлять единый библиографический список для своей повседневной работы, а затем на его основе полуавтоматичес­ ки формировать и пристатейные (прикнижные) списки литературы и внутритекстовые отсылки к ним. Естественно, что во всех программах такого рода введение новой отсылки автоматически меняет всю нумера­ цию отсылок в тексте документа. Короче говоря, это существенно уско­ ряет работу любого автора. Нет никаких сомнений, что со временем по­ добные системы программного обеспечения будут совершенствоваться и объединяться с системами сетевого поиска информации. Описание этих перспектив не входит в наши задачи, и достаточно знать, что такие возможности существуют и уже частично реализуются.

2 8 0

Глава 8

В заключение укажем на еще одно смежное обстоятельство. Сетевой поиск выводит пользователя на большое количество ресурсов, местона­ хождение которых определяется их URL-адресом. Соответственно, при цитировании этих ресурсов в различных документах, особенно в тради­ ционных книгах, журнальных статьях и отчетах, необходимо давать ссылки на эти ресурсы в соответствующих списках цитированной лите­ ратуры. Как известно, библиографические ссылки во всех подобных изданиях составляются в соответствии с определенными правилами. В России эти правила регулируются соответствующими стандартами. Существуют достаточно жесткие правила на характер и порядок распо­ ложения данных о цитированной литературе и за рубежом. Несмотря на некоторые различия, все эти правила схожи между собой, хотя во всех странах мира имеется по два-три разных формата записей. За рубежом их часто называют стилем цитирования (Citing Style). Для простоты можно сказать, что различаются формы записей ссылок для естествен­ но-научной, гуманитарной и обычной книжной литературы. Появление электронных ресурсов в качестве объектов цитирования потребовало формализовать данные для ссылок и на электронные источники (ресур­ сы). Их обязательно нужно знать, чтобы суметь при успешном поиске правильно зафиксировать доступными для вас методами всю необходи­ мую информацию о найденном ресурсе.

И за рубежом, и в России основой для систем цитирования элект­ ронных ресурсов являются рекомендации Международной федерации библиотечных ассоциаций, International Federation o f Library Associa­ tions and Institutions (ИФЛА, IFLA). Описание электронных докумен­ тов (ресурсов) включает в себя те же основные описательные сведе­ ния, размещаемые в полях, как и при обычном цитировании. Поскольку цитирование, предназначенное для зарубежных публикаций, дело до ­ статочно специфическое, мы рекомендуем желающим обратиться по URL-адресам учебных материалов библиотек двух уже упоминавших­ ся ведущих университетов США — Университета штата Нью-Йорк

(http://www.potsdam.edu/library/Home/Citing_Sources.htm) и Калифор­ нийского университета (http://www.lib.berkeley.edu/TeachingLib/Guides/Intemet/Style/html). Можно найти аналогичные материалы и на сай­ тах других западных университетов — особой разницы в характере приводимых при этом описаний во всех этих случаях нет. В России известный нам адрес, где описываются основы цитирования электрон­ ных документов, имеется лишь в малотиражном методическом посо­ бии по написанию курсовых работ, изданном в 1999 г. Санкт-Петер­ бургским государственным университетом и предназначенным для студентов-гуманитариев.