книги / Сетевой информационный поиск
..pdfПоиск журнальных статей и отчетов о НИР. Работа с базами данных,... |
271 |
тности, доступна через главные страницы подавляющего большинства поисковых машин, различных справочников и т. п., а здесь мы кратко остановимся на методах поиска информации на специализированных новостных сайтах (естественно, что речь будет идти только о русско язычной информации).
В РУ Н Е Т е имеется обширный набор новостных сайтов. Для при мера назовем http://www.lenta.ru, http://www.gazeta.ru, http://www. nerosru.com, http://www.grani.ru, http://www.strana.ru и т. д. Многие га зеты, например, Известия, Аргументы и факты, Новая газета, Комсо мольская правда также имеют свои специальные сайты. Они, конечно, не являются точными копиями этих газет, но повторяют, а иногда с опережением дают тексты важнейших статей. Адреса таких сайтов кон струируются обычно по принципу использования во втором домене полного или сокращенного названия газеты: http://www.izvestia.ru, http://www.af.ru, http://www.ng.ru и т. д. Имеются и специальные сете вые газеты, например, http://www.utro.ru. Периодичность выхода сете вых газет разная — это и ежедневные газеты, с выходными днями и без них, и газеты, выходящие раз в два дня. Сравнительно недавно в Санкт-Петербурге появилась чисто электронная газета, которая из дается одним из 111 муниципальных образований города — «Пискаревка» (http://www.mo22.spb.ru).
В российской сети есть новостные сайты с информацией о других странах. Так, сайт http://zemw.ukraine.ru посвящен событиям на Украи не. Хотя в нем принимают участие и украинские авторы, сам сайт — чисто российское творчество. Сайт же Центральный еврейский ресурс {http://www.sem40.ru) создается израильскими авторами. Есть сайты, где в переводе дается оперативная перепечатка наиболее интересных газетных статей западной прессы. Одним из таких сайтов является сайт http://www.inosmi.ru.
Получение новостной информации на всех перечисленных и им по добных сайтах строится по стандартной схеме. На домашней странице каждого сайта приводится систематический указатель с главными те мами, например, Ближний Восток, Спорт, Мир религий и пр. Имеется (обычно вверху) строчка с темами важнейших новостей. Имеются и названия статей, с которыми обычно связано краткое резюме или на чальные фразы конкретного ресурса. Активизируя названия или специ альные значки, можно ознакомиться с полным текстом. Иногда такую активизацию следует проводить два раза. На многих сайтах можно при нять участие в дискуссии или в голосовании по теме прочитанного ре сурса. Во многих случаях, введя в соответствующее окошко адрес своей электронной почты, можно сразу же подписаться на получение рассыл
272 |
Глава 7 |
ки новостей с данного новостного сервера. В верхней части главной стра ницы сайта довольно часто размещают графические материалы с назва ниями ресурсов, размещенных на других новостных серверах, и активи зация изображений позволяет совершить соответствующий переход. Так как загрузка графического материала отнимает довольно много вре мени, многие новостные сайты имеют кнопку для отключения графики. Ряд новостных серверов имеют окно для формирования поискового запроса по темам, а также небольшие архивы публикаций. В общем, ме тодика поисковой работы с новостным сервером остается практически неизменной во всех случаях. В то же время серверы разнятся между собой по частоте появления новостей, их надежности и политической ориентации. Иногда новостные серверы дают список новостей в виде стандартной таблицы с темами, названия которых следует активизиро вать для дальнейшего ознакомления с содержанием. Такой новостной сервер находится, в частности, по адресу http://www.rol.ru.news.
В заключение несколько слов о новостном сервере Немецкая волна, Deutsche Welle (http://dw-world.de), который предоставляет посетите лю подчеркнуто неполитизированные обзоры прессы на нескольких языках, в том числе и на русском. Работу следует начинать с выбора языка, для чего надо активизировать флажок справа от единственного окошка на главной странице. В раскрывающемся меню в алфавитном порядке сверху вниз расположены названия большого числа языков. Если быть не очень внимательным, то создается впечатление о том, что русский язык в этом списке отсутствует, но это не так — просто важней шие языки — немецкий, английский и русский, расположены в самом верху списка, еще до буквы А. После выбора языка на схематической карте чуть выше появится стилизованное изображение человеческого глаза. Щелкнув по нему, вы войдете в список предлагаемых статей. К их полному тексту переходят, активизируя соответствующие названия. Тематика и содержание статей на каждом языке разные — они именно те, которые, по мнению модераторов программы, наилучшим образом учитывают интересы посетителей той или иной языковой группы. Авто ры не раз убеждались в этом, читая в один и тот же день новости на не мецком, английском, русском, украинском и белорусском языках, так что владея несколькими языками, можно получить много информации, которая на обычных новостных сайтах нередко недоступна.
ГЛАВА 8
ОСОБЕННОСТИ РАБОТЫ ЭЛЕКТРОННЫХ ПОИСКОВЫХ СИСТЕМ И ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ
/Новые возможности сетевого поиска
^Если внимательно посмотреть на главную страницу Открытой русской электронной библиотеки OREL (http://orel.rsl.ru), то в верхнем
правом углу можно заметить информацию о том, какое число «скачиваний» текстов было произведено и о том, какая из книг была «скача на» последней. Эти строки дают возможность осознать те новые воз можности, которые открывает работа с электронными системами. Действительно, при использовании таких систем не возникает ника ких затруднений в определении того, сколь часто обращались посетите ли к тому или иному ресурсу и, более того, узнать много дополнитель ной информации. Например, можно определить периоды наибольших обращений к тому или иному ресурсу, можно также узнать, какие дру гие материалы заинтересовали посетителей того ресурса, который при влек ваше внимание, и многое другое. Некоторые поисковые системы запоминают ваши запросы и на их основании «предлагают» вам новые потенциально интересные материалы. Некоторые подобные возмож ности, связанные с особенностями электронных систем, уж е обсуж дались нами в разделе, посвященном работе Библиотеки конгресса. Обычному пользователю может показаться, что подобная информация никакой особой ценности не представляет, но это неверно.
Так, определение читаемости тех или иных материалов важно от нюдь не только для определения тиражной политики издательств или оценки запросов читателей. Динамика изменения читаемости — одна из важнейших социологических характеристик общества, и изучением этих вопросов занимались всегда, хотя в «докомпьютерную эру» это была трудоемкая и тяжелая работа. Ныне же вычислительная техника позволяет оперативно выяснять очень многие, ранее считавшиеся вто ричными, показатели читаемости, которые дают возможность делать интересные и полезные выводы. Достаточно сослаться на то, что воз можности изучения цитируемости научных и технических публикаций открыли новые пути анализа информационных потоков, развития на учных связей и многого другого.
Этими проблемами занимается специальный Институт научной информации, InstitutforScientific Information (ISI), зачастую называемый по имени своего основателя и многолетнего директора Институтом Гарфилда. Институт расположен в г. Филадельфия (С Ш А ) и имеет представительства во многих странах мира. Основной сайт институ та находится по URL-адресу http://www.isinet.com. Институт научной информации — независимая коммерческая организация, но многие
Особенности работы электронных поисковых систем и заключительные замечания 275
интересные материалы и издания этого институтадоступны бесплатно. Ряд сетевых материалов, в частности, знаменитые выпуски Current contents, доступны в течение 7 дней в режиме Freetrial. Для начала рабо ты в этом режиме следует войти на http://connect.isihost.com. Продук ция института выпускается в традиционной печатной и в электронной форме в виде подписки и CD -дисков. Практическое пользование мате риалами института возможно при достаточно высокой квалификации пользователя. Мы же здесь кратко отметим, что использование вычис лительной техники позволяет Институту определять индексы цитиро вания статей (такая платная услуга с ценой около $10 за обработку одной статьи доступна через Интернет). Можно определять и узнавать адреса наиболее цитируемых работ за последний период времени, оп ределять так называемые индексы влияния журналов или их импактиндексы. Многие результаты, предлагаемые институтом, можно ис пользовать и в квалифицированной поисковой работе.
Авторы проекта «Генеративная энциклопедия Брокгауза и Ефрона»
планируют изучать статистику посещений статей энциклопедии и ста тистику запросов, на которые энциклопедия не смогла дать ответа. Эти данные предполагается использовать для корректировки содержания и объема статей энциклопедии. При желании можно изучать статисти ку чтения и поисковых операций любого пользователя, отслеживая его по логину или номеру компьютера. Именно так поступает поисковая машина Пингвин. Анализируя типовые запросы и «интересы» пользо вателя, эта машина пытается «подсказать» ему адреса «полезных» ре сурсов. Этим, конечно, создается некоторая дополнительная комфорт ность в работе. В то же время роль посредника (им в данном случае является автор программного обеспечения поисковой машины), резко возрастает. «Машинная помощь» может привести и к пропуску пользо вателем ряда полезных материалов.
Иными словами, новые возможности, представляемые электронны ми системами, связаны и с некоторыми опасностями. Тем не менее пользователь, по возможности, должен учитывать все эти обстоятель ства в своей практической работе. Мы также хотим обратить внимание еще на одно обстоятельство. Электронные системы позволяют даже рядовому пользователю получить во время работы много дополнитель ной полезной информации, которую традиционными приемами полу чить трудно. Так, войдя в хороший электронный каталог любой биб лиотеки, можно без особого труда определить число книг по той или иной теме по годам. Для этого можно использовать индекс УДК или ключевое слово. То же самое можно сделать и по патентной литерату ре, и по журнальным публикациям. В результате легко исследовать
276 |
Глава 8 |
динамику развития вопроса, что очень полезно для начинающих иссле дователей, оценивающих перспективность проблемы на начальной ста дии своей работы. Известно, что анализ ссылок на публикации позволя ет легко выделить внешне незаметные научные связи и аналогии.
Знакомство с CD Encyclopedia Britannica позволяет на основе встро енной программы сравнивать цифровые показатели разных статей, ав томатически строить таблицы и графики, которые опираются на тек сты разных статей энциклопедии. Традиционными методами такие результаты могут быть получены только в результате длительной и кропотливой работы. Часть таких результатов можно получить и не посредственно при сетевой работе, если вы уже овладели необходимы ми базовыми навыками. Тем не менее наш жизненный опыт подсказы вает, что освоение этих приемов и знакомство с принципиальными их возможностями лучше всего выполнять, пользуясь или CD, или же специальными тренировочными программами (если таковые вам дос тупны). Во всяком случае электронные поисковые системы обладают богатейшими дополнительными возможностями по сравнению с тра диционными методиками. Серьезное ознакомление с ними безусловно полезно, если вы всерьез собираетесь посвятить себя творческой рабо те с использованием современных поисковых систем.
/Автоматическое цитирование, составление личных библиографических каталогов и цитирование электронных документов
Даже при не очень большом опыте работы с различными видами источников информации становится очевидным, что нахождение нуж ного документа (электронного ресурса) зачастую не решает всех прак тических задач. Сведения о ресурсе необходимо сохранить, а основное его содержание —описать. Иными словами, материал, говоря библио течным языком, надо каталогизировать. Эта работа важна не только для крупных хранилищ информации — библиотек, БД и т. п. Неболь шая библиотека, группа исследователей и индивидуальный пользова тель также нуждаются в соответствующих «памятных записях». Говоря об индивидуальных пользователях, чаще всего используют не понятие «персональный каталог», а понятие «личная картотека». В библиотеч ной практике каталог включает в себя описание документов, которые заведомо хранятся в библиотеке. Картотека же включает в себя и све дения (обычно этоописания статей), которые в собрании отсутствуют. В практике исследовательской работы пользователи хранят записи о прочитанных и просмотренных документах и их адреса. Сами же доку
Особенности работы электронных поисковых систем и заключительные замечания 277
менты-первоисточники или их копии у владельца личной картотеки обычно отсутствуют — отсюда и широкое употребление термина «кар тотека» , который используется и тогда, когда речь идет о каталоге лич ного собрания книг и журналов.
Естественно, каждый волен вести свои записи так, как ему более удобно. Тем не менее в этих записях во избежание лишней работы дол жны отражаться не только личные оценки содержания материала, но и те формальные стороны описания, которые могут впоследствии пона добиться при написании статей и других документов. Короче говоря, в любые, даже сугубо личные записи, нужно включать определенные обязательные элементы библиографического описания. Они, конечно, должны в основном повторять элементы традиционного библиографи ческого описания, которое используется в библиотеках. Желательно, по возможности, в личных записях сохранять и стандартный библио течно-библиографический стиль, и соответствующий порядок. Этих правил следует придерживаться, даже если многие из сохраняемых данных непосредственно в вашей практической работе не будет ис пользоваться.
Любой исследователь-практик знает, как сложна и длительна акку ратная работа по оформлению записей о найденной информации. При использовании традиционных бумажных картотек со временем стано вятся необходимы карточки-дубликаты для размещения их в различ ных разделах картотеки. Объем подобной «оформительской» работы со временем существенно возрастает. Появление электронных БД по зволяет упростить подобную работу. Персональные БД экономят вре мя и силы любого исследователя. Основная трудность здесь — это вы бор в начале своей практической деятельности подходящей системы каталогизации, так как опыт показывает, что неудачные системы хра нения информации практически никогда не переделываются. В луч шем случае их бросают и начинают ведение новых систем, зачастую теряя при этом накопленные ранее сведения.
Разработчики программных продуктов предлагают пользователям ряд программ, которые позволяют упростить работы по составлению личных и групповых каталогов. В настоящее время не представляет большого труда купить CD -диск с серией однотипных программ, кото рые, в частности, предназначены для составления каталога личных и групповых библиотек. Так, на одном из CD -дисков, наряду с другими программами, можно встретить группу из трех программ, названных
Address Organizer De Luxe, Collectibles OrganizerDe Luxe и Book Organizer De Luxe. Последняя из этих программ представляет собой каталожную библиотечную программу, которую можно разбить на несколько неза
278 |
Глава 8 |
висимых подпрограмм, предназначенных для разных пользователей. Две другие программы — это расширенная БД личных сведений (типа записной книжки) и программа для составления каталога коллекций разных материалов. Все три программы опираются на одну и ту же математическую базу и используют Windows. Чисто библиотечная программа позволяет вести поиск внесенной в каталог информации по нескольким дескрипторам и допускает шесть уровней дробления описания, что вполне достаточно не только для индивидуального пользователя, но и для небольшой учрежденческой библиотеки. Со ставители программы ориентировались на личную библиотеку, состо ящую только из книг. Тем не менее не представляет большого труда приспособить одну из трех программ диска и для картотеки (каталога) с записями о статьях. Внесение записей в такой каталог — достаточно трудоемкое дело, и поэтому основными достоинствами программы яв ляется отсутствие необходимости заполнения карточек-дубликатов, стандартизация формы записей, возможность их простого электрон ного копирования и, наконец, отсутствие необходимости самому рас ставлять карточки в определенном порядке. Последняя операция при использовании традиционных картотек является одной из самых тру доемких.
Известны и другие программы подобного типа, однако основные преимущества электронных систем проявляются в том случае, если сам каталог начинает составляться автоматически. В западной библиотеч ной практике описано несколько подобных программ, и примером мо жет служить программа Athena CD Cataloger(http://www.sagebrushco7p. com/dataservices/cdcatalog.cfm), предназначенная для составления ин дивидуальных каталогов в MARC-формате. Программа составляет ка талог по принципу каталогов Библиотеки конгресса США.
Все программы такого типа предназначены для библиотек, так что даже употребляется выражение «Программы, составленные библиоте карями для библиотекарей». Приобретение всех этих программ плат ное, и широкому российскому индивидуальному пользователю они пока реально недоступны. Поэтому их очень краткое описание мы даем но основе рекламы, которая имеется в Интернете и в ряде рекламных объявлений книжных магазинов.
Одной из таких программ является программа QuickBib. Она про дается фирмой Infoork Technology Company (http://www.itcompany.com. quickbib.htm). Как видно из записи, мы привели линк той страницы, где содержится информация именно об этой программе. Для ориентиров ки стоимость каждой одноразовой инсталляции программы составля ет $49 за копию. Покупка этого продукта с правом неограниченного
Особенности работы электронных поисковых систем и заключительные замечания 279
числа инсталляций обойдется уже в $149. Техника работы с програм мой основана на использовании традиционных запросных окон (темплетов). Вводимый материал группируется в соответствии с американс кими библиографическими стандартами.
Имеются и более совершенные программы, стоимость покупки ко торых настолько высока, что мы ее просто не обсуждаем. Одна из та ких программ самостоятельно, ориентируясь на заданные пользова- телем-библиотекарем ключевые слова, обходит каталоги ведущих библиотек и сама составляет карточки на подходящие (релевантные) материалы в МЛЯС-формате. Программы такого типа являются до вольно перспективными, и рано или поздно они появятся и в России. Вне всякого сомнения, такие программы очень хорошо используют преимущества электронного поиска, но для реальной оценки качества и полноты отбора материалов такими программами нужны специаль ные исследования. Вне всякого сомнения, создание таких программ представляет интерес для работы с каталогами журнальных статей. Для их реального использования необходима достаточно жесткая стан дартизация словаря ключевых слов, которая может быть выполнена на основе какой-либо системы библиотечно-библиографической класси фикации. Огромное количество информации о программах подобного типа, различных для библиотек разной величины, имеется на сайте
AutomaticalJournalLibrary (http://wwwjtate.me.us/msl/asilis.htm). Преимущества электронных систем можно использовать и при ин
дивидуальной работе, связанной с написанием различного рода доку ментов. Хорошо известны упрощения, которые позволяют ускорить создание пристатейных списков литературы и согласование их с внут ритекстовыми отсылками, характерными для текстового процессора Word. Аналогичные возможности представляются и редакционно-из дательской системой LaTex. Еще большие возможности дает пользова телю версия этой системы LaTex-2e. Связанная с ней система BibTex
позволяет пользователю составлять единый библиографический список для своей повседневной работы, а затем на его основе полуавтоматичес ки формировать и пристатейные (прикнижные) списки литературы и внутритекстовые отсылки к ним. Естественно, что во всех программах такого рода введение новой отсылки автоматически меняет всю нумера цию отсылок в тексте документа. Короче говоря, это существенно уско ряет работу любого автора. Нет никаких сомнений, что со временем по добные системы программного обеспечения будут совершенствоваться и объединяться с системами сетевого поиска информации. Описание этих перспектив не входит в наши задачи, и достаточно знать, что такие возможности существуют и уже частично реализуются.
2 8 0 |
Глава 8 |
В заключение укажем на еще одно смежное обстоятельство. Сетевой поиск выводит пользователя на большое количество ресурсов, местона хождение которых определяется их URL-адресом. Соответственно, при цитировании этих ресурсов в различных документах, особенно в тради ционных книгах, журнальных статьях и отчетах, необходимо давать ссылки на эти ресурсы в соответствующих списках цитированной лите ратуры. Как известно, библиографические ссылки во всех подобных изданиях составляются в соответствии с определенными правилами. В России эти правила регулируются соответствующими стандартами. Существуют достаточно жесткие правила на характер и порядок распо ложения данных о цитированной литературе и за рубежом. Несмотря на некоторые различия, все эти правила схожи между собой, хотя во всех странах мира имеется по два-три разных формата записей. За рубежом их часто называют стилем цитирования (Citing Style). Для простоты можно сказать, что различаются формы записей ссылок для естествен но-научной, гуманитарной и обычной книжной литературы. Появление электронных ресурсов в качестве объектов цитирования потребовало формализовать данные для ссылок и на электронные источники (ресур сы). Их обязательно нужно знать, чтобы суметь при успешном поиске правильно зафиксировать доступными для вас методами всю необходи мую информацию о найденном ресурсе.
И за рубежом, и в России основой для систем цитирования элект ронных ресурсов являются рекомендации Международной федерации библиотечных ассоциаций, International Federation o f Library Associa tions and Institutions (ИФЛА, IFLA). Описание электронных докумен тов (ресурсов) включает в себя те же основные описательные сведе ния, размещаемые в полях, как и при обычном цитировании. Поскольку цитирование, предназначенное для зарубежных публикаций, дело до статочно специфическое, мы рекомендуем желающим обратиться по URL-адресам учебных материалов библиотек двух уже упоминавших ся ведущих университетов США — Университета штата Нью-Йорк
(http://www.potsdam.edu/library/Home/Citing_Sources.htm) и Калифор нийского университета (http://www.lib.berkeley.edu/TeachingLib/Guides/Intemet/Style/html). Можно найти аналогичные материалы и на сай тах других западных университетов — особой разницы в характере приводимых при этом описаний во всех этих случаях нет. В России известный нам адрес, где описываются основы цитирования электрон ных документов, имеется лишь в малотиражном методическом посо бии по написанию курсовых работ, изданном в 1999 г. Санкт-Петер бургским государственным университетом и предназначенным для студентов-гуманитариев.