Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Клецова Информационные технологии електронные таблицы и 2011

.pdf
Скачиваний:
3
Добавлен:
12.11.2022
Размер:
9.64 Mб
Скачать

Рис.2.28

Заключение

Отчет по лабораторной работе должен содержать заключение, в котором описываются полученные в ходе лабораторной работы результаты и выводы по работе.

Контрольные вопросы

1.Какие типы файлов можно импортировать в таблицу?

2.Чем отличаются виды сообщений об ошибках: Останов, Предупреждение, Сообщение?

3.Какие функции по работе с записями таблицы возможны в форме?

4.Сколько уровней отображения команды Итоги существует? Перечислите.

5.Как включить автофильтр?

6.Как используется расширенный фильтр?

7.Какие параметры задаются в окне Промежуточные ито-

ги команды Итоги?

71

8.Как отключить автофильтр?

9.Как убрать промежуточные итоги?

Список литературы

1.Эффективная работа: Microsoft Office Excel 2003 / М. Додж,

К. Стинсон. СПб.: Питер, 2005.

2.Джеллен Б., Сирстад Т. Применение VBA и макросов в Microsoft Excel / Пер. с англ. и ред. А. В. Журавлева. М.: Вильямс, 2006.

3.Кошелев В.Е. Excel2007. М.: ООО «Бином-Пресс», 2008.

72

Работа 3

ЯЗЫКИ ЗАПРОСОВ ДОКУМЕНТАЛЬНЫХ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ НА ПРИМЕРЕ СИСТЕМЫ ЯNDEX

Цель работы – изучение информационно-поисковых языков, изучение стратегий информационного поиска.

Задание на лабораторную работу

Изучить языки запросов информационно-поисковых систем Интернет.

Изучить стратегию сужения запроса. Применяя стратегию сужения запроса, необходимо найти известную песню по одной фразе, используя словосочетание (необходимо, чтобы по последнему запросу было бы найдено не более 10 документов).

Изучить стратегию расширения запроса. Применяя стратегию расширения запроса, необходимо найти материалы для реферата по заданной теме (необходимо, чтобы по последнему запросу было бы найдено не более 100 документов). При проведении запросов учитывать: количество слов в запросе, логические операторы (И, ИЛИ, НЕ, словосочетания, расстояния между словами), статистику количества страниц и серверов, время ответа на запрос.

Изучить методы информационного анализа по словарной статистике. Построить распределение по популярности заданных объектов в Интернете.

Сравнить языки запросов двух поисковых систем. Провести сравнение языков запросов различных поисковых систем Интернета, используя сайт: POISK.RU.

Теоретические аспекты

Интернет представляет собой гигантское неструктурированное хранилище свободно размещаемых страниц, не поддающееся четкой классификации, что делает поиск информации трудным и не-

73

предсказуемым. Поэтому для эффективного поиска требуются некоторые навыки его грамотного проведения.

Среди основных способов, используемых для поиска в Интернете, можно выделить следующие [2]:

поиск с помощью поисковых систем;

поиск через каталоги;

поиск через метапоисковые системы;

Деление на каталоги и поисковые системы условно, так как любой поисковый каталог сейчас обязательно предлагает и услуги поисковой системы. И наоборот, многие поисковые системы предлагают заранее сузить область поиска, выбрав ту или иную тему поиска, или хотя бы ее область.

Поиск с помощью поисковых систем (поисковых машин)

Поисковая машина представляет собой комплект программ, в основе которого лежат следующие пять [1]:

Spider («паук») – программа-робот, который перемещается по сети, собирает информацию о ее ресурсах и загружает в поисковую машину Web-страницы.

Crawler («червяк», или «путешествующий паук») – программа, способная найти на Web-странице все ссылки на другие страницы. Ее задача – определить, куда дальше должен ползти «паук», руководствуясь ссылками или заранее заданным списком адресов.

Indexer (индексатор) – программа, которая «разбирает» страницу на составные части и анализирует их. Вычленяются и анализируются заголовки Web-страниц, заголовки документов, ссылки, текст документов, отдельно – текст, выделенный полужирным шрифтом, курсивом и т.д.

Database (база данных) – хранилище всех данных, которые поисковая система загружает и анализирует.

Search Engine Results Engine (система выдачи результатов по-

иска) решает, какие страницы удовлетворяют запросу пользователя и в какой степени. Именно с этой частью поисковой системы «общается» пользователь.

74

Принципиально поиск заключается в следующем. Поисковые роботы-пауки во время своих блужданий по сети извлекают и индексируют различные виды информации. Причем различные про- граммы-роботы имеют свои поисковые особенности и приоритеты. Одни из них индексируют каждое слово в документе, другие – только наиболее часто встречающиеся слова. В общем случае индексирование документа производится по многим параметрам: по количеству слов в документе, по размеру документа, по его названию, заголовкам, ссылкам и т.д. В связи с постоянным обновлением информации поисковый робот регулярно возвращается через определенный срок (порядка месяца) к уже изученным узлам, чтобы обнаружить и зарегистрировать изменения.

Собранную информацию роботы помещают в базу данных, с которой и взаимодействует пользователь, осуществляя поиск. У каждой поисковой системы вырабатывается своя база данных, которая может отличаться от базы данных другой поисковой системы.

В одной поисковой системе может быть несколько поисковых машин. Так, например, поисковая система Яndex пять лет назад уже включала в себя 30 поисковых машин.

После ввода запроса пользователя, поисковая система выводит список найденных документов из своей базы данных по степени их релевантности. Первым в списке отображается документ, который, по мнению поисковой системы, наиболее соответствует запросу пользователя.

Различные поисковые системы используют разные алгоритмы определения релевантности документа, однако, основные из них следующие:

определение количества искомых слов в тексте документа;

HTML-документы, в содержимом которых эти слова встречаются;

удельный вес искомых слов в общем количестве слов в документе;

учет индекса цитируемости – количество документов, ссылающихся на данный документ;

алгоритм определения релевантности с учетом времени нахождения документа в базе данных ПС.

75

К преимуществам поисковых систем следует отнести следую-

щие [1].

Малое количество в результатах поиска устаревших ссылок (почтовые роботы проверяют уже занесенные в базу данных сайты гораздо чаше, чем это делают редакторы каталогов).

Намного большее количество Web-узлов, по которым производится поиск. Если наиболее крупные поисковые каталоги содержат ссылки на десятки тысяч сайтов, то поисковые системы в своих базах данных – на сотни тысяч и миллионы.

Более высокую скорость поиска. При поиске в каталоге, уточняя тему, приходится открывать несколько страниц, а потом еще «перелистывать» страницы найденных сайтов; поисковая машина сразу выдает адреса конкретных документов.

Высокую релевантность поиска. Правда, это относится не ко всем поисковым системам. Но каждая из них развивается, и повышение релевантности – одно из главных направлений совершенствования.

Существуют у поисковых систем и недостатки. Среди главных отметим следующие [1].

Ограниченная область поиска. Если какой-либо сайт не был внесен в базу данных поисковой системы, он для нее «не существует», и его документы в результаты поиска попасть не могут.

Относительная сложность использования. Для того чтобы составленный запрос на поиск точно соответствовал тому, что именно следует найти, нужно хотя бы немного представлять, как работает поисковая система, и уметь использовать простейшие логические операторы. Поисковые каталоги в этом смысле проще и привычнее.

Менее наглядная форма представления результатов запроса. Каталог выдает название сайта с его краткой аннотацией и другой полезной информацией (количество посещений, дата создания и т.д.). Результаты работы поисковой системы менее наглядны.

Поскольку базу данных поисковой системы пополняют про- граммы-роботы, нечестные владельцы рекламных сайтов могут их «обмануть», из-за чего релевантность поиска может быть значительно снижена.

76

Примеры поисковых систем:

Internet Statistics: Web Groth, Internet Growth [1993], ALIWEB: Archie Like Indexing for the Web [1993]. , WebCrawler [1994], AltaVista [1995], Aport [1996], Ask [1996], Rambler [1996], Яndex [1997], Google [1998], AlltheWeb [1999], Yahoo! Search [1999], MSN [1999].

У каждой поисковой системы имеется свой язык запросов – информационно-поисковый язык (ИПЯ), который позволяет сформулировать запрос к системе в простой и наглядной форме. Важной особенностью современных ИПЯ является наличие языка запросов, приближенного к естественному языку (например, запись слов через пробел).

Информационно-поисковый язык – знаковая система, предназначенная для описания (путем индексирования) основного смыслового содержания текстов (документов) или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации информационного поиска. Любой абстрактный информационно-поисковый язык состоит из алфавита (списка элементарных символов), правил образования и правил интерпретации. Правила образования устанавливают, какие комбинации элементарных символов допускаются при построении слов и выражений, а правила интерпретации – как надлежит понимать эти слова и выражения. На данный момент стандарта на язык запросов к поисковым системам еще не существует.

В табл.3.1 представлена информация по ведущим поисковым системам, в том числе синтаксис информационно-поискового языка систем, возможности расширенного поиска и другие описания.

77

 

 

 

 

 

 

 

 

 

Таблица 3.1

 

 

Яndex

 

Rambler

 

Апорт!

 

AltaVista

 

 

Google

 

 

 

 

 

 

 

1

2

 

3

 

4

 

5

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

Зона

Русская

 

Русская

 

Русская

 

Специали-

 

 

Специали-

 

поис-

часть Ин-

 

часть Ин-

 

часть Ин-

 

зи-

 

 

зи-

 

ка,объем

тернета.

 

тернета

 

тернета.

 

рованный

 

 

рованный

 

базы дан-

Поиск по

 

 

 

Специали-

 

поиск по

 

 

поиск по

 

ных

страницам

 

 

 

зи-

 

новостям,

 

 

универси-

 

 

сайтов из

 

 

 

рованный

 

товарам,

 

 

тетам

 

 

раздела

 

 

 

поиск по

 

развлече-

 

 

США,

 

 

каталога,

 

 

 

новостям,

 

ниям, ау-

 

 

Apple,

 

 

по регио-

 

 

 

товарам,

 

дио (MP3)

 

 

Linux,

 

 

нам. Спе-

 

 

 

картинкам,

 

и видео

 

 

BSD

 

 

циальный

 

 

 

MP3

 

 

 

 

 

 

 

поиск по

 

 

 

 

 

 

 

 

 

 

 

новостям,

 

 

 

 

 

 

 

 

 

 

 

товарам,

 

 

 

 

 

 

 

 

 

 

 

картинкам

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тип ин-

Полнотек-

 

Полнотек-

 

Полнотек-

 

Полнотек-

 

 

Полнотек-

 

дексации

стовая ин-

 

стовая ин-

 

стовая ин-

 

стовая ин-

 

 

стовая ин-

 

 

дексация

 

дексация

 

дексация и

 

дексация

 

 

дексация и

 

 

 

 

 

 

индексация

 

 

 

 

индексация

 

 

 

 

 

 

по ссылкам

 

 

 

 

по ссылкам

 

 

 

 

 

 

 

 

 

 

 

 

 

Наличие

Система

 

Система

 

Система

 

Система

 

 

Система

 

дополни-

объединяет

 

объединяет

 

объединяет

 

объединяет

 

 

объединяет

 

тельных

поисковую

 

поисковую

 

поисковую

 

поисковую

 

 

поисковую

 

сервисов

машину и

 

машину и

 

машину,

 

машину,

 

 

машину и

 

 

каталог, а

 

рейтинг-

 

каталог и

 

каталог и

 

 

каталог,

 

 

также ряд

 

классифи-

 

дополни-

 

ряд допол-

 

 

содержа-

 

 

дополни-

 

катор

 

тельные

 

нительных

 

 

щий 15

 

 

тельных

 

Top100

 

сервисы

 

сервисов

 

 

разделов и

 

 

проектов (

 

 

 

(интернет-

 

(хостинг,

 

 

1,5 мил-

 

 

Народ.Ру,

 

 

 

покупки и

 

регистра-

 

 

лиона Web-

 

 

система

 

 

 

др.)

 

ция домен-

 

 

страниц

 

 

интеллек-

 

 

 

 

 

ного име-

 

 

 

 

 

туального

 

 

 

 

 

ни, перевод

 

 

 

 

 

выбора

 

 

 

 

 

и др.)

 

 

 

 

 

товаров,

 

 

 

 

 

 

 

 

 

 

 

CY и пр.)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

78

Продолжение табл.3.1

Синтаксис языка поиска

1

Яndex

Rambler

 

 

 

Логиче-

Пробел

AND, &,

ское И

или & (в

пробел

 

пределах

между

 

предложе-

словами по

 

ния)

умолча-

 

&&(в пре-

нию

 

делах до-

 

 

кумента)

 

 

 

 

Апорт!

AltaVista

Google

 

 

 

 

 

 

И, AND,

AND, &

По умолча-

&,+, про-

(только

нию для всех

бел между

при слож-

слов поиска

словами по

ном поис-

 

умолча-

ке)

 

нию

 

 

 

 

 

Логиче-

|

OR, |

ИЛИ, OR, |

OR (по

OR

ское

 

 

 

умолча-

 

ИЛИ

 

 

 

нию при

 

 

 

 

 

простом

 

 

 

 

 

поиске),

 

 

 

 

 

| (только

 

 

 

 

 

при слож-

 

 

 

 

 

ном поис-

 

 

 

 

 

ке)

 

 

 

 

 

 

 

Бинар-

~ (в преде-

Не исполь-

Заменяется

AND NOT,

Заменяется

ный опе-

лах пред-

зуется

префикс-

! (только

префиксным

ратор И-

ложения)

 

ным опе-

при слож-

оператором

НЕ

~ ~ (в пре-

 

ратором

ном поис-

«-»

 

делах до-

 

«-» (AND -

ке)

 

 

кумента)

 

пробел по

 

 

 

 

 

умолча-

 

 

 

 

 

нию)

 

 

 

 

 

 

 

 

Префик-

+, -

Не исполь-

+, -

+, - (толь-

+, -

сы обя-

 

зуются

 

ко при

 

затель-

 

 

 

простом

 

ных (+) и

 

 

 

поиске)

 

запре-

 

 

 

 

 

щенных

 

 

 

 

 

(-) слов

 

 

 

 

 

 

 

 

 

 

 

Группи-

( )

( )

( )

( )

Не использу-

рование

 

 

 

 

ется

слов

 

 

 

 

 

 

 

 

 

 

 

79

Продолжение табл.3.1

1

Яndex

Rambler

Апорт!

AltaVista

Google

 

 

 

 

 

 

Расстоя-

/(n m) – в

При рас-

сл2(...),

NEAR (в

Не исполь-

ние меж-

словах,

ширенном

с2(...),

пределах10

зуется

ду клю-

&&/(n m) –

поиске -

w2(...),

слов, толь-

 

чевыми

в предло-

выдача

[2,...]

ко при

 

словами

жениях

докумен-

(- назад, +

сложном

 

при по-

(- назад, +

тов только

вперед)

поиске)

 

иске

вперед)

с мини-

 

 

 

 

 

мальным

 

 

 

 

 

расстояни-

 

 

 

 

 

ем между

 

 

 

 

 

словами

 

 

 

 

 

 

 

 

 

Поиск

« »

Нет

« », ' '

« »

фразы

 

 

 

 

 

 

 

 

 

Символы

Нет

*, ? (замена

* (только в

*

замены

 

любого

конце сло-

 

части

 

символа)

ва)

 

слова

 

 

 

 

 

 

 

 

 

« », ' ', -..-

Нет

Ограничение по языку документа

Морфология

Выбор:

Выбор:

Выбор:

Выбор из

Выбор из 25

любой,

любой,

русский,

25 языков

языков

кириллица,

русский,

английский

 

 

латиница

английский

 

 

 

 

 

 

 

 

 

 

 

 

 

Все скло-

# (все фор-

! (указание

Нет

Нет

нения и

мы слов),

нормаль-

 

 

спряжения

@ (одно-

ной фор-

 

 

по умолча-

коренные

мы)

 

 

нию, ! (по-

слова)

 

 

 

иск точной

 

 

 

 

словофор-

 

 

 

 

мы)

 

 

 

 

 

 

 

 

 

Поиск по

Есть

Есть

Есть

Есть

Нет

датам

 

 

 

 

 

 

 

 

 

 

 

80

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]