- •Лабораторная работа № 2 Поиск информации в сети интернет Правила составления запросов
- •Как поисковые машины трактуют слова в запросе?
- •Как поисковые машины трактуют некоторые специальные символы в запросе? Кавычки «…»
- •Варианты поиска Тонкий поиск
- •Расширенный поиск
- •Словарный фильтр
- •Сайт/вершина
- •Ищите больше, чем по одному слову
- •Не пишите большими буквами
- •Найти похожие документы
- •Попробуйте использовать язык запросов
- •Искать без морфологии
- •Поиск картинок и фотографий
- •Детальное описание языка запросов Как трактуются слова
- •Естественно-языковый поиск
- •Основные операторы
- •Поиск с расстоянием
- •Поиск в зонах
- •Поиск в определенных элементах
- •Ранжирование результата поиска
- •Синтаксис языка запросов (строгий поиск)
- •Поиск в элементах
- •Советы по проведению поиска
- •Ответьте на вопросы:
Лабораторная работа № 2 Поиск информации в сети интернет Правила составления запросов
Что такое запросы к поисковым машинам? Упрощенно говоря это тот текст, который вы должны написать в поле ввода специальной формы на любой поисковой машине.
Предположим, что в поле ввода текста поисковой машины Yandex вы написали фразу [Любовь зла полюбишь и]. Это и есть запрос к поисковой машине. По этому запросу она будет искать документы, в которых встречаются слова, перечисленные в этом запросе. Если говорить о приведенном примере, то будут найдены документы, содержащие следующие слова: любовь, зла, полюбишь. Причем именно слова, а не точную фразу [Любовь зла полюбишь и] как можно было бы предположить. Конечно, среди всех найденных документов будут и те, которые содержат эту фразу, но будет много и других.
Но как быть, если нужны документы именно с такой фразой и больше никакие? Как добиться, чтобы поисковые машины находили документы в наибольшей степени, отвечающие вашим потребностям?
На эти вопросы отвечают правила составления запросов или, иначе говоря, синтаксис запросов. Синтаксис запросов – это набор правил, по которым поисковая машин трактует все, что вы пишите в поле ввода текста. Безусловно, также как в каждом человеческом языке существуют свои правила так же и у каждой поисковой системы свой синтаксис запросов. Сначала рассмотрим некоторые общие правила на примере нескольких поисковых систем: Yandex, Rambler, AltaVista, Google, Aport, затем более подробно одну из них – Yandex.
Как поисковые машины трактуют слова в запросе?
Все эти пять машин ищут документы, содержащие все слова, которые вы определили в запросе. Но Yandex и AltaVista также находят документы, содержащие часть слов или даже одно слово из запроса. Правда документы, содержащие не все слова, размещаются в конце списка результатов, а в начале списка те, в которых есть все слова.
Yandex и Aport ищут документы, в которых слова запроса встречаются в любой словоформе. Например, по запросу [Любовь зла полюбишь и] будут найдены документы со словами: любви, любовью и т.п. Если нужно найти слово в определенной форме и только в этой, то перед словом (в запросе) нужно поставить знак ! Например: [!Любовь!зла полюбишь и].
Все описываемые машины игнорируют союзы, предлоги и т.п. слова. Например по запросу [Любовь и голуби] союз И будет проигнорирован.
Как поисковые машины трактуют некоторые специальные символы в запросе? Кавычки «…»
Если группа слов ограничена кавычками ([«Любовь зла полюбишь и»]), то Yandex и AltaVista будут искать точно такую же фразу, в тех же словоформах;
Aport будет искать эту фразу, но также и близкую к ней (с другими союзами, с другими словоформами).
Знак +.
Yandex, AltaVista и Aport трактуют этот знак перед словом как указание на необходимость поиска этого слова. Google в принципе действует также, но по замыслу его разработчиков знак + должен использоваться для включения в запрос союзов предлогов и т.п. (которые по умолчанию игнорируются). Пример использования: [«+Любовь зла+полюбишь и»].
Знак -
Имеет обратное действие (исключает слово из результатов поиска). Google не поддерживает этот знак. Пример использования: [«+Любовьзла +полюбишь и»].
Знак |
Указывает на необходимость выбора одного из двух вариантов. Запрос [любовь|ненависть] означает «или любовь или ненависть». Google не поддерживает этот знак.
Скобки (…)
Отделяют одну часть запроса от другой. Например, запрос [(любовь|ненависть)+чувство] в переводе на «русский» звучит как «найти документы со словами чувство и одно из двух: ненависть или любовь».
Теперь более подробно остановимся на поисковой машине Yandex.
Поисковая машина Yandex?
Яндекс – поисковая машина, способная по вашему запросу найти наиболее подходящие Web-страницы в русской части сети Интернет. Яндекс ежедневно просматривает сотни тысяч Web-страниц в поисках изменений или новых ссылок. Коллекция ссылок постоянно растет.
Яндекс не требует от вас знания специальных команд для поиска. Достаточно набрать вопрос («где найти дешевые компьютеры» или «нужны телефоны Москвы и московской области»), и вы получите результат – список страниц, где встречаются эти слова.
Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос идти, то в результате поиска будут найдены ссылки на документы, содержащие слова идти, идет, шел, шла и т.д. На запрос окно будет выдана информация, содержащая и слово окон, а на запрос отзывали – документы, содержащие слово отозвали.
При этом поиск не ограничен лишь словами или фразами. Яндекс отыщет всех, кто сослался на вашу страницу, файлы с нужной картинкой, последние новости или товары в электронных магазинах.
Как известно, в хорошем вопросе содержится половина ответа. Мы считаем, что искать и находить нужное в ворохе текстов в сети Интернет – умение не только поисковой системы, но и пользователя, задающего запрос.