Интернет – легко и просто! - Егор Александров
Шрифт:
Интервал:
Закладка:
У каждой поисковой машины свой синтаксис языка запросов. В одних случаях он реализован лучше, в других – хуже.
Не будем рассматривать синтаксис отдельно взятой поисковой системы (детальное описание языка запросов любой системы можно без труда найти на ее сайте), а поговорим об основных операторах и правилах, работающих одинаково в большинстве поисковых машин. Их, как правило, бывает вполне достаточно.
– Операторы. Запрос, состоящий из нескольких слов, может содержать операторы. Каждый оператор имеет левую и правую части (то есть, соответственно, то, что стоит перед оператором и после него).
• AND (логическое И) – и левая, и правая части этого оператора должны присутствовать в тексте одновременно. Иными словами, при запросе «самолет AND вертолет» результатом поиска будут документы, которые содержат одновременно и слово «самолет», и слово «вертолет». Как правило, если оператор явно не указан и слова разделены пробелом, то по умолчанию используется оператор AND. Таким образом, запрос «дешевый фотоаппарат» будет истолкован поисковой машиной как «дешевый AND фотоаппарат».
• OR (логическое ИЛИ) – при использовании этого оператора в найденном тексте должна присутствовать или его левая, или правая часть. Этот оператор очень удобен при поиске синонимов. Например, в результате запроса «учеба OR занятие OR обучение» будут найдены документы, содержащие хотя бы одно из перечисленных слов.
• NOT (логическое НЕ) – отсекает документы, находящиеся в его правой части. Так, по запросу «игры NOTкомпьютерные» будут найдены веб-страницы, в которых есть слово «игры», но нет слова «компьютерные».
Если в запросе присутствует несколько операторов, то поисковая машина будет работать с ними в соответствии с их приоритетом. Обычно операторы AND и NOT имеют более высокий приоритет, нежели OR. Другими словами, при обработке таких запросов поисковая машина будет сначала группировать ключевые слова по операторам AND и NOT, а только потом по операторам OR. Однако порядок группировки можно изменять. Для этого предусмотрены скобки.
– Скобки. Скобки задают порядок действия логических операторов. Они представляют собой превосходный инструмент, позволяющий строить очень гибкие и эффективные запросы.
Ключевые слова, заключенные в скобки, трактуются операторами, как одно целое. Таким образом, появляется возможность изменять приоритеты операторов и строить сложные вложенные запросы. Например, по запросу «мобильный OR сотовый AND телефон» в соответствии с приоритетами будут выданы документы, содержащие либо слово «мобильный», либо одновременно слова «сотовый» и «телефон». При использовании скобок запрос вида «(мобильный OR сотовый) AND телефон» задает поиск документов, где встречается слово «телефон», а также слово «мобильный» или «сотовый».
Можно строить самые разные конструкции. К примеру, вы хорошо владеете китайским языком и хотите найти себе удаленную работу. Тогда формируем запрос «переводчик AND китайский». Дальше логично написать что-то вроде «требуется» или «работа». Однако чтобы поиск был более эффективным, лучше предусмотреть как можно больше вариантов. Поэтому добавляем к запросу «(работа OR требуется OR вакансия)». Далее следует показать машине, что вы хотите работать удаленно, поэтому добавляем «(удаленная OR дистанционная OR внештатная)». Ну а чтобы исключить из списка найденных документов всевозможные резюме таких же, как вы, соискателей, в конце можно дописать «NOT (резюме OR ищу OR предлагаю)». В конечном итоге получим следующий текст запроса:
(переводчик AND китайский AND (работа OR требуется OR вакансия) AND (удаленная OR дистанционная OR внештатная)) NOT (резюме OR ищу OR предлагаю)
Возможно, это выглядит слегка устрашающе, зато работает довольно эффективно.
– Кавычки. В большинстве поисковых систем по умолчанию поиск учитывает все формы заданного ключевого слова. Чтобы искать точные словоформы, предусмотрены кавычки. Ключевые слова, заключенные в кавычки, ищутся именно в той форме и последовательности, в которой использовались в запросе. Таким образом очень удобно искать, к примеру, цитаты.
– Поиск с расстоянием. Допустим, вы хотите собственными руками собрать радиоприемник и сформировали запрос «схема радиоприемник». Поисковая машина, согласно алгоритму, начнет поиск документов, содержащих оба ключевых слова. В итоге в списке найденных веб-страниц будет огромное количество документов, в которых эти слова совершенно не связаны между собой и находятся в разных частях текста. Чтобы этого не допустить и не получить ссылки на документы, в которых «радиоприемник работал так громко, что мешал изучать схему подземных сооружений», предусмотрен поиск с расстоянием.
В языках запросов различных поисковых машин расстояние ограничивается по-разному. Например, в Яндексе это осуществляется следующим образом. Если все слова в тексте пронумеровать по порядку их следования, то расстояние между какими-либо двумя словами будет равно разнице между номерами этих слов. Таким образом, расстояние между соседними словами равно 1, а между словами, стоящими наоборот, – -1. Для определения расстояния в Яндексе применяется символ «/». Так, на запрос «схема /2 радиоприемник» будут найдены документы, в которых присутствуют слова «схема» и «радиоприемник», причем расстояние между ними составляет не более двух слов и они находятся в одном предложении. В других поисковых системах синтаксис может быть другим, но суть примерно та же.
Кроме того, некоторые поисковые системы позволяют искать по адресам сайтов, ключевым словам, аннотациям, подрисуночным подписям и т. д.
В табл. 4.1 приведены основные правила языков запроса самых популярных отечественных поисковых систем.
Таблица 4.1. Основные правила языков запроса поисковых систем
Советы
– Проверяйте правильность написания запроса. Орфографическая ошибка, как правило, сводит весь поиск на нет.
– Не применяйте в запросе специальные символы, такие как «#», «%», «?» и т. д.
– Используйте синонимы. Это очень полезно, если список найденных документов слишком мал или его содержимое вас не устраивает.
– Как можно реже используйте в тексте запроса популярные слова, такие как «E-mail», «программа», «ссылка» и т. п. Подобные слова встречаются на миллионах веб-страниц, поэтому большой пользы они не принесут, если, конечно, вы не ищете именно эти объекты.
– Обязательно применяйте язык запросов. Поверьте, если им правильно пользоваться, то он станет очень эффективным орудием поиска и поможет вам сэкономить много времени.
Метапоисковые системы
Интернет развивается невероятно быстрыми темпами. Объем информации в Сети постоянно увеличивается, а часть данных динамически изменяется. По этой причине ни одна существующая поисковая система не может охватить все ресурсы Интернета. Таким образом, может возникнуть ситуация, когда ваша любимая поисковая машина не сможет найти нужный вам документ, хотя в Сети он присутствует. Тогда придется использовать другие поисковые системы в надежде найти то, что вам нужно. Но есть и альтернативный способ решения этой проблемы – использование метапоисковой системы, которая представляет собой поисковый инструмент, посылающий ваш запрос одновременно нескольким поисковым системам. Метапоисковая система не имеет собственной базы данных, а пользуется исключительно ресурсами других систем. Полученные результаты метапоисковая система обрабатывает и в соответствии со своим алгоритмом ранжирует в общий список. Преимущество метапоисковых систем очевидно – они экономят значительное количество времени, избавляя вас от необходимости вводить запрос в каждой поисковой машине. С другой стороны, эти системы не позволяют вам воспользоваться уникальными возможностями отдельно взятых поисковых машин. Таким образом, поиски в Интернете удобно начинать с метапоисковых систем, а если это не помогло, то стоит попробовать детальный поиск на различных сайтах.
Метапоисковых систем существует великое множество. Вот несколько из них, пользующихся заслуженным признанием в мире:
– ez2find – http://ez2find.com;
– Vivisimo – http://vivisimo.com;
– Query Server – http://www.queryserver.com/web.htm;
– WebCrawler – http://www.webcrawler.com.
В русскоязычной части Интернета дела с метапоисковыми системами обстоят хуже, однако несколько подобных систем все-таки есть. Из них можно отметить следующие:
– MetaBot – http://www.metabot.ru (рис. 4.3);
– MetaPing – http://www.metaping.com.
Рис. 4.3. Поиск жизни на Марсе с помощью метапоисковой системы
Каталоги
Альтернативным методом поиска информации в Интернете являются каталоги ресурсов. Каталог – это структурированная коллекция ссылок, разбитая на разделы и подразделы. Каталоги ссылок во многом напоминают библиотечные каталоги, однако в отличие от них имеют гораздо больше составных частей.