Интернет-разведка. Руководство к действию - Евгений Ющук
Шрифт:
Интервал:
Закладка:
Надо сказать, что многие поисковики стараются предоставить пользователю дополнительный сервис. Поскольку они перенимают друг у друга лучшее, их услуги часто бывают похожи, хотя каждая система имеет свою изюминку. Мы не будем подробно останавливаться на службах остальных поисковых сайтов, так как считаем, что читатель в состоянии разобраться в данном вопросе самостоятельно. Скажем лишь, что, например, услугам Гугла посвящен целый сайт, созданный энтузиастом данного сайта Николаем Петровым и расположенный по адресу: http://www.mir-google.ru/.
Внешний вид главной страницы ресурса, с которой можно перейти на соответствующие страницы Гугла, приведен на рис. 14.
Рис. 14. Главная страница сайта Мир Google.
А тем читателям, которые интересуются появлением новых сервисов (или изменениями старых) в Яндексе, мы рекомендуем включить в свою Ленту Блог Яндекса: http://company.yandex.ru/blog/.
Здесь регулярно появляется официальная информация, посвященная вопросам работы этого сайта, что позволит вам своевременно узнавать обо всех новинках.
Формы расширенного поиска в поисковых системах
Создатели поисковых машин понимают, что не все их пользователи хотят изучать язык поисковой машины. Тем более, что при всей принципиальной схожести синтаксис запросов конкретных поисковых машин специфичен, а к некоторым машинам обращаются и вовсе нечасто. Иными словами, все указывает на то, что особого смысла в глубоком изучении этого языка для каждого поисковика нет.
Между тем, машин таких действительно немало.
Рис. 15. Поисковые строки поисковых систем, собранные на одной странице на сайте «Центра новых технологий» ОАО «ЮТК»
Интересен ресурс, рекомендованный специалистом конкурентной разведки Рогачевой Еленой Юрьевной (она участвует в форуме проекта it2b под псевдонимом). На сайте филиала ОАО «Южная телекоммуникационная компания» «Центр новых технологий» по адресу http://www.kuban.ru/search/search.shtml на одной странице собраны поисковые строки сразу десяти машин, а также пяти систем поиска по FTP-серверам, как показано на рис. 15. При нажатии на этом ресурсе кнопки «Искать» ваш запрос будет адресован конкретному, выбранному вами поисковику, причем синтаксис запроса будет сохранен. С этого же ресурса можно попасть и на страницу расширенного поиска каждой из представленных в списке машин, если нажать кнопку «Детальный поиск».
Условия расширенного поиска предоставляют возможность детализировать запрос. После заполнения предусмотренной для этого формы поисковая система автоматически расставляет операторы запроса и выдает соответствующий результат. Такая простота в обращении позволяет достигать эффективности при минимуме затрачиваемых усилий.
Однако существует и оборотная сторона использования такой формы поиска, а именно – невозможность тонкой настройки запроса. Как показывает практика, запрос, адресованный информационной системе человеком, знакомым со всеми нюансами ее работы, значительно более точен, нежели алгоритм, записанный в форме расширенного поиска.
Именно поэтому мы предлагаем использовать ее лишь на тех машинах, к которым вы обращаетесь нечасто, и только в том случае, когда вас устраивает получение неисчерпывающего результата.
Внешний вид формы расширенного поиска Яндекса приведен на рис. 16.
Рис. 16. Форма расширенного поиска Яндекса.
На рисунке видно, что пользователь имеет возможность задать расположение слов запроса на странице – в заголовке страницы, в тексте или в ссылке на страницу. Кроме того, можно задать расположение слов друг относительно друга – согласно оператору «Логическое И» в Яндексе. Можно также запретить образование словоформ.
Помимо того, вы можете произвести поиск в определенном регионе или на отдельно взятом сайте. Ну и, наконец, затребовать выдачу документов указанного вами формата или на выбранном вами языке.
При этом авторы Яндекса почему-то не стали вводить строку для исключения слов из запроса, а ограничились текстом под поисковой строкой, который рекомендует ставить знак «минус» перед словами, которые вы хотели бы исключить.
На наш взгляд, это не самое удачное решение, поскольку оно может быть не вполне понятно неподготовленному человеку. В этом смысле, нам представляется более удобным механизм, действующий в большинстве информационных систем: строка для исключения слов из запроса представлена в виде полноправного инструмента, доступного в форме расширенного поиска наравне с остальными элементами.
Сложные запросы в форме расширенного поиска создать нельзя.
Хорошо видно, что, например, решение такой относительно сложной задачи, как:
[!налог & +недвижимость ~~ +подоходный] —
просто не предусмотрено структурой формы расширенного поиска Яндекса, поскольку разные слова в приведенном запросе имеют разные атрибуты.
Рис. 17. Форма расширенного поиска Гугла.
Подобная ситуация в той или иной степени характерна и для остальных поисковых систем. Пожалуй, только форма расширенного поиска Гугла страдает этим в меньшей степени, что достигается за счет сочетания двух направленных навстречу друг другу факторов: с одной стороны, сам по себе язык запросов Гугла проще (в смысле, несколько примитивнее), чем в Яндексе, а с другой стороны, форма расширенного поиска этой программы предоставляет больше возможностей в отличие от таковой в Яндексе. В частности, как иллюстрирует рис. 17, она позволяет сделать такой запрос, в котором логические «И» сочетаются с логическими «ИЛИ».
Метапоисковые машины Интернета с примерами поиска различных типов информации
Каждый из увлеченных пользователей Сети в душе мечтает о существовании одной-единственной информационной системы, которая сочетала бы в себе достоинства всех поисковиков одновременно.
Казалось бы, достаточно автоматизировать процесс размещения запроса в каждую из поисковых машин, как исследователю останется лишь собирать богатый урожай. И действительно, нашлись люди, которые так и поступили. Однако полученный результат хорошим не назовешь, с точки зрения специалиста конкурентной разведки.
Поскольку, как известно, большинство поисковых машин по умолчанию воспринимают знак пробела как логическое «И», то для слов, введенных в поисковую строку каждой машины, автоматический «вброс» запроса работает неплохо. То есть, само по себе размещение содержимого поисковой строки в разные поисковые машины технических трудностей не представляет. Только дело в том, что ввод слов через пробел крайне редко позволяет специалисту конкурентной разведки получить нужный результат. А вот автоматизировать составление поискового запроса для каждой поисковой машины на одном шаблоне, чтобы потом этот запрос автоматически переконвертировался с учетом синтаксиса языка запросов конкретной машины и забрасывался туда, пока что никто в широко доступных продуктах не стал. Да и сама по себе такая возможность переконвертации вызывает на сегодня сомнения, поскольку просто не существует, например, в Гугле поиска «в пределах одного предложения».
В результате, целый класс подобных инструментов, названный метапоисковыми машинами, практически не применяется для нужд конкурентной разведки.
Метапоисковая машина не имеет собственных пауков и собственной базы данных. Она в неизменном виде размещает запрос в тех поисковых машинах, которые отметил пользователь, а затем дожидается ответа от них и выдает результат со всех машин на одной странице. Для удобства пользователя эти результаты содержат пометку о том, с какой поисковой машины был получен тот или иной ответ. В результате вместо всех плюсов каждой поисковой машины, которые достаточно индивидуальны, пользователь может ощутить общие для них всех минусы, поскольку неточный поиск «сырой» информации с большим содержанием «информационного шума» непригоден для целей конкурентной разведки. Нам нравится высказывание специалиста журнала «Игромания» Алексея Бутрина о принципе работы метапоисковых машин и их недостатках, по сравнению с настоящими поисковыми машинами:
Гораздо эффективнее влезть на яблоню и сорвать именно то яблоко, которое вам нужно, а не трясти бедное дерево (скорее всего, вас просто завалит яблоками по самые уши).[8]
Примеры метапоисковых машин Интернета
Примерами метапоисковых машин, работающих в Интернете, могут служить Nigma (http://nigma.ru/), xRambler (http://xrambler.ru/) и Metabot (http://www. metabot.ru/).
Они имеют схожие интерфейсы и представляют собой поисковую строку, под которой можно отметить те поисковые системы, в которые будет отправляться запрос. Результаты запроса включают также, в отличие от таковых при работе с обычными поисковиками, информацию о том, из какой конкретно машины они получены.