Категории
Самые читаемые
Лучшие книги » Компьютеры и Интернет » Интернет » Интернет-разведка. Руководство к действию - Евгений Ющук

Интернет-разведка. Руководство к действию - Евгений Ющук

Читать онлайн Интернет-разведка. Руководство к действию - Евгений Ющук

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 6 7 8 9 10 11 12 13 14 ... 59
Перейти на страницу:

Например, по запросу:

[красная * площадь]

будет выдано:

«Красная и Манежная площади»,

с подчеркиванием всех этих слов, в том числе буквы «и». В какой-то степени это похоже на поиск с расстоянием между словами, применяемый в Яндексе. По запросу:

[красная * площадь – «красная площадь»] —

будут получены результаты:

«Красная (Семеновская) площадь»,

где слово «Семеновская» не считается релевантным и не подчеркивается Гуглом.

14. Дополнительные операторы.

14.1. Оператор cache:

Поисковая машина хранит версию текста, которая проиндексирована поисковым пауком, в специальном хранилище в формате, называемом кэшем. Кэшированную версию страницы можно извлечь, если оригинальная страница недоступна (например, не работает сервер, на котором она хранится). Кэширо-ванная страница показывается в том виде, в котором она хранится в базе данных поисковой машины, и при показе пользователю сопровождается надписью наверху страницы о том, что это страница из кэша. Там же содержится информация о времени создания кэшированной версии. На странице из кэша ключевые слова запроса подсвечены, причем каждое слово для удобства пользователя подсвечено своим цветом. Например:

«Это сохраненная в кэше G o o g l e копия страницы http://www.kickerclub.spb.ru/tournaments/2005-09–03.html, записанная 4 янв 2006 06:07:09 GMT.».

Можно создать запрос, который сразу будет выдавать кэшированную версию страницы с определенным адресом: Так, запрос:

[cache:www.bstm.ru]

будет сразу выдавать версию страницы www.bstm.ru из кэша, а не проверять ее нынешнее состояние.

Внимание: пробела между оператором cashe: и URL’ом запрашиваемой страницы быть не должно.

Если вы хотите, чтобы ключевые слова на кэшированной версии страницы были подчеркнуты, их надо через пробел указать после оператора cashe: и адреса страницы.

Например:

[cache:www.bstm.ru библиотека].

14.2. Оператор info:

Оператор info: позволяет увидеть информацию, которая известна Гуглу об этой странице.

Например, запрос:

[info:www.bstm.ru]

дает следующий результат:

BSTM – Бизнес-школа технологий менеджмента | Екатеринбург: Новости phpsm, phpsitemanager… Президентская программа. О программе – Стратегический менеджмент – Менеджмент качества – Маркетинг на предприятии…www.bstm.ru/ Google может показать следующую информацию об этом адресе:

Показать сохраненную в Google версию www.bstm.ru

Найти страницы, похожие на www.bstm.ru

Найти страницы, ссылающиеся на www.bstm.ru

Найти страницы на сайте www.bstm.ru

Найти страницы, упоминающие ссылку «www.bstm.ru»

Внимание: пробела между оператором info: и URL’ом запрашиваемой страницы быть не должно.

14.3. Оператор site:

Этот оператор ограничивает поиск конкретным доменом. То есть, если сделать запрос:

[маркетинг разведка site:www.acfor-tc.ru], —

то результаты будут получены со страниц, содержащих слова «маркетинг» и «разведка» именно в домене «acfor-tc.ru», а не в других частях Интернета. Если сделать запрос:

[scip site: ru], —

то будут получены документы, содержащие слово «scip» и расположенные в доменной зоне «.ru».

Внимание: пробела между оператором site: и URL’ом запрашиваемой страницы быть не должно.

14.4. Оператор link:

Этот оператор позволяет увидеть все страницы, которые ссылаются на страницу, по которой сделан запрос. Например, по запросу:

[link:www.livejournal.com/community/kubok/45852.html] —

будут получены известные Гуглу ссылки на статью о поиске через Яндекс, написанную liveuser.

Внимание: пробела между оператором link: и URL’ом запрашиваемой страницы быть не должно.

14.5. Оператор allintitle:

Если запрос начать с оператора allintitle:, что переводится как «все – в заголовке», то Гугл выдаст тексты, в которых все слова запроса содержатся в заголовках (внутри тега Title в HTML).

Например, запрос:

[allintitle: википедия яндекс] —

даст результаты, где слова «википедия» и «яндекс» содержатся внутри тега Title на просмотренных поисковой машиной страницах. На момент написания статьи результат был таким:

Результаты 1–3 из примерно 7 для allintitle: википедия яндекс.

14.6. Оператор intitle:

Показывает страницы, в заголовке которых содержится слово, расположенное непосредственно после опретора intitle:,; все остальные слова запроса могут находиться в любом месте текста. Если поставить оператор intitle: перед каждым словом запроса, это будет эквивалентно использованию оператора allintitle:

[intitle: википедия яндекс].

На момент написания статьи результат был таким:

Результаты 1 – 10 из примерно 888 для intitle: википедия яндекс.

Внимание: пробела между оператором intitle: и последующим словом быть не должно.

14.7. Оператор allinurl:

Если запрос начинается с оператора allinurl:, то поиск ограничивается теми документами, в которых все слова запроса содержатся исключительно в адресе страницы, то есть в URL.

Так, на момент написания статьи для запроса:

[allinurl: narod razvedka] —

результат был таким:

Результаты 1 – 10 из примерно 14 для allinurl: narod razvedka.

Внимание: оператор allinurl: работает лишь со словами, а никак не со служебными фрагментами URL. Такие специальные символы, как слэш или точка, не окажут положительного влияния на результат. Напротив, влияние будет отрицательным, поскольку они могут быть восприняты Гуглом как попытка ввести в запрос точную фразу.

Например, запрос:

[allinurl: narod.razvedka],

равно как и

[allinurl: narod/razvedka] —

результата не дал вообще.

14.8. Оператор inurl:

Слово, написанное слитно с оператором inurl:, будет найдено лишь в адресе страницы Интернета, а остальные слова – в любом месте такой страницы.

Например, для того, чтобы найти слово «разведка „на сайтах, содержащих в адресе сочетание букв «tc“, можно сделать такой запрос:

[inurl: tc razvedka].

Результат на момент написания статьи:

Результаты 1–1 из 1 для inurl: tc razvedka.

Был представлен следующим текстом:

«Otryady-5

Razvedka okazalas' neskol'ko utomitel'noi (obratno shli V lavirovku). Poetomu k pirsu my podoshli sovershenno izmuchennye: no ne stol'ko samoi razvedkoi…. www-lat.rusf.ru/tc/tc08/08otr5.htm».

Если оператор inurl: поставить перед каждым словом запроса, это будет эквивалентно использованию оператора allinurl:.

Внимание: пробела между оператором inurl: и последующим словом быть не должно. Внимание: оператор inurl: работает только со словами и не работает со служебными фрагментами URL. Такие специальные символы, как слэш или точка, не окажут положительного влияния на результат. Влияние будет отрицательным, так как они могут быть восприняты Гуглом как попытка ввести в запрос точную фразу.

Например, запрос

[inurl: tc/razvedka],

равно как и

[inurl: tc.razvedka] —

результата не дал вообще. Результат мог бы быть, если бы в адресе какой-то страницы содержалась точная фраза «tc/razvedka» или «tc.razvedka».

В этом можно убедиться, введя запрос:

[inurl: kubok].

Результаты 1 – 10 из примерно 28 400 для inurl: kubok.

И этот результат начинается с текста:

«Кубок Яндекса. Как искать эффективно

– Вопросы и ответы

– Предложение организаторам соревнований

– Форум

– Кубок в LiveJournal kubok…kubok.yandex.ru/»

По запросу:

[inurl: kubok/45852]

Результаты 1–2 из примерно 44 для inurl: kubok/45852.

И этот результат начинается с текста:

«kubok: Хозяйке на заметку. Хозяйке на заметку. Материал рассчитан на подготовленного читателя, знающего, что такое стоп-слова и операнды, чем ~~ отличается от && и зачем их…www. livejournal.com/community/kubok/45852.html».

14.9. Оператор related:

Этот оператор описывает страницы, которые «похожи» на какую-то конкретную страницу. Так, запрос

[related: it2b.ru]

дает результат:

Результаты: 1 – 10 из приблизительно 29 подобных it2b.ru.

Мы не считаем, что все страницы действительно подобны странице сайта it2b. ru, с точки зрения человека, а не робота. Хотя некоторые из них действительно посвящены схожей тематике.

На самом деле первым в выдаче стоит сайт it2b.ru, который специализируется на вопросах использования технологий разведки для бизнеса. А вот вторым – сайт компании «SW-Trans», предлагающей услуги по перевозке грузов.

Можем предположить, что основанием для сравнения двух сайтов послужило упоминание на ресурсе грузовой компании услуг по охране маршрутов, их сопровождению машинами со спецсигналами, о предусмотренных в таких случаях пропусках и о «решении всех возможных дополнительных проблем, возникающих при транспортировке». Наряду с транспортной компанией, Гугл включил в «подобные» страницы и такие источники, как журнал «Sales/Business (Продажи)», в котором встречается немало публикаций о предпринимательских рисках и о конкурентной разведке, а также компанию «Информзащита», работающую в области обеспечения информационной безопасности.

1 ... 6 7 8 9 10 11 12 13 14 ... 59
Перейти на страницу:
На этой странице вы можете бесплатно скачать Интернет-разведка. Руководство к действию - Евгений Ющук торрент бесплатно.
Комментарии