Категории
Самые читаемые
Лучшие книги » Компьютеры и Интернет » Интернет » Яндекс для всех - М. Абрамзон

Яндекс для всех - М. Абрамзон

Читать онлайн Яндекс для всех - М. Абрамзон

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 23 24 25 26 27 28 29 30 31 ... 199
Перейти на страницу:

Прежде чем просматривать результат поиска, обратите внимание на строки, предваряющие его. Здесь размещена очень интересная и полезная информация. В первой строке — количество найденных страниц и сайтов, содержащих ключевые слова. Чем точнее поставлен вопрос, тем меньше будут эти значения, тем больше вероятность найти требуемое.

Пример

Результат поиска: страниц — 95 865, сайтов — не менее 1 885.

Следующая строка показывает статистику Рндекса, Р° если точнее — сколько раз ключевые слова встречаются РІ проиндексированных документах. Чем чаще слово употребляется РІ текстах, тем больше будет это значение.

Пример

Статистика слов: архитектурный — 15 063 257, проект — 497 340 239, жилого — 59 541 623, дома — 787 144 580.

Обратите внимание, что если слова запроса были взяты в кавычки, например, при поиске цитаты, то в строке Статистика слов все слова будут приведены с предшествующим знаком! определяющим обязательность включения слова в поиск.

Р, наконец, РІ последней строке приводятся статистические данные РїРѕ количеству запросов, РІ которых было использовано каждое РёР· ваших ключевых слов.

Пример

Запросов за месяц: архитектурный — 33 779, проект — 273 903, жилого — 26 366, дома — 1 062 700.

Рђ что бывает, РєРѕРіРґР° РІС‹ ошиблись РІ написании слова? РњС‹ уже говорили, что Яндекс использует РїСЂРё обработке запроса морфологический анализ. Р’ результате РѕРЅ способен определить, что РІС‹ написали слово СЃ ошибкой Рё предложить СЃРІРѕР№ вариант. Например, если РІ нашем примере вместо слова проект РјС‹ напишем РїСЂРѕРєС‚, Яндекс предложит нам корректный вариант, снабдив его предположением, РЅРµ опечатка ли это. Впрочем, РЅРµ всегда следует пользоваться этими подсказками. Р’ некоторых случаях некорректное написание слова было выполнено специально. Рљ примеру, всем известно слово "агентство", РЅРѕ РЅРµ РІСЃРµ пишут его правильно. Очень часто это слово пишут так: агенство (РїРѕ информации Яндекса, РІ его Рндексе это слово СЃ ошибкой встречается 7 783 366 раз, Р° количество запросов Р·Р° месяц составило 152 952.) Если вести РїРѕРёСЃРє РїРѕ правильному написанию, то документы, РіРґРµ слово написано СЃ ошибкой, РІ результаты РїРѕРёСЃРєР° РЅРµ попадут.

Есть и другие случаи, когда Яндекс воспринимает правильно написанное слово иначе, предлагая другой вариант. По всей видимости, критерием "правильно-неправильно" в данном случае служит частота употребления слова. Поэтому редко встречающиеся слова, похожие на часто употребительные, могут быть восприняты как написанные с ошибкой.

Но, конечно, далеко не всегда Яндекс может правильно определить, какое слово было задумано посетителем.

Пример

Посетитель написал слово колеки, вместо того, чтобы написать калеки. Яндекс, подумав, решил, что должно было быть написано слово колени. С точки зрения Яндекса предложенное им слово находится ближе к исходному, чем первоначально задуманное посетителем.

В том случае, если на ваш запрос ничего не было найдено, Яндекс предложит вам повторить поиск. К примеру, если поисковое выражение стояло в кавычках, будет предложено выполнить аналогичный поиск, но кавычки убрать.

Орфографическая проверка

Предположение о том, что слово в строке поиска набрано неверно, строится не на пустом месте. Определить корректность написания слов помогает орфографический словарь либо статистика написания слова, полученная в результате индексирования интернет-страниц. Однако в наши дни новые слова, названия компаний, фамилии людей появляются не по одному каждый день, и уследить за ними одному Яндексу было бы проблематично. Создать словарь, в который были бы занесены все слова русского языка, и, самое главное, поддерживать его в актуальном состоянии, не сможет ни одна команда, как бы подготовлена и обеспечена она ни была. Зачастую слова приходят из других языков, совершенно не соответствуют правилам русского языка, нечитаемые и непроизносимые. При появлении таких слов в запросах Яндекс ранее предлагал их исправить, предполагая, что человек допустил опечатку.

Р’ 2005 РіРѕРґСѓ был запущен новый алгоритм, участвующий РІ разборе Рё анализе таких ситуаций. Его цель — создание словаря исправлений. Запросы пользователей собираются Рё анализируются, обрабатывается статистика. Если оказывается, что РїРѕ какому-то слову есть РјРЅРѕРіРѕ вариантов исправлений, то РёР· кластера выбирается похожее слово РёР· числа наиболее распространенных РІ Рнтернете. Таким образом, появляется база пар "плохих" Рё "хороших" слов — слов СЃ ошибками Рё исправленных, Рё каждое слово РІ запросе пользователя теперь проверяется РїРѕ такому "народному" словарю. Набранная статистика позволяет отбирать наиболее употребляемые варианты написания слов, Р·Р° счет чего Рё РїСЂРѕРёСЃС…РѕРґРёС‚ поддержка орфографического словаря.

1 ... 23 24 25 26 27 28 29 30 31 ... 199
Перейти на страницу:
На этой странице вы можете бесплатно скачать Яндекс для всех - М. Абрамзон торрент бесплатно.
Комментарии
Открыть боковую панель
Комментарии
Сергей
Сергей 24.01.2024 - 17:40
Интересно было, если вчитаться