Яндекс для всех - М. Абрамзон
Шрифт:
Интервал:
Закладка:
С 2000 года — менеджер проектов компании "Яндекс".
РџРѕРґ руководством Евгения Ломизе были запущены популярные сервисы Яндекса — Каталог, Рнциклопедии, Яндекс. Лингво, Р Р РЎ-версия Директа, Рекламная сеть.
Глава 10
Владельцам сайтов
10.1. Яndex.Server для вашего сайта
РџРѕРёСЃРє РІ Рнтернете СЃ помощью Яндекса или РёРЅРѕРіРѕ РїРѕРёСЃРєРѕРІРёРєР°, безусловно, С…РѕСЂРѕС€. Рнаходит РјРЅРѕРіРѕ, Рё работает быстро. РќРѕ зачастую проблема заключается РЅРµ РІ том, чтобы искать РїРѕ всему, допустим, Рунету, Р° РІ том, чтобы найти необходимую информацию РЅР° РѕРґРЅРѕРј-единственном сайте. Если сайт невелик, то проблема РїРѕРёСЃРєР° информации РЅР° нем сложностей РЅРµ представляет — вполне можно пролистать страницы Рё отыскать необходимое. РќРѕ если сайт "разрастается", Р° информация РЅР° нем пополняется часто, появляется потребность реализовать РїРѕРёСЃРє РІ рамках этого отдельно взятого проекта.
Надо сказать, что существует множество вариантов организации такого поиска, включая и собственные разработки, и бесплатные скрипты. Яндекс предлагает для решения подобных задач свое решение — Яndex.Server. Он предназначен для полнотекстового поиска информации на веб-сервере или в локальной сети с учетом морфологии русского языка и является аналогом поисковой системы, используемой самим Яндексом.
Рмеется РґРІР° варианта поставки этого продукта: бесплатная версия Рё платная версия Enterprise, различающиеся СЃРІРѕРёРјРё возможностями. Отличия версии Enterprise РѕС‚ бесплатной заключаются РІ:
□ возможности настройки дизайна страницы результатов поиска с помощью Perl, C++, XSLT;
□ настраиваемом поиске в отдельных частях документа;
□ поиске в нескольких коллекциях документов с возможностью слияния результатов;
□ индексировании документов, хранящихся в СУБД;
□ поддержке индексирования документов в форматах, отличных от простого текстового и HTML (XML, RTF, PDF, DOC, XLS, PPT, FLASH, MP3 — с возможностью расширения этого списка).
РќРѕ даже бесплатная версия обеспечивает организацию РјРЅРѕРіРёС… поисковых возможностей Яндекса. Рта версия РЅРµ содержит лицензионных ограничений РЅР° число индексируемых документов, РёС… размер или суммарный размер индекса. Позволяет индексировать документы как через HTTP-соединение, так Рё чтением локальной файловой системы. Дает независимо настраивать параметры индексирования для разных РіСЂСѓРїРї документов. Поддерживает РІСЃРµ возможности языка запросов, ранжирования результатов РїРѕРёСЃРєР° Рё подсветки найденных слов. РќРѕ вывод результатов делает только РЅР° встроенную форму дизайна. РљСЂРѕРјРµ того, РЅР° использование бесплатной версии имеются Рё РґСЂСѓРіРёРµ ограничения. Так, недопустимо изменение встроенного дизайна страниц результатов РїРѕРёСЃРєР°, полученных СЃ помощью этой программы, удаление информации РѕР± авторских правах. Рными словами, устанавливая программу РЅР° СЃРІРѕР№ веб-ресурс, РІС‹ РЅРµ сможете подогнать дизайн РїРѕРёСЃРєРѕРІРёРєР° Рє дизайну вашего сайта. Рта возможность доступна лишь РІ версии Enterprise.
10.1.1. Настраиваем Яndex.Server
Программу можно разделить на две основные и две вспомогательные подсистемы:
в–Ў основные — подсистема индексации Рё подсистема РїРѕРёСЃРєР°. Рндексатор обеспечивает анализ документов Рё сохранение информации Рѕ РЅРёС… РІ индексных файлах. Поисковый сервер обрабатывает запросы Рё формирует полученные результаты;
□ вспомогательные — это языковой модуль, предназначенный для преобразования слов к их словарным формам с учетом морфологии языка, и шаблоны выходных страниц.
В связи с тем, что объем индексируемой информации на сайте или в локальной сети конечен, индексатор анализирует документы и сохраняет данные о них в индексных файлах, после чего прекращает работу. Если на вашем вебсервере информация меняется, то необходимо обновлять и проиндексированные данные, для чего требуется заново запускать индексатор. При повторном индексировании возможно как выполнение всей работы заново, так и выполнение лишь обновления сведений, размещенных в индексе.
Рндексирование выполняется без остановки РїРѕРёСЃРєРѕРІРѕРіРѕ сервера, имеются возможности создания компактных индексов, использования стоп-слов, распознавания Р·РѕРЅ РІ HTML- Рё XML-документах, распознавания РєРѕРґРёСЂРѕРІРѕРє Рё использования различных фильтров РїСЂРё индексации.
Установка и настройкаДля установки программы под Windows (есть релизы и под другие системы —.nix, FreeBSD, Sun Solaris) достаточно распаковать дистрибутив в выбранный вами раздел (размер дистрибутива для Windows составляет примерно 6 Мбайт), отредактировать конфигурационный файл, установить программу в качестве системного сервиса. После выполнения этих действий поиск готов к работе.