- Любовные романы
- Фантастика и фэнтези
- Ненаучная фантастика
- Ироническое фэнтези
- Научная Фантастика
- Фэнтези
- Ужасы и Мистика
- Боевая фантастика
- Альтернативная история
- Космическая фантастика
- Попаданцы
- Юмористическая фантастика
- Героическая фантастика
- Детективная фантастика
- Социально-психологическая
- Боевое фэнтези
- Русское фэнтези
- Киберпанк
- Романтическая фантастика
- Городская фантастика
- Технофэнтези
- Мистика
- Разная фантастика
- Иностранное фэнтези
- Историческое фэнтези
- LitRPG
- Эпическая фантастика
- Зарубежная фантастика
- Городское фентези
- Космоопера
- Разное фэнтези
- Книги магов
- Любовное фэнтези
- Постапокалипсис
- Бизнес
- Историческая фантастика
- Социально-философская фантастика
- Сказочная фантастика
- Стимпанк
- Романтическое фэнтези
- Ироническая фантастика
- Детективы и Триллеры
- Проза
- Юмор
- Феерия
- Новелла
- Русская классическая проза
- Современная проза
- Повести
- Контркультура
- Русская современная проза
- Историческая проза
- Проза
- Классическая проза
- Советская классическая проза
- О войне
- Зарубежная современная проза
- Рассказы
- Зарубежная классика
- Очерки
- Антисоветская литература
- Магический реализм
- Разное
- Сентиментальная проза
- Афоризмы
- Эссе
- Эпистолярная проза
- Семейный роман/Семейная сага
- Поэзия, Драматургия
- Приключения
- Детская литература
- Загадки
- Книга-игра
- Детская проза
- Детские приключения
- Сказка
- Прочая детская литература
- Детская фантастика
- Детские стихи
- Детская образовательная литература
- Детские остросюжетные
- Учебная литература
- Зарубежные детские книги
- Детский фольклор
- Буквари
- Книги для подростков
- Школьные учебники
- Внеклассное чтение
- Книги для дошкольников
- Детская познавательная и развивающая литература
- Детские детективы
- Домоводство, Дом и семья
- Юмор
- Документальные книги
- Бизнес
- Работа с клиентами
- Тайм-менеджмент
- Кадровый менеджмент
- Экономика
- Менеджмент и кадры
- Управление, подбор персонала
- О бизнесе популярно
- Интернет-бизнес
- Личные финансы
- Делопроизводство, офис
- Маркетинг, PR, реклама
- Поиск работы
- Бизнес
- Банковское дело
- Малый бизнес
- Ценные бумаги и инвестиции
- Краткое содержание
- Бухучет и аудит
- Ораторское искусство / риторика
- Корпоративная культура, бизнес
- Финансы
- Государственное и муниципальное управление
- Менеджмент
- Зарубежная деловая литература
- Продажи
- Переговоры
- Личная эффективность
- Торговля
- Научные и научно-популярные книги
- Биофизика
- География
- Экология
- Биохимия
- Рефераты
- Культурология
- Техническая литература
- История
- Психология
- Медицина
- Прочая научная литература
- Юриспруденция
- Биология
- Политика
- Литературоведение
- Религиоведение
- Научпоп
- Психология, личное
- Математика
- Психотерапия
- Социология
- Воспитание детей, педагогика
- Языкознание
- Беременность, ожидание детей
- Транспорт, военная техника
- Детская психология
- Науки: разное
- Педагогика
- Зарубежная психология
- Иностранные языки
- Филология
- Радиотехника
- Деловая литература
- Физика
- Альтернативная медицина
- Химия
- Государство и право
- Обществознание
- Образовательная литература
- Учебники
- Зоология
- Архитектура
- Науки о космосе
- Ботаника
- Астрология
- Ветеринария
- История Европы
- География
- Зарубежная публицистика
- О животных
- Шпаргалки
- Разная литература
- Зарубежная литература о культуре и искусстве
- Пословицы, поговорки
- Боевые искусства
- Прочее
- Периодические издания
- Фанфик
- Военное
- Цитаты из афоризмов
- Гиды, путеводители
- Литература 19 века
- Зарубежная образовательная литература
- Военная история
- Кино
- Современная литература
- Военная техника, оружие
- Культура и искусство
- Музыка, музыканты
- Газеты и журналы
- Современная зарубежная литература
- Визуальные искусства
- Отраслевые издания
- Шахматы
- Недвижимость
- Великолепные истории
- Музыка, танцы
- Авто и ПДД
- Изобразительное искусство, фотография
- Истории из жизни
- Готические новеллы
- Начинающие авторы
- Спецслужбы
- Подростковая литература
- Зарубежная прикладная литература
- Религия и духовность
- Старинная литература
- Справочная литература
- Компьютеры и Интернет
- Блог
Журнал «Компьютерра» № 5 за 7 февраля 2006 года - Компьютерра
Шрифт:
Интервал:
Закладка:
Софтерра: Обыск местного значения
Автор: Макс Магляс
Говорить о том, что в наше время информационных технологий и бесконечного роста объема данных существует много проблем с обработкой и поиском информации, — это уже кощунство. Дабы не загружать вас субъективными и объективными суждениями, почерпнутыми из различных источников, перейду непосредственно к решению задачи.
Апгрейд «прямого поиска»Когда информации в локальных сетях было немного, любой поиск осуществлялся банальным перебором горстки доступных файлов и последовательной проверкой их названий и содержимого. Такой поиск называется прямым, и программы, его использующие, традиционно включаются во все ОС и инструментальные пакеты. Но даже мощности современных компьютеров не хватит для быстрого прямого поиска в гигантских объемах данных. Перебор пары сотен документов на диске и поиск в громадной библиотеке и нескольких десятках почтовых ящиков — разные вещи. Поэтому программы прямого поиска сегодня уходят на второй план, если речь идет об универсальных средствах.
В корпоративном секторе такой вид поиска уже не применяется — объемы не те. Не так давно Билл Гейтс, позавидовав, судя по всему, феноменальному успеху Google, огласил желание софтверного (уже и не только) гиганта всячески способствовать развитию поисковых систем и технологий. Но до создания какой-либо феноменальной программы от Microsoft или конкурентоспособного сервиса в Интернете пока далеко.
Индекс, запрос, релевантностьВ основе современных технологий поиска лежат два процесса: индексация доступной информации и обработка запроса с последующим выводом результатов. Что касается первого, то любая программа (хоть настольный поисковик, хоть корпоративная информационная система или интернет-поисковый движок) создает свою область поиска. То есть обрабатывает документы и формирует их индекс (организованную структуру, в которой содержится информация об обработанных данных). Затем программа обрабатывает запрос (по ключевому слову-фразе) и выводит список документов, в которых эта ключевая фраза встречается. Так как информация содержится в структурированном индексе, то обработка запроса проходит в десятки и сотни раз быстрее, чем в случае с прямым поиском (выборка документов осуществляется не перебором файлов, а анализом текстовой информации в индексе).
Найденные документы программа выводит в результирующем списке согласно релевантности — соответствию документа тексту запроса. В разных технологиях используются разные методы поиска и определения релевантности (количество «вхождений» слова, частота упоминания, отношение этих параметров к общему количеству слов в документе, расстояние между словами фразы запроса в искомых файлах и т. д.). На основе этих параметров определяется «вес» документа, и в зависимости от него тот или иной файл оказывается в списке результатов на определенной позиции. В случае с интернет-поиском дело обстоит еще сложнее. Ведь в данном случае надо учитывать и множество иных факторов (Page Rank Google тому пример). Но это тема для отдельной статьи, так что Интернет трогать не будем.
На подопытный компьютер (Athlon 2,2 МГц; 1 Гбайт RAM, IDE-винчестер Seagate, 160 Гбайт, 7200 об./мин.; Windows XP) был установлен набор программ: dtSearch Desktop, «Ищейка Проф Deluxe», Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Для тестов была скомпонована текстовая база документов в форматах doc, txt и html общим объемом 20 Гбайт. Группа товарищей под руководством вашего покорного слуги тестировала, сравнивала и делилась своими субъективными впечатлениями по каждой софтине.
dtSearch Desktop 7.0Разработчик: dtSearch Corp.
Официальный сайт: www.dtsearch.com
Цена: $199
Размер дистрибутива: 23,1 Мбайт
Интерфейс dtSearch довольно прост, но некоторые окна или вкладки перегружены элементами, из-за чего создается впечатление сложности использования. Единственным действительно неприятным моментом является отсутствие русскоязычного интерфейса, хотя искать документы программа может на нескольких языках. Зато dtSearch одна из немногих утилит, которая может индексировать веб-страницы на заданную пользователем «глубину» (для этого, правда, нужно докупить адд-он dtSearch Spider).
Имеется морфологический поиск (слово во всех морфологических формах), поиск с коррекцией ошибок (с опечатками) и поиск с использованием синонимов. dtSearch может производить поиск с использованием фраз, состоящих из слов, соединенных логическими операциями. Каждому слову в запросе можно устанавливать свой вес.
В общем и целом неплохая программа из разряда профессиональных поисковиков. Накладок с русским текстом при поиске не было. Как не было их ни с заявленной морфологией, ни с нечетким поиском. Система вполне адекватно находила нужные документы и по простому запросу в одно слово, и при использовании в качестве ключевой фразы пары абзацев документа.
iSYS Desktop 7.0Разработчик: iSYS Search
Официальный сайт: www.isys-search.com
Цена: $570
Размер дистрибутива: 38,8 Мбайт
Очень мощная программа, но размер установочного файла больше 40 Мбайт! Интерфейс весьма симпатичный, но разобраться, где и что находится, куда нажимать и где наконец-то осуществить поиск, новичку будет непросто: запросы для поиска вводятся при помощи запуска одной программы, а управление индексами производится при помощи другой. Поисковые запросы вводятся также в отдельных появляющихся окошках. Ко всему прочему не поддерживается русский язык.
Возможности по созданию индексов включают в себя несколько готовых шаблонов (по папке «Мои документы», «Почта», «Почта и документы», «Определенная папка», «Папка с выбором типов файлов» и др.). ISYS Desktop умеет индексировать информацию из различных источников данных и предоставляет для этого множество настроек. Дополнительные возможности: поддержка SQL, FTP, TRIM Context, WORLDOX 2002, скрипты, планировщик индексации.
Из продвинутых функций программа предлагает использование синонимов, фильтра сортировки (по пути, имени и дате создания файла). Удивило то, что отсутствует поиск с использованием морфологии. Кроме того, нет списка значимых слов, зато имеется обширный список слов незначимых. Также заявлены функции «приблизительный поиск» и «эвристический анализ».
Результаты поиска весьма информативны, отображаются в виде списка документов, отсортированных по релевантности. К сожалению, предпросмотр документа доступен лишь в виде обычного текста, добиться отображения файлов в родном формате, будь то Word, Html или PDF, так и не удалось. Программа позволяет разбивать найденные документы на группы по определенным признакам (по умолчанию они разделены по релевантности).
Google Desktop Search + GDE EnterpriseРазработчик: Google
Официальный сайт: www.google.com
Цена: бесплатно
Размер дистрибутива вместе с TweakGDS:
1,2 Мбайт
Имя Google уже говорит о многом. Бесплатная разработка предназначена для поиска информации на персональном компьютере, в Интернете и корпоративной сети. С одной лишь оговоркой: компания Google предлагает свои услуги по консультации и развертыванию системы GDS Enterprise на предприятии за 10 тысяч долларов на каждую тысячу пользователей.
Первое, что бросается в глаза, — отсутствие собственной оболочки для программы. Google Desktop Search по-прежнему находится в окне браузера, соответственно весь интерфейс настольной версии достался софтине от старшего интернет-брата.
После инсталляции Google Desktop Search начинает индексировать на компьютере все подряд — выбрать пути индексации невозможно. Придется скачать отдельную программку (TweakGDS), которая позволит расширить настройки Google Desktop, в том числе указать предназначенные для индексации диски и папки. Кроме того, для работы с сетью программе необходимы Microsoft .NET Framework и Microsoft Scripting Runtime.
Что касается анализа поисковых запросов и выдачи результатов, то здесь все идентично интернет-поисковику Google: та же система отображения, тот же стандартный набор логических операций для запросов. Google Desktop Search предназначен исключительно для поиска файлов — внутреннего просмотрщика этих файлов в нем нет. Количества поддерживаемых форматов вполне достаточно, поиск осуществляется также по посещенным веб-страницам (данные из кэша).
К сожалению, похвастаться поддержкой русской морфологии, как и прочими интересными функциями поиска, данная софтина не может.Большое преимущество (или упущение?) заключается в настройке программы путем установки плагинов (даже для полноценной работы с архивами нужна отдельная примочка). Правда, все эти дополнения бесплатны. Однако если не брать в расчет десктопную версию поисковика, то грамотная настройка GDS Enterprise может оказаться вам не под силу — ведь не зря Google предлагает свои услуги.
Если же вы все-таки осилите процедуру настройки и установки (или заплатите бригаде быстрого реагирования Google), то поймете, что сложность установки с лихвой компенсируется гибкими настройками при использовании в корпоративных сетях. Немаловажным моментом является использование групповых политик, что дает возможность установить настройки для каждого пользователя.
