Профессиональный поиск в Интернете - Алексей Кутовенко
Шрифт:
Интервал:
Закладка:
В системе научного поиска на базе Flexum доступен только режим простого поиска. Найденные веб-страницы могут выводиться единым списком с сортировкой по релевантности или группироваться по сайтам, на которых они были найдены. Рядом с каждой ссылкой в списке выдачи находится кнопка вызова формы поиска с помощью Flexum на найденном сайте. Расположенная рядом со списком выдачи панель тегов-закладок позволяет быстро переходить к поиску только на сайтах, помеченных соответствующими тегами, что повышает точность поиска.
Главное достоинство данного ресурса – хороший охват научных интернет-ресурсов на русском языке. К недостаткам отнесем отсутствие дополнительных возможностей составления сложных запросов, а также наличие информационного шума в результатах поиска. Справедливости ради отметим, что эти недостатки свойственны многим персональным поисковикам.
Scirus
Любой серьезный специалист не может развиваться в профессиональном плане, не получая качественной информации о сфере своей деятельности. О студенте, который пишет курсовую, мы уже говорили. Давайте теперь вспомним про его научного руководителя. Современная наука многонациональна, оставаться на гребне волны, не интересуясь зарубежными публикациями, сейчас, пожалуй, просто невозможно. Однако здесь начинаются проблемы. В мире выходит огромное количество книжных и периодических изданий научной тематики. Получить доступ к таким «бумажным» версиям зачастую сложно, иногда не помогают и библиотеки: относительно малое количество людей, интересующихся специфическими узкими темами, помноженное на традиционно высокую стоимость научной литературы не способствует полноте комплектования таких библиотек. В этой ситуации на помощь опять же приходит интернет. Даже исторически глобальная компьютерная сеть связана с академической наукой – это было, пожалуй, первое применение интернета в «мирной» жизни за пределами сферы интересов военных. Сохраняется это значение интернета и в наши дни. В. Сети находится значительное количество архивов и баз данных научной тематики. Правда, при попытке ими воспользоваться возникают новые проблемы. Во-первых, никуда не пропадает проблема оценки качества и достоверности информации. Более того, критерии качества источников в научной и профессиональной деятельности значительно повышаются. Во-вторых, сетевые базы могут быть как открытыми, бесплатными, так и коммерческими, цены на доступ к которым не отличаются демократичностью. Разделить их в списке выдачи универсальных интернет-поисковиков сложно. Справиться с новыми вызовами помогают специализированные интернет-поисковики.
Система Scirus предназначена для поиска научной информации в сферах естественных наук, компьютерных технологий, экологии, экономики, менеджмента и лингвистики. Индексная база Scirus рассчитана на специалистов и исследователей В настоящее время в нее входит порядка трехсот семидесяти миллионов документов. Это именно научные публикации, взятые из солидных источников. Если говорить о доступных видах документов, то это не только журнальные статьи и монографии, но и научные рефераты, препринты, материалы конференций, патенты. Кроме того, ведется поиск на официальных сайтах научных организаций и учреждений. К сожалению, среди источников Scirus нет русскоязычных ресурсов, поэтому для эффективной работы с найденным контентом требуется знание иностранных языков.
Замечательное качество данного поисковика состоит в том, что любая найденная ссылка обязательно ведет к полному тексту найденной публикации. Это значит, что пользуясь Scirus, вы, в отличие от многих других подобных поисковиков, не попадете в результате на страницу платной базы, где вам покажут один-два абзаца текста и ненавязчиво попросят за просмотр остального несколько десятков евро. В то же время Scirus может работать и с коммерческими источниками. Для этого предусмотрена устанавливаемая при настройке поисковика опция показа результатов, полученных, в том числе, и из коммерческих баз.
Возможности составления запросов предусматривают режимы простого и расширенного поиска. В режиме расширенного поиска можно пользоваться стандартными логическими операторами, фильтровать список выдачи по видам документов и форматам файлов. Доступен поиск введенных ключевых слов в определенных полях описания документов (автор, заглавие, ISSN и другие). Кроме того, в форме расширенного поиска присутствует несколько специфических для научной сферы фильтров. Например, можно ограничить выдачу только электронными материалами «печатных» журналов или же результатами, полученными со страниц веб-проектов, причем допускается детальный выбор используемых при поиске источников. Интересен фильтр Subject Areas. Как известно, значительный процент современных исследований проводится на стыках нескольких дисциплин. С помощью данного фильтра можно четко обозначить сферу науки, к которой должны относиться ожидаемые результаты поиска. Это позволяет гибко выделять в результатах поиска как узкие исследования, так и публикации междисциплинарного характера (рис. 2.3).
Рис. 2.3. Система Scirus предлагает поиск среди 370 млн научных публикаций
Интерфейс страницы поисковой выдачи Scirus разделен на несколько панелей. Основная часть экрана отдана списку выдачи, который можно сортировать по релевантности и по дате публикаций. Возле всех ссылок находятся флажки, с помощью которых можно отобрать нужное подмножество записей и одним щелчком мыши отправить их по электронной почте, сохранить для дальнейшей работы (не более 25 ссылок, причем для этого понадобится включить в браузере режим сохранения куки-файлов) или же экспортировать в виде списка. Раздел Refine your Search демонстрирует список дополнительных ключевых слов, автоматически найденных в результатах поиска и позволяющих быстро уточнить свой запрос. Доступны инструменты фильтрации найденного контента по признаку источника.
Возможности дополнительной настройки поисковика Scirus достаточно скромны. Можно задать количество ссылок на странице выдачи, включить режим вывода ссылок на документы из фондов библиотек-партнеров Scirus, а также управлять группировкой ссылок на странице выдачи.
Scirus предлагает несколько вспомогательных дополнений для браузеров Это стандартный простой поисковый плагин и довольно удобная панель инструментов Scirus Toolbar. У веб-мастеров есть возможность установить на своем сайте поисковую форму Scirus. Соответствующий код доступен на странице Downloads – останется только разместить его в коде своего проекта, как любой другой JavaScript-виджет.
ScienceResearch
Проект ScienceResearch является бесплатным и общедоступным поисковиком научных ресурсов, который обладает рядом интересных особенностей. Данный проект работает с базами данных, электронными библиотеками и другими источниками онлайновых научных публикаций. Такие источники называются на данном проекте «коллекциями». В общей сложности проект поддерживает поиск более чем на трех сотнях таких коллекций. Основные особенности ScienceResearch – это поддержка технологии Federated Search и использование кластеризации при выводе результатов поиска.
Технология «объединенного поиска» (Federated Search) разработана компанией Deep Web Technologies и реализована в поисковом алгоритме Explorit Research Accelerator, который предлагается заинтересованным разработчикам. Данная технология отличается тем, что построенные на ее основе поисковики не собирают какую-либо собственную индексную базу, а способны работать в режиме реального времени с большим количеством внешних подключаемых баз данных.
После поступления запроса от пользователя ScienceResearch отправляет его всем поддерживаемым коллекциям. Затем в полученных ответах отбрасываются дублирующиеся записи и определяются наиболее релевантные результаты. Заметим, что степень релевантности определяется с помощью алгоритмов самой системы ScienceResearch и не зависит от качества ранжирующих алгоритмов отдельных источников информации. В результате формируется страница выдачи, которая и демонстрируется пользователю.
Поскольку все эти операции выполняются в режиме реального времени, ScienceResearch предлагает несколько уникальных возможностей. Например, если за время просмотра пользователем страницы результатов поиска в какой-либо из внешних баз появляются новые записи, подходящие под условия введенного запроса, система выводит соответствующее сообщение и предлагает дополнить список выдачи новыми результатами. При составлении запросов допускается использование логических операторов и поиск по точной фразе. Режим расширенного поиска позволяет вести поиск по конкретным признакам (заглавию, автору публикации), ограничить выдачу определенным хронологическим промежутком, а также конкретной научной дисциплиной. Список основных дисциплин выводится на боковой панели поисковика. Кроме того, можно выбрать одну или несколько коллекций, на которые будет отправлен ваш запрос. К сожалению, в бесплатной версии ScienceResearch предлагается выбирать не из всех доступных коллекций, а только из нескольких основных.