Яндекс для всех - М. Абрамзон
Шрифт:
Интервал:
Закладка:
Главной особенностью программы является отсутствие какого бы то ни было заранее заданного списка людей — новые несловарные фамилии автоматически определяются и приводятся к словарной форме по специфическому контексту (имя, инициалы и др.). Кроме того, с высокой точностью разграничиваются однофамильцы и разрешается родовая омонимия (ср. Валентина Матвиенко, Александра Лебедева — мужчина или женщина?).
А вот, например, с какими проблемами и ошибками пришлось столкнуться.
• Рмена омонимичны обычным словам. Р’ самом начале РІ "Сегодня РІ лицах" фигурировали такие персонажи: Гера Советского, Вячеслав Богу, Надежда Доброй.
• Фамилии РјРѕРіСѓС‚ совпадать СЃ отчествами. Бывшие бизнес-партнеры Борис Абрамович Березовский Рё Роман Аркадьевич Абрамович Рё РІ придачу президент компании "КрасРР№СЂ" Борис Михайлович Абрамович доставили нам немало хлопот.
• Некоторые фамилии склоняются, некоторые нет. Ресли их нет в словаре, по их внешнему виду (по буквам) понять, к какому типу относится фамилия (и если склоняется, то как) далеко не всегда удается. Ардзинба и Анкваба. Поняли, что первая фамилия в именительном падеже, а вторая — в родительном? А так похожи.
• Мужские и женские имена тоже очень часто имеют общие формы (см. ранее).
• Есть такие народы, в которых одного имени человеку недостаточно. Мы этого не понимаем и ошибаемся. Без энциклопедического багажа совершенно не понятно, сколько человек тут упомянуто: Джон Рональд Руэл Толкиен.
Как бы то ни было, но сервис Новости в лицах был создан, и через год после начала разработки был предъявлен посетителям. Сейчас этот сервис не выделяется отдельной страницей, как было при его создании, но превратился в поставщика информации для блоков Сюжеты в лицах.
Главной особенностью программы, анализирующей тексты новостей, является отсутствие заранее заданного списка персон — при обработке сообщения программа самостоятельно находит в тексте имена и фамилии и добавляет их в рейтинг.
РЎРїРёСЃРєРё имен создаются отдельно для каждой СЂСѓР±СЂРёРєРё, региона, сюжета Рё результатов РїРѕРёСЃРєР°. Таким образом, пользователь может наблюдать, как меняется состав лиц, Рѕ которых пишут журналисты, РѕС‚ Нижнего РќРѕРІРіРѕСЂРѕРґР° Рє Рркутску, кто сегодня является наиболее заметной фигурой спортивной сферы, Р° кто — культурной.
Рейтинги обновляются каждые 10 минут — одновременно с появлением новых сообщений на Яндекс. Новостях, — что позволяет быстро находить упоминания ньюсмейкеров в актуальных сюжетах. Списки имен представлены на всех страницах службы, когда данные позволяют набрать достаточную статистику.
Отзывы об этом сервисе превзошли все ожидания, захотелось двигаться дальше, и тогда появились пресс-портреты.
3.1.6. Пресс-портреты в Новостях
Читая новость о каком-либо событии, зачастую, если в тексте упоминается какой-либо человек, хочется узнать о нем побольше. Кто он такой, чем и когда занимался, какого его отношение к различным событиям. Самостоятельно собрать подобные сведения об интересующем вас человеке довольно сложно, для этого придется проводить обширный поиск нужной информации.
Яндекс. Новости решил выполнить эту работу за нас. Теперь в составе Новостей появился дополнительный сервис — пресс-портреты. Вот как было написано в пресс-релизе по поводу открытия этого сервиса:
Р’ пресс-портрете РЅР° сегодняшний день представлено три типа сведений Рѕ человеке: свободные определения человека, послужной СЃРїРёСЃРѕРє Рё цитаты. Свободные определения — это звания (полковник, доцент), ученые степени (доктор экономических наук), профессии (литературный критик, известный адвокат) Рё любые РґСЂСѓРіРёРµ описания (хороший семьянин, старый знакомый Маши Рвановой, самый богатый человек РІ РјРёСЂРµ). Р’ послужной СЃРїРёСЃРѕРє РІС…РѕРґСЏС‚ факты, состоящие РёР· названия организации (Юкос, Министерство экономического развития) Рё должности (президент, генеральный директор, секретарь), которую человек РІ ней занимал, занимает (или займет РІ будущем). Р’ третьем блоке содержатся цитаты человека Рё цитаты Рѕ нем РґСЂСѓРіРёС… людей. Каждый факт снабжен текстовой иллюстрацией фрагментом новостного сообщения, РёР· которого была извлечена информация. РљСЂРѕРјРµ того, для каждого факта можно получить РІСЃРµ его упоминания РІ Яндекс. Новостях.
Справочная часть службы Яндекс. Новости состоит более чем из 1 млн пресс-портретов, 30 тыс. из которых обновляется ежедневно. Новостная служба Яндекса была открыта семь лет назад, поэтому большая часть пресс-портретов создана на основе анализа сообщений СМРс 2000 года, в настоящее время к службе подключаются архивы новостных источников за предыдущие годы, что повышает полноту и точность сервиса.