Журнал «Компьютерра» № 15 от 17 апреля 2007 года - Компьютерра
Шрифт:
Интервал:
Закладка:
Несмотря на то что в этом соревновании каждый год участвует достаточно много участников, «фаворитов» всего два: Jabberwacky, который завоевал бронзу в 2005 году, и A.L.I.C.E., признававшаяся лучшей три раза — в 2000, 2001 и 2004 году. Название программы — аббревиатура, которая расшифровывается как Artificial Linguistic Internet Computer Entity (можно перевести как «искусственная лингвистическая компьютерная интернет-сущность»).
Ричард Веллес начал работу над программой в 1995 году, а ее совершенствованием (или хотя бы клонированием) многие программисты занимаются по сей день. A.L.I.C.E. была в некотором роде уникальной разработкой. И не только потому, что ее общение многие эксперты считают более всего напоминающим человеческое. Автор опубликовал спецификации AIML — подвида XML, который использовался при создании программы. Язык распространяется под лицензией GNU GPL. Это привлекло людей и позволило создать вокруг проекта целое сообщество программистов, написавших интерпретаторы AIML на всех популярных языках программирования. Наиболее популярен интерпретатор Program D на Java. В результате подавляющее большинство сегодняшних чат-ботов используют базы знаний, разработанные на AIML. При этом многие из них способны к самообучению.
Кстати, в Рунете узнать чат-бота с такими возможностями можно по нецензурным выражениям, которыми он перемежает речь. И по частоте ненормативной лексики у виртуального собеседника можно судить, как давно он общается с отечественной IM-аудиторией. Хотя это общая проблема. Интернет-пользователи охотно учат программы плохому. Так, Уэс Моудс, автор бота «Мимика», четыре года назад даже призвал пользователей отказаться от глупых и нецензурных высказываний.
Одной из самых «талантливых» самообучающихся программ считается бот 20Q.net, расположенный по соответствующему URL. За двадцать вопросов он, по данным разработчика, способен отгадать любое задуманное слово. Поддерживается беседа на 21 языке (причем различаются американский и британский английский), но русского, к сожалению, нет. База данных в ходе таких викторин пополнялась в течение четырнадцати лет, так что программа может похвастать достаточно широкой «эрудицией».
Тем временем ряд поклонников AIML даже вынашивает идею объединения ботов по всему Интернету. Если им удастся достичь поставленной цели, то программы-собеседники, прежде чем признаваться пользователю в своих скудных умственных способностях, не позволяющих интерпретировать реплику, будут обращаться к общей базе данных, непрерывно пополняемой всем «сообществом» ботов в ходе многочисленных диалогов. Поэтому Ричард Веллес всячески поощряет появление ботов-клонов A.L.I.C.E., полагая, что наиболее вероятный путь развития для таких разработок заключается в количественном росте программ.
Коммерциализация в разгареВторая жизнь бота
Программы-собеседники прочно обосновались не только в IM-сетях, но и виртуальной вселенной Second Life. Для создания ботов в этой игре даже разработан подвид языка AIML (Linden Scripting Language).
Одной из первых за применение ботов в бизнес-целях взялась компания NativeMinds, разработавшая софт для обмена сообщениями с пользователями на естественном языке Virtual Representative (vRep). Теперь этой компании уже нет. По-видимому, ее, как и многих других, подкосил инвестиционный кризис 2001 года. Но все ее разработки около трех лет назад были выкуплены Verity за $3,8 млн. и теперь развиваются под крылом этой корпорации. NativeMinds и ее первых ботов многие участники рынка доткомов помнят по сей день, так как продукция компании впервые продемонстрировала возможность использования программ общения с клиентами.
NativeMinds потратила немало усилий, доказывая потенциальным заказчикам, что чат-боты, интегрированные, например, в интернет-магазины, служат эффективным средством упрощения структуры порталов и упрощения доступа для неквалифицированных пользователей, одновременно уменьшая нагрузку на персонал (техподдержку и отдел по работе с клиентами). По данным NativeMinds, виртуальный менеджер имеет ряд неоспоримых преимуществ перед реальным, выдавая полный вежливый ответ на все вопросы 24 часа в сутки 7 дней в неделю. А кроме того, vRep успевал обработать вшестеро больше запросов, придерживался того же стиля общения, что и обратившийся к нему пользователь, и не требовал зарплаты.
В результате одна из самых популярных разработок компании — Neuroserver — была установлена на сайтах Coca-Cola, Oracle, Ford и ряда других именитых корпораций. На сайте NativeMinds имелся собственный виртуальный консультант — Николь, а также созданный в рекламных целях персонаж — тетя Этель, которая среди представителей е-бизнеса была известна не меньше, чем Eliza Вейзенбаума в академической американской тусовке. Вообще, большинство разработок в сфере коммерческих чат-ботов, которые сейчас пользуются относительным успехом, начались в 2000—2001 гг., а некоторые и раньше. Правда, если в то время программы-собеседницы старались интегрировать исключительно в веб-порталы, то сейчас не менее активно они используются для реализации маркетинговых кампаний в IM-сетях.
Шесть лет назад была запущена демо-версия SmarterChild, продукт тогда еще стартапа ActiveBuddy. Позже компания была переименована а Colloquis. Бот-агент в AIM мог поддержать разговор, рассказывая о последних новостях, финансовых сводках и результатах спортивных матчей, а также сообщая точное время и делая прогноз погоды с учетом местоположения собеседника. За год SmaterChild поговорил примерно с 8 млн. пользователей, причем солидная часть аудитории призналась боту в любви. Это был не первый опыт Colloquis в разработке чат-ботов, но на тот момент самый успешный. После того как руководство компании узнало, что SmarterChild превзошел по популярности агента, разработанного для продвижения фильма «Austin Powers in Goldmember» по заказу New Line Cinema, демо-версию убрали из IM-сети. Долгое время пообщаться с известным ботом можно было только на сайте smarterchild.com, но в конце концов «по многочисленным просьбам» программу вернули в AIM.
SmarterChild сделал большую рекламу как самой Colloquis, так и идее виртуальных ассистентов в целом, а спустя некоторое время в свободном доступе появилась среда разработки BuddyScript SDK, в которой была создана программа. Пакет позволяет любому желающему сделать своего пиар-бота. Это не аналог AIML. BuddyScript позволял научить бота не только «говорить», но и выполнять различные задачи — например, набирать телефонный номер или искать товар в складской базе данных. Пакет включает также библиотеки самых частых фрагментов кода, функцию тестирования готового агента и коллекцию готовых ботов. Программы-собеседники, написанные на BuddyScript, поддерживают IM-сети AIM, MSN Messenger и Yahoo Messenger, а также могут работать через электронную почту, WAP и SMS. Правда, AOL требует, чтобы при запуске бота в ее сеть с коммерческими целями ей платили деньги как за предоставление рекламной площадки. Другие корпорации до такого еще не додумались.
Бесплатность самого BuddyScript тоже довольно условна. За онлайн-запуск демо-версии готового скрипта придется выложить $199, а запуск полноценной версии тарифицируется в зависимости от количества разговоров. Альтернативной разработкой Colloquis на сегодняшний день являются уже готовые боты для коммерческих нужд — ASA (automated service agents). В октябре прошлого года Microsoft приобрела Colloquis. Корпорация планирует использовать технологии обработки запросов на естественном языке в веб-сервисах Windows Live Service Agents.
Постепенно боты становятся все более «интеллектуальными». Так, австралийская компания RelevanceNow, которая продвигает сразу несколько проектов, базирующихся на семантическом анализе текста, предлагает компаниям пиар-ботов собственного происхождения. Для настройки виртуального персонажа нужно установить значения по нескольким чертам «характера» — например, степень «жизнерадостности». Самым известным ботом компании стал агент в MSN Messenger, вещающий от лица Джека Воробья. Таким образом, народ завлекали на «Пиратов Карибского моря».
В начале апреля компания запустила альфа-версию сервиса MyCyberTwin, позволяющего создать своего онлайн-двойника, который сможет за хозяина ответить в ICQ и даже запостить текст в блоге, в том числе скопировав фрагменты найденного в Сети текста. При создании такого бота пользователям предлагается пройти психологический тест, дабы обеспечить более полную идентичность или выбрать один из шаблонных типажей. Кроме того, можно пополнять базу вопросов-ответов для своего «двойника».
Русские ботыВ России созданием программ-собеседников для коммерческих целей занимается фирма «Наносемантика». Чат-бот в терминологии компании называется инфом и характеризуется как «интерактивное информационное существо, которое живет на сайте клиента, умеет отвечать на вопросы, заданные на естественном языке в рамках определенных тем, а также поддерживает связный диалог».