- Любовные романы
- Фантастика и фэнтези
- Ненаучная фантастика
- Ироническое фэнтези
- Научная Фантастика
- Фэнтези
- Ужасы и Мистика
- Боевая фантастика
- Альтернативная история
- Космическая фантастика
- Попаданцы
- Юмористическая фантастика
- Героическая фантастика
- Детективная фантастика
- Социально-психологическая
- Боевое фэнтези
- Русское фэнтези
- Киберпанк
- Романтическая фантастика
- Городская фантастика
- Технофэнтези
- Мистика
- Разная фантастика
- Иностранное фэнтези
- Историческое фэнтези
- LitRPG
- Эпическая фантастика
- Зарубежная фантастика
- Городское фентези
- Космоопера
- Разное фэнтези
- Книги магов
- Любовное фэнтези
- Постапокалипсис
- Бизнес
- Историческая фантастика
- Социально-философская фантастика
- Сказочная фантастика
- Стимпанк
- Романтическое фэнтези
- Ироническая фантастика
- Детективы и Триллеры
- Проза
- Юмор
- Феерия
- Новелла
- Русская классическая проза
- Современная проза
- Повести
- Контркультура
- Русская современная проза
- Историческая проза
- Проза
- Классическая проза
- Советская классическая проза
- О войне
- Зарубежная современная проза
- Рассказы
- Зарубежная классика
- Очерки
- Антисоветская литература
- Магический реализм
- Разное
- Сентиментальная проза
- Афоризмы
- Эссе
- Эпистолярная проза
- Семейный роман/Семейная сага
- Поэзия, Драматургия
- Приключения
- Детская литература
- Загадки
- Книга-игра
- Детская проза
- Детские приключения
- Сказка
- Прочая детская литература
- Детская фантастика
- Детские стихи
- Детская образовательная литература
- Детские остросюжетные
- Учебная литература
- Зарубежные детские книги
- Детский фольклор
- Буквари
- Книги для подростков
- Школьные учебники
- Внеклассное чтение
- Книги для дошкольников
- Детская познавательная и развивающая литература
- Детские детективы
- Домоводство, Дом и семья
- Юмор
- Документальные книги
- Бизнес
- Работа с клиентами
- Тайм-менеджмент
- Кадровый менеджмент
- Экономика
- Менеджмент и кадры
- Управление, подбор персонала
- О бизнесе популярно
- Интернет-бизнес
- Личные финансы
- Делопроизводство, офис
- Маркетинг, PR, реклама
- Поиск работы
- Бизнес
- Банковское дело
- Малый бизнес
- Ценные бумаги и инвестиции
- Краткое содержание
- Бухучет и аудит
- Ораторское искусство / риторика
- Корпоративная культура, бизнес
- Финансы
- Государственное и муниципальное управление
- Менеджмент
- Зарубежная деловая литература
- Продажи
- Переговоры
- Личная эффективность
- Торговля
- Научные и научно-популярные книги
- Биофизика
- География
- Экология
- Биохимия
- Рефераты
- Культурология
- Техническая литература
- История
- Психология
- Медицина
- Прочая научная литература
- Юриспруденция
- Биология
- Политика
- Литературоведение
- Религиоведение
- Научпоп
- Психология, личное
- Математика
- Психотерапия
- Социология
- Воспитание детей, педагогика
- Языкознание
- Беременность, ожидание детей
- Транспорт, военная техника
- Детская психология
- Науки: разное
- Педагогика
- Зарубежная психология
- Иностранные языки
- Филология
- Радиотехника
- Деловая литература
- Физика
- Альтернативная медицина
- Химия
- Государство и право
- Обществознание
- Образовательная литература
- Учебники
- Зоология
- Архитектура
- Науки о космосе
- Ботаника
- Астрология
- Ветеринария
- История Европы
- География
- Зарубежная публицистика
- О животных
- Шпаргалки
- Разная литература
- Зарубежная литература о культуре и искусстве
- Пословицы, поговорки
- Боевые искусства
- Прочее
- Периодические издания
- Фанфик
- Военное
- Цитаты из афоризмов
- Гиды, путеводители
- Литература 19 века
- Зарубежная образовательная литература
- Военная история
- Кино
- Современная литература
- Военная техника, оружие
- Культура и искусство
- Музыка, музыканты
- Газеты и журналы
- Современная зарубежная литература
- Визуальные искусства
- Отраслевые издания
- Шахматы
- Недвижимость
- Великолепные истории
- Музыка, танцы
- Авто и ПДД
- Изобразительное искусство, фотография
- Истории из жизни
- Готические новеллы
- Начинающие авторы
- Спецслужбы
- Подростковая литература
- Зарубежная прикладная литература
- Религия и духовность
- Старинная литература
- Справочная литература
- Компьютеры и Интернет
- Блог
Журнал «Компьютерра» №39 от 25 октября 2005 года - Журнал Компьютерра
Шрифт:
Интервал:
Закладка:
Когда незнакомые люди спрашивают: «Чем вы занимаетесь в жизни?», сразу теряюсь, бормочу нечленораздельное, заикаясь отшучиваюсь. В самом деле, что сказать-то? Ращу сына? Пишу статьи о компьютерных программах и книги об аферистах? Преподаю биржевой трейдинг? Страдаю астрологией и бриджем? Это, однако, частности. По гамбургскому счету своим главным занятием в жизни полагаю изыскание, накопление, обработку и анализ информации - все вместе Data Mining (оборотик хоть и гаденький, английский, но уж больно емкий). Между прочим, занятие это самым недвусмысленным образом прописано в моем гороскопе: Асцендент в Близнецах и там же Меркурий, увешанный гроздьями аспектов. Короче, если долго объяснять, то что-то путное и получится, а так, на лету, незнакомым людям разве ж можно ответить: «Видите ли, я датамайнингист»? Либо сразу прибьют, либо заподозрят в нетрадиционных сексуальных домогательствах.
Возвращаюсь к провиденции. Конечно, лопатя тонны софтверного навоза, с годами удалось отыскать ослепительные диаманты и в Data Mining. Особенно повезло с обработкой и анализом информации, поскольку судьба подарила нам такое бесценное сокровище, как Cros, о котором писал, пишу и не перестану писать как о лучшей программе для создания структурированных информационных архивов и поиска в них. К превеликому сожалению, разработчики Cros практически прекратили совершенствовать свое детище, что печалит несказанно: какой бы замечательной ни была программа, работы в ней еще непочатый край - и радикальное преобразование наижутчайшего интерфейса, и непременное расширение функциональности, и глобальное переосмысление концепции в сторону user-friendly. Остается лишь удивляться гигантскому заряду мощности, заложенному в Cros уже сегодня, коли даже все перечисленные недостатки не в состоянии сместить колосса со своего пьедестала The Best.
Неизмеримо хуже обстояли дела с программным обеспечением стартового этапа Data Mining - накоплением информации[Как вы догадываетесь, стадию изыскания я сознательно опустил, поскольку процесс этот субъективный и зависит не от софтверного обеспечения, а от таланта и опыта датамайнингиста (прости господи!)]. За долгие годы поиска не удалось найти ничего лучше китайской MyBase - программы во всех отношениях убогой, хотя и выделяющейся из когорты еще более убогих аналогов. От херема MyBase спасал удачный модуль WebCollect, позволяющий собирать информацию из MSIE. Этим летом разработчики (Wjjsoft) добавили модуль WebCollect для браузера FireFox, однако у меня он так и не заработал. Да и с Opera MyBase взаимодействовать не научился.
Провиденция ContentSaver заключается в том, что программа блеснула на моем горизонте аккурат в момент, когда недостатки MyBase стали доводить меня даже не до отчаяния, а до белого каления. Из-за врожденной концептуальной ущербности китайская программа медленно, но верно привела все мои информационные архивы в состояние безнадежной энтропии и бардака. Какой, к черту, MyBase архивный систематизатор! Самый банальный накопитель заметок, к тому же подленький по натуре.
Поначалу жизнь кажется в шоколаде: находим какую-нибудь интересную заметку в Интернете, выделяем часть текста или страницу целиком, вызываем контекстное меню (опция Save to MyBase) и сохраняем заметку в уже существующем либо новом документе MyBase, который теоретически должен объединить в будущем данные общей тематики. Внутри своего документа MyBase организует информацию в банальной древовидной форме. Возможности динамической обработки материалов мизерны: можно экспортировать заметки из документа в файлы html, txt или другой файл MyBase либо перетащить заметку из одной ветки дерева в другую. Всё! Поиск в Mybase реализован чудовищно - достаточно сказать, что отсутствует функция выделения (хайлайтинга), поэтому отыскать что-либо в какой-нибудь заметке килобайт под пятьдесят нереально: программа открывает ее целиком, а дальше рой сам!
Неудивительно, что я всегда использовал MyBase в качестве незамысловатого контейнера a-la CHM: скидываешь всю информацию в документ MyBase только ради того, чтобы ничего не потерялось по ходу. Затем экспортируешь все заметки из документа в какое-нибудь место на жестком диске и загоняешь их в Cros для индексирования и последующего быстрого поиска по ключевым словам и фразам. Никакой самостоятельной ценности в качестве архивного систематизатора MyBase не имеет.
Подобная схема работы туда-сюда приемлема для выполнения единичных задач, например сбора материалов для статьи. Скажем, все свои аналитические «предпринимательские поэмы» в «Бизнес-журнале» я подготавливаю именно таким образом: собираю в документ MyBase материалы из множества разноплановых источников (газетные заметки, журнальные обзоры, протоколы судебных заседаний, рекламные проспекты и т. п.), все это перечитываю, перевариваю, формулирую собственную концепцию и видение предмета, затем сажусь писать. Если забываю дату или фамилию, тут же извлекаю ее из индексированного архива Cros, который создаю из заблаговременно экспортированных из MyBase файлов. Сдав статью в редакцию, благополучно забываю обо всем и через две недели готовлю новые материалы.
Прошли месяцы, прошли годы… Что же я получил на сегодняшний день? Сотни файлов с расширением NYF (документы MyBase), никак между собой не связанные, не обработанные, не осмысленные и абсолютно бесполезные для какого бы то ни было применения. Вопреки возлагаемым поначалу надеждам документы MyBase оказались такой же макулатурой, что и несчетные документы html, doc и txt, сваленные в кучу и годами пылящиеся на антресолях директории «Documents» на одном из жестких дисков. Тоскливые памятники впустую растраченным интернет-часам, подхваченным, поматрошенным и брошенным благим намерениям, начинаниям и инициативам. Кладбище несбывшихся амбиций, одним словом.
***А все почему? Все потому, что подлинный архивный систематизатор должен обладать гораздо большей функциональностью, нежели примитивная древовидная система хранения материалов. Навскидку: праздно шатаясь по Интернету, бывает, наталкиваешься на информацию, которой в настоящий момент не находишь никакого применения, однако чувствуешь, что в перспективе она очень пригодится для самых разных тематических исследований. Вопрос: в каком документе MyBase следует эту информацию сохранить? Разумеется, ни о каком документе не должно быть и речи. Требуется полноценный объединенный архив, наделенный функцией категориальной индексации, что позволяет соотносить одни и те же данные с различными тематиками.
Пример из личной практики: как-то раз, собирая материалы о «Маттел» (деловой мамке куклы Барби), наткнулся на статью об использовании детского труда на китайской фабрике компании. Тема эта показалась мне чрезвычайно фактурной, однако никаким боком не вписывалась в задуманную канву сюжета, посему я отложил ее до лучших времен, сохранив в документе MyBase под названием Mattel.hyf. И что же? Прошло три года, и буквально на прошлой неделе, работая над статьей для «Бизнес-журнала» о так называемом китайском экономическом чуде, я вдруг вспомнил о рабовладельческой тематике, которая как нельзя кстати вписывалась в новую историю. Открываю Mattel.nyf и нахожу добрые полтораста заметок и файлов, собранных в кучу без всякого разбора. Битый час ищу барбийных детишек-рабов и… не нахожу! Почему? Потому что их нет в этом документе MyBase. Пятнадцать минут недоуменно ионического (типа - баранного) созерцания потолка таки навели на истину: дело в том, что тема использования детского и рабского труда всплывала в моих исследованиях раз пятнадцать! Да чего уж там: практически все пиндосские фирмы закрывают глаза на трудовые безобразия, творимые китайскими менеджерами на своих заводах. Сорокачасовая рабочая неделя, смехотворная зарплата, отобранные паспорта, колючая проволока вокруг предприятия, проживание здесь же на территории завода в бараках по пятьдесят человек - все это вполне житейские и банальные составляющие великого китайского экономического прорыва.
Ну да черт с ним, с прорывом: куда я запихал материалы? С трудом вспоминаю, что года полтора назад, когда количество информации перешло в качество, решил его перескладировать и, собрав воедино все китайские ужастики, экспортировал в какой-то другой документ MyBase… А вот в какой - убей, не помню!
Что можно сказать об этом безобразии? Позор! А ведь путаницы можно было элементарно избежать, если бы вместо MyBase у меня был полноценный архивный систематизатор, способный производить категориальную индексацию всех собранных материалов. Тогда бы изначально я сохранил статью про китайские фабрики «Маттел» в нескольких категориях: «Маттел», «Китай», «детский труд» и т. п. Добавьте сюда полноценный поисковый аппарат с (как минимум) возможностью перекрестного поиска по разноплановым архивам, и вы получите настоящую составляющую взрослого Data Mining для накопления информации!

