- Любовные романы
- Фантастика и фэнтези
- Ироническое фэнтези
- Научная Фантастика
- Фэнтези
- Ужасы и Мистика
- Боевая фантастика
- Альтернативная история
- Космическая фантастика
- Попаданцы
- Юмористическая фантастика
- Героическая фантастика
- Детективная фантастика
- Социально-психологическая
- Боевое фэнтези
- Русское фэнтези
- Киберпанк
- Романтическая фантастика
- Городская фантастика
- Технофэнтези
- Мистика
- Разная фантастика
- Иностранное фэнтези
- Историческое фэнтези
- LitRPG
- Эпическая фантастика
- Зарубежная фантастика
- Городское фентези
- Космоопера
- Разное фэнтези
- Книги магов
- Любовное фэнтези
- Постапокалипсис
- Бизнес
- Историческая фантастика
- Социально-философская фантастика
- Сказочная фантастика
- Стимпанк
- Романтическое фэнтези
- Ироническая фантастика
- Детективы и Триллеры
- Проза
- Феерия
- Новелла
- Русская классическая проза
- Современная проза
- Повести
- Контркультура
- Русская современная проза
- Историческая проза
- Проза
- Классическая проза
- Советская классическая проза
- О войне
- Зарубежная современная проза
- Рассказы
- Зарубежная классика
- Очерки
- Антисоветская литература
- Магический реализм
- Разное
- Сентиментальная проза
- Афоризмы
- Эссе
- Эпистолярная проза
- Семейный роман/Семейная сага
- Поэзия, Драматургия
- Приключения
- Детская литература
- Загадки
- Книга-игра
- Детская проза
- Детские приключения
- Сказка
- Прочая детская литература
- Детская фантастика
- Детские стихи
- Детская образовательная литература
- Детские остросюжетные
- Учебная литература
- Зарубежные детские книги
- Детский фольклор
- Буквари
- Книги для подростков
- Школьные учебники
- Внеклассное чтение
- Книги для дошкольников
- Детская познавательная и развивающая литература
- Детские детективы
- Домоводство, Дом и семья
- Юмор
- Документальные книги
- Бизнес
- Тайм-менеджмент
- Кадровый менеджмент
- Экономика
- Менеджмент и кадры
- Управление, подбор персонала
- О бизнесе популярно
- Интернет-бизнес
- Личные финансы
- Делопроизводство, офис
- Маркетинг, PR, реклама
- Поиск работы
- Бизнес
- Банковское дело
- Малый бизнес
- Ценные бумаги и инвестиции
- Краткое содержание
- Бухучет и аудит
- Ораторское искусство / риторика
- Корпоративная культура, бизнес
- Финансы
- Государственное и муниципальное управление
- Менеджмент
- Зарубежная деловая литература
- Продажи
- Переговоры
- Личная эффективность
- Торговля
- Научные и научно-популярные книги
- Биофизика
- География
- Экология
- Биохимия
- Рефераты
- Культурология
- Техническая литература
- История
- Психология
- Медицина
- Прочая научная литература
- Юриспруденция
- Биология
- Политика
- Литературоведение
- Религиоведение
- Научпоп
- Психология, личное
- Математика
- Психотерапия
- Социология
- Воспитание детей, педагогика
- Языкознание
- Беременность, ожидание детей
- Транспорт, военная техника
- Детская психология
- Науки: разное
- Педагогика
- Зарубежная психология
- Иностранные языки
- Филология
- Радиотехника
- Деловая литература
- Физика
- Альтернативная медицина
- Химия
- Государство и право
- Обществознание
- Образовательная литература
- Учебники
- Зоология
- Архитектура
- Науки о космосе
- Ботаника
- Астрология
- Ветеринария
- История Европы
- География
- Зарубежная публицистика
- О животных
- Шпаргалки
- Разная литература
- Боевые искусства
- Прочее
- Периодические издания
- Фанфик
- Военное
- Цитаты из афоризмов
- Гиды, путеводители
- Литература 19 века
- Зарубежная образовательная литература
- Военная история
- Кино
- Современная литература
- Военная техника, оружие
- Культура и искусство
- Музыка, музыканты
- Газеты и журналы
- Современная зарубежная литература
- Визуальные искусства
- Отраслевые издания
- Шахматы
- Недвижимость
- Великолепные истории
- Музыка, танцы
- Авто и ПДД
- Изобразительное искусство, фотография
- Истории из жизни
- Готические новеллы
- Начинающие авторы
- Спецслужбы
- Подростковая литература
- Зарубежная прикладная литература
- Религия и духовность
- Старинная литература
- Справочная литература
- Компьютеры и Интернет
- Блог
Умный менеджмент - Jochen Reb
Шрифт:
Интервал:
Закладка:
Рисунок 12.3
В задаче отбора персонала дельта-индукция выбирала лучшего кандидата чаще, чем алгоритмы машинного обучения. Это преимущество сохранялось независимо от того, были ли возможности для обучения скудными, умеренными или широкими (случайные выборки размером 30, 100 и 1000 соответственно), но оно было особенно выражено, когда возможности были скудными или умеренными. По материалам Luan et al. (2019).
В отличие от исследований эвристик хиатуса и мультипликатора, о которых говорилось ранее, мы не выводили параметры эвристики дельта-инференции (т. е. порядок поиска подсказок и дельту в каждой подсказке) из опыта менеджеров. Вместо этого мы использовали подход, основанный на данных, подобно тому, как разрабатываются большинство алгоритмов машинного обучения. В свете результатов этого исследования (и многих других, о которых рассказывается в этой книге) мы советуем аналитикам данных всегда помнить о том, что простые эвристики могут работать не хуже или лучше сложных алгоритмов в условиях неопределенности, и призываем их опробовать такие модели на своих собственных данных. В последние годы сообщество специалистов по машинному обучению повторяет это мнение. 14
Выявление кредитов с высоким уровнем риска
К третьему кварталу 2022 года общая стоимость неработающих кредитов в китайских коммерческих банках составила 3 трлн юаней (примерно 426 млрд долларов). 15 Это только официальная цифра - реальная, скорее всего, выше. Как банки могут принимать более эффективные решения о выдаче кредитов? Сотрудница одного из нас (Луань) более десяти лет проработала в одном из крупнейших банков Китая, специализируясь на выдаче кредитов малым и средним компаниям. Она собрала данные о 411 компаниях, которым банк выдал кредит и о результатах выплат которых (т. е. своевременных или просроченных) было известно. Она выявила семнадцать признаков, которые обычно проверяются в заявках на получение кредита, и кодифицировала эти признаки для каждой компании. Как банки могут использовать эти признаки для отнесения заявок на кредит к категории высокого или низкого риска? 16
Сначала мы набрали девятнадцать менеджеров банков, чтобы установить базовый уровень эффективности. В среднем эти менеджеры имели более чем десятилетний опыт работы в кредитном бизнесе. Мы дали каждому менеджеру по двадцать кредитных заявок, каждая из которых содержала значения семнадцати признаков. Затем мы попросили их классифицировать заявки как "высокорискованные" (отклонить) или "низкорискованные" (одобрить). Во-вторых, мы построили быстрые и экономные деревья для этой задачи классификации, используя четыре признака, которые в наибольшей степени свидетельствовали о хороших результатах кредитования. Для четырех признаков, расположенных в одинаковом порядке, можно построить восемь быстрых и экономных деревьев (для трех признаков - четыре дерева; см. рисунок 4.3 в главе 4). Эти деревья различаются балансом между двумя возможными ошибками: ложноположительными (принятие приложения, которое впоследствии откажется работать) и ложноотрицательными (отклонение приложения, которое не откажется работать). На нижней панели рисунка 12.4 эти восемь деревьев расположены на кривой приемника-оператора. Эта кривая соединяет отдельные деревья, которые отличаются тем, как они балансируют две возможные ошибки. В целом деревья, расположенные в левой части кривой приемника-оператора, уменьшают количество ложноположительных результатов ценой увеличения количества ложноотрицательных результатов, в то время как деревья, расположенные в правой части, уменьшают количество ложноотрицательных результатов ценой увеличения количества ложноположительных результатов. Взгляд на кривую показывает, что ни самое левое дерево (то есть FFTHHH), ни четыре самых правых дерева не обеспечивают разумного баланса между двумя ошибками; таким образом, выбор банка должен быть сделан среди трех оставшихся деревьев, два из которых показаны на верхней панели рис. 12.4.
Рисунок 12.4
Банковские менеджеры могут улучшить свои решения о выдаче кредитов, используя быстрые и экономные деревья. Кроме того, прозрачные быстрые и экономные деревья работают так же хорошо, как и более сложные и непрозрачные алгоритмы машинного обучения. На верхней панели показаны два дерева, на нижней - кривая приемника-оператора для всех восьми возможных деревьев, а также производительность менеджеров банка и восьми алгоритмов машинного обучения. Каждое "быстрое и экономное" дерево состоит из четырех подсказок, расположенных в одном и том же порядке, а выход с высоким риском отмечает компании, которые с большей вероятностью могут объявить дефолт, тем самым предлагая принять решение "отклонить". Деревья названы по типам выходов в первых трех подсказках; например, FFTHHL имеет три выхода, указывающих на "высокий риск", "высокий риск" и "низкий риск" соответственно. Показатели истинных и ложных срабатываний банковских менеджеров были основаны на 380 решениях, принятых девятнадцатью менеджерами. FFT = быстрое и экономное дерево; LR = логистическая регрессия со штрафом L2; KNN = k-nearest neighbor; NB = naive Bayes; CART = дерево классификации и регрессии; RF = случайный лес; AB = адаптивный бустинг; NN = нейронная сеть; SVM = супорт-векторная машина. По данным Li et al. (2022).
Например, менеджер банка, использующий дерево, показанное на левой верхней панели, сначала спросит, содержит ли кредитная история недостатки; если да, заявка классифицируется как высокорискованная и отклоняется. Если нет, то задается второй вопрос о том, составляет ли соотношение сбережений к кредиту менее 5 процентов; если да, то заявка классифицируется как высокорискованная. Если нет, задается третий вопрос, и так далее. Обратите внимание, что первые два выхода относятся к "высокому риску", что помогает менеджерам избежать ложных срабатываний. Напротив, в дереве на панели справа вверху только первый выход является "высокорискованным", что позволяет получить больше ложных срабатываний, но при этом добиться более высокого показателя истинных срабатываний (т. е. избежать ложноотрицательных результатов).
Сплошная диагональная линия на нижней панели рисунка 12.4 представляет собой случайную характеристику. Например, если все кредиты приняты, то коэффициент ложноположительных и истинно-положительных результатов равен 1, что соответствует точке в правом верхнем углу. Если случайным образом принимается половина кредитов, то коэффициент ложноположительных и истинно-положительных результатов равен 0,5. Видно, что результаты работы менеджеров банка лишь немного превышают случайность. Они могли бы работать гораздо лучше, если бы использовали одно из быстрых и экономных деревьев, о которых говорилось в этой статье.
Могут ли сложные и непрозрачные методы машинного обучения принимать лучшие решения по кредитам, чем прозрачные быстрые и экономные деревья? Мы протестировали восемь мощных алгоритмов машинного обучения, включая SVM, случайный лес и нейронные сети. Эти алгоритмы используют все семнадцать признаков и весов и добавляют их зачастую сложными способами. На нижней панели рисунка 12.4 показано, что в среднем они не достигают лучшей производительности, чем быстрые и экономные деревья. Если судить по метрике d′, которая уравновешивает количество ложных и истинных срабатываний, то производительность алгоритмов машинного обучения и быстрых и