Искусство мыслить рационально. Шорткаты в математике и в жизни - Маркус дю Сотой
Шрифт:
Интервал:
Закладка:
Чтобы узнать, какое минимальное количество данных требуется, чтобы сделать обоснованные выводы, можно использовать регрессионный анализ и правило одной десятой. Если мы рассматриваем 5 переменных, приблизительно 10 × 5 = 50 единиц информации должно быть достаточно, чтобы получить представление о том, как изменения этих параметров отражаются на продажах.
Но пользоваться такими шорткатами следует с осторожностью, потому что иногда они уводят в сторону. Чтобы получить пользу от коллективного разума, важно, чтобы коллектив был разнообразным; точно так же необходимо обеспечивать и разнообразие данных. Когда компания Amazon пыталась разработать искусственный интеллект, который помогал бы просеивать заявки претендентов на рабочие вакансии, она дала ему в качестве образца для поведения профили уже работающих сотрудников. Казалось бы, вполне разумное решение, учитывая, что до тех пор компанию вполне устраивал уровень ее сотрудников. Но, когда ИИ начал забраковывать все резюме, кроме присланных двадцатилетними белыми мужчинами, компания поняла, что алгоритм дискриминирует множество желающих получить в ней работу.
Выявлением таких алгоритмических шорткатов, которые приводят нас не к новым целям, а лишь к старым предрассудкам, занимается Лига алгоритмической справедливости (Algorithmic Justice League), которую основала Джой Буоламвини.
Также важно не отслеживать одновременно слишком много переменных, потому что чем больше их будет, тем с большей вероятностью в них можно будет найти какие-нибудь паттерны. Опасность работы со слишком большим количеством переменных проявилась, когда установку фМРТ (функциональной магнитно-резонансной томографии) использовали в эксперименте, в котором изучали 8064 области мозга, чтобы понять, какие из них могут быть задействованы, когда подопытному показывают разные выражения человеческого лица. Действительно, в 16 областях была обнаружена статистически значимая реакция. Вот только сканировали при этом мозг крупного атлантического лосося, причем мертвого. Исследователи использовали неодушевленные предметы, чтобы исключить из рассмотрения ложноположительные результаты. Но эта история показывает, как опасно просто проводить слишком много измерений, надеясь найти в результатах какие-нибудь паттерны. Исследователи получили за эту работу Шнобелевскую премию, которую присуждают за достижения, которые «заставляют сначала засмеяться, а потом – задуматься»[103].
Один из соавторов этого исследования, Крейг Беннет, объяснял: «Если вы бросаете дротики, имея 1-процентный шанс попасть в “яблочко”, и вы бросите один дротик, вероятность попадания будет равна одному проценту. Но, если вы бросите 30 000 дротиков, вы, скажем так, вероятно, попадете в цель хотя бы несколько раз. Чем больше у вас возможностей получить результат, тем больше вероятность, что вы его получите, даже если это произойдет случайно».
Сколько вам нужно данных, чтобы принять решение?
Телевизионная игра, которую я описал в начале этой главы, – это на самом деле хорошая модель многих задач, с которыми мы сталкиваемся в жизни. Первый человек, с которым у вас случился роман, может быть человеком прекрасным, но следует ли вам вступать с ним в брак или же вас преследует назойливое ощущение, что вы можете найти и кого-нибудь получше? На нем свет клином не сошелся; может быть, есть на свете кто-то, кто окажется «тем самым». Но, если бросить нынешнего партнера, пути назад, как правило, не будет. В какой же момент следует смириться с неизбежным и удовольствоваться тем, что есть?
Классический пример в этом роде дают поиски жилья. Сколько раз случалось так, что вы с первой же попытки находили превосходную квартиру, но потом вам казалось, что, прежде чем окончательно решиться, нужно посмотреть еще несколько вариантов, – и в результате первая прекрасная квартира от вас ускользала?
Ключом к оптимизации шансов на получение лучшего из возможных призов является второе по популярности в математике число – е = 2,71828… Подобно числу π, самому важному в математике, десятичная запись числа е бесконечна и не повторяется. Это число то и дело возникает в самых разных обстоятельствах. Оно есть и в великолепном уравнение Эйлера, объединяющем пять самых важных в математике чисел; я уже говорил о нем во второй главе. Кроме того, оно тесно связано с начислением процентов на вашем банковском счете.
Но, кроме того, число е оказывается шорткатом к получению наилучших шансов выбрать правильный ящик в нашей гипотетической телевизионной игре. Математика доказывает: чтобы составить некоторое представление о величине денежного приза при наличии N ящиков, нужно собрать данные по N/e из них. 1/e = 0,37… То есть речь идет о 37 процентах всех ящиков. После того, как вы их откроете, следует остановиться на том ящике, который будет лучше всех, уже открытых. Это не гарантирует, что вы получите самый большой приз, но в одном случае из трех у вас окажется наибольшая из возможных сумм. Если вы примете решение по результатам, увиденным в меньшем или большем числе ящиков, эта вероятность уменьшится. 37 процентов – оптимальное количество данных, которые нужно собрать перед принятием решения, идет ли речь о ящиках в телевизионной игре, квартирах, ресторанах или даже спутниках жизни. Хотя, когда речь идет о любви, возможно, будет лучше, если ваши избранники не узнают, насколько вы расчетливы.
Шорткат к шорткатам
Принятию решения о направлении, в котором следует развивать идеи нового проекта, во многих случаях помогает информация о личных предпочтениях. Хотя часто говорят, что данные – это новая нефть, все равно важно знать, сколько именно требуется этого топлива, чтобы идеи работали. В слишком большом количестве данных можно утонуть. Если их будет слишком мало, проект так и не сдвинется с места. Статистические шорткаты показывают, что иногда можно обойтись на удивление небольшой выборкой. Рациональные шорткаты играют очень важную роль и при сборе данных. Как показал Марк Твен, покраска забора в одиночку занимает долгое время, но, когда за работу берутся несколько человек, ее удается закончить гораздо быстрее. Работа коллективного разума помогает рождению новых идей, идет ли речь об организации опроса в Twitter, разработке сетевой игры, из которой можно извлекать данные, или определении популярности веб-сайта по данным Google Analytics.
Пит-стоп: Психотерапия
Когда я