Семь главных игр в истории человечества. Шашки, шахматы, го, нарды, скрабл, покер, бридж - Оливер Рейдер
Шрифт:
Интервал:
Закладка:
Помимо штудирования его научных работ, профессиональные игроки начали предпринимать попытки воспользоваться талантом Боулинга. «Профессионалы пронюхали, чем мы занимаемся», – сказал мне Ричард Гибсон, бывший аспирант Боулинга. Диссертация Гибсона называлась «Минимизация потерь в играх и разработка многопользовательских компьютерных программ чемпионского уровня, играющих в покер». Потери – это формализованное математическое понятие, применяемое, когда нужно принимать решения в условиях неопределенности, разница между оптимальным и фактическим решениями. Минимизация потерь является важной составляющей многих современных алгоритмов игры в покер. «Судя по всему, для них это представляло большую ценность. Они платили мне приличные деньги».
Высокая цена, которую может иметь хорошая покерная программа, является свидетельством того, что игра кардинально изменилась. Компьютерные программы стали практическим воплощением теории игр, разработанной Джоном Нэшом. Если в нашем примере с камнем-ножницами-бумагой вы делаете каждый ход рандомно, с вероятностью 1/3, противник не может распознать ваш паттерн и победить. Коль скоро вы непредсказуемы, вас невозможно эксплуатировать. В покере этого можно добиться за счет смешанных стратегий и диапазонов рук. Если я повышаю 100-долларовый префлоп в малом блайнде только при паре тузов, – это факт, который можно эксплуатировать. Чтобы этого избежать, я объединяю руки в диапазоны: повышаю $100, допустим, при тузах, королях и дамах. Более того, мне не следует всегда делать одно и то же с одним и тем же диапазоном рук – я должен смешивать стратегии и рандомизировать. Например, в двух третях случаев я повышаю ставку, а в одной трети – поддерживаю. Типовой результат хорошей коммерческой покерной программы – это большая многоцветная таблица, в которой представлены все 169 возможных стартовых рук, а также то, что с ними делать в течение какого-то процента времени. Известно даже, что некоторые покеристы используют секундную стрелку на своих часах в качестве устройства рандомизации.
В наше время игроки в покер называют такой стиль игры GTO (game-theory optimal) – теоретический игровой оптимум. Те, кто его придерживается, могут преспокойно надвигать на глаза капюшон худи и надевать большие наушники, так как, если овладеть этой системой в полной мере, можно напрочь игнорировать других игроков за столом. Их личные особенности и хитрости несущественны. Важно лишь то, что в конце концов они совершат ошибку, а вы выгадаете. Именно поэтому использующие GTO игроки нанимают программистов, которые корректируют все эти диапазоны и проценты с тем, чтобы найти и убрать из игры своих заказчиков все нюансы, которые могут эксплуатироваться.
Летом 2019 года Боулинг предоставил мне доступ к своей компьютерной программе DeepStack, в которой используются такие передовые алгоритмы ИИ, как повторяющийся процесс решения, интуитивный локальный поиск и нечто под названием «разреженные прогностические деревья». Программа была разработана Боулингом совместно с группой исследования покерных ботов и Чешским техническим университетом. Ее создатели утверждают, что это первая компьютерная программа, способная обыграть человека в безлимитном хедз-апе.
Солнечным днем я сел за лэптоп в своей бруклинской квартире, чтобы поиграть с программой DeepStack, имея в своем распоряжении лишь полуторакилограммовый мозг млекопитающего да кофейник с хорошим кофе. Мы с компьютером начали с 20 000 фишек каждый, при этом блайнды (обязательные ставки перед раздачей) стартовали с 50 и 100 фишек и повышались каждые 10 рук. Если бы матч продолжался 100 рук или более, предельные значения ставок составляли бы 1500 и 3000. Когда один из игроков выигрывал все фишки, он регистрировал очко и процесс начинался снова.
В течение нескольких дней DeepStack демонстрировала своеобразный стиль игры. Это был неистово агрессивный первый раунд торговли (префлоп), когда игрок видит только две карты у себя в руке. Она поднимала ставку снова и снова, практически при любой руке, иногда делала огромные олл-ины на ранней стадии и почти никогда не пасовала в малом блайнде. Но после флопа она значительно успокаивалась, точно приняв цифровой ксанакс[39], и вела, с моей точки зрения, пассивную игру. Я делал все возможное для эксплуатации того, что казалось мне тенденциями программы, поскольку так подсказывал мой инстинкт млекопитающего. Однако система разрабатывалась и обучалась с прицелом на исключение эксплуатации, на действия в соответствии с математическими правилами теории игр и базовую геометрии игры. «Главная задача DeepStack – максимально приблизиться к равновесной игре по Нэшу, то есть минимизировать возможность эксплуатации», – написано в научной работе, посвященной программе.
К собственному удивлению, я все же вымучил несколько побед и прекратил матч, когда опередил машину, выиграв 15 партий против ее 14. Как и Каспаров после первой игры с Deep Blue в 1996 году, я долго смотрел в потолок после матча, испытывая облегчение оттого, что обыграл машину.
Это ощущение длилось недолго. Вскоре после окончания нашего матча Боулинг прислал мне электронное письмо с разбором результатов: он проанализировал, какая часть моих успехов объяснялась мастерством, а какая – густым туманом рандомности, окутывающим безлимитный покер. Боулинг писал: «Вы можете рассчитывать на победу в 42 % (с погрешностью 5 %) матчей против DeepStack. Несмотря на выигрыш 15:14, ваша игра (если убрать элемент везенья) показывает, что вы должны были выиграть 12 матчей и проиграть 17». Вот так-то.
Если убрать элемент везенья. Удача или неудача – важнейшая составляющая игры. И хотя в долгосрочной перспективе везенье испаряется, в краткосрочной оно главенствует. Например, во время проведения Мировой серии по покеру (в которой я принимал участие) в районе Риджкреста, калифорнийского городка в пустыне, произошло землетрясение магнитудой 7,1 балла. Его толчки достигли Лас-Вегаса и нарушили ход Главного события. Игроку по имени Энди Франкенбергер сдали две карманные шестерки в малом блайнде перед тем, как в разгар розыгрыша руки его вместе с парой сотен других присутствующих эвакуировали из зала. Вскоре после этого Франкенбергер вернулся и увидел, что его рука сброшена, борд (общие карты) уже туз-шестерка-пятерка, а у его противника, который во время толчков продолжал играть, пара пятерок на закрытых картах.
Во время Второй мировой войны личному составу было выдано около 13 млн карточных колод. У моего дедушки, как и у миллионов других солдат, была колода, и он играл с сослуживцами в покер. Он никогда не рассказывал о том, что пережил в боях, но, вернувшись несколько лет спустя на свою ферму в Айове, частенько играл в пятикарточный дро-покер на речных судах, которые ходили по Миссисипи. Годы спустя он научил играть