Теория игр. Искусство стратегического мышления в бизнесе и жизни - Авинаш Диксит
Шрифт:
Интервал:
Закладка:
Равенство максимума минимальных значений (максимина) бьющего игрока и минимума максимальных значений (минимакса) вратаря – это и есть теорема фон Неймана – Моргенштерна о минимаксе в действии. Возможно, было бы правильнее назвать ее теоремой о равенстве максимина и минимакса, но общепринятое название короче и легче запоминается.
Неожиданные последствия изменений в смешанных стратегиях
Даже в играх с нулевой суммой равенство смешанных стратегий обладает на первый взгляд необычными свойствами. Вернемся к примеру с футбольным пенальти и предположим, что вратарь усовершенствует навыки отражения штрафных ударов, сделанных с естественной для него стороны (справа), что снизит показатель эффективности бьющего игрока с 70 до 60 процентов. Как это скажется на вероятности смешивания стратегий вратаря в разных пропорциях? Ответ на этот вопрос можно получить, сместив соответствующую линию на графике. Число позиций «слева» в равновесной смешанной стратегии вратаря увеличится с 41,7 до 50 процентов. Это означает, что, если вратарь усовершенствует навыки отражения штрафных ударов справа, он будет реже использовать эту сторону!
Хотя на первый взгляд это кажется странным, причина вполне понятна. Когда вратарь улучшает свою способность отбивать пенальти справа, бьющий игрок начнет реже делать удары справа от вратаря. В ответ на увеличение числа ударов слева вратарь увеличит долю стратегий «слева» в своей смешанной стратегии. Смысл укрепления слабых навыков в том, что вам не придется пользоваться ими так часто.
Вы можете проверить истинность этого утверждения, рассчитав долю ударов слева и справа в смешанной стратегии бьющего игрока после такого изменения навыков вратаря. Вы увидите, что доля ударов слева увеличится с 38,3 до 47,1 процента.
Работа вратаря над усилением навыка отражения ударов справа действительно принесет свои плоды: средний процент забитых мячей при равновесной смешанной стратегии снизится с 79,6 до 79,5.
Если хорошо подумать, этот кажущийся парадокс подчиняется обычной логике теории игр. То, что лучше всего для вас, зависит не только от вас самих, но и от действий других игроков. Именно к этому и сводится суть стратегической взаимозависимости.
Учебный пример: Джанкен на Ступеньках{83}
Действие происходит в суши-баре в деловой части Токио. Такаши и Уити сидят у стойки бара и пьют саке в ожидании своих заказов. Каждый из них заказал фирменное блюдо суши-бара – уни сашими (икра морского ежа). К сожалению, шеф-повар сообщает им, что у него осталась только одна порция этого блюда. Кто из двух молодых людей уступит другому?
В Америке эти двое могли бы подбросить монету. В Японии они скорее сыграют в игру джанкен, на Западе более известную как «камень, ножницы, бумага». Разумеется, к этому моменту вы уже стали настоящими экспертами по этой игре, поэтому для того, чтобы несколько усложнить задачу, мы используем здесь один из ее вариантов, который называется «джанкен на ступеньках».
В этот вариант джанкена играют на ступеньках. Как и обычно, игроки одновременно выбрасывают знаки камня, ножниц и бумаги. Но теперь победитель очередного раунда поднимается вверх по лестнице: на пять ступенек, если он сыграл «бумагой» (раскрытая ладонь с пятью пальцами), на две ступеньки – в случае «ножниц» (два пальца) и на одну ступеньку – если выбросил «камень» (пальцы сложены в кулак). В случае ничьей игра повторяется. Как правило, победителем становится тот, кто находится на верхней ступеньке лестницы. Мы немного упростим игру, приняв предположение, что цель каждого игрока – как можно больше опередить соперника.
Каким будет равновесное сочетание стратегий в этой версии игры джанкен?
Анализ примера
Поскольку с каждой очередной ступенькой победитель продвигается вперед, а проигравший отстает, это игра с нулевой суммой. Проанализировав все возможные пары ходов, получим матрицу игры. Выигрыши в этой таблице измеряются числом ступенек.
Как найти равновесное сочетание выбрасывания «бумаги», «ножниц» и «камня»? Мы уже рассказали о таких простых методах, как числовые расчеты и построение графика, которые применимы, когда у каждой стороны только одна альтернатива: удар справа и удар слева. Но в игре джанкен на ступеньках – три варианта выбора.
Прежде всего необходимо выяснить, какие стратегии войдут в состав равновесной смешанной стратегии. В данном случае важны все три варианта. Для того чтобы убедиться в этом, представьте себе, что Уити никогда не будет выбрасывать камень. В таком случае Такаши не станет играть бумагой; тогда Уити не будет выбрасывать ножницы. Если продолжить эту цепочку рассуждений, получится, что Такаши не будет использовать камень при условии, что Уити не использует бумагу. Если Уити никогда не будет выбрасывать камень, это сведет на нет все его стратегии, а значит, такое предположение было бы ложным. Аналогичные доводы подтверждают тот факт, что оставшиеся две стратегии тоже необходимо включить в смешанную стратегию Уити (и Такаши).
Теперь мы знаем, что в равновесной смешанной стратегии должны присутствовать все три стратегии. Остается выяснить, когда именно они будут использоваться. Игроки заинтересованы в получении максимального выигрыша, а не в смешивании стратегий ради самого смешивания. Уити готов использовать камень, ножницы и бумагу методом случайного выбора только при условии, что все три стратегии в равной степени привлекательны. (Если бы камень обеспечивал Уити более высокий выигрыш, чем ножницы или бумага, то ему следовало бы играть только камнем, но такая стратегия не была бы равновесной.) Таким образом, особый случай, когда все три стратегии обеспечивают Уити один и тот же ожидаемый выигрыш, определяет структуру равновесной смешанной стратегии Такаши.
Предположим, Такаши использует следующий принцип смешивания:
p = вероятность того, что Такаши выбросит бумагу;
q = вероятность того, что Такаши выбросит ножницы;
1 – (p + q) = вероятность того, что Такаши выбросит камень.
В таком случае, если Уити сыграет камнем, он будет отставать на пять ступенек, если Такаши сыграет бумагой (р), и выиграет одну ступеньку, если Такаши сыграет ножницами (q), а чистый выигрыш составит –5p + q. Точно так же Уити получит следующий выигрыш за счет каждой из своих стратегий:
Камень: –5p + 1q + 0(1 – (p + q)) = –5p + q.