bannerbannerbanner
Теория игр. Искусство стратегического мышления в бизнесе и жизни

Барри Дж. Нейлбафф
Теория игр. Искусство стратегического мышления в бизнесе и жизни

Игроки Cornhuskers вступили в борьбу за победу, пытаясь добиться перевеса в два очка. Ирвин Фриар получил мяч, но не смог доставить его в очковую зону соперника. Команды Майами и Небраски завершили тот год с равными результатами. Но поскольку команда Майами победила Небраску в финальном матче, именно эта команда заняла первое место в турнирной таблице.

Поставьте себя на место тренера Осборна. Вы смогли бы добиться большего?

Анализ примера

Многие болельщики обвиняли Осборна в том, что он попытался добиться победы, вместо того чтобы довольствоваться ничьей. Но нас интересует не этот вопрос. Осборн был готов пойти на риск, чтобы одержать победу, но он сделал это неправильно. Он добился бы большего, если бы его команда сначала попыталась заработать два очка, доставив мяч в очковую зону. Если бы удалось это сделать, команда могла бы попытаться забить гол и получить еще одно очко; в случае неудачи следовало бы сделать еще одну попытку заработать два очка после тачдауна.

Давайте глубже проанализируем эту ситуацию. Когда команда Осборна проигрывала 14 очков, он уже тогда знал, что ему необходимо заработать два тачдауна и три дополнительных очка. Он решил заработать сначала одно очко, а затем еще два. Если бы обе попытки оказались успешными, порядок, в котором они предпринимались, не имел бы значения. Если бы гол, который обеспечивал одно очко, не был забит, а двухочковая доставка мяча в очковую зону завершилась удачно, то порядок тоже не имел бы значения, поскольку матч закончился бы вничью и команда Небраски получила титул чемпиона. Порядок игры имел бы значение только в том случае, если бы команда Небраски сделала неудачную попытку заработать два очка. Согласно плану Осборна это привело команду Небраски к поражению не только в финальном матче, но и во всем чемпионате. Если бы вместо этого команда попыталась заработать сначала два очка, тогда даже неудачная попытка не обязательно привела бы к поражению. Счет остался бы 31:23. Заработав следующий тачдаун, команда сократила бы разрыв и счет стал бы 31:29. Успешная попытка заработать два очка после тачдауна обеспечила бы команде Небраски ничью, и она заняла бы первое место![65]

Мы слышали и контраргумент: если бы Осборн решил сначала заработать два очка, но эта попытка оказалась неудачной, это означало бы, что его команда играет на ничью. В связи с этим команда рисковала утратить моральный дух, и тогда она вряд ли заработала бы второй тачдаун. С другой стороны, если бы команда разыгрывала два решающих очка в самом конце матча, игроки осознавали бы, что на карту поставлено все, и действовали бы соответственно. Этот аргумент ошибочен по нескольким причинам. Во-первых, если бы команда Небраски попыталась заработать два очка только после второго тачдауна и эта попытка оказалась бы неудачной, она проиграла бы. Но если бы команде не удалось заработать два очка после первого тачдауна, у нее все еще оставался бы шанс на ничью. И хотя этот шанс мог оказаться еще меньше, «что-то» – это больше, чем ничего. Аргумент о динамике игры тоже несостоятелен. Хотя команда Небраски действительно могла бы активизировать наступление в финальной игре чемпионата, можно ожидать, что команда Майами усилила бы при этом свою защиту. Этот матч был важен для обеих команд. Что касается наступательного порыва, то если бы команда Осборна заработала два очка после первого тачдауна, это увеличило бы ее шансы заработать еще один тачдаун. Кроме того, это позволило бы команде закончить матч вничью, забив три гола в ворота соперника.

Один из общих выводов этой истории заключается в следующем: если вам приходится рисковать, в большинстве случаев лучше сделать это как можно скорее. Это очевидно для тех, кто играет в теннис: всем известно, что нужно рисковать на первой подаче, а вторую следует делать более осторожно. В таком случае, если первая попытка закончится неудачей, это не значит, что все потеряно. У вас еще есть время для других действий, которые помогут наверстать упущенное или даже продвинуться вперед. Такой подход (идти на риск как можно раньше) применим во многих областях жизни, будь то выбор карьеры, инвестиции или романтические свидания.

Для того чтобы лучше освоить принцип «смотреть вперед и рассуждать в обратном порядке», ознакомьтесь со следующими учебными примерами, приведенными в главе 14: «Как выбрать самое лучшее место»; «Красное – я выигрываю, черное – ты проигрываешь»; «“Отпугиватель акул” с обратным эффектом»; «Жесткий человек, мягкое предложение»; «Трехсторонняя дуэль»; «Выиграть, не зная как».

Глава 3. Решение дилеммы заключенных

Много контекстов – одна концепция

Что общего между следующими ситуациями?

• Две заправочные станции или два супермаркета, расположенных в непосредственной близости друг от друга, время от времени начинают жесткие ценовые войны между собой.

• Во время предвыборной кампании как Демократическая, так и Республиканская партия США часто придерживаются центристской политики, пытаясь привлечь на свою сторону избирателей, не определившихся со своими предпочтениями; при этом они игнорируют основных сторонников, придерживающихся крайних левых и крайних правых взглядов.

• «Разнообразие и продуктивность рыбного промысла в Новой Англии достигли беспрецедентного уровня. Однако сформировавшаяся за прошедшее столетие тенденция чрезмерного промысла привела к вымиранию одного вида рыбы за другим. Атлантический палтус, морской окунь, треска, желтохвостая камбала… пополнили ряды тех видов, которые считаются сейчас вымершими с точки зрения коммерческого промысла»[66].

• В конце известного романа Джозефа Хеллера Catch-22[67] Вторая мировая война уже почти завершилась. Йоссариан не хочет быть среди тех, кто погибнет последним: это уже никак не повлияет на исход войны. Он объясняет это майору Денби, старшему по званию офицеру. Денби спрашивает его: «Но, Йоссариан, представь себе, что получится, если каждый американец станет рассуждать подобным образом?» Йоссариан отвечает ему: «Только круглый дурак рассуждает иначе. Разве я не прав?»[68].

Ответ: все это примеры дилеммы заключенных[69]. Как и во время допроса Дика Хикока и Перри Смита (героев романа «Хладнокровное убийство», о которых шла речь в главе 1), у каждого участника игры есть свои причины сделать то, что повлечет за собой неблагоприятные последствия для обоих, поскольку каждый из них отслеживает только собственные интересы. Если один признается в совершении преступления, другому тоже лучше признаться, чтобы избежать сурового приговора; если один решит воздержаться от признания, другой сможет значительно облегчить свою участь, если признается. В действительности заключенные испытывают в подобной ситуации настолько сильное давление, что у них появляется желание признать свою вину независимо от того, виновны они (как в романе «Хладнокровный убийца») или невиновны, но полиция сфабриковала против них дело (как в фильме «Секреты Лос-Анджелеса»).

 

То же самое происходит и с ценовыми войнами. Если автозаправочная станция Nexon назначит низкую цену, Lunaco тоже лучше снизить цены, чтобы не потерять клиентов; если Nexon берет высокую цену за свой бензин, Lunaco может привлечь многих покупателей на свою сторону, снизив цену. Но если обе заправочные станции будут продавать бензин по низкой цене, ни одна из них ничего не заработает (хотя клиентам такая цена только на руку).

Если демократы примут предвыборную платформу, ориентированную на сторонников центристской политики, республиканцы рискуют потерять всех этих избирателей, а значит, и проиграть выборы, если будут работать только со своими основными сторонниками из числа борцов за экономические и социальные права; если демократы станут опекать только своих основных сторонников из числа представителей национальных меньшинств и профсоюзов, тогда республиканцы смогут привлечь на свою сторону умеренных избирателей, а значит, победить в выборах со значительным перевесом голосов, придерживаясь более центристской позиции.

Если все рыболовы будут ловить рыбу в умеренных количествах, большой улов одного рыболова не истощит рыбные ресурсы; если же все остальные начнут активно увеличивать промысел, тогда любой отдельный рыболов поступил бы глупо, пытаясь в одиночку охранять рыбные ресурсы[70]. В итоге происходит чрезмерный вылов рыбы и некоторые виды вымирают.

В романе «Уловка-22» именно логика Йоссариана делает таким трудным дальнейшее участие в уже проигранной войне.

Немного истории

Как специалисты по теории игр изобрели и назвали эту игру, которая охватывает так много аспектов экономического, политического и социального взаимодействия? Это произошло еще на начальном этапе истории развития дисциплины. Гарольд Кун, который и сам был одним из пионеров теории игр, рассказал об этом на симпозиуме, который проводился в рамках церемоний вручения Нобелевской премии за 1994 год.

Весной 1950 года Альберт Такер, будучи в отпуске, приехал в Стэнфорд, а поскольку там не хватало кабинетов, его разместили в кабинете кафедры психологии. Однажды кто-то из психологов постучал к нему в дверь и спросил, чем он занимается. Такер ответил: «Я работаю над теорией игр». Психолог спросил, не согласится ли он провести семинар по этой теме. Для этого семинара Такер и придумал дилемму заключенного в качестве примера, иллюстрирующего теорию игр, равновесие Нэша, а также парадоксы, сопутствующие равновесиям, нежелательным с точки зрения общества. Поскольку это был поистине фундаментальный пример, он стал темой десятков научных работ и ряда серьезных книг[71].

Другие ученые рассказывают несколько иную историю. По их мнению, математическая структура игры была описана еще до Такера двумя математиками – Меррилом Фладом и Мелвином Дрешером из Rand Corporation (исследовательский центр, который был в свое время оплотом холодной войны)[72]. Гениальность Такера заключалась в том, что он придумал историю, иллюстрирующую математические выкладки. И это действительно было гениально, поскольку подача идеи может решить ее судьбу: запоминающаяся презентация способствует быстрому распространению идеи среди мыслящих людей, тогда как скучная и сухая – может привести к тому, что идея не получит должного внимания или вообще будет забыта.

Визуальное представление

Мы проиллюстрируем метод решения этой игры примером из бизнеса. Две конкурирующие компании посылочной торговли – Rainbow’s End и B. B. Lean – специализируются на торговле одеждой. Каждую осень они печатают и рассылают зимние каталоги. Обе компании должны придерживаться тех цен, которые указаны в их каталогах, на протяжении всего зимнего сезона. Период подготовки каталогов гораздо более продолжителен, чем окно для их рассылки, поэтому обе компании должны принимать решения о ценах одновременно, не имея никакой информации о решениях конкурента. В обеих компаниях знают, что их каталоги рассчитаны на общую аудиторию потенциальных покупателей, которые умеют делать покупки с умом и ищут низкие цены.

Как правило, в обоих каталогах публикуется практически идентичный ассортимент товаров. Предположим, один из таких товаров – рубашка из высококачественной ткани шамбре. Такая рубашка обходится каждой компании в 20 долларов[73]. По оценкам обеих компаний, если каждая из них назначит за этот товар цену 80 долларов и продаст 1200 единиц, это обеспечит прибыль в размере (80–20) × 1200 = 72 000 долларов. Кроме того, оказалось, что это наилучшая цена для обеих компаний: если они смогут договориться о том, чтобы назначить одинаковую цену, 80 долларов – это та цена, которая обеспечит обеим максимальную прибыль.

В каждой из компаний подсчитали, что если одна из них снизит цену на 1 доллар, а другая оставит ее неизменной, то компания, снизившая цену, привлечет 100 покупателей: 80 покупателей, перешедших от другой компании, и 20 новых (например, тех, кто решил приобрести рубашку, которую не стали бы покупать по более высокой цене, или покупателей, пожелавших заказать товар по каталогу, вместо того чтобы покупать его в местном торговом центре). Таким образом, у каждой компании есть соблазн назначить более низкую цену, чтобы привлечь больше покупателей. Цель всей этой истории – разобраться в том, чем может обернуться такое решение.

Начнем с предположения о том, что обеим компаниям предстоит выбрать одну из двух цен: 80 и 70 долларов[74]. Если одна компания снизит цену до 70 долларов, а другая оставит цену 80, первая компания привлечет на свою сторону 1000 покупателей, тогда как вторая потеряет 800. Следовательно, компания, снизившая цену, продаст 2200 рубашек, а у другой компании объем продаж сократится до 400 единиц; прибыль составит (70–20) × 2200 = 110 000 долларов у компании, снизившей цену, и (80–20) × 400 = 24 000 – у другой компании.

Что произойдет, если обе компании одновременно снизят цену до 70 долларов? При снижении цены на 1 доллар у компаний останутся имеющиеся покупатели и появятся по 20 новых. Следовательно, если обе компании снизят цену на 10 долларов, каждая из них продаст на 10 × 20 = 200 единиц товара больше предыдущих 1200 единиц. Таким образом, каждая компания продаст по 1400 единиц товара и получит прибыль в размере (70–20) × 1400 = 70 000 долларов.

Представим возможную прибыль обеих конкурирующих компаний в наглядном виде. Мы не можем использовать для этого дерево игры наподобие тех деревьев, которые приведены в главе 2. В данном примере два игрока действуют одновременно. Ни один из них не может сделать очередной ход, опираясь на информацию о том, что сделал другой игрок или какой ответный ход он может предпринять. Вместо этого каждый игрок должен анализировать, о чем в это же время думает другой игрок. Отправная точка для таких «рассуждений о рассуждениях» состоит в том, чтобы отобразить в наглядном виде все последствия каждой комбинации возможных вариантов выбора, который могут одновременно сделать обе компании. Поскольку у каждой из них только одна альтернатива: 80 или 70 долларов, это значит, что существует четыре возможные комбинации. Проще всего отобразить их в виде таблицы, состоящей из столбцов и строк, которую мы будем называть таблицей игры, или таблицей выигрышей. Выбор Rainbow’s End (сокращенно RE) будет отображен в строках этой таблицы, а выбор B. B. Lean (BB) – в столбцах. В каждой из четырех ячеек таблицы, соответствующих каждому выбору RE в строке и BB в столбце, содержатся две цифры, обозначающие прибыль каждой компании от продажи рубашки (в тысячах долларов). Цифра, расположенная в левом нижнем углу ячейки, соответствует тому игроку, для которого выделены строки; цифра в правом верхнем углу ячейки – игроку, для которого выделены столбцы[75]. На языке теории игр эти цифры называются выигрышем[76]. Для того чтобы внести полную ясность в то, какие выигрыши соответствуют каждому из игроков, в представленной таблице соответствующие фрагменты ячеек выделены разными оттенками серого цвета.


Прежде чем приступить к поиску решения этой игры, мы хотели бы обратить ваше внимание на один ее аспект. Сравните пары выигрышей в четырех ячейках. Лучший результат для RE не всегда означает худший результат для ВВ, и наоборот. В частности, для обеих компаний ситуация в левой верхней ячейке лучше, чем в правой нижней. В конце этой игры не обязательно должен быть победитель и проигравший: это не игра с нулевой суммой. В главе 2 мы уже говорили о том, что инвестиционная игра Чарли Брауна тоже не относится к категории игр с нулевой суммой, как и большинство игр, с которыми мы сталкиваемся в реальной жизни. Во многих играх, таких как дилемма заключенных, главный вопрос заключается в том, как избежать проигрыша или добиться выигрыша обеих сторон.

 
Дилемма

Проанализируем ход рассуждений менеджера компании RE. «Если ВВ выберет 80 долларов, я могу получить 110 тысяч долларов вместо 72 тысяч, снизив цену до 70 долларов. Если ВВ выберет 70 долларов, мой выигрыш составит 70 тысяч, если я тоже назначу эту цену, и только 24 тысячи долларов, если я оставлю цену 80. Для меня более выгодный вариант (в действительности самый выгодный, поскольку у меня только одна альтернатива) остается неизменным, что бы ни решили в ВВ. Следовательно, мне вообще не нужно думать о том, что думают они; мне просто нужно первым назначить цену 70 долларов».

Если в игре с параллельными ходами есть такое свойство (а именно оптимальный выбор игрока не зависит от выбора других игроков), это существенно упрощает рассуждения игроков, а также анализ, который делают специалисты по теории игр в подобных случаях. Следовательно, наличие такого свойства существенно упрощает решение игры. Специалисты по теории игр обозначают его термином «доминирующая стратегия». Говорят, что у игрока есть доминирующая стратегия, если эта стратегия лучше всех остальных стратегий независимо от того, какую стратегию или сочетание стратегий выберет другой игрок или игроки. Существует простое правило участия в играх с параллельными ходами[77]:

ПРАВИЛО № 2: если у вас есть доминирующая стратегия, примените ее.

Дилемма заключенных – еще более специфичная игра: в ней доминирующая стратегия есть не у одного, а у обоих игроков (или у всех игроков). Менеджер компании ВВ рассуждает точно так же, как менеджер RE; для того чтобы хорошо усвоить эту идею, вы должны самостоятельно проанализировать ход рассуждений менеджера ВВ. Сделав это, вы увидите, что цена 70 долларов – это доминирующая стратегия и для компании ВВ.

Результат применения такой стратегии отображен в правой нижней ячейке таблицы игры: обе компании назначают цену 70 долларов и получают прибыль по 70 тысяч долларов каждая. Необходимо обратить внимание на следующий аспект дилеммы заключенных, который делает ее настолько важной игрой. Когда каждый из игроков применяет свою доминирующую стратегию, оба получают худший результат по сравнению с тем, что они получили бы, если бы доверились друг другу и договорились о том, что каждый выберет другую, доминируемую стратегию. В нашем примере это означало бы, что каждая компания назначит на свой товар цену 80 долларов, для того чтобы получить результат, отображенный в верхней левой ячейке матрицы игры, а именно прибыль в размере 72 тысячи долларов[78].

Для этого было бы недостаточно, чтобы только одна компания назначила на свой товар цену 80 долларов: это повлекло бы за собой очень плохие последствия для этой компании. Так или иначе, обе компании должны назначить высокую цену, чего очень трудно добиться на практике, учитывая существующий у каждой из них соблазн назначить более низкую цену, чем у конкурента. Если обе компании будут преследовать свои эгоистические интересы, они не смогут получить наилучший результат для них обеих. Такой вывод противоречит тому, чему учат нас классические экономические теории, начиная с теории Адама Смита[79].

Это вызывает ряд вопросов, часть которых связана с более общими аспектами теории игр. Что произойдет, если доминирующая стратегия будет только у одного участника игры? Что если ни у одного игрока не окажется доминирующей стратегии? Если оптимальный выбор каждого игрока зависит от того, что в это же время выбирает другой игрок, могут ли они разгадать выбор друг друга и найти решение этой игры? Мы проанализируем ответы на эти вопросы в следующей главе, в которой рассматривается более общий подход к решению игр с параллельными ходами, а именно равновесие Нэша. В данной главе сосредоточимся на решении дилеммы заключенных.

В обобщенном описании дилеммы заключенных две стратегии, имеющиеся в распоряжении каждого игрока, обозначаются так: «сотрудничать» и «предать» (или в некоторых случаях – «обмануть»); мы будем придерживаться именно этих терминов. Предательство – это доминирующая стратегия для каждого игрока; если оба игрока выберут эту стратегию, их выигрыш будет меньше, чем в случае выбора стратегии сотрудничества.

Предварительные соображения по поводу решения дилеммы заключенных

У игроков, столкнувшихся с дилеммой заключенных, есть веские основания для достижения договоренности о совместных действиях, которые позволили бы уйти от ее решения. Например, в Новой Англии рыболовы могут согласиться на ограничение улова ради сохранения рыбных ресурсов на будущее. Проблема состоит только в том, как обеспечить выполнение таких договоренностей в условиях, когда каждая сторона испытывает соблазн обмануть другую (например, выловить рыбы больше, чем позволяет квота). Что говорит теория игр по этому поводу? И что происходит в таких случаях в реальной жизни?

С тех пор как дилемму заключенных сформулировали впервые, прошло более пятидесяти лет. За это время были усовершенствованы теоретические основы этой дилеммы, а также накоплен большой объем данных, полученных как в процессе наблюдений за тем, что происходит в реальной жизни, так и в ходе лабораторных экспериментов. Давайте проанализируем этот материал и посмотрим, какие уроки мы можем из него извлечь.

У стратегии сотрудничества есть обратная сторона: стремление избежать предательства. Игрока можно заинтересовать в том, чтобы он выбрал стратегию сотрудничества вместо доминирующей стратегии предательства, пообещав ему достаточное вознаграждение. Кроме того, его можно удержать от применения стратегии предательства с помощью адекватного наказания.

Метод вознаграждения проблематичен по нескольким причинам. Вознаграждение может носить внутренний характер: один игрок платит другому за выбор стратегии сотрудничества. В иных случаях вознаграждение может быть внешним: третья сторона, заинтересованная в сотрудничестве между двумя игроками, платит им за выбор этой стратегии. Как бы там ни было, вознаграждение нельзя предоставлять игроку, пока он не сделает свой выбор, в противном случае он просто положит его себе в карман, после чего откажется выполнять договоренность. С другой стороны, если вознаграждение просто обещают, игрок может не поверить этому обещанию: когда он выберет стратегию сотрудничества, не исключено, что тот, кто дал это обещание, нарушит его.

Однако, несмотря на все эти трудности, вознаграждение бывает действенным и полезным. Проявив максимум креативности и воображения, игроки могли бы одновременно дать друг другу обещания и сделать их заслуживающими доверия, поместив обещанное вознаграждение на счете условного депонирования, который контролирует третья сторона[80]. В реальной жизни чаще складывается иная ситуация: поскольку игроки взаимодействуют по нескольким направлениям, сотрудничество в одном из них вознаграждается ответной услугой в чем-то другом. Так, самки шимпанзе делятся едой или присматривают за чужими детенышами в обмен на помощь в уходе за шерстью. В некоторых случаях третья сторона может быть заинтересована в обеспечении сотрудничества в игре. Например, ради того чтобы положить конец конфликтам в разных странах мира, Соединенные Штаты Америки и Европейский союз иногда обещают участникам противостояния экономическую помощь в качестве вознаграждения за мирное решение конфликта. Именно таким способом Соединенные Штаты вознаградили Израиль и Египет за сотрудничество в рамках подписания Кэмп-Дэвидских мирных соглашений в 1978 году.

Более распространенный метод решения дилеммы заключенных – наказание. Он имеет прямое действие. В фильме «Секреты Лос-Анджелеса» сержант Эд Эксли обещает Лерою Фонтейну, одному из подозреваемых, что если он согласится стать государственным свидетелем, то получит более мягкий приговор, чем два других подозреваемых, Рэй Коутс и Тайрон Джонс. Но Лерой знает, что, когда он выйдет из тюрьмы, его могут ждать на свободе друзья этих двоих!

Наказание, которое в данном контексте выглядит более естественным, оказывается возможным в связи с тем, что большинство подобных игр представляют собой часть непрерывного взаимодействия. Обман может обеспечить одному игроку краткосрочное преимущество, но навредит его взаимоотношениям с другим игроком и в долгосрочной перспективе обойдется гораздо дороже. Если цена достаточно велика, именно это может удержать игрока от обмана[81].

Наглядный пример такой ситуации предоставляет бейсбол. В Американской бейсбольной лиге питчеры попадают мячом в бэттеров на 11–17 процентов чаще, чем в Национальной бейсбольной лиге. По мнению профессоров Университета Юга в Суони Дага Драйнена и Джона-Чарльза Брэдбери, это обусловлено правилом о назначенном хиттере[82]. В Американской бейсбольной лиге питчеры не бьющие игроки. Следовательно, питчер Американской лиги, который попадает мячом в бэттера, может не бояться ответных действий со стороны питчера команды-соперника. Вероятность того, что мяч попадет в питчера, совсем небольшая, но она повышается в четыре раза, если он попал в кого-то в предыдущей половине иннинга. В таком случае страх получить ответный удар очевиден. Первоклассный питчер Курт Шиллинг объяснил это так: «Вы на самом деле готовы бросить в кого-то мяч, если играете против Рэнди Джонсона?»[83][84].

В ситуации, когда один игрок наказывает другого за обман, действует стратегия «око за око, зуб за зуб». Эта стратегия оказалась настоящим открытием, сделанным в ходе самого известного эксперимента с дилеммой заключенных. В следующем разделе вы узнаете об этом эксперименте и его уроках.

Стратегия равноценных ответных действий

В начале 1980-х годов политолог Мичиганского университета Роберт Аксельрод предложил специалистам по теории игр со всего мира разработать стратегии решения дилеммы заключенных в виде компьютерных программ. Они были распределены по парам, каждая из которых разыгрывала дилемму заключенных 150 раз. На основании набранных очков составили рейтинг программ, принимавших участие в турнире.

Победителем стал профессор математики университета в Торонто Анатолий Рапопорт. Его выигрышная стратегия оказалась одной из самых простых: «око за око, зуб за зуб». Для Роберта Аксельрода этот результат явился большой неожиданностью, поэтому он решил провести еще один турнир, увеличив число участников. Рапопорт и в этот раз подал программу, основанную на той же стратегии, – и снова победил.

Стратегия равноценных ответных действий – один из вариантов правила поведения «поступайте с другими так, как они поступают с вами»[85]. Если говорить более точно, эта стратегия подразумевает сотрудничество на первом этапе, после чего повторяются действия, которые предпринял соперник на предыдущем этапе.

По мнению Роберта Аксельрода, стратегия равноценных ответных действий опирается на четыре принципа, которые должны присутствовать в любой эффективной стратегии для повторяющейся дилеммы заключенных: понятность, доброжелательность, возмездие и прощение. Стратегия равноценных ответных действий очень проста и понятна: сопернику нет необходимости долго размышлять над вашим следующим ходом или просчитывать его. В основе такой стратегии лежит доброжелательность: она никогда не инициирует обман. В этой стратегии есть элемент возмездия: она не оставляет обман безнаказанным. Кроме того, эта стратегия стимулирует прощение: участники игры не держат зла друг на друга слишком долго и готовы возобновить сотрудничество.

Одна из самых впечатляющих характеристик стратегии равноценных ответных действий состоит в том, что она показала лучшие результаты по итогам всего турнира, хотя и не победила (и не могла победить) ни одну из конкурирующих стратегий в прямом противостоянии с ними. В лучшем случае эта стратегия может только сравнять счет с соперником. Следовательно, если бы Аксельрод оценивал каждую игру по принципу «победитель получает все», стратегия равноценных ответных действий имела бы на своем счету только проигрыши и ничьи, а значит, не добилась бы победы по итогам всего турнира[86].

Однако Аксельрод оценивал парные игры между компьютерными программами не по принципу «победитель получает все»: в его турнирах учитывался такой фактор, как готовность к сотрудничеству. Большое преимущество этой стратегии заключается в том, что она сближает соперников. В худшем случае эта стратегия может потерпеть поражение из-за одного предательства, но дальше – только ничья.

Стратегия равноценных ответных действий стала победителем этих соревнований именно потому, что стимулировала сотрудничество, не допуская при этом эксплуатации. Другие стратегии были либо слишком ориентированными на доверие и открытыми для эксплуатации, либо слишком агрессивными и побуждающими игроков выбивать друг друга из игры.

И все-таки мы считаем, что стратегия равноценных ответных действий – ошибочная. Малейший промах или неправильное толкование результатов приводят к полному провалу стратегии. Этот недостаток не был столь очевидным в искусственной среде соревнования между компьютерными программами, поскольку там просто исключались ошибки и неправильное толкование. Однако в случае применения этой стратегии в реальном мире ошибки и заблуждения неизбежны, а результат может оказаться катастрофическим.

Проблема стратегии равноценных ответных действий состоит в том, что обе стороны противостояния повторяют ошибки и заблуждения друг друга. Одна сторона наказывает другую за предательство, и это вызывает цепную реакцию. Соперник отвечает на наказание ответным ударом, который влечет за собой очередное наказание. В таком противостоянии может и не наступить момент, когда одна из сторон приняла бы наказание без ответного удара.

Предположим, Флад и Дрешер разыгрывают стратегию равноценных ответных действий. Поначалу ни один из них не идет на предательство, поэтому какое-то время все складывается хорошо. Затем, скажем, в 11-м раунде игры Флад по ошибке выбирает стратегию «предать» или останавливается на стратегии «сотрудничать», но Дрешер по ошибке считает, что Флад выбрал предательство. В любом случае Дрешер выберет в 12-м раунде ход «предать», но Флад выберет стратегию «сотрудничать», поскольку Дрешер выбрал сотрудничество в 11-м раунде. В 13-м раунде они поменяются ролями. Ситуация, когда один из игроков выберет сотрудничество, а другой – предательство, будет повторяться снова и снова до тех пор, пока очередная ошибка или заблуждение не восстановят сотрудничество между соперниками или не заставят каждого из них выбрать предательство.

Такие циклы или ответные удары часто наблюдаются во время реальных конфликтов между израильтянами и арабами на Ближнем Востоке, или между католиками и протестантами в Северной Ирландии, или между индусами и мусульманами в Индии. На границе между штатами Западная Вирджиния и Кентукки шла памятная вражда между Хэтфилдами и Маккоями. В художественной литературе тоже можно найти яркие примеры того, как такие действия могут привести к непрекращающемуся циклу ответных ударов, как в случае вражды между Грэнджерфордами и Шепердсонами в романе Марка Твена.

65Более того, это была бы ничья, полученная после неудачной попытки одержать победу, поэтому никто не стал бы критиковать Осборна за то, что он играл на ничью.
  Цитата взята из статьи «Краткая история рыбного промысла в Новой Англии» (Brief History of the Groundfishing Industry of New England), опубликованной на сайте правительства США: www.nefsc.noaa.gov/history/stories/groundfish/grndfsh1.html.
67В переводе Андрея Кистяковского – «Поправка-22»; в других переводах – «Уловка-22». Прим. пер.
68Хеллер Дж. Уловка-22. М.: Издательский концерн А-2, 1992; Хеллер Дж. Поправка-22. СПб.: Амфора, 2012.
69Нет никаких призов за правильный ответ, ведь дилемма заключенных – тема данной главы. Однако мы решили воспользоваться этой возможностью, чтобы обратить ваше внимание (как мы это сделали и в главе 2) на то, что общая концептуальная модель теории игр поможет понять ряд разнообразных и на первый взгляд несвязанных явлений. Мы должны также отметить, что расположенные по соседству магазины не ведут ценовые войны постоянно, а политические партии не всегда тяготеют к центристской позиции. Анализ и примеры того, как участники подобных игр могут избежать такой дилеммы или решить ее, – важная часть текущей главы.
70Биолог из Калифорнийского университета Гаррет Харлинг привлек всеобщее внимание к этой проблеме в своей знаменитой статье «Трагедия общин»: The Tragedy of the Commons, Science 162 (December 13, 1968): 1243–1248.
  The Work of John Nash in Game Theory, Nobel Seminar, December 8, 1994. Опубликовано на сайте http://nobelprize.org/nobel_prizes/economics/laureates/1994/nash-lecture.pdf.
72William Poundstone, Prisoner’s Dilemma (New York: Doubleday, 1992), 8–9; Sylvia Nasar, A Beautiful Mind (New York: Simon & Schuster, 1998), 118–19.
73Эта цена включает не только затраты на покупку рубашки и на китайского производителя, но и затраты на транспортировку в США, таможенные пошлины, а также на хранение товара до момента выполнения заказа. Иными словами, эта цена включает в себя все затраты, связанные с данным товаром.
74Уточнение, касающееся наличия у компаний только двух вариантов цены, необходимо только для того, чтобы описать аналитический метод решения таких игр самым простым способом. В следующей главе мы предоставим компаниям большую свободу действий в отношении выбора цен.
75Этот способ представления выигрыша обоих игроков в одной таблице, позволяющий четко разграничить, какой выигрыш соответствует каждому игроку, изобрел Томас Шеллинг. Он с излишней скромностью написал по этому поводу следующее: «Если меня когда-либо спросят, внес ли я какой-нибудь вклад в теорию игр, я отвечу… да, это метод расположения всех выигрышей в шахматном порядке в одной матрице». На самом деле Шеллинг разработал много других важных концепций теории игр: фокальные точки, достоверность, обязательство, угрозы и обещания, перелом и многое другое. В следующих главах мы будем часто ссылаться на Томаса Шеллинга и его работы.
76Как правило, чем больше значение выигрыша, тем лучше для игрока. Однако в некоторых случаях (как, например, в случае заключенных, находящихся под следствием) выигрыш измеряется в числе лет, которые им предстоит провести в тюрьме, поэтому каждый заключенный стремится получить как можно меньше лет. То же самое происходит в случае, если выигрыш – это место в рейтинге, где первое место – самое лучшее. Анализируя таблицу игры, необходимо прежде всего определить, как интерпретируется выигрыш в этой игре.
77В главе 2 мы предложили вашему вниманию общий принцип разработки оптимальных стратегий для игр с последовательными ходами. Это было наше правило № 1: смотрите вперед и рассуждайте в обратном порядке. В играх с параллельными ходами все не так просто. Тем не менее «рассуждения о рассуждениях», которые необходимы в играх с параллельными ходами, можно сформулировать в виде трех простых правил. Эти правила в свою очередь опираются на две простые концепции: доминирующие стратегии и равновесие. Правило № 2 представлено в данной главе; правила № 3 и 4 будут сформулированы в следующих главах.
78В действительности 80 долларов – это та сумма, которая обеспечивает обеим компаниям максимальную прибыль. Они могли бы назначить эту цену, если бы объединились и создали картель в своей отрасли. Строгое доказательство этого утверждения требует математических расчетов, поэтому просто поверьте нам на слово. Читатели, которые захотят ознакомиться с этими расчетами, могут получить доступ к ним на сайте книги.
79Разумеется, такое снижение цен выгодно потребителям, которые не являются активными участниками этой игры. Следовательно, в интересах общества в целом целесообразно сделать так, чтобы две компании не смогли решить дилемму ценообразования. В США и в других странах эту функцию выполняет антимонопольная политика.
80На основании этой идеи Джеймс Андреони и Хэл Вэриан разработали экспериментальную игру под названием Zenda. См. Preplay Communication in the Prisoners’ Dilemma, Proceedings of the National Academy of Sciences 96, no. 19 (September 14, 1999): 10933–10938. Мы проводили эту игру на занятиях и пришли к выводу, что она обеспечивает сотрудничество между игроками. Однако в реальных условиях достичь этого гораздо труднее.
81В 2005 году Роберт Ауман получил Нобелевскую премию по экономике за выдающийся вклад в разработку общей теории кооперации в повторяющихся играх.
  Об этом идет речь в их рабочем докладе Identifying Moral Hazard: A Natural Experiment in Major League Baseball, доступ к которому можно получить здесь: http://ddrinen.sewanee.edu/Plunk/dhpaper.pdf.
83Рэндалл Дэвид Рэнди Джонсон – американский профессиональный бейсболист. Скорость его подач часто превышала 160 км/ч. – Прим. ред.
84В то время Шиллинг был питчером команды Arizona Diamondbacks Национальной бейсбольной лиги, а обладатель приза Сая Янга Рэнди Джонсон – его товарищем по команде. Источник: Ken Rosenthal, “Mets Get Shot with Mighty Clemens at the Bat,” Sporting News, June 13, 2002.
85В книге «Исход» (21:22–25) сказано: «Когда дерутся люди, и ударят беременную женщину, и она выкинет, но не будет [другого] вреда, то взять с [виновного] пеню, какую наложит на него муж той женщины, и он должен заплатить оную при посредниках; а если будет вред, то отдай душу за душу, глаз за глаз, зуб за зуб, руку за руку, ногу за ногу, обожжение за обожжение, рану за рану, ушиб за ушиб». Новый Завет проповедует поведение, основанное на принципах сотрудничества. В Евангелии от Матфея (5:38–39) сказано: «Вы слышали, что сказано: око за око и зуб за зуб. А Я говорю вам: не противься злому. Но кто ударит тебя в правую щеку твою, обрати к нему и другую». Таким образом, мы перешли от правила «Поступайте с другими так, как они поступают с вами» к золотому правилу: «И как хотите, чтобы с вами поступали люди, так и вы поступайте с ними» (Евангелие от Луки 6:31). Если бы люди всегда придерживались золотого правила, дилеммы заключенных просто не существовало бы. Если мыслить более широко, становится очевидным следующий вывод: хотя сотрудничество может снизить ваш выигрыш в той или иной игре, возможное вознаграждение в жизни после смерти может сделать эту стратегию целесообразной даже для эгоиста. Вы считаете, что загробной жизни нет? Пари Блеза Паскаля гласит: если действовать, опираясь на это предположение, последствия могут оказаться катастрофическими, поэтому лучше выбрать другой вариант.
86Поскольку на каждого проигравшего приходится один победитель, это неизбежно приводит к тому, что у одного из участников соревнования окажется в итоге больше побед, чем поражений, а у других – больше поражений, чем побед. (Единственное исключение составляет ситуация, когда каждый поединок заканчивается вничью.)
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35 
Рейтинг@Mail.ru