Математики построили модель сотрудничества «заключённых».

Cыграем в игру?

Вы — преступник. Вы попались стражам порядка за свою деятельность и сидите в камере. По счастливой (или не очень) случайности, полиция взяла второго преступника, который совершил очень схожее преступление.

У полиции есть основания полагать, что вы действовали в сговоре, поэтому вас изолировали друг от друга и предлагают одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). Если вы оба молчите, ваше деяние проходит по более лёгкой статье, и каждый из вас приговаривается к полугоду тюрьмы. Если вы свидетельствуете друг против друга, то получаете минимальный срок (по 2 года).

Вы и ваш подельник должны сделать выбор: молчать или свидетельствовать против другого. Однако никто не знает точно, что сделает другой.

Что ты выберешь?

На первый взгляд кажется, что стратегия свидетельствовать против другого человека, более выгодна, нежели молчать. Как минимум потому, что самый плохой исход из возможных — это минимальный срок по 2 года, а если вам повезет, то вас освободят за помощь следствию.

Но если вы оба промолчите, то получите по полгода и суммарный срок заключения на двоих составит всего один год, что меньше любого другого исхода.

Данная проблема называется «Дилеммой заключенного», согласно которой игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок максимизирует свой собственный выигрыш, не заботясь о выгоде других. В классической теории игр стратегия предательства называется равновесием по Нэшу, она является математически верной стратегией даже в повторяющейся игре.

Но не все так просто.

Об исследовании

Международной группе исследователей из МФТИ, Сколтеха, ТГУ и Орегонского университета удалось теоретически описать сильные отклонения участников от рационального поведения в «Дилемме Заключённого» — известной стратегической игре из теории игр. После знакомства и недолгого общения участников лабораторных экспериментов уровень их кооперации повысился со стандартных 20% до более чем 50%. Результат был опубликован в журнале PLOS ONE.

Теория игр — это наука о принятии решений, математический метод изучения оптимальных стратегий в играх, где игроки обладают разными интересами и могут действовать нерационально. Её методики активно используются в экономике, политологии, психологии и многих других социальных сферах жизни.

В исследовании применялись методы экспериментальной экономики. Она позволяет выявлять модели поведения людей в определённых социально-экономических ситуациях, понимать влияние одних событий и факторов на другие, прослеживать логику принятия решения в различных экономических областях.

Чтобы проанализировать социальные характеристики поведения людей во время игрового взаимодействия в группах от 4 до 12 человек, учёные в течение трёх лет проводили эксперименты в лаборатории экспериментальной экономики МФТИ совместно со Сколтехом. Исследователи изучали индивидуальные процессы принятия решения при различных условиях, а также влияние социальных факторов, психологии и физиологии. В опубликованной работе представлены результаты восьми экспериментов, в каждом из которых принимало участие 12 игроков. Всего было задействовано 96 человек: 59 мужчин и 37 женщин.

Студенты МФТИ, которые принимали участие в экспериментах, изначально были незнакомы и вначале действовали по стандартной схеме выбора стратегий в игре «Дилемма Заключённого». Её суть заключалась в том, что участникам предлагалось анонимно взаимодействовать друг с другом посредством двух действий: кооперировать (К) или предавать (П). По правилам игры, если один игрок выбирает «К», а другой «П», предатель получает 10 очков, а кооператор — 0 очков. Если оба игрока выбирают «К», каждому достается по 5 очков, если «П» — каждый получает всего по 1 очку. Зная правила, можно понять, что кооперироваться выгодно, хотя с точки зрения математики рациональнее выбирать предательство. Именно эта ситуация является в данной игре равновесием по Нэшу, то есть математически верной стратегией, названной именем автора, — знаменитого нобелевского лауреата Джона Форбса Нэша. Отклонение от равновесия Нэша не приводит к увеличению выигрыша, если другие участники игры своих стратегий не меняют. В начале игры уровень кооперации в группах составил в среднем 21%, то есть участники скорее выбирали рациональную стратегию предательства. Но после знакомства и «социализации» средний уровень кооперации увеличился до 53% и выше, то есть в среднем участники скорее отклонялись от равновесия Нэша, чем придерживались рациональной стратегии.

Расчёты учёных показали, что поведение участников до социализации может быть описано с помощью модели Quantal Response Equilibrium (QRE). Концепция QRE возникла на стыке теории игр и экспериментальной экономики для объяснения наблюдаемого поведения участников лабораторных экспериментов в тех случаях, когда оно отличается от равновесия Нэша. Эта модель хорошо соответствовала практике для порядка 20% процентов отклонений. Но оказалось, что стандартный подход QRE не может применяться для описания поведения участников после социализации, потому что отклонений участников от равновесия Нэша в этом случае становится слишком много — больше половины, то есть их уже нельзя считать случайными ошибками, как это делается в традиционной модели.

Поэтому математики решили применить марковские стратегии для теоретического обоснования полученных экспериментальных данных. Учёные построили и проанализировали модель повторяющейся игры «Дилемма Заключённого». Каждый участник мог реагировать только на то, какую стратегию (кооперировать или предавать) реализовал его случайный анонимный партнёр ход назад. Анализируя эту информацию, он делал выбор стратегии на текущем ходе. Такой подход, названный в честь автора, — русского математика Андрея Маркова — в итоге позволил получить игру в нормальной форме: то есть состоящей из множества игроков, множества чистых стратегий и множества действий каждого игрока. Также удалось показать, что выигрыши нелинейно зависят от вероятностей поведения игроков. Учёные нашли в явном виде семейство внутренних симметричных равновесий Нэша: набор оптимальных стратегий, одинаковый для обоих партнёров и зависящий только от вероятностей поведения игроков.

Таким образом, учёным удалось построить теоретическую модель, позволяющую описывать преобладание выбора кооперативных стратегий в повторяющейся игре «Дилемма Заключенного» и соответствующую экспериментальным данным.

«Парадокс индивидуальной рациональности разбирается на примере „Дилеммы Заключённого“ уже на первой лекции практически любого курса по теории игр. Тем не менее, эта игра в чём-то сложнее шахмат: применение каждым участником своей наилучшей стратегии приводит к плохому исходу для всех. Нам удалось полностью исследовать повторяющуюся „Дилемму Заключённого“ в марковских стратегиях. Более того, нам повезло ещё раз. Оказалась, что поведение участников экспериментов приближается к теоретическим равновесным положениям, найденных нами, причём при разных уровнях социализации. Ещё один удивительный пример того, как математическая модель рождается из анализа поведения людей».

По словам учёных, остаются открытыми вопросы теоретического обоснования результатов таких игр, как «Игра на доверие» и «Игра-ультиматум», экспериментальные данные которых не соответствуют известным теоретическим игровым моделям в рамках исследования влияния социального взаимодействия.