Стандартні ігрові стратегії. Гра ”дилема ув’язненого”. Гра ”курча”
Стандартні ігрові стратегії. Гра “дилема ув’язненого”. Гра “курча”
Найбільш поширеними та продуктивними стандартними моделями ігрової динаміки, які добре відображають поведінку акторів у конфліктній ситуації, є ігри «дилема ув’язненого» та «курча». Дані ігри мають теорію виграшних та програшних стратегій.
Дилема ув’язненого – фундаментальна проблема в теорії ігор, згідно з якою гравці не завжди будуть співпрацювати один з одним, навіть якщо це в їхніх інтересах. Передбачається, що гравець (“ув’язнений”) максимізує свій власний виграш, не піклуючись про вигоду інших.
Суть проблеми була сформульована Мірилом Флад і Мелвіном Дрешер в 1950 році. Назва дилемі дав математик Альберт Такер.
У теорії ігор дилема в’язня (ДВ) — гра з ненульовою сумою, в якій гравці прагнуть одержати вигоду, співпрацюючи один з одним або зраджуючи. Як у всій теорії ігор, передбачається, що гравець («в’язень») максимізує свій власний виграш, не піклуючись про вигоду інших.
У дилемі в’язня зрада строго домінує над співпрацею, тому єдина можлива рівновага — зрада обох учасників. Простіше кажучи, не важливо, що зробить інший гравець, кожен виграє більше, якщо зрадить. Оскільки в будь-якій ситуації зрадити вигідніше, ніж співпрацювати, всі раціональні гравці виберуть зраду.
Поводячись окремо раціонально, разом учасники приходять до нераціонального рішення: якщо обидва зрадять, вони одержать в сумі менший виграш, ніж якби співпрацювали (єдина рівновага в цій грі не веде до Парето-оптимального рішення). У цьому і полягає дилема.
У дилемі в’язня, що повторюється, гра відбувається періодично, і кожен гравець може «покарати» іншого за неспівпрацю раніше. У такій грі співпраця може стати рівновагою, а стимул зрадити може переважуватися загрозою покарання (із зростанням числа ітерацій рівновага Неша прагне до Парето-оптимуму).
Класична дилема ув’язненого така:
Двоє підозрюваних, А і Б, арештовані. У поліції немає достатніх доказів для звинувачення, і ізолювавши їх один від одного, вони пропонують їм одну і ту ж операцію: якщо один свідчить проти іншого, а той зберігає мовчання, то перший звільняється, а другий одержує 10 років в’язниці. Якщо обидва мовчать, у поліції мало доказів, і вони засуджуються до 6 місяців. Якщо обидва свідчать проти один одного, вони одержують по 2 роки. Кожен ув’язнений вибирає, мовчати або свідчити проти іншого. Проте жоден з них не знає точно, що зробить інший. Що відбудеться
Гру можна представити у вигляді такої таблиці:
Дилема з’являється, якщо припустити, що обидва піклуються тільки про мінімізацію власного терміну ув’язнення.
Представимо міркування одного з ув’язнених. Якщо партнер мовчить, то краще за нього зрадити і вийти на свободу (інакше – півроку в’язниці). Якщо партнер свідчить, то краще теж свідчити проти нього, щоб одержати 2 роки (інакше – 10 років). Стратегія «свідчити» строго домінує над стратегією «мовчати». Аналогічно інший ув’язнений приходить до того ж висновку.
З погляду групи (цих двох в’язнів) краще всього співпрацювати один з одним, зберігати мовчання і одержати по півроку, оскільки це зменшить сумарний термін ув’язнення. Будь-яке інше рішення буде менш вигідним.