Бібліотека Studies працює за підтримки агентства Magistr.ua

Стандартні ігрові стратегії. Гра ”дилема ув’язненого”. Гра ”курча”


Стандартні ігрові стратегії. Гра “дилема ув’язненого”. Гра “курча”

Найбільш поширеними та продуктивними стандартними моделями ігрової динаміки, які добре відображають поведінку акторів у конфліктній ситуації, є ігри «дилема ув’язненого» та «курча». Дані ігри мають теорію виграшних та програшних стратегій.

Дилема ув’язненого – фундаментальна проблема в теорії ігор, згідно з якою гравці не завжди будуть співпрацювати один з одним, навіть якщо це в їхніх інтересах. Передбачається, що гравець (“ув’язнений”) максимізує свій власний виграш, не піклуючись про вигоду інших.

Суть проблеми була сформульована Мірилом Флад і Мелвіном Дрешер в 1950 році. Назва дилемі дав математик Альберт Такер.

У теорії ігор дилема в’язня (ДВ) — гра з ненульовою сумою, в якій гравці прагнуть одержати вигоду, співпрацюючи один з одним або зраджуючи. Як у всій теорії ігор, передбачається, що гравець («в’язень») максимізує свій власний виграш, не піклуючись про вигоду інших.

У дилемі в’язня зрада строго домінує над співпрацею, тому єдина можлива рівновага — зрада обох учасників. Простіше кажучи, не важливо, що зробить інший гравець, кожен виграє більше, якщо зрадить. Оскільки в будь-якій ситуації зрадити вигідніше, ніж співпрацювати, всі раціональні гравці виберуть зраду.

Поводячись окремо раціонально, разом учасники приходять до нераціонального рішення: якщо обидва зрадять, вони одержать в сумі менший виграш, ніж якби співпрацювали (єдина рівновага в цій грі не веде до Парето-оптимального рішення). У цьому і полягає дилема.

У дилемі в’язня, що повторюється, гра відбувається періодично, і кожен гравець може «покарати» іншого за неспівпрацю раніше. У такій грі співпраця може стати рівновагою, а стимул зрадити може переважуватися загрозою покарання (із зростанням числа ітерацій рівновага Неша прагне до Парето-оптимуму).

Класична дилема ув’язненого така:

Двоє підозрюваних, А і Б, арештовані. У поліції немає достатніх доказів для звинувачення, і ізолювавши їх один від одного, вони пропонують їм одну і ту ж операцію: якщо один свідчить проти іншого, а той зберігає мовчання, то перший звільняється, а другий одержує 10 років в’язниці. Якщо обидва мовчать, у поліції мало доказів, і вони засуджуються до 6 місяців. Якщо обидва свідчать проти один одного, вони одержують по 2 роки. Кожен ув’язнений вибирає, мовчати або свідчити проти іншого. Проте жоден з них не знає точно, що зробить інший. Що відбудеться

Гру можна представити у вигляді такої таблиці:

Дилема з’являється, якщо припустити, що обидва піклуються тільки про мінімізацію власного терміну ув’язнення.

Представимо міркування одного з ув’язнених. Якщо партнер мовчить, то краще за нього зрадити і вийти на свободу (інакше – півроку в’язниці). Якщо партнер свідчить, то краще теж свідчити проти нього, щоб одержати 2 роки (інакше – 10 років). Стратегія «свідчити» строго домінує над стратегією «мовчати». Аналогічно інший ув’язнений приходить до того ж висновку.

З погляду групи (цих двох в’язнів) краще всього співпрацювати один з одним, зберігати мовчання і одержати по півроку, оскільки це зменшить сумарний термін ув’язнення. Будь-яке інше рішення буде менш вигідним.


Magistr.ua
Дізнайся вартість написання своєї роботи
Кількість сторінок:
-
+
Термін виконання:
-
днів
+