Стандартні ігрові стратегії. Гра ”дилема ув’язненого”. Гра ”курча”

Стандартні ігрові стратегії. Гра “дилема ув’язненого”. Гра “курча”

Найбільш поширеними та продуктивними стандартними моделями ігрової динаміки, які добре відображають поведінку акторів у конфліктній ситуації, є ігри «дилема ув’язненого» та «курча». Дані ігри мають теорію виграшних та програшних стратегій.

Дилема ув’язненого – фундаментальна проблема в теорії ігор, згідно з якою гравці не завжди будуть співпрацювати один з одним, навіть якщо це в їхніх інтересах. Передбачається, що гравець (“ув’язнений”) максимізує свій власний виграш, не піклуючись про вигоду інших.

Суть проблеми була сформульована Мірилом Флад і Мелвіном Дрешер в 1950 році. Назва дилемі дав математик Альберт Такер.

У теорії ігор дилема в’язня (ДВ) — гра з ненульовою сумою, в якій гравці прагнуть одержати вигоду, співпрацюючи один з одним або зраджуючи. Як у всій теорії ігор, передбачається, що гравець («в’язень») максимізує свій власний виграш, не піклуючись про вигоду інших.

У дилемі в’язня зрада строго домінує над співпрацею, тому єдина можлива рівновага — зрада обох учасників. Простіше кажучи, не важливо, що зробить інший гравець, кожен виграє більше, якщо зрадить. Оскільки в будь-якій ситуації зрадити вигідніше, ніж співпрацювати, всі раціональні гравці виберуть зраду.

Поводячись окремо раціонально, разом учасники приходять до нераціонального рішення: якщо обидва зрадять, вони одержать в сумі менший виграш, ніж якби співпрацювали (єдина рівновага в цій грі не веде до Парето-оптимального рішення). У цьому і полягає дилема.

У дилемі в’язня, що повторюється, гра відбувається періодично, і кожен гравець може «покарати» іншого за неспівпрацю раніше. У такій грі співпраця може стати рівновагою, а стимул зрадити може переважуватися загрозою покарання (із зростанням числа ітерацій рівновага Неша прагне до Парето-оптимуму).

Класична дилема ув’язненого така:

Двоє підозрюваних, А і Б, арештовані. У поліції немає достатніх доказів для звинувачення, і ізолювавши їх один від одного, вони пропонують їм одну і ту ж операцію: якщо один свідчить проти іншого, а той зберігає мовчання, то перший звільняється, а другий одержує 10 років в’язниці. Якщо обидва мовчать, у поліції мало доказів, і вони засуджуються до 6 місяців. Якщо обидва свідчать проти один одного, вони одержують по 2 роки. Кожен ув’язнений вибирає, мовчати або свідчити проти іншого. Проте жоден з них не знає точно, що зробить інший. Що відбудеться

Гру можна представити у вигляді такої таблиці:

Дилема з’являється, якщо припустити, що обидва піклуються тільки про мінімізацію власного терміну ув’язнення.

Представимо міркування одного з ув’язнених. Якщо партнер мовчить, то краще за нього зрадити і вийти на свободу (інакше – півроку в’язниці). Якщо партнер свідчить, то краще теж свідчити проти нього, щоб одержати 2 роки (інакше – 10 років). Стратегія «свідчити» строго домінує над стратегією «мовчати». Аналогічно інший ув’язнений приходить до того ж висновку.

З погляду групи (цих двох в’язнів) краще всього співпрацювати один з одним, зберігати мовчання і одержати по півроку, оскільки це зменшить сумарний термін ув’язнення. Будь-яке інше рішення буде менш вигідним.

Magistr.ua

Дізнайся вартість написання своєї роботи

Курсова

Магістерська

Звіт з практики

Контрольна

Бакалаврська

Всі типи

Кількість сторінок:

Термін виконання:

днів

від 990^₴

Дізнатися точну вартість

Попередній розділ

Синергетичні параметри порядку в політичному розвитку транзитивних, індустріальних та постіндустріальних суспільств

Наступний розділ

Сутність імітаційного моделювання процесів