Теория игр

Решить игру с матрицей (тип mх2). В ответе указать цену игры и вероятности применения стратегий , т.е. v, p, q.

Решение.
1. Поиск седловой точки. В играх с нулевой суммой, считается, что игрок A выбирает свою стратегию, чтобы получить максимальный свой выигрыш, а игрок B руководствуется тем, чтобы минимизировать выигрыш игрока A.

ИгрокиB1B2a = min(Ai)
A1030
A2-44-4
A32-9-9
A4-55-5
A5-79-7
b = max(Bi)29
Находим нижнюю цену игры a = max(ai) = 0, которая указывает на максимальную чистую стратегию A1. Верхняя цена игры b = min(bj) = 2. Поскольку a ≠ b, то это свидетельствует об отсутствии седловой точки. Тогда цена игры находится в пределах 0 ≤ y ≤.
Решим задачу графическим методом. Для этого проделаем следующие шаги.
1. По оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х=0) соответствует стратегии B1, правый - стратегии B2 (x=1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (p1,p2).
2. На левой оси ординат откладываются выигрыши стратегии B1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии B2.
Решение игры (m x 2) проводим с позиции игрока B, придерживающегося максиминной стратегии.
Выделяем верхнюю границу выигрыша A1NA3. Максиминной оптимальной стратегии игрока B соответствует точка N, лежащая на пересечении прямых A1A1 и A3A3, для которых можно записать следующую систему уравнений:
y = 0 + (3 - 0)q2
y = 2 + (-9 - 2)q2
Откуда q1 = 6/7, q2 = 1/7. Цена игры, y = 3/7
Теперь можно найти минимаксную стратегию игрока A, записав соответствующую систему уравнений, исключив стратегию A2,A4,A5, которая дает явно больший проигрыш игроку A, и, следовательно, p2 = 0,p4 = 0,p5 = 0.
2p3 = y
3p1-9p3 = y
p1+p3 = 1
или
2p3 = 3/7
3p1-9p3 = 3/7
p1+p3 = 1
Решая эту систему, находим: p1 = 11/14, p3 = 3/14.

Ответ:
Цена игры: y = 3/7, векторы стратегии игроков:
P(11/14, 0, 3/14, 0, 0), Q(6/7, 1/7)
4. Проверим правильность решения игры с помощью критерия оптимальности стратегии.
∑aijqj ≤ v
∑aijpi ≥ v
M(P1;Q) = (0*6/7) + (3*1/7) = 0.429 = v
M(P2;Q) = (-4*6/7) + (4*1/7) = -2.857 ≤ v
M(P3;Q) = (2*6/7) + (-9*1/7) = 0.429 = v
M(P4;Q) = (-5*6/7) + (5*1/7) = -3.571 ≤ v
M(P5;Q) = (-7*6/7) + (9*1/7) = -4.714 ≤ v
M(P;Q1) = (0*11/14) + (-4*0) + (2*3/14) + (-5*0) + (-7*0) = 0.429 = v
M(P;Q2) = (3*11/14) + (4*0) + (-9*3/14) + (5*0) + (9*0) = 0.429 = v
Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно.
Решение было получено и оформлено с помощью сервиса:
Решение матричных игр
Вместе с этой задачей решают также:
Игры с природой: критерии Вальда, Сэвиджа, Гурвица
Динамическое программирование
Теория массового обслуживания
Помощь в решении задач
Задать вопрос или оставить комментарий Помощь в решении Поиск Поддержать проект