Игры с природой. Пример решения задачи

Фирма производит платья и костюмы, реализация которых зависит от состояния погоды. Затраты фирмы в течение апреля-мая на единицу продукции составят: платья – 5 ден. ед., костюмы – 25 ден. ед. Цена реализации составит 10 ден. ед. и 40 ден. ед. соответственно. По данным наблюдений за несколько предыдущих лет фирма может реализовать в условиях теплой погоды 1 220 платьев и 550 костюмов, при прохладной погоде – 410 платьев и 930 костюмов. В связи с возможными изменениями погоды определить стратегию фирмы в выпуске продукции, обеспечивающую ей максимальный доход. Задачу решить графическим методом и с использованием критерия Гурвица, приняв степень оптимизма 0,4.
Решение. У фирмы две стратегии: A₁: выпустить продукцию, считая, что погода будет теплой; A₂: выпустить продукцию, считая, что погода будет прохладной.
У природы две стратегии: B₁: погода теплая; B₂: погода прохладная.
Найдем элементы платежной матрицы:
1) a₁₁ – доход фирмы при выборе стратегии A₁ при условии B₁:
a₁₁ = (10-5)*1220+(40-25)*550 = 14350
2) a₁₂ – доход фирмы при выборе A₁ при условии B₂. Фирма выпустит 1220 платьев, а продаст 410, доход от реализации платьев
a₁₂ = (10-5)*410-5*(1220-410)+(40-25)*550=6250
3) аналогично при стратегии A₂ в условиях B₁ фирма выпустит 930 костюмов, а продаст 550;
a₂₁ = (10-5)*410+(40-25)*550-25*(930-550)=800
4) a₂₂ = (10-5)*410+(40-25)*930=16000
Платежная матрица:

Далее решаем через калькулятор. Рассмотрим игру двух лиц, интересы которых противоположны. Такие игры называют антагонистическими играми двух лиц. В этом случае выигрыш одного игрока равен проигрышу второго, и можно описать только одного из игроков.
Чистой стратегией игрока I (производитель) является выбор одной из n строк матрицы выигрышей А, а чистой стратегией игрока II (природа) является выбор одного из столбцов этой же матрицы.

1. Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.
Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.

Игроки	B₁	B₂	a = min(A_i)
A₁	14350	6250	6250
A₂	800	16000	800
b = max(B_i)	14350	16000

Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(a_i) = 6250, которая указывает на максимальную чистую стратегию A₁.
Верхняя цена игры b = min(b_j) = 14350.
Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 6250 ≤ y ≤ 14350. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).
Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш.
Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.

3. Находим решение игры в смешанных стратегиях.
Решим задачу геометрическим методом, который включает в себя следующие этапы:
1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии A₁, правый - стратегии A₂ (x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S₁ = (p₁,p₂).
2. На левой оси ординат откладываются выигрыши стратегии A₁. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии A₂.
Решение игры (2xn) проводим с позиции игрока A, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет.

Максиминной оптимальной стратегии игрока A соответствует точка N, лежащая на пересечении прямых B₁B₁ и B₂B₂, для которых можно записать следующую систему уравнений:
y = 14350 + (800 - 14350)p₂
y = 6250 + (16000 - 6250)p₂
Откуда
p₁ = ¹⁵²/₂₃₃ = 0,652
p₂ = ⁸¹/₂₃₃ = 0,348
Цена игры, y = ^2246000/₂₃₃
Теперь можно найти минимаксную стратегию игрока B, записав соответствующую систему уравнений
14350q₁+6250q₂ = y
800q₁+16000q₂ = y
q₁+q₂ = 1
или
14350q₁+6250q₂ = 9639¹¹³/₂₃₃
800q₁+16000q₂ = 9639¹¹³/₂₃₃
q₁+q₂ = 1
Решая эту систему, находим:
q₁ = ¹⁹⁵/₄₆₆.
q₂ = ²⁷¹/₄₆₆.
Ответ:
Цена игры: y = ^2246000/₂₃₃ = 9639.49, векторы стратегии игроков:
Q(¹⁹⁵/₄₆₆, ²⁷¹/₄₆₆), P(¹⁵²/₂₃₃, ⁸¹/₂₃₃)
Таким образом, если придерживаться стратегии на 65%, что погода будет теплой, это обеспечит максимальный доход в размере 9640 ден.ед. Оптимальный план производства швейных изделий составит: 0.652 (1 220; 550) + 0.348 (410; 930) = (938.4; 682.1). Таким образом, фирме целесообразно производить в течение апреля-мая 938 платьев и 682 костюма, тогда при любой погоде она получит доход не менее 9 639.485 ден.ед.
4. Проверим правильность решения игры с помощью критерия оптимальности стратегии.
∑a_ijq_j ≤ v
∑a_ijp_i ≥ v
M(P₁;Q) = (14350•¹⁹⁵/₄₆₆) + (6250•²⁷¹/₄₆₆) = 9639.485 = v
M(P₂;Q) = (800•¹⁹⁵/₄₆₆) + (16000•²⁷¹/₄₆₆) = 9639.485 = v
M(P;Q₁) = (14350•¹⁵²/₂₃₃) + (800•⁸¹/₂₃₃) = 9639.485 = v
M(P;Q₂) = (6250•¹⁵²/₂₃₃) + (16000•⁸¹/₂₃₃) = 9639.485 = v
Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно.

В условиях неопределённости, если не представляется возможным фирме использовать смешанную стратегию (договоры с другими организациями), для определения оптимальной стратегии фирмы используем критерии природы и платежную матрицу (1).
Критерий Гурвица является критерием пессимизма - оптимизма. За оптимальную принимается та стратегия, для которой выполняется соотношение:
max(s_i), где s_i = y min(a_ij) + (1-y)max(a_ij)
Рассчитываем s_i.
s₁ = 0.4•6250+(1-0.4)•14350 = 11110
s₂ = 0.4•800+(1-0.4)•16000 = 9920

A_i	П₁	П₂	min(a_ij)	max(a_ij)	y min(a_ij) + (1-y)max(a_ij)
A₁	14350	6250	6250	14350	11110
A₂	800	16000	800	16000	9920

Выбираем из (11110; 9920) максимальный элемент max=11110
Вывод: выбираем стратегию N=1.
Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A₁ (выпустить продукцию, считая, что погода будет теплой).

см. также решение задачи про запасы сырья.

Игры с природой. Пример решения задачи

Правила ввода данных

Поиск

Процесс

Сообщение