Решение матричной игры: графическим методом, методом линейного программирования
Решение матричной игры
Цена игры, седловая точка
Примеры решений Метод Брауна Системы массового обслуживания Матрица рисков Седловая точка Платежная матрица Цена игры Смешанные стратегии Матричная игра онлайн Чистые стратегии

Задача принятия решений в условиях неопределенности

Предположим, что ЛПР (лицо, принимающее решения) рассматривает несколько возможных решений: i = 1,…,m. Ситуация, в которой действует ЛПР, является неопределенной. Известно лишь, что наличествует какой-то из вариантов: j = 1,…, n. Если будет принято i-e решение, а ситуация есть j-я , то фирма, возглавляемая ЛПР, получит доход qij. Матрица Q = (qij) называется матрицей последствий (возможных решений). Какое же решение нужно принять ЛПР? В этой ситуации полной неопределенности могут быть высказаны лишь некоторые рекомендации предварительного характера. Они не обязательно будут приняты ЛПР. Многое будет зависеть, например, от его склонности к риску. Но как оценить риск в данной схеме?
Допустим, мы хотим оценить риск, который несет i-e решение. Нам неизвестна реальная ситуация. Но если бы ее знали, то выбрали бы наилучшее решение, т.е. приносящее наибольший доход. Т.е. если ситуация есть j-я , то было бы принято решение, дающее доход qij.
Значит, принимая i-e решение мы рискуем получить не qj, а только qij, значит принятие i-го решения несет риск недобрать rij = qj - qij. Матрица R = (rij) называется матрицей рисков.

Пример №1. Пусть матрица последствий есть

матрица последствий

Составим матрицу рисков. Имеем q1 = max(qi1) = 8, q2 = 5, q3 = 8, q4 = 12.. Следовательно, матрица рисков есть
матрица рисков

Принятие решений в условиях полной неопределенности

Не все случайное можно "измерить" вероятностью. Неопределенность – более широкое понятие. Неопределенность того, какой цифрой вверх ляжет игральный кубик отличается от неопределенности того, каково будет состояние российской экономики через 15 лет. Кратко говоря, уникальные единичные случайные явления связаны с неопределенностью, массовые случайные явления обязательно допускают некоторые закономерности вероятностного характера.
Ситуация полной неопределенности характеризуется отсутствием какой бы то ни было дополнительной информации. Какие же существуют правила-рекомендации по принятию решений в этой ситуации?

Правило Вальда (правило крайнего пессимизма). Рассматривая i-e решение будем полагать, что на самом деле ситуация складывается самая плохая, т.е. приносящая самый малый доход ai Но теперь уж выберем решение i0 с наибольшим ai0. Итак, правило Вальда рекомендует принять решение i0, такое что
 Так, в вышеуказанном примере, имеем a1 = 2, a2 = 2, a3 = 3, a4 = 1. Из этих чисел максимальным является число 3. Значит, правило Вальда рекомендует принять 3-е решение.

Правило Сэвиджа (правило минимального риска). При применении этого правила анализируется матрица рисков R = (rij). Рассматривая i-e решение будем полагать, что на самом деле складывается ситуация максимального риска bi = max [rij]
Но теперь уж выберем решение i0 с наименьшим bi0. Итак, правило Сэвиджа рекомендует принять решение i0, такое что
В рассматриваемом примере имеем b1 = 8, b2 = 6, b3 = 5, b4 = 7. Минимальным из этих чисел является число 5. Т.е. правило Сэвиджа рекомендует принять 3-е решение.

Правило Гурвица (взвешивающее пессимистический и оптимистический подходы к ситуации). Принимается решение i, на котором достигается максимум
, где 0 ≤ λ ≤ 1.
Значение λ выбирается из субъективных соображений. Если λ приближается к 1, то правило Гурвица приближается к правилу Вальда, при приближении λ к 0, правило Гурвица приближается к правилу "розового оптимизма" (догадайтесь сами, что это значит). В вышеуказанном примере при λ= 1/2 правило Гурвица рекомендует 2-е решение.

Принятие решений в условиях частичной неопределенности

Предположим, что в рассматриваемой схеме известны вероятности pj того, что реальная ситуация развивается по варианту j. Именно такое положение называется частичной неопределенностью. Как здесь принимать решение? Можно выбрать одно из следующих правил.
Правило максимизации среднего ожидаемого дохода. Доход, получаемый фирмой при реализации i-го решения, является случайной величиной Qi с рядом распределения

qi1

qi2


qin

p1

p2


pn

Математическое ожидание M[Qi] и есть средний ожидаемый доход, обозначаемый . Правило рекомендует принять решение, приносящее максимальный средний ожидаемый доход.
Предположим, что в схеме из предыдущего примера вероятности есть (1/2, 1/6, 1/6, 1/6). Тогда Q1=29/6, Q2=25/6, Q3=7, Q4=17/6. Максимальный средний ожидаемый доход равен 7, соответствует третьему решению.
Правило минимизации среднего ожидаемого риска. Риск фирмы при реализацииi-го решения, является случайной величиной Riс рядом распределения

ri1

ri2


rin

p1

p2


pn

Математическое ожидание M[Ri] и есть средний ожидаемый риск, обозначаемый также Ri. Правило рекомендует принять решение, влекущее минимальный средний ожидаемый риск.
Вычислим средние ожидаемые риски при указанных выше вероятностях. Получаем R1=20/6, R2=4, R3=7/6, R4=32/5. Минимальный средний ожидаемый риск равен 7/6, соответствует третьему решению.
Анализ принимаемых решений по двум критериям: среднему ожидаемому доходу и среднему ожидаемому риску и нахождение решений, оптимальных по Парето, аналогично анализу доходности и риска финансовых операций. В примере множество решений, оптимальных по Парето операций, состоит только из одного 3-его решения.
В случае, если количество Парето-оптимальных решений больше одного, то для определения лучшего решения  применяется взвешивающая формула f(Q)=2Q-R.

Правило Лапласа

Иногда в условиях полной неопределенности применяют правило Лапласа, согласно которому все вероятности pj считают равными. После этого можно выбрать какое-нибудь из двух приведенных выше правил-рекомендаций принятия решений.

Пример №2. Рассмотрим пример решения статистической игры в экономической задаче.
Сельскохозяйственное предприятие может реализовать некоторую продукцию:
А1) сразу после уборки;
А2) в зимние месяцы;
А3) в весенние месяцы.
Прибыль зависит от цены реализации в данный период времени, затратами на хранение и возможных потерь. Размер прибыли, рассчитанный для разных состояний-соотношений дохода и издержек (S1, S2 и S3), в течение всего периода реализации, представлен в виде матрицы (млн. руб.)

S1S2S3
A12-37
A2-154
A3-713-3
Определить наиболее выгодную стратегию по всем критериям (критерий Байеса, критерий Лапласа, максиминный критерий Вальда, критерий пессимизма-оптимизмаГурвица, критерий Ходжа-Лемана, критерий минимаксного риска Сэвиджа), если вероятности состояний спроса: 0,2; 0,5; 0,3; коэффициент пессимизма С = 0,4; коэффициент достоверности информации о состояниях спроса u = 0,6.
Решение
Результаты расчетов будем заносить в таблицу:
S1S2S3БНОММП-ОХ-Л
А12-3712-33-0,6
А2-1543,52,7-12,61,7
А3-713-34,21-75-0,28
pj0,20,50,3А3А2А2А3А2

1. Критерий Байеса (максимального математического ожидания)

Расчет осуществляется по формуле:
;
W1 = 2∙0,2 + (-3) ∙0,5 + 7∙0,3 = 0,4 – 1,5 + 2,1 = 1
W2 = -1∙0,2 + 5 ∙0,5 + 4∙0,3 = -0,2 + 2,5 + 1,2 = 3,5
W3 = -7∙0,2 + 13 ∙0,5 + (-3)∙0,3 = -1,2 + 6,5 - 0,9 = 4,2
Найденные значения заносим в первый столбец (Б) и выбираем максимальное
W = max{1;3.5;4.2} = 4.2,

значит оптимальной по данному критерию является стратегия А3 – продавать в весенние месяцы.

2. Критерий недостаточного основания Лапласа (НО)

Находим среднее значение элементов каждой строки:
.
;
;
.
Найденные значения заносим во второй столбец (НО) и выбираем максимальное W = max{2; 2.7; 1} = 2.7, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.

3. Максиминный критерий Вальда (ММ)

В каждой строке находим минимальный элемент: .
W1 = min{2; -3; 7} = -3
W2 = min{-1; 5; 4} = -1
W3 = min{-7; 13; -3} = -7
Найденные значения заносим в третий столбец (ММ) и выбираем максимальное W= max{-3; -1; -7} = -1, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.

4. Критерий пессимизма-оптимизма Гурвица (П-О)

Для каждой строки рассчитываем значение критерия по формуле: . По условию C = 0.4, значит:
W1 = 0,4∙min{2; -3; 7} + (1-0,4) ∙ max{2; -3; 7} = 0,4∙(-3) + 0,6∙7 = -1,2 + 4,2 = 3
W2 = 0,4∙min{-1; 5; 4} + (1-0,4) ∙ max{-1; 5; 4} = 0,4∙(-1) + 0,6∙5 = -0,4 + 3 = 2,6
W3 = 0,4∙min{-7; 13; -3} + (1-0,4) ∙ max{-7; 13; -3} = 0,4∙(-7) + 0,6∙13 = -2,8 + 7,2 = 5
Найденные значения заносим в четвертый столбец (П-О) и выбираем максимальное W = max{3; 2.6 5} = 5, значит оптимальной по данному критерию является стратегия А3 – продавать в весенние месяцы.

5. Критерий Ходжа-Лемана (Х-Л)

Для каждой строки рассчитываем значение критерия по формуле: . По условию u = 0.6 и множители в каждом слагаемом уже рассчитаны, их можно взять их первого столбика (Б) и из третьего столбика (ММ), значит:
W1 = 0,6∙1 + (1-0,6) ∙(-3) = 0,6 – 1,2 = -0,6
W2 = 0,6∙3,5 + (1-0,6) ∙(-1) = 2,1 – 0,4 = 1,7
W3 = 0,6∙4,2 + (1-0,6) ∙(-7) = 2,52 – 2,8 = -0,28
Найденные значения заносим в пятый столбец (Х-Л) и выбираем максимальное W = max{-0.6; 1.7; -0.28} = 1.7, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.

5. Критерий минимаксного риска Сэвиджа

Рассчитаем матрицу рисков. Заполнять ее лучше по столбцам. В каждом столбце находим максимальный элемент и вы читаем из него все остальные элементы столбца, результаты записываем на соответствующих местах.
Вот как рассчитывается первый столбец. Максимальный элемент в первом столбце: a11 = 2, значит по формуле :
r11 = 2 – a11 = 2 -2 = 0
r21 = 2 – a21 = 2 –(-1) = 3
r31 = 2 – a31 = 2 –(-7) = 9
Рассчитаем второй столбец матрицы рисков. Максимальный элемент во втором столбце: a32 = 13, значит:
r12 = 13 – a12 = 13 –(-3) = 16
r22 = 13 – a22 = 13 –5 = 8
r32 = 13 – a32 = 13 –13 = 0
Рассчитаем третий столбец матрицы рисков. Максимальный элемент в третьем столбце: a13 = 7, значит:
r13 = 7 – a13 = 7 –7 = 0
r23 = 7 – a23 = 7 –4 = 3
r33 = 7 – a33 = 7 –(-3) = 10
Таким образом, матрица рисков имеет вид (в каждом столбце на месте максимального элемента платежной матрицы должен стоять ноль):
Wi
016016
3838
901010
Дополним матрицу рисков рассчитанными значениями критерия Wi – в каждой строке выбираем максимальный элемент ():
W1 = max{0; 16; 0} = 16
W2 = max{3; 8; 3} = 8
W3 = max{9; 0; 10} = 10
Найденные значения заносим в столбец (Wi) и выбираем минимальное W = min{16,8,10} = 8, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.

Вывод:

  1. Стратегия А1 (продавать сразу после уборки) не является оптимальной ни по одному из критериев.
  2. Стратегия А2 (продавать в зимние месяцы) является оптимальной согласно критериям недостаточного основания Лапласа, максиминного критерия Вальда и минимаксного критерия Сэвиджа.
  3. Стратегия А3 (продавать в весенние месяцы) является оптимальной согласно критериям Байеса, пессимизма-оптимизма Гурвица, Ходжа-Лемана.

Пример №2. В обычной стратегической игре каждый игрок предпринимает именно те действия, которые наиболее выгодны ему и менее выгодны противнику. При этом предполагается, что игроки – разумные и антагонистические противники. Однако очень часто присутствует неопределенность, которая не связана с сознательным противодействием противника, а зависит от некоторой объективной действительности.
Сельскохозяйственное предприятие имеет три участка земли: влажный, средней влажности и сухой. Один из этих участков предполагается использовать для выращивания картофеля, остальные – для посева зеленой массы. Для получения хорошего урожая картофеля требуется определенное количество влаги в почве в период вегетации. При излишней влажности посаженый картофель на некоторых участках может гнить, а при недостаточном количестве осадков будет плохо развиваться, что приводит к снижению урожайности. Определить, на каком участке сеять картофель, чтобы получить хороший урожай его, если известна средняя урожайность картофеля на каждом участке в зависимости от погодных условий. На участке A1 урожайность составляет 200, 100 и 250 ц с 1 га при выпадении соответственно нормального количества осадков, больше и меньше нормы. Аналогично на участке A2 – 230, 120 и 200 ц, а на участке A3 – 240, 260 и 100 ц.
Используем игровой подход. С/х предприятие – игрок A, у которого три стратегии: A1 – сеять картофель на влажном участке, A2 – на участке средней влажности, A3 – на сухом участке. Игрок П – природа, у которого три стратегии: П1 соответствует количеству осадков меньше нормы, П2 – норме, П3 – больше нормы. Выигрыш с/х предприятия при каждой паре стратегий (Ai, Пj) задается урожайностью картофеля с 1 га.

П
A
П1 П2 П3
A1 250 200 100
A2 200 230 120
A3 100 240 260
Рассмотрим общую ситуацию, когда какой-то стороне необходимо выполнить операцию в недостаточно известной обстановке. О состоянии этой обстановки можно сделать n предположений: П1, П2,…, Пn. Например, покупательский спрос. По аналогии с примером 8 эти состояния рассматривают как стратегии природы. В теории статистических игр природа не является разумным игроком, она рассматривается как некая незаинтересованная инстанция, которая не выбирает для себя оптимальных стратегий. Ее возможные состояния реализуются случайным образом. Такие ситуации принято называть играми с природой. Оперирующая сторона A в своем распоряжении имеет m возможных стратегий: A1, A2,…, Am. Выигрыши игрока A при каждой паре стратегий Aiи Пj предполагаются известными aij.
Может показаться, что игра с природой проще стратегической игры, поскольку природа не противодействует игроку A. На самом деле это не так, поскольку в неопределенной ситуации труднее принять обоснованное решение. Хотя выиграет A, скорее всего, больше, чем в игре против сознательного противника.

Пример 9. Фирма производит пользующиеся спросом детские платья и костюмы, реализация которых зависит от состояния погоды. Затраты фирмы в течение августа-сентября на единицу продукции составили: платья – 7 ден. ед., костюмы – 28 ден. ед. Цена реализации составляет 15 и 50 ден. ед. соответственно. По данным наблюдений за несколько предыдущих лет, фирма может реализовать в условиях теплой погоды 1 950 платьев и 610 костюмов, а при прохладной погоде – 630 платьев и 1 050 костюмов.
Составить платежную матрицу.
Решение. У фирмы две стратегии: A1: выпустить продукцию, считая, что погода будет теплой; A2: выпустить продукцию, считая, что погода будет прохладной.
У природы две стратегии: B1: погода теплая; B2: погода прохладная.
Найдем элементы платежной матрицы:
1) a11 – доход фирмы при выборе стратегии A1 при условии B1:
a11=(15-7)·1950+(50-28)·610=29020.
2) a12 – доход фирмы при выборе A1 при условии B2. Фирма выпустит 1 950 платьев, а продаст 630, доход от реализации платьев
(15-7)·630-7·(1950-630)=5040-9240
a12=5040-9240+22·610=9220.
3) аналогично при стратегии A2 в условиях B1 фирма выпустит 1 050 костюмов, а продаст 610;
a21=8·630+22·610-28·(1050-610)=6140
4) a22=8·630+22·1050=28140
Платежная матрица:

20 0209 220
6 14028 140

Пример 2. Объединение производит разведку полезных ископаемых на трех месторождениях. Фонд средств объединения составляет 30 ден. ед. Деньги в первое месторождение M1 могут быть вложены в количестве, кратном 9 ден. ед., во второе M2 – 6 ден. ед., в третье M3 – 15 ден. ед. Цены на полезные ископаемые в конце планового периода могут оказаться в двух состояниях: C1 и C2. Эксперты установили, что в ситуации C1 прибыль от месторождения M1 составит 20 % от количества вложенных ден. ед. на разработку, на M2 – 12 % и на M3 – 15 %. В ситуации C1 на конец планового периода прибыль составит 17 %, 15 %, 23 % на месторождениях M1, M3, M3 соответственно.
Игрок A – объединение. Игрок П (природа) – совокупность внешних обстоятельств, которые обуславливают ту или иную прибыль на месторождениях. У игрока A имеется четыре возможности, полностью использующие имеющиеся средства. Первая стратегия, A1, состоит в том, что A вложит в M1 9 ден. ед., в M2 – 6 ден. ед., в M3 – 15 ден. ед. Вторая стратегия A2: в M1 – 18 ден. ед., в M2 – 12 ден. ед., в M3 деньги не вкладывать. Третья стратегия, A3: 30 ден. ед. вложить в M3. Четвертая стратегия, A4:. 30 ден. ед. вложить в M2. Кратко можно записать A1 (9, 6, 15), A2 (18, 12, 0), A3 (0, 0, 30), A4 (0, 30, 0).
Природа может реализовать одно из двух своих состояний, характеризующихся различными ценами на полезные ископаемые в конце планового периода. Обозначим состояния природы П1 (20 %, 12 %, 15 %), П2 (17 %, 15 %, 23 %).
Элементы aij платежной матрицы имеют смысл суммарной прибыли, получаемой объединением в различных ситуациях (Ai, Пj) (i=1, 2, 3, 4, j = 1, 2). Например, вычислим a12, отвечающий ситуации (A1, П2), т. е. случаю, когда объединение вкладывает в месторождения M1, M2, M3, соответственно 9 ден. ед., 6 ден. ед., 15 ден. ед., и на конец планового периода цены оказались в состоянии C2:
a12 = 9·0,17+6·0,15+15·0,23 = 5,88 ден. ед.

Пример 3. Ожидается наступление наводнения, которое может иметь категорию с первой по пятую. Величина ущерба от наводнения:

Категория наводнения12345
Ущерб, ден. ед.510131620
В качестве профилактического действия можно построить дамбу; имеется пять вариантов выбора высоты дамбы: h1 < h2 < h3 < h4 < h5, причем дамба высоты h1 защищает только от наводнения первой категории, высоты h2 – от наводнения первой и второй категории, и т. д., дамба высоты h5 защищает от наводнения любой категории.
Затраты на строительство дамбы:
Высота дамбыh1h2h3h4h5
Затраты, ден. ед.246810
Принимающий решение имеет шесть стратегий (не строить дамбу вообще (A0) или строить дамбу высоты hi (Ai), i = 1, 2, 3, 4, 5). Природа также имеет шесть стратегий (не осуществлять наводнение (П0) или осуществить наводнение j-й категории (Пj), 1≤j≤5).
Получаем матрицу потерь:
П / A П0 П1 П2 П3 П4 П5
A0 0 5 10 13 16 20
A1 2 2 12 15 18 22
A2 4 4 4 17 20 24
A3 6 6 6 6 22 26
A4 8 8 8 8 8 28
A5 10 10 10 10 10 10
Например, если построить дамбу высоты h2, а наводнение будет третьей категории, то затраты на строительство составят 4 ден. ед., а ущерб от наводнения 13 ден. ед. Таким образом, общие потери составят 4 + 13 = 17 ден. ед. Если же наводнение будет второй категории, то ущерба от наводнения не будет, и потери связаны только со строительством дамбы, т.е. 4 ден. ед
Чтобы из матрицы потерь (bij) получить матрицу выигрышей, достаточно у всех элементов поменять знак и прибавить любую константу C (в данном случае C можно интерпретировать как сумму, выделенную на строительство дамбы, тогда выигрыш aij=C-bij представляет собой сэкономленную сумму). Например, при C=30 матрица выигрышей:
П / A П0 П1 П2 П3 П4 П5
A0 30 25 20 17 14 10
A1 28 28 18 15 12 8
A2 26 26 26 13 10 6
A3 24 24 24 24 8 4
A4 22 22 22 22 22 2
A5 20 20 20 20 20 20

Игры с "природой"

Термин "природа" в теории игр понимается в широком смысле. Это могут быть действительные природные физические (климатические), биологические, химические, социальные и т.п. процессы, которые сопровождают экономическую деятельность. Под "природой" может также пониматься рынок, противостоящий предпринимателю, конкурирующая среда, монополия и т.п. "Природа" может выступать как антагонистическая сторона, а может как кооперативная среда. "Природа" в виде природных процессов, как часть экономики, не стремиться "специально" навредить предпринимателю, но она несёт определённый урон от его экономической деятельности и этот "проигрыш"для неё должен быть минимален, если, вообще, без него для окружающей среды нельзя обойтись. Игрок A в таких играх - это экономические субъекты, а игрок B - это "природа". Откуда средства у физической "природы"? Проигрыш игрока B, физической "природы", должен компенсироваться из вне, например, государственными дотациями либо заложенными в инвестиционные проекты средствами на возобновление природных ресурсов. Знание оптимальных стратегий "природы" позволяет определить наиболее неблагоприятные условия для игрока A (предпринимателя), которые его ожидают ("надейся на лучшее, но готовься к худшему"), и оценить необходимые ресурсы на восстановление природных ресурсов, дающих ему возможность получить гарантированный доход.
Если "природа" подразумевает конкурентную среду - то проигрыш второго игрока есть цена борьбы с конкурентами на рынке.
Перейдём к примерам содержательных постановок задач игры с "природой".
1. Антагонистические игры
Пример 1. (Планирование посевов). Фермер, имеющий ограниченный участок земельных угодий, может его засадить тремя различными культурами A1, A2, A3. Урожай этих культур зависит главным образом от погоды ("природы"), которая может находиться в трёх различных состояниях: B1, B2, B3. Фермер имеет информацию (статистические данные) о средней урожайности этих культур (количество центнеров культуры, получаемого в одного гектара земли) при трёх различных состояниях погоды, которая отражена в таблице:
Виды культурВозможные состояния погодыЦены
Засуха B1Нормальная B2Дождливая B3
A12015105
A271557
A3051010
Тогда матрица доходов (платёжная матрица) фермера A имеет вид:

Элемент матрицы A - (aij) показывает, какой доход может получить фермер с одного гектара земли, если он посеет культуру i (i =1, 2, 3), а погода будет находиться в состоянии j (j = 1, 2, 3).
Необходимо определить пропорции, в которых фермер должен засеять имеющийся участок земли, чтобы получить максимальный гарантированный доход вне зависимости от того, какие погодные условия будут реализованы.
Данная задача может быть сведена к антагонистической игре. В данном случае в качестве первого игрока выступает фермер, а в качестве второго игрока - природа. Будем предполагать, что природа, как игрок, может вести себя таким образом, чтобы максимально навредить фермеру, преследуя тем самым противоположные интересы (эти предположения позволяют оценить тот доход, который он может получить в том случае, если погодные условия будут для него максимально неблагоприятные). В этом случае фермер имеет в своём распоряжении три чистые стратегии:
  • первая чистая стратегия предполагает, что весь участок земли буде засеян культурой A1;
  • вторая чистая стратегия предполагает, что весь участок земли будет засеян культурой A2;
  • третья чистая стратегия предполагает, что весь участок будет засеян культурой A3.
Как игрок, природа может также использовать три возможные стратегии:
  • засушливую погоду, которая соответствует первой чистой стратегии B1;
  • нормальную погоду, которая соответствует второй чистой стратегии B2;
  • дождливую погоду, которая соответствует третьей чистой стратегии B3.
Решение
1. Проанализируем платёжную матрицу A.

Матрица A не имеет доминируемых стратегий и не может быть упрощена.
2. Проверим, имеет ли данная игра седловую точку.
Найдём нижнюю и верхнюю цену игры:
V*=maxi minjaij = 50.
V*=minjmaxiaij = 100.
Поскольку V* ≠V*, то данная антагонистическая игра не имеет седловой точки и решения в чистых стратегиях.
3. Решение игры следует искать в смешанных стратегиях. Сведём игровую задачу к задаче линейного программирования. Если первый игрок - фермер - применяет свою оптимальную смешанную стратегию P*, а второй игрок - природа - применяет последовательно свои чистые стратегии, то математическое ожидание дохода, который фермер может получить со своего участка, будет не меньше цены игры V. Следовательно, должна выполняться следующая система неравенств:

Разделим каждое из неравенств, входящих в систему на V и введём новые переменные:
.
В результате получим новую систему неравенств:

Разделим равенство:
p*1 + p*2 + p*3 = 1
на V, получим, что новые переменные y1, y2, y3 удовлетворяют условию:
y1 + y2 + y3 = 1/V
Поскольку цель первого игрока - максимизация его выигрыша, а математическое ожидание его выигрыша не меньше цены игры, то первый игрок будет стремиться максимизировать цену игры, которая эквивалентна минимизации величины 1/V.
Итак, для первого игрока (фермера) задача об определении оптимальной стратегии поведения свелась к задаче линейного программирования:
найти минимум функции F = y1 + y2 + y3
при следующих функциональных ограничениях:

и прямых ограничениях:
y1 ≥ 0, y2≥ 0, y3≥ 0
Переходим ко второму игроку, к природе. Если второй игрок - природа - будет применять свою оптимальную смешанную стратегию Q*,а первый игрок - фермер будет последовательно применять свои чистые стратегии, то математическое ожидание проигрыша второго игрока будет не больше цены игры. Следовательно, должна выполняться следующая система неравенств:

Разделим каждое из неравенств, входящих в систему на V и введём новые переменные:
.
В результате получим новую систему неравенств:

Разделим равенство:
q*1 + q*2 + q*3 = 1
на V, получим, что новые переменные q1 , q2 , q3 удовлетворяют условию:
q1 + q2 + q3 = 1/V
Поскольку цель второго игрока - природы - минимизация его проигрыша, а математическое ожидание его проигрыша не больше цены игры, то второй игрок будет стремиться минимизировать цену игры, которая эквивалентна максимизации величины 1/V.
Итак, для второго игрока (природы) задача об определении оптимальной стратегии поведения свелась к задаче линейного программирования:
найти максимум функции F/ = x1 + x2 + x3
при следующих функциональных ограничениях:

и прямых ограничениях:
x1 ≥ 0, x2 ≥ 0, x3 ≥ 0
Таким образом, для того чтобы найти оптимальную смешенную стратегию второго игрока, необходимо также решить задачу линейного программирования.
Задачи обоих игроков свелись к паре двойственных задач линейного программирования:
Задача второго игрока минимизация проигрыша VЗадача первого игрока максимизация выигрыша V
Целевая функция
F/= x1+x2+x3= → maxF = y1+y2+y3 = → min
Функциональные ограничения


Прямые ограничения

x1≥ 0, x2≥ 0, x3≥ 0

y1≥ 0, y2≥ 0, y3≥ 0

Задача первого игрока решается симплекс-методом. Результаты счёта:
у1 =0,01p1 =0,67
у2 =0p2 =0,00
у3 =0,005p3 =0,33
F =0,015V =66,67

Задача второго игрока решается также симплекс-методом. Результаты счёта:
x1 =0,005
p1 =
0,33
x2 =0
p2 =
0,00
x3 =0,01
p3 =
0,67
F =0,015
V =
66,67

Выводы. В соответствии с полученными результатами фермеру гарантирован средний доход в размере 66,67 единицс каждого гектара используемой под культурами земли при самых неблагоприятных условиях. Оптимальная стратегия для него - выращивание двух культур, A1и A3, причём, под первую культуруему следует отвести 0,67 часть всей земли, а под третью культуру 0,33 часть всей земли.
Природа "грозит" фермеру жарой 0,33 часть сезона возделывания культур и 0,67 часть сезона дождями.

Пример. Планирование выпуска продукции при разных состояниях природы - рынка спроса.
Предприятие может выпускать 4 вида продукции: A1, A2, A3, A4, получая при этом прибыль. Её величина определяется состоянием спроса (природой рынка), который может находиться в одном из четырёх возможных состояний: B1, B2, B3, B4. Зависимость величины прибыли от вида продукции и состояния рынка представлено в таблице:

Виды продукции Возможные состояния рынка спроса
B1B2B3B4
A14356
A22615
A33072
A43513

Платёжная матрица имеет вид:

Элемент матрицы A - {aij} характеризует, какую прибыль может получить предприятие, если оно будет выпускать i- й вид продукции(i =1, 2, 3, 4) при j-м спросе(j = 1, 2, 3, 4).
Необходимо определить оптимальные пропорции выпускаемых предприятием видов продукции, продажа которой обеспечила бы ему максимально возможную выручку вне зависимости от того, какое состояние спроса будет реализовано
Эта задача может быть сведена к антагонистической игре.
В данном случае в качестве первого игрока выступает предприятие, а в качестве второго игрока - природа, которая влияет на состояние спроса и может сделать его максимально неблагоприятным для предприятия. Будем предполагать, что природа, как игрок, будет вести себя таким образом, чтобы максимально навредить предприятию, преследуя тем самым противоположные интересы.
В этом случае конфликт двух сторон может характеризоваться, как антагонистический, а использование модели этого конфликта позволяет предприятию. оценить выручку, которую оно может получить вне зависимости от того, какое состояние спроса будет реализовано.
Выступая в качестве первого игрока, предприятие может использовать четыре стратегии:
· первую чистую стратегию, соответствующую выпуску предприятием только продукции A1
· вторую чистую стратегию, соответствующую выпуску предприятием только продукции A2
· третью чистую стратегию, соответствующую выпуску предприятием только продукции A3
· четвёртую чистую стратегию, соответствующую выпуску предприятием только продукции A4
Выступая в качестве второго игрока, природа может использовать также четыре стратегии:
· первую чистую стратегию, при которой реализуется состояние спроса B1;
· вторую чистую стратегию, при которой реализуется состояние спроса B2;
· третью чистую стратегию, при которой реализуется состояние спроса B3;
· четвёртую чистую стратегию, при которой реализуется состояние спроса B4.
Решение
1. Проанализируем платёжную матрицу A.

Матрица A не имеет доминируемых стратегий и не может быть упрощена.
2. Проверим, имеет ли данная игра седловую точку.
Найдём нижнюю и верхнюю цену игры:
V*=maxi minj aij = 3.
V*=minj maxiaij = 4.
Поскольку V* ≠V*, то данная антагонистическая игра не имеет седловой точки и решения в чистых стратегиях.
Решение игры следует искать в смешанных стратегиях. Сведём рассматриваемый антагонистический конфликт к прямой и двойственной задаче линейного программирования.
Если первый игрок - предприятие - применяет свою оптимальную смешанную стратегию P*, а второй игрок - природа - применяет последовательно свои чистые стратегии, то математическое ожидание дохода, который предприятие может получить, будет не меньше цены игры V.
И наоборот, если второй игрок - природа - будет применять свою оптимальную смешанную стратегию Q*,а первый игрок - предприятие будет последовательно применять свои чистые стратегии, то математическое ожидание проигрыша второго игрока будет не больше цены игры. Следовательно, должна выполняться следующая система неравенств:
Задача второго игрока минимизация проигрыша V Задача первого игрока максимизация выигрыша V
Целевая функция
F/ = x1+x2+x3+x4 =→ max F = y1+y2+y3+y4 =→ min
Функциональные ограничения


Прямые ограничения

x1 ≥ 0, x2 ≥ 0, x3 ≥ 0, x4 ≥ 0

y1 ≥ 0, y2 ≥ 0, y3 ≥ 0, y4 ≥ 0
Применяя симплекс-метод для решения задачи первого игрока, получим:
Y*= (y1* = 0,182; y2* = 0; y3* = 0; y4* =0,091)
F= y1*+ y2*+ y3*+y4*= 0,273
Из соотношения y1*+ y2*+ y3*+y4*=1/V найдём V:

Из соотношений:

Найдём:
p*1 = y*1V = 0,67 , p*2 = y*2V = 0 , p*3 = y*3V = 0 , p*4 = y*4V =0,33

Окончательно имеем:
Р*= (р*1 =0,67; р*2= 0; р*3=0; р*4 = 0,33), V = 3.67
На основании решения, найденного для двойственной задачи линейного программирования, найдём решение исходной задачи - задачи второго игрока:
X*= (x1* = 0,121; x2* =0,121; x3* = 0,03; x4* = 0)
F/ = x1*+ x2*+ x3*+x4*= 0,273
Из соотношения x1*+ x2*+ x3*+x4* = 1/V найдём V:

Из соотношений:

Найдём:
q*1 = x*1V = 0,445 , q*2 = x*2V = 0,444 , q*3 = x*3V = 0,111 , q*4 = x*4V = 0.
Окончательно имеем:
Q*= (q*1= 0,445; q*2=0,444; q*3= 0,111; q*4= 0), V = 3.67

Пример. Фирма планирует реализацию своей продукции на рынках, учитывая возможные варианты покупательского спроса Пj, j=1,4 (низкий, средний, высокий, очень высокий). На предприятии разработано три стратегии сбыта товаров A1, А2, А3. Объем товарооборота (ден.ед.), зависящий от стратегии и покупательского спроса, представлен в таблице.

Аj Пj
П1 П2 П3 П4
А1 30 +N 10 20 25 + N/2
А2 50 70 - N 10 + N/2 25
А3 25 – N/2 35 40 60 - N/2
где N=3
Известны возможные состояния покупательского спроса, которые соответственно q1=0,3, q2=0,2, q3=0,4, q4=0,1. Необходимо найти стратегию сбыта, максимизирующую средний товарооборот фирмы. При этом использовать критерии Вальда, Гурвица, Сэвиджа, Байеса.

Решение находим с помощью калькулятора.
Критерий Байеса.
По критерию Байеса за оптимальные принимается та стратегия (чистая) Ai, при которой максимизируется средний выигрыш a или минимизируется средний риск r.
Считаем значения ∑(aijpj)
∑(a1,jpj) = 33•0.3 + 10•0.2 + 20•0.4 + 26.5•0.1 = 22.55
∑(a2,jpj) = 50•0.3 + 67•0.2 + 11.5•0.4 + 25•0.1 = 35.5
∑(a3,jpj) = 23.5•0.3 + 35•0.2 + 40•0.4 + 58.5•0.1 = 35.9

Ai П1 П2 П3 П4 ∑(aijpj)
A1 9.9 2 8 2.65 22.55
A2 15 13.4 4.6 2.5 35.5
A3 7.05 7 16 5.85 35.9
pj 0.3 0.2 0.4 0.1
Вывод: выбираем стратегию N=3.
Критерий Лапласа.
Если вероятности состояний природы правдоподобны, для их оценки используют принцип недостаточного основания Лапласа, согласно которого все состояния природы полагаются равновероятными, т.е.:
q1 = q2 = ... = qn = 1/n.
qi = 1/4
Ai П1 П2 П3 П4 ∑(aij)
A1 8.25 2.5 5 6.63 22.38
A2 12.5 16.75 2.88 6.25 38.38
A3 5.88 8.75 10 14.63 39.25
pj 0.25 0.25 0.25 0.25
Вывод: выбираем стратегию N=3.
Критерий Вальда.
По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.
a = max(min aij)
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Ai П1 П2 П3 П4 min(aij)
A1 33 10 20 26.5 10
A2 50 67 11.5 25 11.5
A3 23.5 35 40 58.5 23.5
Вывод: выбираем стратегию N=3.
Критерий Севиджа.
Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:
a = min(max rij)
Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Находим матрицу рисков.
Риск – мера несоответствия между разными возможными результатами принятия определенных стратегий. Максимальный выигрыш в j-м столбце bj = max(aij) характеризует благоприятность состояния природы.
1. Рассчитываем 1-й столбец матрицы рисков.
r11 = 50 - 33 = 17; r21 = 50 - 50 = 0; r31 = 50 - 23.5 = 26.5;
2. Рассчитываем 2-й столбец матрицы рисков.
r12 = 67 - 10 = 57; r22 = 67 - 67 = 0; r32 = 67 - 35 = 32;
3. Рассчитываем 3-й столбец матрицы рисков.
r13 = 40 - 20 = 20; r23 = 40 - 11.5 = 28.5; r33 = 40 - 40 = 0;
4. Рассчитываем 4-й столбец матрицы рисков.
r14 = 58.5 - 26.5 = 32; r24 = 58.5 - 25 = 33.5; r34 = 58.5 - 58.5 = 0;
Ai П1 П2 П3 П4
A1 17 57 20 32
A2 0 0 28.5 33.5
A3 26.5 32 0 0

Ai П1 П2 П3 П4 max(aij)
A1 17 57 20 32 57
A2 0 0 28.5 33.5 33.5
A3 26.5 32 0 0 32
Вывод: выбираем стратегию N=3.
Критерий Гурвица.
Критерий Гурвица является критерием пессимизма - оптимизма. За (оптимальную принимается та стратегия, для которой выполняется соотношение:
max(si)
где si = y min(aij) + (1-y)max(aij)
При y = 1 получим критерий Вальде, при y = 0 получим – оптимистический критерий (максимакс).
Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы. Как выбирается y? Чем хуже последствия ошибочных решений, тем больше желание застраховаться от ошибок, тем y ближе к 1.
Рассчитываем si.
s1 = 0.5•10+(1-0.5)•33 = 21.5
s2 = 0.5•11.5+(1-0.5)•67 = 39.25
s3 = 0.5•23.5+(1-0.5)•58.5 = 41
Ai П1 П2 П3 П4 min(aij) max(aij) y min(aij) + (1-y)max(aij)
A1 33 10 20 26.5 10 33 21.5
A2 50 67 11.5 25 11.5 67 39.25
A3 23.5 35 40 58.5 23.5 58.5 41
Вывод: выбираем стратегию N=3.
Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A3.

Руководство компании принимает решение о размещении производства нового продукта в некотором месте. Чтобы сформировать представление о ситуации на рынке нового продукта на момент освоения производства, ему необходимо учесть затраты на доставку готовой продукции до потребителя, развитость транспортной и социальной инфраструктуры региона, конкуренцию на рынке, соотношение спроса и предложения, курсы валют и многое другое. Возможные варианты решений, инвестиционная привлекательность которых определяется как процент прироста дохода по отношению к сумме капитальных вложений, представлены в таблице.
Выбрать:
1) место для размещения производства, если руководитель предприятия уверен в том, что на рынке сложится ситуация 4;
2) место для размещения производства, если руководство оценивает вероятность ситуации 1 в 0,2; ситуации 2 в 0,1; ситуации 3 в 0,25;
3) провести выбор варианта в условиях неопределенности по критерию: максимакс, максимин, критерий Лапласа, критерий Сэведжа, критерий Гурвица (y = 0,3);
4) изменится ли наилучший вариант решения по критерию Гурвица если величину a увеличить до 0,5?
5) предположив, что данные таблицы представляют затраты предприятия, определить выбор, который сделает предприятие при использовании каждого из следующих критериев: максимин; максимакс; критерий Гурвица(? = 0,3); критерий Сэведжа; критерий Лапласа

Типовые задания

  1. Выбрать оптимальный проект для строительства используя критерии Лапласа, Вальда, максимального оптимизма, Сэвиджа и Гурвица при a=0.58. Матрица затрат имеет вид:
    0.070.260.110.250.10.21
    684554794799
    568942567481
    728756406242
    654875895280
    699393564543
    739479686746
    6610064899449
    704297424250
  2. Розничное торговое, предприятие разработало несколько вариантов плана продажи товаров на предстоящей ярмарке с учетом меняющейся конъюнктуры рынка и спроса покупателей, получающиеся от их возможных сочетаний величины прибыли представлены в виде матрицы выигрышей. Определить оптимальный план продажи товаров.
    x=0,7
    Величина прибыли, тыс. руб.
    План продажи Состояние конъюнктуры рынка
    E1 E2 E3 E4
    I1 5,0 4,5 5,1 4,0
    I2 4,2 5,6 3,9 4,3
    I3 3,6 4,1 4,7 4,0
    I4 3,5 3,9 4,6 3,8
  3. Фирма планирует реализацию своей продукции на рынках, учитывая возможные варианты покупательского спроса Пj, j=1͞,4͞ (низкий, средний, высокий, очень высокий). На предприятии разработано три стратегии сбыта товаров A1, А2, А3. Объем товарооборота (ден.ед.), зависящий от стратегии и покупательского спроса, представлен в таблице.
    Аj Пj
    П1 П2 П3 П4
    А1 30 +N 10 20 25 + N/2
    А2 50 70 - N 10 + N/2 25
    А3 25 – N/2 35 40 60 - N

    Где N=3
    Известны возможные состояния покупательского спроса, которые соответственно q1=0,3, q2=0,2, q3=0,4, q4=0,1. Необходимо найти стратегию сбыта, максимизирующую средний товарооборот фирмы. При этом использовать критерии Вальда, Гурвица, Сэвиджа, Байеса.
    Решение
  4. Затраты фабрики в течение апреля — мая на единицу продукции составили: платья — 8 денежных единиц, костюмы — 27, а цена реализации равняется соответственно 16 и 48. По данным наблюдений за прошлое время, фабрика может реализовать в течение этих месяцев в условиях теплой погоды 600 костюмов и 1975 платьев, а при прохладной погоде — 625 платьев и 1000 костюмов.
    Решение

Перейти к онлайн решению своей задачи

Транспортная задача
Используя метод минимального тарифа, представить первоначальный план для решения транспортной задачи. Проверить на оптимальность, используя метод потенциалов. Стоимость доставки единицы груза из каждого пункта отправления в соответствующие пункты назначения задана матрицей тарифов
1234b
112436
243858
3276310
a4688 
Решить онлайн
Линейное программирование
Решение ЗЛП графическим методомГрафический метод решения ЗЛП
Решить онлайн
Динамическое программирование
Задачи динамического программирования: задача распределения инвестиций, задача замены оборудования, задача Джонсона
xf1(x)f2(x)f3(x)
16.345
25.267
34.34.67.8
4563
5*76.38.2
Решить онлайн
Курсовые на заказ