Стратегии крайнего пессимизма, крайнего оптимизма и оптимизма-пессимизма


Задание. Выберите стратегии с позиции крайнего пессимизма, крайнего оптимизма и оптимизма-пессимизма для следующей платежной матрицы.

12

2

8

3

15

12

6

2.5

6

7

16

5


Критерий Байеса.
По критерию Байеса за оптимальные принимается та стратегия (чистая) Ai, при которой максимизируется средний выигрыш a или минимизируется средний риск r.
Считаем значения ∑(aijpj)
∑(a1,jpj) = 40•0.3 + 10•0.2 + 20•0.4 + 30•0.1 = 25
∑(a2,jpj) = 50•0.3 + 60•0.2 + 15•0.4 + 25•0.1 = 35.5
∑(a3,jpj) = 20•0.3 + 35•0.2 + 40•0.4 + 50•0.1 = 34

Ai

П1

П2

П3

П4

∑(aijpj)

A1

12

2

8

3

25

A2

15

12

6

2.5

35.5

A3

6

7

16

5

34

pj

0.3

0.2

0.4

0.1

0



Выбираем из (25; 35.5; 34) максимальный элемент max=35.5
Вывод: выбираем стратегию N=2.
Критерий Вальда.
По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.
a = max(min aij)
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.

Ai

П1

П2

П3

П4

min(aij)

A1

40

10

20

30

10

A2

50

60

15

25

15

A3

20

35

40

50

20



Выбираем из (10; 15; 20) максимальный элемент max=20
Вывод: выбираем стратегию N=3.
Критерий Севиджа.
Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:
a = min(max rij)
Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Находим матрицу рисков.
Риск – мера несоответствия между разными возможными результатами принятия определенных стратегий. Максимальный выигрыш в j-м столбце bj = max(aij) характеризует благоприятность состояния природы.
1. Рассчитываем 1-й столбец матрицы рисков.
r11 = 50 - 40 = 10; r21 = 50 - 50 = 0; r31 = 50 - 20 = 30;
2. Рассчитываем 2-й столбец матрицы рисков.
r12 = 60 - 10 = 50; r22 = 60 - 60 = 0; r32 = 60 - 35 = 25;
3. Рассчитываем 3-й столбец матрицы рисков.
r13 = 40 - 20 = 20; r23 = 40 - 15 = 25; r33 = 40 - 40 = 0;
4. Рассчитываем 4-й столбец матрицы рисков.
r14 = 50 - 30 = 20; r24 = 50 - 25 = 25; r34 = 50 - 50 = 0;

Ai

П1

П2

П3

П4

A1

10

50

20

20

A2

0

0

25

25

A3

30

25

0

0



Результаты вычислений оформим в виде таблицы.

Ai

П1

П2

П3

П4

max(aij)

A1

10

50

20

20

50

A2

0

0

25

25

25

A3

30

25

0

0

30



Выбираем из (50; 25; 30) минимальный элемент min=25
Вывод: выбираем стратегию N=2.
Критерий Гурвица.
Критерий Гурвица является критерием пессимизма - оптимизма. За (оптимальную принимается та стратегия, для которой выполняется соотношение:
max(si)
где si = y min(aij) + (1-y)max(aij)
При y = 1 получим критерий Вальде, при y = 0 получим – оптимистический критерий (максимакс).
Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы. Как выбирается y? Чем хуже последствия ошибочных решений, тем больше желание застраховаться от ошибок, тем y ближе к 1.
Рассчитываем si.
s1 = 0.5•10+(1-0.5)•40 = 25
s2 = 0.5•15+(1-0.5)•60 = 37.5
s3 = 0.5•20+(1-0.5)•50 = 35

Ai

П1

П2

П3

П4

min(aij)

max(aij)

y min(aij) + (1-y)max(aij)

A1

40

10

20

30

10

40

25

A2

50

60

15

25

15

60

37.5

A3

20

35

40

50

20

50

35



Выбираем из (25; 37.5; 35) максимальный элемент max=37.5
Вывод: выбираем стратегию N=2.

Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A2.

загрузка...