Статистические игры

Решение типового примера

Рассмотрим пример решения статистической игры в экономической задаче.

Сельскохозяйственное предприятие может реализовать некоторую продукцию:

А1) сразу после уборки;

А2) в зимние месяцы;

А3) в весенние месяцы.

Прибыль зависит от цены реализации в данный период времени, затратами на хранение и возможных потерь. Размер прибыли, рассчитанный для разных состояний-соотношений дохода и издержек (S1, S2 и S3), в течение всего периода реализации, представлен в виде матрицы (млн. руб.)

 

S1

S2

S3

A1

2

-3

7

A2

-1

5

4

A3

-7

13

-3

Определить наиболее выгодную стратегию по всем критериям (критерий Байеса, критерий Лапласа, максиминный критерий Вальда, критерий пессимизма-оптимизма Гурвица, критерий Ходжа-Лемана, критерий минимаксного риска Сэвиджа), если вероятности состояний спроса: 0,2; 0,5; 0,3; коэффициент пессимизма С = 0,4; коэффициент достоверности информации о состояниях спроса u = 0,6.

Решение

Результаты расчетов будем заносить в таблицу:

 

S1

S2

S3

Б

НО

ММ

П-О

Х-Л

А1

2

-3

7

1

2

-3

3

-0,6

А2

-1

5

4

3,5

2,7

-1

2,6

1,7

А3

-7

13

-3

4,2

1

-7

5

-0,28

pj

0,2

0,5

0,3

А3

А2

А2

А3

А2

1. Критерий Байеса (максимального математического ожидания)

Расчет осуществляется по формуле:

;

W1 = 2∙0,2 + (-3) ∙0,5 + 7∙0,3 = 0,4 – 1,5 + 2,1 = 1

W2 = -1∙0,2 + 5 ∙0,5 + 4∙0,3 = -0,2 + 2,5 + 1,2 = 3,5

W3 = -7∙0,2 + 13 ∙0,5 + (-3)∙0,3 = -1,2 + 6,5 - 0,9 = 4,2

Найденные значения заносим в первый столбец (Б) и выбираем максимальное

W = max{1;3.5;4.2} = 4.2,

значит оптимальной по данному критерию является стратегия А3 – продавать в весенние месяцы.

 

2. Критерий недостаточного основания Лапласа (НО)

Находим среднее значение элементов каждой строки:

.

;

;

.

Найденные значения заносим во второй столбец (НО) и выбираем максимальное W = max{2; 2.7; 1} = 2.7, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.

3. Максиминный критерий Вальда (ММ)

В каждой строке находим минимальный элемент: .

W1 = min{2; -3; 7} = -3

W2 = min{-1; 5; 4} = -1

W3 = min{-7; 13; -3} = -7

Найденные значения заносим в третий столбец (ММ) и выбираем максимальное W= max{-3; -1; 7} = -1, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.

4. Критерий пессимизма-оптимизма Гурвица (П-О)

Для каждой строки рассчитываем значение критерия по формуле: . По условию C = 0.4, значит:

W1 = 0,4∙min{2; -3; 7} + (1-0,4) ∙ max{2; -3; 7} = 0,4∙(-3) + 0,6∙7 = -1,2 + 4,2 = 3

W2 = 0,4∙min{-1; 5; 4} + (1-0,4) ∙ max{-1; 5; 4} = 0,4∙(-1) + 0,6∙5 = -0,4 + 3 = 2,6

W3 = 0,4∙min{-7; 13; -3} + (1-0,4) ∙ max{-7; 13; -3} = 0,4∙(-7) + 0,6∙13 = -2,8 + 7,2 = 5

Найденные значения заносим в четвертый столбец (П-О) и выбираем максимальное W = max{3; 2.6 5} = 5, значит оптимальной по данному критерию является стратегия А3 – продавать в весенние месяцы.

5. Критерий Ходжа-Лемана (Х-Л)

Для каждой строки рассчитываем значение критерия по формуле: . По условию
u = 0.6 и множители в каждом слагаемом уже рассчитаны, их можно взять их первого столбика (Б) и из третьего столбика (ММ), значит:

W1 = 0,6∙1 + (1-0,6) ∙(-3) = 0,6 – 1,2 = -0,6

W2 = 0,6∙3,5 + (1-0,6) ∙(-1) = 2,1 – 0,4 = 1,7

W3 = 0,6∙4,2 + (1-0,6) ∙(-7) = 2,52 – 2,8 = -0,28

Найденные значения заносим в пятый столбец (Х-Л) и выбираем максимальное W = max{-0.6; 1.7; -0.28} = 1.7, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.

5. Критерий минимаксного риска Сэвиджа

Рассчитаем матрицу рисков. Заполнять ее лучше по столбцам. В каждом столбце находим максимальный элемент и вы читаем из него все остальные элементы столбца, результаты записываем на соответствующих местах.

Вот как рассчитывается первый столбец. Максимальный элемент в первом столбце: a11 = 2, значит по формуле :

r11 = 2 – a11 = 2 -2 = 0

r21 = 2 – a21 = 2 –(-1) = 3

r31 = 2 – a31 = 2 –(-7) = 9

Рассчитаем второй столбец матрицы рисков. Максимальный элемент во втором столбце: a32 = 13, значит:

r12 = 13 – a12 = 13 –(-3) = 16

r22 = 13 – a22 = 13 –5 = 8

r32 = 13 – a32 = 13 –13 = 0

Рассчитаем третий столбец матрицы рисков. Максимальный элемент в третьем столбце: a13 = 7, значит:

r13 = 7 – a13 = 7 –7 = 0

r23 = 7 – a23 = 7 –4 = 3

r33 = 7 – a33 = 7 –(-3) = 10

Таким образом, матрица рисков имеет вид (в каждом столбце на месте максимального элемента платежной матрицы должен стоять ноль):

 

 

 

Wi

0

16

0

16

3

8

3

8

9

0

10

10

Дополним матрицу рисков рассчитанными значениями критерия Wi – в каждой строке выбираем максимальный элемент ():

W1 = max{0; 16; 0} = 16

W2 = max{3; 8; 3} = 8

W3 = max{9; 0; 10} = 10

Найденные значения заносим в столбец (Wi) и выбираем минимальное W = min{16,8,10} = 8, значит оптимальной по данному критерию является стратегия А2 – продавать в зимние месяцы.

Вывод:

1) Стратегия А1 (продавать сразу после уборки) не является оптимальной ни по одному из критериев.

2) Стратегия А2 (продавать в зимние месяцы) является оптимальной согласно критериям недостаточного основания Лапласа, максиминного критерия Вальда и минимаксного критерия Сэвиджа.

3) Стратегия А3 (продавать в весенние месяцы) является оптимальной согласно критериям Байеса, пессимизма-оптимизма Гурвица, Ходжа-Лемана.

загрузка...