Стратегии крайнего пессимизма, крайнего оптимизма и оптимизма-пессимизма
Задание. Выберите стратегии с позиции крайнего пессимизма, крайнего оптимизма и оптимизма-пессимизма для следующей платежной матрицы.
12 | 2 | 8 | 3 |
15 | 12 | 6 | 2.5 |
6 | 7 | 16 | 5 |
Критерий Байеса.
По критерию Байеса за оптимальные принимается та стратегия (чистая) Ai, при которой максимизируется средний выигрыш a или минимизируется средний риск r.
Считаем значения ∑(aijpj)
∑(a1,jpj) = 40•0.3 + 10•0.2 + 20•0.4 + 30•0.1 = 25
∑(a2,jpj) = 50•0.3 + 60•0.2 + 15•0.4 + 25•0.1 = 35.5
∑(a3,jpj) = 20•0.3 + 35•0.2 + 40•0.4 + 50•0.1 = 34
Ai | П1 | П2 | П3 | П4 | ∑(aijpj) |
A1 | 12 | 2 | 8 | 3 | 25 |
A2 | 15 | 12 | 6 | 2.5 | 35.5 |
A3 | 6 | 7 | 16 | 5 | 34 |
pj | 0.3 | 0.2 | 0.4 | 0.1 | 0 |
Выбираем из (25; 35.5; 34) максимальный элемент max=35.5
Вывод: выбираем стратегию N=2.
Критерий Вальда.
По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.
a = max(min aij)
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Ai | П1 | П2 | П3 | П4 | min(aij) |
A1 | 40 | 10 | 20 | 30 | 10 |
A2 | 50 | 60 | 15 | 25 | 15 |
A3 | 20 | 35 | 40 | 50 | 20 |
Выбираем из (10; 15; 20) максимальный элемент max=20
Вывод: выбираем стратегию N=3.
Критерий Севиджа.
Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:
a = min(max rij)
Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Находим матрицу рисков.
Риск – мера несоответствия между разными возможными результатами принятия определенных стратегий. Максимальный выигрыш в j-м столбце bj = max(aij) характеризует благоприятность состояния природы.
1. Рассчитываем 1-й столбец матрицы рисков.
r11 = 50 - 40 = 10; r21 = 50 - 50 = 0; r31 = 50 - 20 = 30;
2. Рассчитываем 2-й столбец матрицы рисков.
r12 = 60 - 10 = 50; r22 = 60 - 60 = 0; r32 = 60 - 35 = 25;
3. Рассчитываем 3-й столбец матрицы рисков.
r13 = 40 - 20 = 20; r23 = 40 - 15 = 25; r33 = 40 - 40 = 0;
4. Рассчитываем 4-й столбец матрицы рисков.
r14 = 50 - 30 = 20; r24 = 50 - 25 = 25; r34 = 50 - 50 = 0;
Ai | П1 | П2 | П3 | П4 |
A1 | 10 | 50 | 20 | 20 |
A2 | 0 | 0 | 25 | 25 |
A3 | 30 | 25 | 0 | 0 |
Результаты вычислений оформим в виде таблицы.
Ai | П1 | П2 | П3 | П4 | max(aij) |
A1 | 10 | 50 | 20 | 20 | 50 |
A2 | 0 | 0 | 25 | 25 | 25 |
A3 | 30 | 25 | 0 | 0 | 30 |
Выбираем из (50; 25; 30) минимальный элемент min=25
Вывод: выбираем стратегию N=2.
Критерий Гурвица.
Критерий Гурвица является критерием пессимизма - оптимизма. За (оптимальную принимается та стратегия, для которой выполняется соотношение:
max(si)
где si = y min(aij) + (1-y)max(aij)
При y = 1 получим критерий Вальде, при y = 0 получим – оптимистический критерий (максимакс).
Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы. Как выбирается y? Чем хуже последствия ошибочных решений, тем больше желание застраховаться от ошибок, тем y ближе к 1.
Рассчитываем si.
s1 = 0.5•10+(1-0.5)•40 = 25
s2 = 0.5•15+(1-0.5)•60 = 37.5
s3 = 0.5•20+(1-0.5)•50 = 35
Ai | П1 | П2 | П3 | П4 | min(aij) | max(aij) | y min(aij) + (1-y)max(aij) |
A1 | 40 | 10 | 20 | 30 | 10 | 40 | 25 |
A2 | 50 | 60 | 15 | 25 | 15 | 60 | 37.5 |
A3 | 20 | 35 | 40 | 50 | 20 | 50 | 35 |
Выбираем из (25; 37.5; 35) максимальный элемент max=37.5
Вывод: выбираем стратегию N=2.
Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A2.