РЕШЕНИЕ МАТРИЧНЫХ ИГР 2x2 В СМЕШАННЫХ СТРАТЕГИЯХ

РЕШЕНИЕ ТИПОВОГО ПРИМЕРА

Задание

Матричную игру 2х2 решить в смешанных стратегиях:

1) аналитически (для игрока А); геометрически (для игрока В)

2) провести моделирование результатов игры с помощью таблицы равномерно распределенных случайных чисел, разыграв 30 партий; определить относительные частоты использования чистых стратегий каждым игроком и средний выигрыш, сравнив результаты с полученными теоретически в п.1.

Игра задана платежной матрицей: .

Решение:

1. Найдем аналитически оптимальную стратегию игрока А и соответствующую цену игры Х*(р1, р2), n.

Так как Х* - оптимальная, то она должна гарантировать средний выигрыш игроку А, равный цене игры при любом поведении игрока В:

для стратегии В1: 10p1 + 8p2 = v;

для стратегии В2: 7p1+11p2 = v.

С учетом того, что сумма компонентов смешанной стратегии равна 1, получаем систему уравнений:

 

Вычтем из первого уравнения второе: 3p1 - 3p2 = 0 или p1 = p2.Значит:

 

Итак: , n = 9.

Найдем геометрически оптимальную смешанную стратегию игрока В: Y*(q1, q2).

Стратегию А1 изобразим точками с ординатами 10 и 7 на прямых В1 и В2 соответственно. Стратегию А2 - точками с ординатами 8 и 11 (см. рис. 1).

Рис. 1. Геометрическая интерпретация матричной игры для игрока В

Каждой точке на отрезке [0; 1] соответствует смешанная стратегия игрока В. Среди них оптимальной будет та, которая определяется самой низкой точкой ломанной А1МА2, т.е. точкой М. Для нахождения компонентов оптимальной стратегии игрока В надо найти координаты точки М, причем если М (х, у), то q1 = 1 - х, q2 = х, n = y. Для этого найдем уравнения прямых А1А1 и А2А2, воспользовавшись уравнением прямой, проходящей через две точки:

.

Так как А1(0; 10) и А1(1; 7), то

, , , .

Т.е. уравнение прямой А1А1 имеет вид: 3x + y - 10 = 0.

Так как А2(0; 8) и А2(1; 11), то

, , 3x = y-8, 3x-y + 8=0.

Т.е. уравнение прямой А2А2 имеет вид: 3x-y + 8 = 0.

Найдем координаты точки М, решив систему уравнений прямых А1А1 и А2А2:

Итак, , значит n = 9, или .

Ответ: , , n = 9.

2. Проведем моделирование результатов решения с помощью таблицы равномерно распределенных случайных чисел. Для 30 партий хватит 60 чисел, на основе которых будут выбираться стратегии игроками. Используемые случайные числа сгенерированы в MS Excel функцией =СЛЧИС(). В приложении достаточно много чисел, но использовать для моделирования можно любые 60, выбранные произвольно с любого места таблицы. Мы возьмем первые числа.

0,02988

0,12558

0,25974

0,17641

0,00937

0,52264

0,08086

0,84858

0,99427

0,49452

0,61109

0,49042

0,61076

0,65834

0,25579

0,80641

0,07675

0,84419

0,18268

0,29702

0,76606

0,95854

0,20704

0,45154

0,27367

0,56261

0,30037

0,96485

0,47252

0,55084

0,73868

0,56421

0,07183

0,99420

0,11184

0,80524

0,42897

0,45031

0,05350

0,67078

0,94483

0,25710

0,39190

0,72491

0,88888

0,03791

0,50773

0,63034

0,94091

0,80165

0,41647

0,88664

0,83519

0,46930

0,39285

0,34159

0,77252

0,65987

0,48750

0,79735

0,51314

0,22625

0,06211

0,39299

0,84336

0,80859

0,52694

0,73306

0,36874

0,93390

0,71749

0,46727

0,18182

0,45791

0,08667

0,58570

0,75495

0,68645

0,90270

0,87484

0,99401

0,82235

0,89122

0,33631

0,42694

0,37053

0,70413

0,59805

0,40425

0,96181

0,41244

0,24426

0,37553

0,09464

0,56208

0,68889

0,59503

0,92378

0,03108

0,33182

Будем выбирать стратегии игроков, используя геометрическое определение вероятности. Так как все случайные числа из отрезка [0; 1], то чтобы стратегия А1 появлялась примерно в половине случаев, будем ее выбирать если случайное число меньше 0,5; в остальных случаях выбирается стратегия А2. Аналогично для игрока В. Стратегию В1 будем выбирать, если соответствующее случайное число меньше , в противном случае выбираем стратегию В1.

Заполним расчетную таблицу:

Номер партии

Случайное число игрока А

Стратегия игрока А

(А1: < 0,5)

Случайное число игрока В

Стратегия игрока В

(В1: < 0,667)

Выигрыш А

Накоплен­ный выиг­рыш А

Средний выигрыш А (цена игры)

0,029

А1

0,125

В1

10

10

10,000

0,611

А2

0,490

В1

8

18

9,000

0,766

А2

0,958

В2

11

29

9,667

0,738

А2

0,564

В1

8

37

9,250

0,944

А2

0,257

В1

8

45

9,000

0,416

А1

0,886

В2

7

52

8,667

0,513

А1

0,226

В1

10

62

8,857

0,717

А2

0,467

В1

8

70

8,750

0,994

А2

0,822

В2

11

81

9,000

0,412

А1

0,244

В1

10

91

9,100

0,259

А1

0,176

В1

10

101

9,182

0,610

А2

0,658

В1

8

109

9,083

0,207

А1

0,451

В1

10

119

9,154

0,071

А1

0,994

В2

7

126

9,000

0,391

А1

0,724

В2

7

133

8,867

0,835

А2

0,469

В1

11

144

9,000

0,062

А1

0,392

В1

10

154

9,059

0,181

А1

0,457

В1

10

164

9,111

0,891

А2

0,336

В1

8

172

9,053

0,375

А1

0,094

В1

10

182

9,100

0,009

А1

0,522

В1

10

192

9,143

0,255

А1

0,806

В2

7

199

9,045

0,273

А1

0,562

В1

10

209

9,087

0,111

А1

0,805

В2

7

216

9,000

0,888

А2

0,037

В1

8

224

8,960

0,392

А1

0,341

В1

10

234

9,000

0,843

А2

0,808

В2

11

245

9,074

0,086

А1

0,585

В1

10

255

9,107

0,426

А1

0,370

В1

10

265

9,138

0,562

А2

0,688

В2

11

276

9,200

Таким образом, в результате моделирования в 30 партиях цена игры (средний выигрыш) равен 9,2. Этот результат согласуется с теоретической ценой игры 9.

Частоты использования игроками своих чистых стратегий соответственно равны:

Х(18/30;12/30), Y(21/30; 9/30) или

Х(0,6; 0,4), Y(0,7; 0,3)

Сравнивая с теоретическими оптимальными стратегиями Х*(0,5; 0,5) и Y*(0,67; 0,33) можно сделать вывод, что результаты моделирования достаточно близко им соответствуют даже для небольшого количества партий.

загрузка...