Итерационный метод Брауна-Робинсона

Пусть игра задана матрицей A размерности m x n. Каждое разыгрывание игры в чистых стратегиях будет далее называться партией. Метод Брауна-Робинсон — это итеративная процедура построения последовательности пар смешанных стратегий игроков, сходящейся к решению матричной игры.
В 1-ой партии оба игрока выбирают произвольную чистую стратегию. Пусть сыграно k партий, причем выбор стратегии в каждой партии запоминается. В (k + 1)-ой партии каждый игрок выбирает ту чистую стратегию, которая максимизирует его ожидаемый выигрыш, если противник играет в соответствии с эмпирическим вероятностным распределением, сформировавшимся за k партий. Оценивается интервал для цены игры и, если он достаточно мал, процесс останавливается. Полученные при этом вероятностные распределения определяют смешанные стратегии игроков.

Достоинства метода Брауна:

Этот метод ориентирован на произвольную игру G(m×n).
Не требует условия a_ij>0.
Легко реализуем программными методами.

Недостатки метода Брауна: скорость сходимости метода быстро уменьшается с ростом размерности матрицы игры.
Рассмотрим метод на примере игры G(3×3).

A_i \ B_j	B₁	B₂	B₃
A₁	7	2	9
A₂	2	9	0
A₃	9	0	11

S_A=(p₁,p₂,p₃)

S_B=(q₁,q₂,q₃)

Строится следующая матрица:

k	i	B₁	B₂	B₃	j	A₁	A₂	A₃	Vmin	Vmax	V^*
1	3	9	0	11	2	2	9	0	0	9	4.5
2	2	11	9	11	2	4	18	0	4.5	9	6.75
3	2	13	18	11	3	13	18	11	3.67	6	4.84
4	2	13	18	11	3	22	18	22	…	…	…
5	…	…	…	…	…	…	…	…	…	…	…
…	…	…	…	…	…	…	…	…	…	…	…

где:
k – номер партии.
i – номер стратегии, выбираемой игроком A.
j – номер стратегии, выбираемой игроком В.
B_i– накопленный игроком А выигрыш за k партий, при условии, что в данной партии B выбирает стратегию B_i.
А_j – накопленный игроком В проигрыш за k партий, при условии, что в данной партии A выбирает стратегию А_j.
Vmin – нижняя оценка игры = min (накопленный выигрыш)/k.
Vmax – верхняя оценка игры = max (накопленный проигрыш)/k.

Доказано, что
V^*=(Vmin+Vmix)/2, V^* à V при k à ¥ и

N_i - сколько раз выбирается А_iстратегия.
N_j - сколько раз выбирается B_jстратегия.
Итерационный процесс метода Брауна-Робинсон не является, вообще говоря, монотонным. Кроме того, скорость сходимости метода быстро уменьшается с ростом размерности матрицы игры. Однако он обладает одним неоспоримым преимуществом, которое заключается в исключительной простоте программирования метода.

Пример.
1. Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.
Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.

Игроки	B₁	B₂	B₃	a = min(A_i)
A₁	6	1	4	1
A₂	2	4	2	2
A₃	4	3	5	3
b = max(B_i)	6	4	5

Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(a_i) = 3, которая указывает на максимальную чистую стратегию A₃.
Верхняя цена игры b = min(b_j) = 4.
Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 3 <= y <= 4. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).

k	i	B₁	B₂	B₃	j	A₁	A₂	A₃	V_min	V^max	V_ср
1	1	6	1	4	2	1	4	3	1	4	⁵/₂
2	2	8	5	6	2	2	8	6	⁵/₂	4	¹³/₄
3	2	10	9	8	3	6	10	11	⁸/₃	¹¹/₃	¹⁹/₆
4	3	14	12	13	2	7	14	14	3	⁷/₂	¹³/₄
5	2	16	16	15	3	11	16	19	3	¹⁹/₅	¹⁷/₅
6	3	20	19	20	2	12	20	22	¹⁹/₆	¹¹/₃	⁴¹/₁₂
7	3	24	22	25	2	13	24	25	²²/₇	²⁵/₇	⁴⁷/₁₄
8	3	28	25	30	2	14	28	28	²⁵/₈	⁷/₂	⁵³/₁₆
9	2	30	29	32	2	15	32	31	²⁹/₉	³²/₉	⁶¹/₁₈
10	2	32	33	34	1	21	34	35	¹⁶/₅	⁷/₂	⁶⁷/₂₀
11	3	36	36	39	1	27	36	39	³⁶/₁₁	³⁹/₁₁	⁷⁵/₂₂
12	3	40	39	44	2	28	40	42	¹³/₄	⁷/₂	²⁷/₈
13	3	44	42	49	2	29	44	45	⁴²/₁₃	⁴⁵/₁₃	⁸⁷/₂₆
14	3	48	45	54	2	30	48	48	⁴⁵/₁₄	²⁴/₇	⁹³/₂₈
15	2	50	49	56	2	31	52	51	⁴⁹/₁₅	⁵²/₁₅	¹⁰¹/₃₀
16	2	52	53	58	1	37	54	55	¹³/₄	⁵⁵/₁₆	¹⁰⁷/₃₂
17	3	56	56	63	1	43	56	59	⁵⁶/₁₇	⁵⁹/₁₇	¹¹⁵/₃₄
18	3	60	59	68	2	44	60	62	⁵⁹/₁₈	³¹/₉	¹²¹/₃₆
19	3	64	62	73	2	45	64	65	⁶²/₁₉	⁶⁵/₁₉	¹²⁷/₃₈
20	3	68	65	78	2	46	68	68	¹³/₄	¹⁷/₅	¹³³/₄₀

N_A1 = 1
P(A₁) = 1/20 = ¹/₂₀
N_A2 = 7
P(A₂) = 7/20 = ⁷/₂₀
N_A3 = 12
P(A₃) = 12/20 = ³/₅
N_B1 = 4
P(B₄) = 4/20 = ¹/₅
N_B2 = 14
P(B₄) = 14/20 = ⁷/₁₀
N_B3 = 2
P(B₄) = 2/20 = ¹/₁₀
Цена игры, W = ¹³³/₄₀
p = (¹/₂₀, ⁷/₂₀, ³/₅)
q = (¹/₅, ⁷/₁₀, ¹/₁₀)

Итерационный метод Брауна-Робинсона

Правила ввода данных

Поиск

Процесс

Сообщение