Итерационный метод Брауна-Робинсона


Также универсальным, но менее трудоемким по сравнению с методом линейного программирования в плане затрат вычислительных ресурсов является приближенный метод Брауна-Робинсона. Данный итерационный метод предназначен для решения любой игры G(m´n), не требуя никаких ограничений на элементы матрицы игры.

Метод базируется на многократном разыгрывании игры и подсчете верхней и нижней оценок цены игры с занесением результатов в таблицу специального вида (табл. 3.11):

Таблица 3.11

k i B1 Bn j A1 Am V V*
                       

 

Каждая строка таблицы соответствует однократному розыгрышу игры (партии игры).

Поясним записи в соответствующих позициях:

· k — номер партии (итерации);

· i и j — номера стратегий, выбранных соответственно игроками A и B в данной партии;

· B1,, Bn — накопленный за k партий выигрыш игрока A при выборе им стратегии Ai в данной партии и ответе игроком B соответственно стратегиями B1,, Bn;

· A1,, Am — накопленный за k партий выигрыш игрока A при выборе игроком B стратегии Bj в данной партии и ответе игроком A соответственно стратегиями A1,, Am;

· V —нижняя оценка цены игры (минимальный накопленный выигрыш, поделенный на k);

· — верхняя оценка цены игры (максимальный накопленный выигрыш, поделенный на k);

· .

В [6] доказано, что при k à ¥: V*à V, , ,

где V – цена игры, Ni и Nj – число применений соответственно стратегий Аi и Bj за k партий, pi и qj – значения вероятностей в оптимальных стратегиях SA =(pi), i =1,, m, SB =(qj), j =1, , n,игроков A и B соответственно.

Проиллюстрируем метод на примере игры G(3´3), представленной табл. 3.12.

Таблица 3.12

Bj Ai B1 B2 B3
A1
A2
A3

Требуется найти решение – пару оптимальных смешанных стратегий (SA, SB), SA =(p1, p2, p3), SB =(q1, q2, q3), и цену игры V.

Будем искать пару смешанных стратегий SA =(p1, p2, p3), p1 + p2 + p3 = 1, SB =(q1, q2, q3), q1 + q2 + q3 = 1 и цену игры V.

Построим табл. 3.13 для первых десяти итераций.

Таблица 3.13

k i B1 B2 B3 j A1 A2 A3 V `V V*
1 4,5
2 4,5 6,75
3 3,67 4,84
4 2,75 5,5 4,13
5 4,0 6,6 5,3
6 4,84 5,5 5,17
7 4,43 5,14 4,79
8 5,0 5,61 5,30
9 4,45 5,11 4,78
10 4,90 5,30 5,1

 

Поясним процесс заполнения табл. 3.13.

Пусть начинает (k =1) игрок A и выбирает на первом шаге стратегию А1. Его выигрыш в зависимости от выбора игрока B может равняться 9 (при выборе стратегии B1), 0 (при выборе B2) или 11 (при выборе B3). Поскольку теперь выбор за игроком B (а он заинтересован в минимизации выигрыша игрока A), то выделим (жирным шрифтом) минимальный выигрыш 0, соответствующий стратегии B2. Следовательно игроку B выгоднее всего ответить стратегией B2, что, в свою очередь, может привести к выигрышу игрока A при его ответе в следующей партии, равному 2 (при выборе стратегии A1), 9 (A2) или 0 (A3). Так как игрок A заинтересован в максимизации выигрыша, то выделим максимальный выигрыш 9 (для A2). Соответствующие значения V, и V* равны 0; 9 и 4,5.

Во второй партии (k =2) игроку A,следовательно,выгодно выбратьстратегию A2,которая позволит ему накопить выигрыш, равный соответственно 11 (для B1), 9 (для B2) или 11 (для B3) и т.д. Заметим, что для k =4в столбцах А1и А3 получаются одинаковые накопленные выигрыши (22), поэтому игрок A в пятой партии может выбрать как стратегию А1, так и А3.

К сожалению (что видно и по табл. 3.12), сходимость данного метода довольно слабая, но существуют методы ее ускорения. Критерием останова можно выбрать достаточную стабильность величины V* при увеличении числа итераций.

Для рассматриваемого примера в итоге получим:

и , что соответствует точному решению, полученному, например, методом Лагранжа.

Как уже отмечалось, сравнительно невысокая трудоемкость данного метода часто делает его более предпочтительным по сравнению с методом линейного программирования (например, симплекс-методом) при решении задач линейного программирования (после их сведения к соответствующей теоретико-игровой задачи) большой размерности.



Дата добавления: 2020-06-09; просмотров: 631;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.01 сек.