Смешанные стратегии


В случае отсутствия седловой точки, в качестве решения игры используются так называемые смешанные стратегии

,

где pi и qj – вероятности выбора стратегий Ai и Bj игроками A и B соответственно. Решением игры в данном случае является пара оптимальных смешанных стратегий (SA*, SB*), максимизирующих математическое ожидание цены игры (средний выигрыш).

Теорема 3.2[6]. Любая антагонистическая игра имеет хотя бы одно оптимальное решение, т.е., пару в общем случае смешанных стратегий (SA*, SB*), дающих игроку А устойчивый выигрыш, равный цене игры V ≤ V ≤ β.

Чистую стратегию можно рассматривать как частный случай смешанной стратегии, когда одна вероятность имеет единичное значение, а все остальные – нулевое.

Рассмотрим матричную игру G(m´n), не имеющую седловой точки, для которой необходимо найти решение – пару оптимальных смешанных стратегий SA =(p1, p2, , pmSB =(q1, q2, , qn) и соответствующую цену игры V.

Предварительно следует попытаться упростить матрицу игры. Для этого вводятся отношения предпочтения (доминирования) и безразличия (дублирования) на множестве стратегий.

Определение 3.3:

· стратегия Ai предпочтительнее стратегии Ak (доминирует Ak) (обозначается ), если все выигрыши, указанные в i-й строке матрицы игры, не меньше соответствующих выигрышей k-й строки, или формально ;

· стратегии Ai и Ak находятся в отношении безразличия (дублирования) (обозначается Ai»Ak), если все выигрыши, указанные в i-й строке матрицы игры, совпадают с соответствующими выигрышами k-й строки, или формально ;

· стратегия Bj предпочтительнее стратегии Br (доминирует Br) (обозначается ), если все выигрыши, указанные в j-м столбце матрицы игры, не меньше соответствующих выигрышей r-го столбца, или формально ;

· отношение безразличия для стратегий игрока B вводится аналогично игроку A, т.е. .

Можно доказать следующую лемму [5].

Лемма 3.2. Для игры G(m´n)число активных стратегий игроков равно min{m,n}. Другими словами, если, например, m>n, то в оптимальной стратегии SA =(p1, p2, , pm) игрока A будет не более n отличных от нуля вероятностей pi.

Таким образом, предварительным этапом решения матричной игры является ее упрощение, т.е. удаление из матрицы доминируемых и дублируемых стратегий.

Рассмотрим данный этап на примере матричной игры G(5´5), представленной табл. 3.7.

Таблица 3.7

Bj Ai B1 B2 B3 B4 B5
A1
A2
A3
A4
A5

 

Так как справедливы соотношения , , , , , то удалим доминируемые и дублируемые стратегии A4, A5, B2, B4, B5.

В полученной матрице снова проведём удаление, так как . Получим упрощенную игру G(2´2), представленную табл. 3.8.

Таблица 3.8

Bj Ai B1 B3
A1
A2

 

Нетрудно убедиться, что данная игра не имеет седловой точки и необходимо искать решение в смешанных стратегиях.

После упрощения игры следующим (основным) этапом является поиск оптимального решения в виде смешанных стратегий (SA, SB), применяя точные или приближенные методы.

Метод Лагранжа

Метод Лагранжа относится к точным методам решения матричных игр G(m´m), т.е. имеющим квадратные матрицы (или приведенные к такому виду после упрощения).

Допустим, что игрок A использует смешанную стратегию SA =(p1,, pm), а игрок B отвечает своей чистой стратегией Bi (i =1, 2, , m). Цена игры в таком случае равна . Если же игрок B также будет применять смешанную стратегию SB =(q1,, qm), то итоговая цена игры будет равна

. (3.1)

Для нахождения оптимального решения необходимо максимизировать значение V при ограничениях .

Составим функцию Лагранжа L = V + l1(p1 + … + pm – 1) + l2(q1 + … + qm – 1) и приравняем к нулю частные производные по всем аргументам: .

В результате получим следующую систему из (2m + 2)уравнений с (2m + 2) неизвестными:

Решение этой системы и даёт смешанные стратегии для обоих игроков.

Нетрудно заметить, что исходная система уравнений включает две независимые подсистемы (для pi, i =1,, m, l1 и qj, j =1,, m, l2 соответственно), состоящие из (m + 1)уравнений с (m + 1)неизвестными, решение которых и даст искомые вероятности pi и qj, а также после подстановки этих вероятностей в формулу (3.1) цену игры V.

В качестве примера рассмотрим игру G(2´2), представленную в общем виде табл. 3.9.

Таблица 3.9

Bj Ai B1 B2
A1 a11 a12
A2 a21 a22

 

V1 = a11p1 + a21p2, V2 = a12p1 + a22p2,

V = V1q1 + V2q2 = (a11p1 + a21p2)q1 + (a12p1 + a22p2)q2.

L = V + l1(p1 + p2 – 1) + l2(q1 + q2 – 1).

Приравняв к нулю частные производные функции Лагранжа по всем аргументам, получим следующую систему уравнений:

Решив данную систему получим следующие значения вероятностей:

.

Подставив полученные значения в выражение для V, получим цену игры.

Например, для игры G(2´2), представленной табл. 3.8, получим:

p1=0,6; p2=0,4; q1=0,8; q3=0,2; V =3,6.

Можно также найти решение в общем виде для игры G(3´3)и т.д.

Приведем более универсальный и достаточно легко компьютеризируемый способ решения матричных игр методом Лагранжа.

Рассмотрим игру игры G(3´3) в общем виде, представленную табл. 3.10.

Таблица 3.10

Bj Ai B1 B2 B3
A1 a11 a12 a13
A2 a21 a22 a23
A3 a31 a32 a33

 

Для нахождения решения в смешанных стратегиях необходимо решить следующую систему уравнений:

Эту систему можно представить следующим образом:

.

Решением в общем виде представляется системой

Более конкретно:

 

Обозначив

k = – a11a22 + a11a32 + a11a23a11a33 + a21a12a21a32

a21a13 + a21a33a31a12 + a31a22 + a31a13a31a23

a12a23 + a12a33 + a22a13a22a33a32a13 + a32a23,

получим итоговое решение:

p1 = (– a21a32 + a21a33 + a31a22a31a23a22a33 + a32a23) / k

p2 = ( a11a32a11a33a31a12 + a31a13 + a12a33a32a13) / k

p3 = (– a11a22 + a11a23 + a21a12a21a13a12a23 + a22a13) / k

q1 = (– a12a23 + a12a33 + a22a13a22a33a32a13 + a32a23) / k

q2 = ( a11a23a11a33a21a13 + a21a33 + a31a13a31a23) / k

q3 = (– a11a22 + a11a32 + a21a12a21a32a31a12 + a31a22) / k

V = – |A| / |A1|,

где А — исходная матрица игры.

Данный подход легко применим для произвольной игры G(m´m): строится матрица A1, далее, используя определители, записываются выражения для pi и qj, множитель знака для них будет равен (1)m + i + 1.



Дата добавления: 2020-06-09; просмотров: 544;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.018 сек.