Смешанные стратегии
В случае отсутствия седловой точки, в качестве решения игры используются так называемые смешанные стратегии
,
где pi и qj – вероятности выбора стратегий Ai и Bj игроками A и B соответственно. Решением игры в данном случае является пара оптимальных смешанных стратегий (SA*, SB*), максимизирующих математическое ожидание цены игры (средний выигрыш).
Теорема 3.2[6]. Любая антагонистическая игра имеет хотя бы одно оптимальное решение, т.е., пару в общем случае смешанных стратегий (SA*, SB*), дающих игроку А устойчивый выигрыш, равный цене игры V,α ≤ V ≤ β.
Чистую стратегию можно рассматривать как частный случай смешанной стратегии, когда одна вероятность имеет единичное значение, а все остальные – нулевое.
Рассмотрим матричную игру G(m´n), не имеющую седловой точки, для которой необходимо найти решение – пару оптимальных смешанных стратегий SA =(p1, p2, …, pm)и SB =(q1, q2, …, qn) и соответствующую цену игры V.
Предварительно следует попытаться упростить матрицу игры. Для этого вводятся отношения предпочтения (доминирования) и безразличия (дублирования) на множестве стратегий.
Определение 3.3:
· стратегия Ai предпочтительнее стратегии Ak (доминирует Ak) (обозначается ), если все выигрыши, указанные в i-й строке матрицы игры, не меньше соответствующих выигрышей k-й строки, или формально ;
· стратегии Ai и Ak находятся в отношении безразличия (дублирования) (обозначается Ai»Ak), если все выигрыши, указанные в i-й строке матрицы игры, совпадают с соответствующими выигрышами k-й строки, или формально ;
· стратегия Bj предпочтительнее стратегии Br (доминирует Br) (обозначается ), если все выигрыши, указанные в j-м столбце матрицы игры, не меньше соответствующих выигрышей r-го столбца, или формально ;
· отношение безразличия для стратегий игрока B вводится аналогично игроку A, т.е. .
Можно доказать следующую лемму [5].
Лемма 3.2. Для игры G(m´n)число активных стратегий игроков равно min{m,n}. Другими словами, если, например, m>n, то в оптимальной стратегии SA =(p1, p2, …, pm) игрока A будет не более n отличных от нуля вероятностей pi.
Таким образом, предварительным этапом решения матричной игры является ее упрощение, т.е. удаление из матрицы доминируемых и дублируемых стратегий.
Рассмотрим данный этап на примере матричной игры G(5´5), представленной табл. 3.7.
Таблица 3.7
Bj Ai | B1 | B2 | B3 | B4 | B5 |
A1 | |||||
A2 | |||||
A3 | |||||
A4 | |||||
A5 |
Так как справедливы соотношения , , , , , то удалим доминируемые и дублируемые стратегии A4, A5, B2, B4, B5.
В полученной матрице снова проведём удаление, так как . Получим упрощенную игру G(2´2), представленную табл. 3.8.
Таблица 3.8
Bj Ai | B1 | B3 |
A1 | ||
A2 |
Нетрудно убедиться, что данная игра не имеет седловой точки и необходимо искать решение в смешанных стратегиях.
После упрощения игры следующим (основным) этапом является поиск оптимального решения в виде смешанных стратегий (SA, SB), применяя точные или приближенные методы.
Метод Лагранжа
Метод Лагранжа относится к точным методам решения матричных игр G(m´m), т.е. имеющим квадратные матрицы (или приведенные к такому виду после упрощения).
Допустим, что игрок A использует смешанную стратегию SA =(p1, …, pm), а игрок B отвечает своей чистой стратегией Bi (i =1, 2, …, m). Цена игры в таком случае равна . Если же игрок B также будет применять смешанную стратегию SB =(q1, …, qm), то итоговая цена игры будет равна
. (3.1)
Для нахождения оптимального решения необходимо максимизировать значение V при ограничениях .
Составим функцию Лагранжа L = V + l1(p1 + … + pm – 1) + l2(q1 + … + qm – 1) и приравняем к нулю частные производные по всем аргументам: .
В результате получим следующую систему из (2m + 2)уравнений с (2m + 2) неизвестными:
Решение этой системы и даёт смешанные стратегии для обоих игроков.
Нетрудно заметить, что исходная система уравнений включает две независимые подсистемы (для pi, i =1, …, m, l1 и qj, j =1, …, m, l2 соответственно), состоящие из (m + 1)уравнений с (m + 1)неизвестными, решение которых и даст искомые вероятности pi и qj, а также после подстановки этих вероятностей в формулу (3.1) цену игры V.
В качестве примера рассмотрим игру G(2´2), представленную в общем виде табл. 3.9.
Таблица 3.9
Bj Ai | B1 | B2 |
A1 | a11 | a12 |
A2 | a21 | a22 |
V1 = a11p1 + a21p2, V2 = a12p1 + a22p2,
V = V1q1 + V2q2 = (a11p1 + a21p2)q1 + (a12p1 + a22p2)q2.
L = V + l1(p1 + p2 – 1) + l2(q1 + q2 – 1).
Приравняв к нулю частные производные функции Лагранжа по всем аргументам, получим следующую систему уравнений:
Решив данную систему получим следующие значения вероятностей:
.
Подставив полученные значения в выражение для V, получим цену игры.
Например, для игры G(2´2), представленной табл. 3.8, получим:
p1=0,6; p2=0,4; q1=0,8; q3=0,2; V =3,6.
Можно также найти решение в общем виде для игры G(3´3)и т.д.
Приведем более универсальный и достаточно легко компьютеризируемый способ решения матричных игр методом Лагранжа.
Рассмотрим игру игры G(3´3) в общем виде, представленную табл. 3.10.
Таблица 3.10
Bj Ai | B1 | B2 | B3 |
A1 | a11 | a12 | a13 |
A2 | a21 | a22 | a23 |
A3 | a31 | a32 | a33 |
Для нахождения решения в смешанных стратегиях необходимо решить следующую систему уравнений:
Эту систему можно представить следующим образом:
.
Решением в общем виде представляется системой
Более конкретно:
Обозначив
k = – a11a22 + a11a32 + a11a23 – a11a33 + a21a12 – a21a32 –
– a21a13 + a21a33 – a31a12 + a31a22 + a31a13 – a31a23 –
– a12a23 + a12a33 + a22a13 – a22a33 – a32a13 + a32a23,
получим итоговое решение:
p1 = (– a21a32 + a21a33 + a31a22 – a31a23 – a22a33 + a32a23) / k
p2 = ( a11a32 – a11a33 – a31a12 + a31a13 + a12a33 – a32a13) / k
p3 = (– a11a22 + a11a23 + a21a12 – a21a13 – a12a23 + a22a13) / k
q1 = (– a12a23 + a12a33 + a22a13 – a22a33 – a32a13 + a32a23) / k
q2 = ( a11a23 – a11a33 – a21a13 + a21a33 + a31a13 – a31a23) / k
q3 = (– a11a22 + a11a32 + a21a12 – a21a32 – a31a12 + a31a22) / k
V = – |A| / |A1|,
где А — исходная матрица игры.
Данный подход легко применим для произвольной игры G(m´m): строится матрица A1, далее, используя определители, записываются выражения для pi и qj, множитель знака для них будет равен (–1)m + i + 1.
Дата добавления: 2020-06-09; просмотров: 534;