Смешанные стратегии
В приведенных примерах описаны ситуации, в которых интересы игроков не совпадают. Естественно встает вопрос о том, какие рекомендации необходимо дать игрокам для того, чтобы моделируемая конфликтная ситуация разрешилась.
Иными словами, что мы будем понимать под решением биматричной игры?
Попробуем ответить на этот вопрос так: вследствие того, что интересы игроков не совпадают, нам нужно построить такое (компромиссное) решение, которое бы в том или ином, но в одинаковом смысле удовлетворяло обоих игроков.
Иначе говоря, попробуем найти некую равновесную ситуацию, явное отклонение от которой уменьшает выигрыш игрока.
Подобный вопрос мы ставили и при рассмотрении матричных игр. Напомним, что возникавшее при разработке минимаксного подхода понятие равновесной ситуации приводило нас к поиску седловой точки, которая, как оказалось, существует далеко не всегда.
Естественно ожидать, что в более сложном случае биматричной игры дело вряд ли будет обстоять проще.
В матричных играх эта трудность была преодолена путем перехода к смешанным стратегиям, т. е. к такому поведению игроков, при котором они чередуют свои собственные чистые стратегии.
Иными словами, любая матричная игра в смешанных стратегиях разрешима.
Поэтому, рассматривая здесь биматричные игры, разумно попробовать сразу же перейти к смешанным стратегиям игроков. Тем самым мы предполагаем, что каждая игра может быть повторена в неизменных обстоятельствах многократно.
2 ´ 2 - биматричные игры. Ситуация равновесия
В 2´2 - биматричной игре платежные матрицы игроков имеют следующий вид:
А= , В= .
Вероятности выбора стратегий игрока А р1=р, р2=1 – р, игрока В q1=q, q2=1–q, а средние выигрыши вычисляются по формулам
HA(р, q) = a11pq + a12p(l - q) + a21(l - p)q + a22(1 - p)(l - q),
HB(р, q) = b11pq + b12p(l - q) + b21(l - p)q + b22(1 - p)(l - q),
где
0 £ р£ 1, 0 £ q£ l.
Определение. Будем говорить, что пара чисел
(p*,q*), 0 £ р* £ 1, 0 £ q* £ l,
определяет равновесную ситуацию, если для любых р и q, подчиненных условиям 0 £ р £ 1, 0 £ q £ l, одновременно выполнены следующие неравенства:
HA(р, q*) £ HA(р*, q*), HB(р*, q) £ HB(р*, q*). (2.7.3)
Пояснение. Неравенства (2.7.3)означают следующее: ситуация, определяемая смешанной стратегией (р*, q*), является равновесной, если отклонение от нее одного из игроков при условии, что другой сохраняет свой выбор, приводит к уменьшению выигрыша первого. Тем самым получается, что если равновесная ситуация существует, то отклонение от нее невыгодно самому игроку.
ТЕОРЕМА (Дж. Нэш). Всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.
Итак, равновесная ситуация существует. Но как ее найти?
Дляобоснования способа определения равновесной ситуации сошлемся на следующийтеоретический результат.
ТЕОРЕМА. Выполнение неравенств (2.7.3) равносильно выполнению неравенств
HA(0, q*) £ HA(р*, q*), HB(р*, 0) £ HB(р*, q*), (2.7.4)
HA(1, q*) £ HA(р*, q*), HB(р*, 1) £ HB(р*, q*).
Иными словами, для того чтобы убедиться, что пара (p*, q*)определяет равновесную ситуацию, достаточно проверить справедливость неравенств (2.7.2) только для двух чистых стратегий игрока А (р = 0 и р = 1) и для двух чистых стратегий игрока В (q = 0 и q = 1).
Пропуская промежуточные алгебраические выкладки, приходим к следующему результату:
Для того чтобы в биматричной игре пара (p*, q*)определяла равновесную ситуацию, необходимо и достаточно одновременное выполнение следующих неравенств:
(p-1)(Cq-a) ³ 0,
p(Cq-a) ³ 0,
(q-1)(Dp-b)³0, (2.7.5)
q(Dp - b) ³ 0,
0 £ р £ 1, 0 £ q £ l,
где
С = a11 – a12 – a21 + a22, a = a22 – a12,
D = b11 – b12 – b21 + b22, b = b22 – b21,
Дата добавления: 2020-10-25; просмотров: 372;