Игра 2–х лиц без седловой точки. Смешанные стратегии


Одна из возможностей расширения стратегий игроков – разнообразить способ выбора своей стратегии, например, «случайно».

Как мы уже отмечали, в отсутствии Седловой точки, игрок А, применяя свою максиминную стратегию, выиграет не менее , а игрок В, применяя свою минимаксную стратегию, проигрывает не более , где . Применение чистых стратегий в каждой партии такой игры не дает возможность игрокам увеличить выигрыш , чем уменьшить проигрыш . Для того, чтобы это было возможным необходимо применять не одну, а несколько чистых стратегий, чередуя их случайным образом с какими–то частотами. Такая стратегия получила название смешанной (ее элементами являются чистые стратегии).

Смешанная стратегия имеет смысл при условии, что игра состоит более чем из одной партии.

Обозначим смешанные стратегии игроков А и В через

и , где

– вероятность (частота) применения игроком А чистой стратегии , – вероятность (частота) принятия игроком В чистой стратегии .

Причем и .

Чистые стратегии игроков А и В, для которых вероятности и отличны от 0, называются активными.

Теорема (основная теорема теории игр) (теорема минимакса).

Любая конечная игра двух лиц с нулевой суммой имеет, по крайней мере, одно решение (т.е. пару оптимальных стратегий, в общем случае смешанных) и соответствующую цену.

Решение игры, не имеющей Седловой точки, может осуществляться различными методами. Рассмотрим наиболее важные из них.

 

7.3.1. Графическое решение игр вида (2×n) и (m×2)

Этот метод применим только к играм, в которых хотя бы один игрок имеет только две стратегии.

Рассмотрим следующую игру (без Седловой точки)

Ожидаемые выигрыши игрока А, соответствующие чистым стратегиям игрока В, представлены в таблице

 

В А

 

Отсюда видно, что ожидаемый выигрыш игрока А линейно зависит от . В соответствии с критерием минимакса игрок А должен выбирать так:

 

Чистые стратегии игрока В Ожидаемые выигрыши игрока А
N

 

 

Пример:

Вj Аi В1 В2 В3
  А1 доминирующая одинаковые
В4

А1 6
А2
А3
А4

 

Замечания: Стратегии, для которых есть доминирующие и дублирующие стратегии можно отбрасывать.

 

Вj Аi В1 В2 В3 В4
А1
А4

В3 доминирующая

 

 

Вj Аi В1 В2 В4  
А1
А4
 

        Чистая стратегия Игрок В Ожидаемый выигрыш игрока А   – цена игры
–6х1 + 8  
–2х1 + 6  
1 + 1  
     
  Чистая стратегия Игрока А   Ожидаемый выигрыш Игрока В
–4у1+6
1+1
   

 
 


 

7.3.2. Решение игр “m×n” симплекс–методом

Допустим, что все элементы платежной матрицы положительны. Этого можно добиться, добавив ко всем членам матрицы достаточно большое число М. Это приведет к увеличению цены игры на М, а оптимальное решение и не изменится.

B A q1 q2 qn
p1 α11 α12 α1n
p2 α21 α12 α2n
pm αm1 αm2 αmn

 

Найдем сначала . На основе принципа целесообразности.

или

где

Очевидно:

Таким образом, решение игры свелось к следующей задаче

 

(1) – это задача линейного программирования

Оптимальная стратегия игрока В находится аналогично. Она является решением задачи.

 

(2)

 

Нетрудно видеть, что задачи (1) и (2) – пара двойственных задач. Следовательно, .

 

 




Дата добавления: 2020-11-18; просмотров: 397;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.011 сек.