Игра 2–х лиц без седловой точки. Смешанные стратегии

Одна из возможностей расширения стратегий игроков – разнообразить способ выбора своей стратегии, например, «случайно».

Как мы уже отмечали, в отсутствии Седловой точки, игрок А, применяя свою максиминную стратегию, выиграет не менее , а игрок В, применяя свою минимаксную стратегию, проигрывает не более , где . Применение чистых стратегий в каждой партии такой игры не дает возможность игрокам увеличить выигрыш , чем уменьшить проигрыш . Для того, чтобы это было возможным необходимо применять не одну, а несколько чистых стратегий, чередуя их случайным образом с какими–то частотами. Такая стратегия получила название смешанной (ее элементами являются чистые стратегии).

Смешанная стратегия имеет смысл при условии, что игра состоит более чем из одной партии.

Обозначим смешанные стратегии игроков А и В через

и , где

– вероятность (частота) применения игроком А чистой стратегии , – вероятность (частота) принятия игроком В чистой стратегии .

Причем и .

Чистые стратегии игроков А и В, для которых вероятности и отличны от 0, называются активными.

Теорема (основная теорема теории игр) (теорема минимакса).

Любая конечная игра двух лиц с нулевой суммой имеет, по крайней мере, одно решение (т.е. пару оптимальных стратегий, в общем случае смешанных) и соответствующую цену.

Решение игры, не имеющей Седловой точки, может осуществляться различными методами. Рассмотрим наиболее важные из них.

7.3.1. Графическое решение игр вида (2×n) и (m×2)

Этот метод применим только к играм, в которых хотя бы один игрок имеет только две стратегии.

Рассмотрим следующую игру (без Седловой точки)

Ожидаемые выигрыши игрока А, соответствующие чистым стратегиям игрока В, представлены в таблице

В А			…
			…
			…

Отсюда видно, что ожидаемый выигрыш игрока А линейно зависит от . В соответствии с критерием минимакса игрок А должен выбирать так:

Чистые стратегии игрока В	Ожидаемые выигрыши игрока А


…	…
N

Пример:

В_j А_i

В₁

В₂

В₃

А₁ доминирующая одинаковые

В₄

А₁

А₂

А₃

А₄

Замечания: Стратегии, для которых есть доминирующие и дублирующие стратегии можно отбрасывать.

В_j А_i	В₁	В₂	В₃	В₄
А₁
А₄

В₃ доминирующая

В_j А_i	В₁	В₂	В₄
А₁
А₄

Чистая стратегия Игрок В	Ожидаемый выигрыш игрока А	– цена игры
–6х₁ + 8
–2х₁ + 6
5х₁ + 1

	Чистая стратегия Игрока А	Ожидаемый выигрыш Игрока В
	–4у₁+6
	7у₁+1

7.3.2. Решение игр “m×n” симплекс–методом

Допустим, что все элементы платежной матрицы положительны. Этого можно добиться, добавив ко всем членам матрицы достаточно большое число М. Это приведет к увеличению цены игры на М, а оптимальное решение и не изменится.

B A	q₁	q₂	…	q_n
p₁	α₁₁	α₁₂	…	α_1n
p₂	α₂₁	α₁₂	…	α_2n
…	…	…	…	…
p_m	α_m1	α_m2	…	α_mn

Найдем сначала . На основе принципа целесообразности.

или

где

Очевидно:

Таким образом, решение игры свелось к следующей задаче

(1) – это задача линейного программирования

Оптимальная стратегия игрока В находится аналогично. Она является решением задачи.

(2)

Нетрудно видеть, что задачи (1) и (2) – пара двойственных задач. Следовательно, .

<13 14 151617 18 19 >

Дата добавления: 2020-11-18; просмотров: 751;

Игра 2–х лиц без седловой точки. Смешанные стратегии

Публикации по технике и механике

Публикации по биологии

Публикации по информатике

Публикации по строительству

Публикации по физике

Публикации по химии

Публикации по электронике

Публикации по искусству

Публикации по географии

Публикации по медицине

Публикации по педагогике