Другие термины и понятия
Выбор и осуществление одного из предусмотренных правилами действий называется ходом игрока. Ходы могут быть личными и случайными. Личный ход – это сознательный выбор игроком одного из возможных действий. Случайный ход – это случайно выбранное действие (выбор карты из перетасованной колоды).
Стратегией игрока называется совокупность правил, определяющих выбор действия при каждом ходе в зависимости от сложившейся ситуации. Чтобы решить игру или найти решение игры, следует для каждого игрока выбрать стратегию, которая удовлетворяет условию оптимальности, то есть один из игроков получает максимальный выигрыш, когда второй придерживается своей стратегии. В то же время второй игрок должен иметь минимальный проигрыш, если первый придерживается своей стратегии. Такие стратегии называются оптимальными.
Оптимальные стратегии должны удовлетворять условию устойчивости, то есть любому из игроков должно быть невыгодно отказываться от своей стратегии в этой игре. Если игра повторяется много раз, то игроков может интересовать не выигрыш и проигрыш в каждой конкретной партии, а средний выигрыш (проигрыш) во всех партиях.
Целью теории игр является определение оптимальной стратегии для каждого игрока.
Выигрыш– это мера эффекта для игрока. В теории игр выигрыш должен измеряться обязательно количественно.
В случае конечной игры двух лиц функции выигрыша каждого из игроков удобно представлять в виде матрицы выигрышей, где строки представляют собой стратегии одного игрока, а столбцы – стратегии другого. В клетках матрицы указываются выигрыши каждого из игроков в каждой из образующихся ситуаций. Данная форма представления конечных игр называется «матричные игры».
Пример решения задачи. Игра в «орлянку».
Если оба выбирают одинаковые стратегии (оба говорят “орел”), то 1-й выигрывает 1 рубль (а второй проигрывает); если выбирают разные, то 2-й выигрывает.
Таблица 2.1
Матрица выигрыша первого игрока (Н1)
Орел | Решка | |
Орел | –1 | |
Решка | –1 |
Матрица выигрыша второго игрока (Н2)
Орел | Решка | |
Орел | –1 | |
Решка | –1 |
Для антагонистических игр всегда Н1= – Н2.
Матрица, элементами которой являются выигрыши, соответствующие стратегиям игроков, называется платежной матрицей или матрицей игры.
Нижняя цена игры (α) (максиминный выигрыш – максимин) – это гарантированный выигрыш первого игрока при любой стратегии второго игрока (то есть из каждой строки выбираем минимальное число, а затем из всех этих минимумов берем наибольший). Стратегия, соответствующая максимину называется максиминной.
Верхняя цена игры (β) (минимаксный выигрыш – минимакс) – это гарантированный проигрыш второго игрока. (То есть из каждого столбца выбираем максимальное число, а затем из всех максимумов берем наименьший). Стратегия, соответствующая минимаксу, называется минимаксной.
Принцип, диктующий игрокам выбор наиболее «осторожных» минимаксной и максиминной стратегий, называется принципом минимакса. Этот принцип следует из разумного предположения, что каждый игрок стремится достичь цели, противоположной цели противника. Если верхняя и нижняя цены игры совпадают α=β= , то эта цена называется чистой ценой игры или ценой игры.
Для А=
Для В=
Минимаксные стратегии, соответствующие цене игры, являются оптимальными стратегиями или решением игры. То есть в этом случае первый игрок получает максимальный, не зависящий от поведения второго игрока выигрыш q, а второй игрок добивается минимального гарантированного, не зависящего от поведения первого игрока проигрыша q. Такое решение обладает устойчивостью, то есть если один из игроков придерживается своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии.
Пара стратегий дает оптимальное решение игры тогда и только тогда, когда соответствующий элемент матрицы (размер выигрыша-проигрыша) является одновременно наибольшим в своем столбце и наименьшим в своей строке. Такая ситуация, если она существует, называется седловой точкой. То есть игра разрешима в чистых стратегиях, каждый из игроков будет на каждом шаге выбирать одну и ту же стратегию и ему не выгодно от нее отклониться: если первый игрок выберет другую стратегию, у него будет выигрыш меньше, а если второй игрок выберет другую стратегию, у него проигрыш будет больше.
Пример решения задачи.
Определить верхнюю и нижнюю цену игры, заданной платежной матрицей. Имеет ли игра седловую точку?
Р=
Таблица 2.2
Платежная матрица игры
B1 | B2 | B3 | α | |
A1 | 0,5 | 0,6 | 0,8 | 0,5 |
A2 | 0,9 | 0,7 | 0,8 | 0,7 |
A3 | 0,7 | 0,6 | 0,6 | 0,6 |
β | 0,9 | 0,7 | 0,8 | 0,7 |
– цена игры. Седловая точка (А2, В2).
Пример решения задачи. Рассмотрим две конкурирующие финансовые компании А и В. Компания В ведёт переговоры с организаторами каждого из трёх проектов В1 , В2 , В3 на предмет инвестирования. Задача компании В: положительный результат переговоров. Компания А ставит своей задачей свести переговоры компании В к отрицательному результату, с тем чтобы занять место компании В в инвестировании.
Компания А для достижения своей цели – срыва переговоров компании В – может применить одно из двух средств: А1 – предложить организаторам проектов более выгодные для них условия инвестирования по сравнению с компанией В и А2 – предоставить в распоряжение организаторов проектов материалы, компрометирующие компанию В.
Действие А1 компании А приводит к отрицательному результату переговоров компании В с организаторами проектов В1 , В2 , В3, соответственно, с вероятностями 0,7; 0,5; 0,3, а действие А2 – с вероятностями 0,6; 0,9; 0,4.
Решение. Смоделируем данную ситуацию. Поскольку компании А и В преследуют противоположные цели, то рассматриваемая конфликтная ситуация является антагонистической. Игроками являются финансовые компании А и В. Игрок А имеет две чистые стратегии А1 и А2: ; множество стратегий игрока В состоит из трёх стратегий: . Игрок В должен выбрать один из трех проектов, игрок А выбирает одно из двух своих действий.
В качестве выигрыша игрока А (или проигрыша игрока В) рассмотрим вероятность отрицательного результата переговоров компании В. В соответствии со своими задачами игрок А стремится максимизировать выигрыш, а игрок В – минимизировать проигрыш.
Выясним, имеет ли игра седловую точку, то есть, разрешима ли игра в чистых стратегиях.
Матрица игры с показателями эффективности стратегий А1 , А2 и показателями неэффективности стратегий В1 , В2 , В3 имеет следующий вид:
Таблица 2.3
Платежная матрица игры
Bj Ai | B1 | B2 | B3 | α |
A1 | 0,7 | 0,5 | 0,3 | 0,3 |
A2 | 0,6 | 0,9 | 0,4 | 0,4 |
β | 0,7 | 0,9 | 0,4 | 0,4 0,4 |
В данном случае максиминной стратегией игрока А является стратегия А2 , а минимаксной стратегией игрока В – стратегия В3.
Если игрок А придерживается своей максиминной стратегии А2 , то игрок В должен выбрать свою минимаксную В3, с тем чтобы выигрыш игрока А (или что то же – проигрыш игрока В) был минимальным а23 = 0,4 (во 2-й строке матрицы (6.1)). На это игрок А должен ответить выбором опять же стратегии А2 , чтобы получить максимальный (в 3-м столбце) выигрыш: а23 = 0,4. Ответным ходом игрок В опять выбирает стратегию В3 и т. д.
Таким образом, если игроки А и В придерживаются своих максиминной и минимаксной стратегий, то ни один из них не может увеличить свой выигрыш, отступая от своей стратегии. Ситуация (А2 , В3) является в данной игре устойчивой.
Нижняя и верхняя цены игры совпадают:
a = b = 0,4
Если игра не имеет седловой точки, то применение чистых стратегий не дает оптимального решения игры. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.
Смешанной стратегией SA игрока А называется применение чистых стратегий А1, А2,…..Аi, …., Аm с вероятностями p1, p2,…., pi,….,pm, причем сумма вероятностей равна 1: . Цена игры будет удовлетворять неравенству .
Основная теорема теории игр – теорема Неймана. Каждая конечная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.
В качестве примеров применения теории можно назвать решения по поводу проведения принципиальной ценовой политики, выхода на новые рынки, кооперации и создания совместных предприятий, определения лидеров и исполнителей в области инноваций, вертикальной интеграции и т.д. Положения данной теории в принципе можно использовать для всех видов решений, если на их принятие влияют другие действующие лица. Этими лицами, или игроками, необязательно должны быть рыночные конкуренты; в их роли могут выступать субпоставщики, ведущие клиенты, сотрудники организаций, а также коллеги по работе.
2.3. Геометрическая интерпретация игры 2´2
Пусть имеется два игрока А и В. У каждого из игроков по две стратегии (А1 и А2 у игрока А, В1 и В2 у игрока В). Игра с нулевой суммой.
По оси абсцисс отложим отрезок А1А2, то есть точка А1 изображает стратегию А1 (х=0), А2 – стратегию А2, все промежуточные точки – смешанные стратегии. На оси ординат откладываем выигрыш первого игрока, если второй применил стратегию В1. Аналогично строим второй график, если второй график выбрал стратегию В2.
Рис. 2.1. Геометрическая интерпретация стратегий первого игрока
q1=a11p1+a21p2
q2=a12p1+a22p2 (ордината точки М1 и М2, соответственно)
В соответствии с принципом минимакса оптимальная стратегия SА* такова, что минимальный выигрыш игрока А (при наихудшем поведении игрока В) обращается в максимум.
Рис. 2.2. Решение игры графическим способом
Отрезок В1N – минимальный выигрыш игрока А при использовании любой смешанной стратегии, если игрок В выбрал стратегию В1. Аналогично, отрезок В2N – выигрыш игрока А, если игрок В выбрал стратегию В2. Следовательно, оптимальную стратегию определяет точка N, то есть минимальный выигрыш достигает максимума.
Пример решения задачи.
Решить графически игру, заданную платежной матрицей:
Р=
Определим верхнюю и нижнюю цены игры: . Следовательно, седловая точка отсутствует, будем искать решение в смешанных стратегиях. Отметим на графике величину выигрыша для каждой пары стратегий.
Рис. 2.3. Графическое решение игры
Запишем уравнение прямых, соответствующих величине выигрыша игрока А, если игрок В выбирает, соответственно, первую (B1) y= = 0,5 x + 1,5 и вторую (B2) y= –2x + 3 стратегии. Точка их пересечения N(0,6; 1,8). Следовательно, р2 = x = 0,6 – вероятность выбора игроком А второй стратегии; р1 = 1 – 0,6 = 0,4 – вероятность выбора игроком А первой стратегии. Цена игры = y = 1,8 – максимально возможный из минимально гарантированных выигрышей игрока А (либо минимально возможный из максимально гарантированных проигрышей игрока В).
Ø Важно помнить.Графически можно решить игру, если в игре участвуют только два игрока и у одного из игроков имеется только две стратегии (у второго игрока – любое количество стратегий).
Задания для самостоятельной работы.
1. Для этой же задачи начертить график, записать уравнения прямых, найти вероятности и седловую точку для игрока В.
2. Применив методы теории игр, найти пропорцию использования посевной площади для производства трех сортов пшеницы, урожайность которых зависит от погодных условий. Критерий оптимальности – максимум валового урожая. Решить задачу графически.
Таблица 2.4
Размер урожайности каждого сорта в зависимости погодных условий
Засушливый год | Нормальный год | Дождливый год | |
Сорт 1 | |||
Сорт 2 | |||
Сорт 3 |
3. Игрок А записывает одно из двух чисел: 2 или 3. Игрок В записывает одно из трех чисел: 3, 4 или 5. Если числа одинаковой четности, то А выигрывает сумму чисел; и если четности чисел не совпадают, то сумму чисел выигрывает В. Построить платежную матрицу игры, определить верхнюю и нижнюю цену игры. Проверить наличие седловой точки.
Рассмотрим ситуацию, когда игра разрешается в чистых стратегиях, т. е. есть седловая точка. Графическое решение задачи может иметь следующие виды.
Рис. 2.4. Графики игр, разрешимых в чистых стратегиях
Дата добавления: 2020-10-14; просмотров: 583;