Многоагентное взаимодействие и равновесные ситуации
Равновесие по Нэшу
Пример биматричной игры в табл. 4.1 демонстрирует, что даже в игре размером
может быть неочевидно, какую стратегию поведения стоит выбирать каждому из игроков. Один из подходов к решению подобных моделей – выделение равновесных ситуаций, к которым должны сходиться рациональные игроки.
Понятие равновесия (по Нэшу) в некоалиционных играх было предложено Джоном Нэшем (John Forbes Nash) в диссертации и серии работ 1950-1953 гг.
Ситуация
в игре
называется равновесием по Нэшу, если для любого игрока
выполняется:
. (4.2.1)
Таким образом, равновесие по Нэшу, это такая ситуация в игре, от которой ни одному из игроков невыгодно отклоняться в одиночку.
Рассмотрим также отображения, которые для каждого игрока в каждой возможной подситуации
ставят в соответствие некоторую стратегию
- наилучший ответ:
.
При этом
называют отображением отклика игрока. Из (4.2.1) следует, что равновесие по Нэшу - это ситуация, образуемая наилучшими ответами каждого игрока на наилучшие ответы остальных игроков: 
К примеру, игра дилемма заключенных (см. табл. 4.1) имеет единственное равновесие по Нэшу: (Сознаться; Сознаться). Действительно, ни одному из заключенных невыгодно отклоняться от данной ситуации поодиночке. Если один заключенный решит сменить стратегию с Сознаться на Молчать, то этим он только уменьшит свой выигрыш с
до
. Одновременно, положение второго игрока улучшится (выигрыш увеличится с
до
), и тому тоже невыгодно будет менять стратегию.
Стоит отметить, что равновесная ситуация в данной игре не является эффективным решением. Ситуация (Молчать; Молчать) максимизирует сумму выигрышей для игроков. Однако недостаток данной ситуации в неустойчивости: каждому игроку выгодно сменить стратегию на признание и предать соперника (подельника). В этом смысле дилемма заключенных демонстрирует разницу между равновесием по Нэшу и оптимальностью по Парето.
Равновесие по Нэшу - необязательно выгодная, но устойчивая ситуация. С другой стороны, ситуация оптимальна по Парето в том случае, когда полезность ни одного из участников не может быть увеличена без уменьшения полезностей других участников.
Упрощенная игровая модель взаимодействия граждан в обществе аналогична дилемме заключенных и представлена в виде биматричной игры в табл. 4.2.
Таблица 4.2
| Гражданин 1 | Гражданин 2 | |
| Альтруизм | Эгоизм | |
| Альтруизм | 2, 2 | -1, 2+ε |
| Эгоизм | 2+ ε, -1 | 0, 0 |
Множества стратегий поведения игроков одинаковы
={Альтруизм; Эгоизм},
.При ε > 0 у каждого игрока всегда есть мотивация отклониться от ситуации общего блага (Альтруизм; Альтруизм), и рациональный игрок должен им воспользоваться. Таким образом, равновесием по Нэшу является устойчивая ситуация (Эгоизм; Эгоизм).
Из приведенных определений и примеров можно сделать вывод, что рациональным игрокам (соперникам), стремящимся максимизировать собственный выигрыш, а также гарантировать некоторое минимальное значение выигрыша, следует разыгрывать равновесные ситуации.
Подобными биматричными моделями можно представить множество различных проблем принятия решений, например, понижение/повышение цен на предлагаемые товары (ресурсы) конкурирующими фирмами, конфликт ядерных держав и т.п.
Дата добавления: 2020-10-25; просмотров: 572;











