Самостоятельная работа студентов
Рекомендуемые темы рефератов
1. Понятие и экономическая интерпретация системы массового обслуживания.
2. Использование теории очередей в управлении потоками товаров и услуг.
3. Условия работоспособности системы массового обслуживания, их обоснование и экономическое значение.
4. Анализ проектов расширения обслуживающих мощностей с использованием теории очередей.
5. Оптимизация обслуживающих мощностей с использованием теории очередей.
Литература для самостоятельной работы
1. Хемди А. Таха. Глава 17. Системы массового обслуживания // Введение в исследование операций –7-е изд. –М.: «Вильямс», 2007. –С. 629-697.
2. Шелобаев С.И. Математические методы и модели в экономике, финансах, бизнесе: Учеб. пособие для вузов. –2‑е изд. М.: ЮНИТИ-ДАНА, 2005. –287 с.
3. Экономико-математические методы и прикладные модели: Учебное пособие для вузов / Под ред. В.В. Федосеева. –2‑е изд. М.: ЮНИТИ-ДАНА, 2005. –304 с.
4. Афанасьев М.Ю., Суворов Б.И. Исследование операций в экономике: модели, задачи, решения: Учеб.пособие. – М.: ИНФРА-М, 2003. – 444с.
5. Бережная Е.В., Бережной В.И. Математические методы моделирования экономических систем: Учебное пособие. –2-е изд., перераб. и доп. – М.: Финансы и статистика, 2006. – 368с.
6. Моделирование экономических процессов: Учебник для студентов вузов, обучающихся по специальностям экономики и управления (060000) / Под ред. М.В. Грачёвой, Л.Н. Фадеевой, Ю.И. Черемных. М.: ЮНИТИ-ДАНА, 2005. –351 с.
ТЕМА 2.7. СОСТЯЗАТЕЛЬНЫЕ ЗАДАЧИ
2.7.1. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ИГР 196
2.7.2. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ИГРЫ 199
2.7.3. ИГРЫ С ПРИРОДОЙ 204
2.7.4. БИМАТРИЧНЫЕ ИГРЫ 214
2.7.5. ПОНЯТИЕ КОАЛИЦИОННЫХ ИГР 226
2.7.6. ПРАКТИЧЕСКИЙ БЛОК 227
2.7.7 САМОСТОЯТЕЛЬНАЯ РАБОТА СТУДЕНТОВ 235
Основные понятия теории игр.
Решение многих экономических задач для индивидуального участника экономических отношений (производителя, потребителя, продавца, покупателя и т.п.) сводится к максимизации полезности при условии сбалансированности своего бюджета. Задачи часто выражаются альтернативно, как, например, максимизация выпуска продукции при заданных издержках или минимизация издержек при данном выпуске. Каждый индивидуум старается достичь максимума своей прибыли, и на его действия не оказывают влияния действия других индивидуумов.
Однако в других экономических ситуациях возникают конфликты интересов, которые должны быть разрешены. Конфликты интересов возникают между продавцом и покупателем, между конкурирующими продавцами (производителями). Более сложные ситуации возникают, если образуются коалиции лиц, участвующих в столкновении интересов, например, в том случае, когда ставки заработной платы определяются союзами рабочих и предпринимателей. Решение таких проблем поднимает более сложные вопросы о стратегиях поведения участников, и соответствующие математические формулировки этих проблем и методы их решения составляют теорию игр.
Игра – это совокупность правил и процедур, которым подчиняются ее участники для достижения своей цели. Каждый участник (игрок) имеет множество возможных ходов, выбрать один из них – значит сделать ход. Партия – это последовательность ходов, сделанных в соответствии с правилами игры и приводящих ее к конечному состоянию. Во многих играх достижение цели сопровождается каким-нибудь выигрышем. Выигрыш в игре будем рассматривать в количественном выражении, причем отрицательное значение выигрыша интерпретируется как проигрыш.
Игра с нулевой суммой – это такая игра, в которой сумма выигрышей участников равна нулю.
Стратегия – это установленный игроком метод выбора решения при каждом ходе в течение игры.
Будем рассматривать конечную игру, то есть игру с конечным числом ходов и конечным числом стратегий.
Платежная матрица – это таблица, которая определяет, какие выигрыши должны быть получены игроками после завершения игры.
Рассмотрим игру двух лиц с нулевой суммой.
Обозначим игроков А и В, и пусть А имеет n вариантов хода, а В имеет m вариантов. Пусть игра заключается в том, что игроки делают по одному ходу и А выигрывает у В сумму aij, если А выбрал вариант i (i=1,2,…,n), а В выбрал вариант j (j=1,2,…,m). Тогда платежная матрица для игрока А имеет вид:
a11 a12 …a1m
A = [aij ] = a21 a22 …a2m
………..
an1 an2 …anm
Если выигрыш игрока А равен проигрышу игрока В, возникает игра двух лиц с нулевой суммой. В этом случае платежную матрицу для игрока В нет необходимости рассматривать самостоятельно, так как В = – А.
Лучшая (оптимальная) стратегия игрока заключается в выборе такого варианта хода (из своих возможных), при котором будет получен максимальный выигрыш при отсутствии информации о ходе противника. Определение оптимальных стратегий для игроков составляет решение игры.
Игрок следует чистой стратегии в повторяющихся партиях, если в каждой партии он выбирает из всех альтернатив одну и ту же, использование комбинаций чистых стратегий называется смешанной стратегией. Для решения игры будем использовать критерий минимакса – максимина. Этот критерий предписывает игроку А выбирать такую стратегию (чистую или смешанную), которая максимизирует его минимальный выигрыш, причем минимум берется по всем стратегиям игрока В. Игрок В в свою очередь выбирает стратегию, которая минимизирует его максимальный проигрыш, где максимум берется по стратегиям игрока А.
Рассмотрим применение данного критерия на примере.
Игрок В
Пусть задана платежная матрица, определяющая выигрыш –2 –4
игрока А. Если игрок А выбирает первую стратегию, его А= –1 3
выигрыш будет не меньше miní–2, –4ý= –4 независимо 1 2
от поведения игрока В. При выборе игроком А второй стратегии гарантированный выигрыш будет равен miní–1, 3ý= –1, и, наконец, если он выберет третью стратегию, гарантированный выигрыш будет равен miní1,2ý= 1. Тогда игрок А, выбирая третью стратегию, максимизирует свой минимальный выигрыш. Его значение равно mахí–4, –1, 1ý=1. Выбранная игроком А стратегия называется максиминной стратегией, а соответствующее ей значение выигрыша – максиминным (нижним) значением игры.
Игрок В хочет минимизировать свой проигрыш. Выбрав первую стратегию, он может проиграть не более чем mахí–2, –1, 1ý=1 независимо от выбора своего противника. При второй стратегии проигрыш составит не более mахí–4, 3, 2ý=3. Игрок В выберет тогда первую стратегию, для которой проигрыш составит miní1, 3ý=1. Эта стратегия называется минимаксной, а соответствующее ей значение проигрыша игрока В – минимаксным (верхним) значением игры.
Если нижнее значение игры совпадает с верхним значением игры, то имеет место ситуация равновесия, в этом случае задача имеет решение в чистых стратегиях, в противном случае необходимо искать оптимальную смешанную стратегию.
Рассмотрим еще несколько примеров матричных игр:
1. "Орлянка". Два игрока одновременно кладут на стол по монете "орлом" или "решеткой" вверх. Если "картинки" совпадут, то выигрывает первый игрок, в противном случае второй. Если в каждой отдельной партии разыгрывается некоторая единичная ставка, то матрица данной игры примет вид:
A= .
2. "Камень, мешок, ножницы". Это одна из древнейших тюремных игр, в которую было принято играть на пальцах. Количество выброшенных пальцев от одного до трех соответствовало выбранному предмету, при этом камень побеждал ножницы, мешок–камень и ножницы – мешок. Если игроками выбирались одинаковые предметы, то результат партии признавался ничейным. Матрица выигрышей этой игры имеет следующий вид:
A= .
3. Не заботясь о содержательном смысле игры, просто напишем некоторую, специальным образом построенную матрицу выигрышей
A= .
Если в первых двух играх ситуации равновесия не существуют, так как нижнее значение игры равно -1, а верхнее значение игры равно 1, то в третьем примере
maxmin{aij}=max{-2,-2,2,-2}=2 и minmax{aij}=min{4,2,3}=2,
т.е. существует ситуация равновесия. Следовательно, значением этой игры будет 2, а оптимальными стратегиями для первого игрока выбор третьей строки и для второго – второго столбца матрицы игры.
Отметим, что матричная игра, для которой существует ситуация равновесия, малоинтересна (и редко случается на практике), так как рациональные действия игроков в ней однозначно предопределены. Если разыгрывается несколько партий такой игры, то каждый раз исход игры будет неизменным. Если же разыгрывается несколько партий в "орлянку", то ни один из игроков не рискнет сохранять неизменной выбираемую стратегию, так как подобные действия легко "расшифровываются" противником. Возможность изменять от партии к партии свои стратегии и составляют суть любой игры, делают ее исход непредсказуемым. Однако в этом случае возникает проблема определения решения игры.
2.7.2. Математическая модель игры.
В математических обозначениях «максимин для А» выражается mахiminj aij, аналогично, «минимакс для В» есть minjmахi aij, причем, очевидно, имеет место mахi minj aij £ minjmахiaij. В случае, когда имеет место равенство, т.е. mахi minj aij = minjmахi aij =аi0j0, соответствующие чистые стратегии (i0 для игрока А и j0 для В) будут оптимальными, а про игру говорят, что она имеет седловую точку. Тогда аi0j0 является значением игры. Легко видеть, что игра имеет седловую точку тогда и только тогда, когда в платежной матрице имеется элемент аi0j0, наименьший для всех элементов своей строки i0 и наибольший для всех элементов своего столбца j0.
При отсутствии седловой точки невозможно получить оптимальное решение, пользуясь чистыми стратегиями. В этом случае для получения решения игры будем пользоваться смешанными стратегиями, которые заключаются в применении чистых стратегий с некоторыми частотами (вероятностями). Пусть р1, р2,.., рn и q1,q2,..,qm – наборы вероятностей, с которыми игроки А и В соответственно выбирают свои чистые стратегии. Естественно
=1, рi , qj ≥0 для всех i и j.
Если игрок А выбирает свои чистые стратегии с вероятностями рi, то его ожидаемый выигрыш должен составить
a11р1+ a21р2+…+ an1рn ,
при ответном выборе игроком В своей первой чистой стратегии,
a12р1+ a22р2+…+ an2рn ,
при ответном выборе игроком В своей второй чистой стратегии, и т.д.
a1mр1+ a2mр2+…+ anmрn
при выборе игроком В m-й чистой стратегии. С другой стороны, если игрок В выбирает свои чистые стратегии с вероятностями qj, то его ожидаемый проигрыш должен составить
a11q1+ a12q2+…+ a1mqm ,
если игрок A выберет свою первую чистую стратегию, и т.д.
an1q1+ an2q2+…+ anmqm,
при выборе игроком A n-й чистой стратегии.
Если игрок А выбрал стратегию (р1,р2,..,рn) и при этом игрок В выбрал (q1,q2,..,qm), то ожидаемый выигрыш игрока А (он же проигрыш игрока В) составит
g= .
Тогда игрок А при выборе рi стремится максимизировать свой наименьший ожидаемый выигрыш по столбцам, тогда как игрок В выбирает qj с целью минимизировать наибольший ожидаемый проигрыш по строкам. Справедлива теорема фон.Неймана, которую мы примем без доказательств, утверждающая, что для любой конечной игры существуют оптимальные стратегии игроков А (р1*,р2*,..,рn*) и В (q1*,q2*,..,qm*), при этом максимум наименьшего ожидаемого выигрыша игрока А совпадает с минимумом наибольшего ожидаемого проигрыша игрока В (обозначим это значение игры через g). Таким образом, математическую модель конечной игры для игрока А можно представить в следующем виде:
Найти такие рi ≥0, для которых выполняются соотношения
р1+р2+…+рn=1,
a11р1+ a21р2+…+ an1рn ≥ g,
a12р1+a22р2+…+an2рn≥g, (2.7.1)
……………………. ……
a1mр1+ a2mр2+…+ anmрn≥ g,
и функция Z=g принимает максимальное значение.
Упростим полученную задачу, разделив все ограничения (2.7.1) на значение игры g > 0 и положив хi =рi/g для всех i. (Проведение аналогичных рассуждений для случая g ≤ 0 предоставляется читателю). В силу того, что
max g =min 1/g = min(р1/g+р2/g+…+рn/g) = min(x1+x2+…+xn)
задача принимает вид
минимизировать Z= x1+x2+…+xn
при ограничениях
a11x1+a21x2+…+an1xn ≥ 1,
a12x1+a22x2+…+an2xn ≥ 1, (2.7.2)
……………………. ……
a1mx1+a2mx2+…+ anmxn≥ 1,
x1, x2,…,xn ≥ 0.
Мы получили задачу линейного программирования (см. 2.2).
Обратите внимание: строка ограничения формируется из столбца платежной матрицы!
Решая ее (например, симплекс–методом), находим оптимальное решение x1*, x2*,…,xn*, откуда, разделив на Z*=x1*+x2*+…+xn*, получаем оптимальную стратегию для игрока А (р1*,р2*,..,рn*), которая заключается в применении i-й чистой стратегии с частотой рi*= хi*/ Z*.
Двойственная ЗЛП – максимизировать F=y1+y2+…+ym→max;
при ограничениях
a11y1+ a12y2+ …+ a1mym ≤1;
a21y1+ a22y2+ …+ a2mym ≤1; (7.2.3)
…………………………..
an1y1+ an2y2+ …+ anmym ≤1;
y1≥0; y2≥0; … ym ≥0.
Здесь строка ограничения формируется из строки платежной матрицы.
Решая данную ЗЛП, находим оптимальное решение у1*, у2*,…,уm*, откуда, разделив на F*=y1*+y2*+…+ym*, получаем оптимальную стратегию для игрока B (q1*, q2*,.., qm*), которая заключается в применении j-й чистой стратегии с частотой qj* = yj*/ F*.
Затем находим цену игры g =1/Z*=1/F*.
Правила упрощения платежной матрицы:
Если к каждому элементу платежной матрицы прибавить одно и то же число, то решение (р1*,р2*,..,рm*) не изменится, а цена игры изменится ровно на добавленную величину.
Если каждый элемент платежной матрицы умножить на одно и то же число (не 0), то решение (р1*,р2*,..,рm*) не изменится, а цена игры изменится ровно во столько же раз.
Если какая-либо строка платежной матрицы доминирует над другой строкой (или линейной комбинацией строк), то доминируемые строки не войдут в оптимальную смешанную стратегию и их можно удалить.
Из двух стратегий та "лучше" (доминирует), которая гарантирует больший выигрыш независимо от действий противника (исходов). Ясно, что доминирующая над всеми строка, если она существует, будет являться чистой оптимальной стратеией первого игрока. Однако, в общем случае, строки, доминирующей над всеми другими строками, может и не существовать.
Проиллюстрируем использование рассмотренных методов при описании и решении некоторых состязательных задач.
Пример 2.7.1. Рассмотрим тотализатор на ипподроме. Пусть выплаты в случае победы одной из трех лошадей относятся к ставке как 1:1, 3:1 и 4:1. Тогда платежная матрица игрока на скачках примет вид:
1 –1 –1 Если прибавить к каждому элементу матрицы число К, то
А=–1 3 –1 оптимальные стратегии не изменятся, а значение игры
–1 –1 4 увеличится на К. Для упрощения матрицы добавим
К=1, тогда получим:
2 0 0 В соответствие с (2.7.2) задача принимает вид:
А= 0 4 0 минимизировать Z= x1+x2+x3
0 0 5 при ограничениях
2x1+ 0x2+0x3 ≥ 1,
0x1+ 4x2+0x3 ≥ 1,
0x1+ 0x2+5x3≥ 1,
x1, x2,x3 ≥ 0.
Легко заметить, что решение этой задачи:
x1*=1/2, x2*=1/4, x3* =1/5.
Значение упрощенной игры 1/Z*=1/(x1*+x2*+x3*)=20/19, откуда (при К=1) значение исходной игры равно 20/19 – 1 = 1/19,
р1*=х1*/Z*=10/19, р2*=х2*/Z*=5/19, р3*=х3*/Z*=4/19.
Таким образом, оптимальная стратегия игрока на скачках в данном примере заключается в смешанной стратегии делать ставки на всех трех лошадей в пропорции 10:5:4, при этом выигрыш игрока (игра имеет положительное значение!) будет равным 1/19 суммы его ставок, независимо от результата гонок. (Если цена игры отрицательна, то не следует в нее играть, так как даже при оптимальной стратегии гарантирован проигрыш, правда, минимальный).
Пример 2.7.2. Предлагается три варианта инвестиций в сельское хозяйство и прогноз получения доходов за год (дивиденды и повышение стоимости капитала) при различных перспективах на урожай.
Варианты инвестиций | Перспективы на урожай | ||
хорошие | средние | плохие | |
1. АО «Сельхозтехника» | |||
2. АО «Агроимпорт» | |||
3. АО «Агроэкспорт» | –50 |
Доходы в платежной матрице приведены в процентах от вложенного капитала. Как распорядиться капиталом, чтобы получить наибольший доход? Искомые переменные р1, р2, р3 определяют пропорции вложений. Заметим, что элементы первой строки платежной матрицы меньше средних арифметических соответствующих элементов второй и третьей строк, и она может быть удалена (первый вариант инвестиций заведомо неэффективен по сравнению с комбинацией второго и третьего вариантов – вкладывать деньги поровну во второй и третий проект). Получаем задачу линейного программирования
минимизировать Z= x2+x3
при ограничениях
0x2 + 150x3 ≥ 1,
100x2+50x3 ≥ 1,
250x2 – 50x3≥ 1,
x1=0, x2, x3 ≥ 0.
Решая данную задачу стандартными средствами (см.2.2) получим следующее решение
x1*=0, x2*=1/150, x3* =1/150.
Значение игры 1/Z*=1/( x1*+x2*+x3*)=150/2=75, откуда
р1*=0, р2*=х2*/Z*=75/150=1/2, р3*=х3*/Z*=75/150=1/2.
Таким образом, оптимальной стратегией является вложение капитала равными долями во второй и третий варианты, при этом гарантированный доход составит 75%.
Игры с природой
Антагонистические конфликты в реальной жизни встречаются очень редко за исключением искусственно созданных конфликтных ситуаций в виде спортивных и азартных игр. Однако, часто бывает удобно в задачах принятия решения в условиях неопределенности наделить случайный фактор "разумом" и считать, что он активным образом противодействует достижению поставленной цели. В этом случае возникает антагонистическая игра с некоторым воображаемым противником, которого принято называть "природой". Такая постановка задачи позволяет оценить возможности достижения цели при самых неблагоприятных условиях.
Рассмотрим следующий пример. Пусть у фермера имеется S гектаров пахотных земель, на которых он может выращивать различные культуры K1, K2,..., Kn. Урожайность культур, а соответственно и доход, будут существенным образом зависеть от погодных условий в весенне-летний период.
На основе многолетних наблюдений можно классифицировать возможные для данной местности погодные условия P1, P2,..., Pm и объявить их стратегиями "природы". Определим матрицу выигрышей A={aij} как ожидаемый доход с участка при посадке на нем i-ой культуры и j-ых погодных условиях.
Не исключено, что получившаяся матричная игра будет иметь решение в чистых стратегиях. Это будет означать, что для данной местности существует культура, выращивание которой дает наибольший доход. Действительно, нечто подобное в мире случается, существуют целые страны, выращивающие только рис, или хлопок, или кофе, или цитрусовые и т.п. Россия, к сожалению, почти всюду является зоной рискованного земледелия, поэтому на существование решения игры в чистых стратегиях надеяться не приходится.
Однако, согласно теореме фон.Неймана, всегда будет существовать решение в смешанных стратегиях. Пусть g* –значение игры и (р1*,р2*,..,рm*) оптимальая смешанная стратегия фермера.
Тогда площадь, выделяемая под каждую культуру, будет соответственно равна Si=S∙рi га.
Если "природа" выберет активную (оптимальную с точки зрения игрока В) стратегию, то фермер все равно реализует значение игры. Поскольку "природа" реальным разумом не наделена и не обязательно будет противодействовать фермеру, то не исключено, что будет реализована пассивная стратегия. Естественно, в этом случае доход фермера превысит ожидаемый.
Игры с "природой" могут быть использованы также для решения задач выбора оборудования для предприятия, определения состава научно-исследовательского коллектива, выбора проектов строительства в сейсмоопасной зоне и т.п. В этих играх компоненты оптимальной смешанной стратегии задают уже не просто вероятности выбора, а главным образом пропорции.
В случае, когда при игре с природой необходимо выбрать одно из альтернативных решений, характеризующееся различными исходами (смешение стратегий по логическим или техническим причинам невозможно), то возникает задача принятия решений в условиях неопределенности и риска. Если вероятности исходов не известны, это ситуация неопределенности, при известных вероятностях исходов – ситуация риска.
Рассмотрим сначала правила принятия решений в условиях неопределенности (без использования численных значений вероятностей исходов – правила максимакса, Вальда, Сэвиджа, Лапласа).
Пример 2.7.3. Пусть себестоимость пирожного в нашей кондитерской составляет 7 руб., свеженькое продаем за 13 руб., а невостребованное за день сдаем на свиноферму за 3 руб. Сколько пирожных надо производить в день, если известно лишь, что спрос на них составляет от 1 до 5?
Составим таблицу возможных доходов (табл.2.7.1), расположив построчно наши альтернативы (производить от 1 до 5 пирожных), а в столбцах исходы (продать от 1 до 5), имея в виду, что доход от продажи одного пирожного составляет 6 руб., а потери при не продаже составляют 4 руб.
Таблица 2.7.1 – Доход (прибыль) в день.
Объем производства | Возможные исходы: спрос пирожных в день | Среднее | ||||
–2 | ||||||
–6 | ||||||
–10 |
Правило максимакса – максимизация максимального дохода. В каждой альтернативе найдем исход с максимальной оценкой (в табл.2.7.1 они все находятся в последнем столбце), и выбираем альтернативу, позволяющую получить самый большой доход. В нашем примере это соответствует решению производить 5 пирожных. Данный подход использует азартный карточный игрок (или пан или пропал).
Правило максимина (Вальда)– максимизация минимального дохода. В каждой альтернативе найдем исход с минимальной оценкой (в табл.2.7.1 они все находятся в первом столбце), и выбираем альтернативу, позволяющую максимизировать доход в самых худших для нас исходах. В нашем примере это соответствует решению производить 1 пирожное. Это очень осторожный подход к принятию решений – стратегия крайнего пессимиста.
Правило, основанное на принципе неопределенности Лапласа. В соответствие с этим принципом предполагается, что все исходы равновозможные, поэтому выбирается альтернатива, дающая максимальный средний доход. В нашем примере этому правилу отвечают альтернативы выпускать три или четыре пирожных в день, имеющие средний доход 12 (колонка 6 табл.2.7.1).
Правило минимакса (Сэвиджа) – минимизация максимально возможных потерь. Составим таблицу возможных потерь или упущенной выгоды (табл.2.7.2). Она составляется из таблицы доходов следующим образом:
для каждого исхода (столбца) находится максимальный доход, затем вычисляются максимально возможные потери всех альтернатив данного исхода (из максимального дохода вычитается доход соответствующей альтернативы).
Для каждой альтернативы находятся максимально возможные потери (выделены жирным цветом). Затем выбирается та альтернатива, которой соответствует минимальное значение максимальных потерь. В данном примере этому правилу подходят альтернативы выпускать три или четыре пирожных в день.
Таблица 2.7.2 – Возможные потери в день.
Объем производства | Возможные исходы: спрос пирожных в день | ||||
Дата добавления: 2020-10-25; просмотров: 487;