Матричные игры
Предмет и задачи теории игр, терминология и классификация игр, их примеры. Принцип максимина в антагонистических играх, седловая точка. Эквивалентные задачи линейного программирования. Способы реализации случайного механизма выбора стратегий, их виды.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | учебное пособие |
Язык | русский |
Дата добавления | 05.05.2020 |
Размер файла | 372,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
если 0<у*<1, то среди оптимальных стратегий игрока 1 найдется такая, которая является смесью стратегий и . Для этих стратегий y(,у*) Ј 0, y(,у*) і 0.
При этом стратегии и употребляются с вероятностями р и 1-р, где р находится из уравнения
р y(,у*) + (1-р) y(,у*)=0.
4.3 Примеры решения бесконечных антагонистических игр
Игра «Борьба за рынки»
Пусть одна из фирм (игрок 1) пытается вытеснить другую фирму (игрок 2), имеющую два рынка сбыта, с одного из этих рынков. Общая сумма средств, выделяемых игроком 1 на эту цель, равна единице (Х ). Стратегии игрока 1 состоят в распределении этих средств между двумя рынками. Если на первый рынок направляется сумма х, то на второй - (1-х). Пусть игрок 2 для удержания рынков также располагает единичной суммой средств, и его стратегия будет состоять в выделении суммы у на первый рынок и (1-у) - на второй.
Считается, что игрок 1, добившись превосходства средств на одном из рынков, вытесняет своего противника с этого рынка и получает выигрыш, равный избытку своих средств, который берется с коэффициентом, характеризующим важность рынка (пусть этот коэффициент равен k1 для первого рынка и k2 для второго).
Рассматриваемая игра является игрой на единичном квадрате. В этой игре пара чисел (х, у), где х, у 0,1 являются точками единичного квадрата.
Функция выигрыша в рассматриваемом примере
где h1 h.
Решение.
График зависимости H(х0,y) от у для некоторого х=х0 представлен на рис.4.1.
Рис.4.1
Очевидно, что при любых х0 функция Н (х0, у) является выпуклой функцией от у. Имеем
.
Поэтому цена игры
.
График функции выделен на рис.4.2. жирной ломаной.
Рис.4.2
Первый член под знаком максимума с ростом у убывает, а второй - возрастает. Поэтому при малых значениях у максимум достигается на отрезке k1(1-у), а при больших - на отрезке прямой k2у. Следовательно, минимальное значение этот максимум принимает при таком у*, для которого
, т.е. при
. (4.1)
Таким образом, найденное у* является единственной оптимальной чистой стратегией игрока 2. Она состоит в распределении имеющихся средств между рынками пропорционально важности рынков.
Значение цены игры
. (4.2)
Далее надо найти оптимальную стратегию игрока 1. Случаи ху* и ху* будем рассматривать порознь.
Теорема 3 утверждает, что если Н(х,у) - выпукла и 0у*1, то среди оптимальных стратегий игрока 1 найдется такая, которая является смесью двух активных стратегий и . Для этих стратегий
и . (4.3)
При этом стратегии и употребляются с вероятностями р и (1-р), где р находится из уравнения
(4.4)
Для случая ху* уравнение (4.2) принимает вид
.
откуда =1.
Для случая ху* уравнение (4.2) имеет уже другой вид:
.
откуда =0.
Таким образом, активными стратегиями игрока 1 оказываются: =0; и =1.Поэтому игрок 1 должен применять смешанную стратегию, являющуюся смесью этих двух активных стратегий. Для нахождения вероятности р, используем уравнение (4.4).
Частные производные
.
.
Тогда уравнение (4.4) для данной игры приобретает вид
, откуда
. (4.5)
Таким образом оптимальная стратегия игрока 1 состоит в концентрации всех его средств на одном из рынков, причем вероятность выбора рынка обратно пропорциональна его важности. Этот результат объясняется просто: чем важнее рынок, тем больше средств вложит противник в его сохранение и тем меньше свободных средств останется на нем после вытеснения противника, и тем менее значимой будет победа над ним.
Игра с выбором момента времени (игра типа дуэли)
Формулировка. Пусть каждый из двух игроков намерен выполнить некоторое действие (выбросить на рынок партию товара, внести на совещание предложение, произвести выстрел и т.д.). При этом обстоятельства часто складываются так, что, во-первых, целесообразно выполнить это действие как можно позже, а во-вторых, желательно своим действием упредить сходное действие противника. Такой конфликт в условиях противоположных интересов его участников естественно моделировать бесконечной антагонистической игрой на единичном квадрате, в которой функция выигрыша Н в общем случае имеет вид
(4.6)
где каждая из функций и
а) непрерывна по обеим переменным;
б) монотонно возрастает по х при любых значениях y;
в) монотонно убывает по y при любом значении х;
г) удовлетворяет условию
.
Игра с функцией выигрыша Н(х,у), удовлетворяющая перечисленным условиям называется игрой с выбором момента времени, или игрой типа дуэли.
Мы ограничимся рассмотрением одного примера данной игры, теория которой, хотя и разработана, но достаточно сложна 2.
Пусть игроки 1 и 2 выбирают соответственно числа х и у из интервала . Эти числа будем понимать как моменты времени выполнения ими требуемых действий. Пусть t - время появления некоторого объекта, который достается игроку, который первый после t совершил требуемое действие. Игрок, обладающий объектом, получает выигрыш, равный 1, а его противник эту единицу теряет. Если ни один из игроков не получит объект, то выигрыш каждого из игроков принимается равным нулю.
Предполагается, что время появления объекта является случайной величиной, распределенной на интервале по равномерному закону. Эту игру называют также борьбой за встречу случайно появляющегося объекта.
Запишем математическое выражение функции выигрыша. Рассмотрим ситуацию (х,у), в которой ху. В этом случае игрок 1 выигрывает единицу, если
tх; (4.7)
проигрывает единицу, если
хty; (4.8)
и не получает ничего, если
yt. (4.9)
Вероятность событий (4.7), (4.8) и (4.9) равны соответственно х, (у-х) и (1-у). Таким образом, при ху имеем
. (4.10)
Аналогичным способом находим, что при ху
. (4.11)
Естественно, что при х=у, Н(х,у)=0.
Схематическое описание Н(х,у) приведено на рис.4.3.
Решение. Заметим, что игра является симметричной. Действительно, при ху
.
Аналогично, при ху
.
Наконец, при х=у
.
Рис.4.3
Для антагонистических симметричных игр существует теорема, утверждающая для этих игр цена игры = 0, а оптимальные стратегии игроков 1 и 2 совпадают.
Поэтому для решения данной задачи достаточно найти оптимальную стратегию игрока 1.
Пусть оптимальная стратегия игроков имеет плотность распределения f:
;
.
Если игрок 2 применяет эту стратегию, то
.
С учетом формул (4.10) и (4.11.). перепишем последний интеграл
. (4.12)
Так как и постоянна, то все производные по х функции Н(x,f) также должны обращаться в нуль.
Дифференцируя тождество (4.12) по х, имеем
(4.13)
Вторая частная производная имеет вид
т.е. .
Интегрируя это дифференциальное уравнение, получаем
,
откуда
. (4.14)
Полученная плотность распределения f(x) положительна и дифференцируема. Однако интеграл расходится. Следовательно, плотность f не может быть дифференцируемой и больше нуля на всем сегменте .
Можно доказать, что плотность распределения может обращаться в нуль лишь между нулем и некоторым . Таким образом, имеем:
Для определения неизвестных параметров и с воспользуемся следующими соображениями. Во-первых, f(x) должна удовлетворять условию нормировки:
. (4.15)
Во-вторых, . (4.16)
Из уравнений (4.15) и (4.16) можно определить значения и с. С этой целью перепишем эти уравнения в явном виде.
, т.е.
. (4.17)
Далее на основании симметричности игры
.
Поскольку с0, это нам дает
.
Откуда получаем . Это квадратное уравнение имеет два корня: 1 и . Корень =1 противоречит равенству (4.17), а подстановка в это равенство дает .
Таким образом, искомая оптимальная стратегия игрока 1 определяется плотностью распределения
График f(x) изображен на рис.4.4.
Рис.4.4.
Остается проверить, что найденные стратегии игроков действительно являются оптимальными. Для этого достаточно убедиться в том, что для любого х .
При , ,
поскольку в рассматриваемом случае . При , формула (4.13) дает
.
Тем самым оптимальность стратегии с плотностью f установлена.
ТЕСТЫ
(В - Верно, Н - Неверно)
Игры называются бесконечными, если у всех игроков множество чистых стратегий бесконечно.
Бесконечные антагонистические игры решать труднее, чем конечные.
В бесконечной антагонистической игре принципом оптимальности является принцип максимина.
Бесконечные антагонистические игры решаются только в чистых стратегиях.
Играми на единичном квадрате называются такие бесконечные антагонистические игры, для которых возможные стратегии двух игроков Х и У .
Для антагонистических симметричных игр оптимальные стратегии игроков 1 и 2 совпадают.
Для антагонистических симметричных игр цена игры v>0.
В строго выпуклой игре игрок 2 имеет единственно оптимальную стратегию, которая является чистой.
(Ответы: 1-Н; 2-В; 3-В; 4-Н; 5-В; 6-В; 7-Н; 8-В).
ЗАДАЧИ
Найти хотя бы одно решение бесконечной антагонистической игры на единичном квадрате со следующей функцией выигрыша:
;
5. БЕСКОАЛИЦИОННЫЕ ИГРЫ
5.1 Общие сведения
Антагонистические игры, которые рассматривались в предыдущих главах книги, описывают конфликты частного вида, которые не всегда адекватны разным ситуациям или вообще не могут считаться приемлемыми.
В частности, антагонистические игры не затрагивают конфликты с числом игроков больше двух. Более того, даже в конфликтах с двумя игроками интересы сторон не всегда противоположны. Во многих конфликтах одна из ситуаций может оказаться предпочтительнее другой для обоих игроков.
Бескоалиционные игры являются играми более общей природы. Бескоалиционность понимается в том смысле, что группам игроков (“коалициям”) не приписывается ни каких-либо интересов, за исключением тех, которые вытекают из интересов отдельных игроков. Целью каждого игрока в такой игре является только получение по возможности наибольшего индивидуального выигрыша.
Определение 1. Бескоалиционной игрой называется игра N игроков (N2), каждый из которых имеет множество стратегий , с функцией выигрыша Нi(x), , где x - ситуация, задаваемая на множество декартового произведения стратегий і.
Определение 2. Бескоалиционная игра называется игрой с постоянной суммой, если существует такое постоянное С, что , для всех ситуаций x.
Класс антагонистических игр является классом игр двух лиц с нулевой суммой.
Определение 3. Конечная бескоалиционная игра двух игроков с ненулевой суммой называется биматричной игрой.
Как и в случае антагонистических игр необходимо выработать принципы оптимального поведения игроков в бескоалиционных играх и найти решения (оптимальные стратегии каждого из игроков).
Для класса антагонистических игр принципом оптимальности является принцип максимина. В общих бескоалиционных играх возможны ситуации одновременного увеличения выигрышей всех игроков или хотя бы их одновременного выигрыша, поэтому в этих играх необходимо ввести формализованное описание таких понятий, как выгодность, устойчивость и справедливость того или иного решения игры.
Определение 4. Ситуация х в игре называется приемлемой для игрока і, если для любой его стратегии
, (5.1)
т.е. при применении і-м игроком в данной ситуации всех других стратегий, его выигрыш не может увеличиться.
Определение 5. Ситуация в игре, приемлемая для всех игроков, называется ситуацией равновесия по Нэшу (равновесной ситуацией).
Иными словами, ситуация х называется равновесной, если для любого игрока іN выполняется условие (5.1).
Из определения видно, что ни один из игроков не заинтересован в отклонении от своей стратегии, образующих в совокупности ситуацию равновесия.
В случае антагонистической игры приемлемые стратегии игроков совпадают с их оптимальными стратегиями. Для неантагонистических игр понятие оптимальной стратегии может вообще не иметь смысла: в таких играх оптимальными оказываются не стратегии отдельных игроков, а их сочетания для всех игроков сразу. В бескоалиционных играх как оптимальные следует квалифицировать не действия того или иного игрока, а совокупность действий всех игроков.
Поэтому в бескоалиционной игре решение игры - это чаще, нахождение ситуаций равновесия.
Пример 1. Игра “Семейный спор”
Одна из наиболее распространенных интерпретаций игры следующая. Муж (первый игрок) и жена (второй игрок) могут выбрать одно из двух вечерних развлечений: футбольный матч или балет. Естественно предположить, что муж предпочтет футбол, а жена - балет. Однако для обоих гораздо важнее идти вместе, чем смотреть предпочитаемое зрелище в одиночестве. В данной 2х2 биматричной игре функции выигрышей Н1 и Н2 соответственного первого и второго игроков можно представить в виде
и ,
где стратегии игрока 1: А1 - выбираю футбол; А2 - иду на балет; игрока 2: В1 - иду на футбол, В2 - на балет.
Очевидно, что для первого игрока предпочтительнее ситуация (А1, В1), а для второго (А2, В2), и эти ситуации являются равновесными. Однако в данном примере как будет показано ниже, есть еще и третья ситуация равновесия, состоящая в выборе игроками смешанных стратегий: ; с ценой игры для обоих игроков .
Однако выигрыши каждого из игроков в этой ситуации равновесия меньше, чем в двух первых ситуациях равновесия, где они равны 2 или 1, в зависимости от ситуации и игрока.
Хотя стратегии (А1,В1) и (А2,В2) являются оптимальными, поскольку дают максимальные выигрыши, однако приносят игрокам не одинаковые выигрыши, поэтому не являются справедливыми.
Отметим также, что если в матричной игре ни одному из игроков не выгодно информировать противника о своей стратегии, то в данной биматричной игре это свойство не выполняется.
Действительно, если игроки не общаются до игры и оба обладают твердыми характерами, т.е. первый игрок выбирает стратегию А1, а второй - В2, то в результате они оба проигрывают. Аналогичная ситуация получиться и в том случае, когда каждый из игроков имеет мягкий характер и решает уступить. Так сочетание устойчивости со справедливостью вступает в противоречие с сочетанием устойчивости и выгодности.
Лучшим для игроков в рассматриваемой игре является договорный вариант (А1,В1) или (А2,В2), причем справедливым решением будет их выбор одного из этих вариантов путем бросания монеты. Выпадение герба будет означать, например, что семейство идет на матч по футболу, а решки - на балет. Заметим, что в антагонистической игре в отличие от биматричной нет смысла вести переговоры до игры и уславливаться о совместном плане действий. В рассматриваемой игре, ясно, что если игроки договорились бы играть оба, скажем первую чистую стратегию, причем игрок 1 за получение большего выигрыша, чем игрок 2, заплатил бы ему 1/2, то решение было бы выгодным и справедливым для обоих игроков. Однако в рамках бескоалиционных игр такого рода дележи не предусматриваются.
5.2 Ситуации, оптимальные по Парето
Как уже отмечалось, формальное понятие оптимальности призвано отражать различные варианты содержательных представлений об устойчивости, выгодности и справедливости. Можно считать, что устойчивость ситуации проявляется в ее равновесности.
Другой вариант устойчивости ситуации в большей степени, чем равновесность, отражающей черты ее выгодности, состоит в ее оптимальности по Парето
Определение 6. Ситуация х0 в бескоалиционной игре называется оптимальной по Парето, если не существует ситуации х, для которой имеет место векторное неравенство
, для всех іІ. (5.2)
Иными словами, в оптимальной по Парето ситуации игроки не могут совместными усилиями увеличить выигрыш кого-либо из них, не уменьшив при этом выигрыш кого-либо другого.
Подчеркнем различие ситуации равновесия от ситуации, оптимальной по Парето: в первой ни один игрок, действуя в одиночку, не может увеличить свой собственный выигрыш; во второй, - все игроки, действуя совместно, не могут (даже нестрого) увеличить выигрыш каждого.
Вопросы об оптимальных по Парето ситуациях решаются в принципе проще, чем аналогичные вопросы о ситуациях равновесия (оптимальных по Нэшу).
Проиллюстрируем графический метод определения ситуаций оптимальных по Парето. На рис. 5.1 изображено множество возможных стратегий х1,х2 двух игроков. Каждой точке х соответствует точка на множестве Н значений функций выигрышей Н1(х) и Н2(х) (рис. 5.2).
Рис. 5.1 Рис. 5.2
На рис. 5.2 дуга АСВ соответствует множеству ситуаций оптимальных по Парето, так как никакими совместными усилиями игроков, нельзя увеличить выигрыш одного из них, не уменьшив при этом выигрыш другого.
Определение 7. Игра называется аффинно эквивалентной игре G, если число игроков , стратегии одной игры , (отсюда следует, что игры и имеют одно и то же множество ситуаций), а функции выигрыша
,
где , .
Различие между двумя аффинно эквивалентными играми по существу состоит в различии начальных капиталов игроков и в соотношениях единиц измерения выигрышей, определяемых соответственно величинами Ci и ki.
Для однородно аффинно эквивалентных игр ki=k, iN.
Очевидно, что для антагонистических игр понятия аффинной эквивалентности и однородной аффинной эквивалентности совпадают.
Теорема 1. Всякая бескоалиционная игра с постоянной суммой аффинно эквивалентна некоторой игре с нулевой суммой.
Теорема 2. Аффинно эквивалентные игры имеют одни и те же оптимальные по Парето ситуации. Рассмотрим пример для нахождения ситуации оптимальной по Парето. Пример 2. Игра “Дилемма заключенного”
Каждый из двух игроков располагает двумя стратегиями: А2 и В2 - стратегии агрессивного поведения, а А1 и В1 - миролюбивое поведение. Предположим, что “мир” (оба игрока миролюбивы) лучше для обоих игроков, чем “война”. Случай, когда один игрок агрессивный, а другой миролюбивый, выгоднее агрессору. Пусть матрицы выигрышей игроков 1 и 2 в данной биматричной игре имеют вид
, .
Для обоих игроков агрессивные стратегии А2 и В2 доминируют мирные стратегии А1 и В1. Таким образом, единственное равновесие в доминирующих стратегиях имеет вид (А2,В2), т.е. постулируется, что результатом некооперативного поведения является война. В то же время исход (А1,В1) (мир) дает больший выигрыш для обоих игроков. Таким образом, некооперативное эгоистическое поведение вступает в противоречие с коллективными интересами. Коллективные интересы диктуют выбор мирных стратегий. В то же время, если игроки не обмениваются информацией, война является наиболее вероятным исходом.
В данном случае ситуация (А1, В1) является оптимальной по Парето. Однако эта ситуация неустойчива, что ведет к возможности нарушения игроками установленного соглашения.
Действительно, если первый игрок нарушит соглашение, а второй не нарушит, то выигрыш первого игрока увеличится до трех, а второго упадет до нуля и, наоборот. Причем, каждый игрок, не нарушающий соглашение, теряет больше при нарушении соглашения вторым игроком, нежели в том случае, когда они оба нарушают соглашение. Как видим, в отличие от примера 1 (игра “семейный спор”), где кооперация игроков была им выгодна, в этом примере кооперация не выгодна для игроков.
5.3 Состояние равновесия по Нэшу
Определение 8. Стратегии , в игре N лиц с ненулевой суммой называются оптимальными по Нэшу (решением по Нэшу или точкой равновесия по Нэшу), если для каждого
, (5.3)
x
т.е. каждый игрок в ситуации х* получает свой наибольший выигрыш (в той мере, в какой это от него самого зависит).
В рассмотренной игре “семейный спор” ситуации (А1,В1) и (А2,В2) являются решением по Нэшу, а в игре “дилемма заключенного” таковой является ситуация (А2,В2).
В случае антагонистической игры равновесные стратегии игроков совпадают с их оптимальными стратегиями. Для неантагонистических игр понятие оптимальной стратегии игрока нередко вообще не имеет смысла: в таких играх оптимальными оказываются не стратегии отдельных игроков, а их сочетания (ситуации) и притом для всех игроков сразу. Поэтому в общих бескоалиционных играх оптимальными следует понимать совокупность действия всех игроков (ситуацию в игре), которая и является решением игры.
Как и в играх двух лиц с нулевой суммой, игра N лиц с ненулевой суммой может не иметь решение по Нэшу в чистых стратегиях. Приведенное выше определение 7 решения по Нэшу в чистых стратегиях легко обобщается на случай смешанных стратегий путем подстановки смешанных стратегий , представляющих собой вероятностное распределение на множестве чистых стратегий.
Таким образом мы приходим к вероятностному распределению Х на множестве всех ситуаций. Другими словами, ситуация игры в смешанных стратегиях реализует различные ситуации в чистых стратегиях с некоторыми вероятностями. Значение функции выигрыша каждого из игроков оказывается случайной величиной. В качестве значения функции выигрыша принимается математическое ожидание этой случайной величины.
Дж. Нэшем было доказано существование ситуации равновесия для любой конечной бескоалиционной игры.
Теорема Нэша. В каждой бескоалиционной игре существует хотя бы одна ситуация равновесия в классе смешанных стратегий.
Если, кроме того, функции Нi(х) выпуклые вверх, то решение по Нэшу достигается в классе чистых стратегий.
Заметим, что принципиальная важность теоремы Нэша ограничивается существованием ситуации равновесия. Непосредственно применять ее для нахождения таких ситуаций не удается.
Дж. Нэшем была доказана также следующая теорема.
Теорема 2. Конечная бескоалиционная игра имеет симметричные ситуации равновесия, в которых игроки, равноправно входящие в игру согласно ее условиям, фактически оказываются в одинаковом положении.
Ее применение позволяет избежать отдельных ошибок при решении конечных бескоалиционных игр.
Одним из простых классов бескоалиционных игр ход решения которых поддается элементарному описанию являются биматричные игры, представляющие собой бескоалиционную игру двух игроков с ненулевой суммой.
5.4 Описание биматричных игр
Пусть в биматричной игре игрок 1 имеет m чистых Аі, , а игрок 2 имеет n чистых стратегий Вj, и в каждой ситуации (Ai, Bj) игрок 1 получает выигрыш aij, а игрок 2 - выигрыш bij. Значение обеих функций выигрыша игроков естественно представить в виде пары матриц
Поэтому такие игры и называются биматричными. Используют также запись платежных матриц А и В в следующем виде:
а11 b11 |
......... |
a1n b1n |
|
........ |
......... |
........ |
|
am1 bm1 |
......... |
amn bmn |
где “северо-западное” число в каждой клетке обозначает выигрыш первого игрока, а “юго-восточное” - выигрыш второго игрока.
Смешанные стратегии X и Y, естественно, понимаются как векторы, причем
и .
Выигрыш игроков 1 и 2 при применении смешанных стратегий равны:
где Т - означает транспонирование, т.е. вектор строка записывается как вектор столбец; - смешанные стратегии игроков 1 и 2 соответственно.
Определение ситуации равновесия для случая биматричной игры приобретает следующую формулировку. Ситуация (X,Y) в биматричной игре с матрицами выигрышей А и В является равновесной, если
. (5.4)
. (5.5)
Очевидно, что при В = -А биматричная игра превращается в матричную.
В качестве примера рассмотрим биматричную игру «Торг».
Пример. Игра «Торг»
Игрок 1 продает неделимый товар игроку 2. Игрок 1 должен решить, какую назначить цену: высокую или низкую. Для покупателя в принципе приемлемы обе цены. Покупатель не может спорить о цене, он может либо сделать покупку, либо отказаться от нее.
Платежные матрицы игроков имеют вид:
Игрок 2 |
||||
В1 - покупка |
В2 - отказ |
|||
Игрок 1 |
А1 - Высокая цена |
10 5 |
0 0 |
|
А2 - Низкая цена |
5 10 |
0 0 |
Описание всех возможных ситуаций в этой игре позволяет определить, что ситуация (А1, В1) является оптимальной по Парето и по Нэшу. Ситуация (А2, В2) также является оптимальной по Парето, но не является устойчивой, т.е. оптимальной по Нэшу.
Рассмотрим способ нахождения устойчивых ситуаций для биматричных игр с произвольным количеством чистых стратегий игроков.
5.5 Решение биматричных игр
Рассмотрим вначале биматричную игру 2х2 с матрицами выигрышей
,
соответственно игроков 1 и 2. Как и в случае матричных игр, смешанные стратегии полностью описываются вероятностями p и q выбора игроками своих первых чистых стратегий (вторые чистые стратегии выбираются, очевидно, с вероятностями 1-p и 1-q.
Опишем порознь множество приемлемых ситуаций, для каждого из игроков и изобразим эти множества на единичном квадрате p, q, где p[0,1] и q[0,1].
Начнем с описания ситуаций, приемлемых в игре для игрока 1.
Приемлемость ситуации (X,Y) для игрока 1 в биматричной игре означает, что
; (5.6)
, (5.7)
где А1 и А2 - вектор строки, соответствующие первой и второй строке матрицы А, соответственно.
Подчеркнем, что эти условия приемлемости никак не связаны с матрицей В выигрышей игрока 2. Поэтому они будут совпадать с аналогичными условиями матричной игры с платежной матрицей А.
Приемлемость ситуации (X,Y) для игрока 2 означает, что
(5.8)
(5.9)
где В1 и В2 - вектор-столбцы, соответствующие первому и второму столбцу матрицы В, соответственно.
В общем случае, Х=Ip, 1 - pI. Рассмотрим три случая:
а) р = 1, (Х=|1,0|). Тогда выражение (5.6) превращается в тождественное равенство, а условием приемлемости данной ситуации для игрока 1 оказывается неравенство (5.7). Для рассматриваемого случая его можно записать как
; (5.10)
б) р = 0 (Х=|1,0|). В этом случае выражение (5.7) превращается в тождественное равенство, а условием приемлемости данной ситуации для игрока 2 оказывается неравенство (5.6). Для рассматриваемого случая оно имеет вид
; (5.11)
в) 0 р 1 (Х=Ip, 1 - pI). В этом случае оба неравенства (5.6) и (5.7) превращаются в равенство, и условием приемлемости становится
. (5.12)
Опишем ситуации приемлемости (5.10), (5.11) и (5.12) в развернутом виде. Так как
то соотношения (5.10), (5.11) и (5.12) можно соответственно записать как
(5.14)
(5.15)
(5.16)
Таким образом, приемлемые для игрока 1 ситуации (X,Y) могут быть одного из трех типов:
(5.17)
(5.18)
(5.19)
Неравенства (5.17) и (5.18) верны в случае, если а11 + а22 - а12 - а21 > 0. Если а11 + а22 - а12 - а21 < 0, то знак неравенства в соотношениях (5.17) и (5.18) необходимо поменять на противоположный.
Если величина а11 + а22 - а12 - а21 = 0, а а22 - а12 0, то (5.19) не имеет место, поэтому будет выполняться или (5.17) и (5.18), и притом со знаком строгого неравенства.
Если же а11 + а22 - а12 - а21 = 0 и а22 - а12 = 0, то все условия (5.17), (5.18) и (5.19) выполняются тождественно, и приемлемыми для игрока 1 будут вообще все ситуации.
Описание ситуаций приемлемости в развернутом виде для игрока 2 получаем аналогично из неравенств (5.8) и (5.9).
В общем случае Y=|q, 1-q|. Для трех случая получаем:
а) q=1 (Y=|1,0|). В этом случае приемлемость ситуации (X,Y) равносильна неравенству
(5.20)
или в развернутом виде
|p, 1-p|
. (5.21)
б) q=0 (Y=|0,1|). В этом случае приемлемость ситуации (X,Y) определяется неравенством
(5.22)
или в развернутом виде
. (5.23)
в) 0q1 (Y = |q,1-q|).
Условие приемлемости
(5.24)
в развернутом виде
. (5.25)
Таким образом, приемлемые для игрока 2 ситуации (X,Y) могут быть одного из трех типов:
(5.26)
(5.27)
(5.28)
Вновь подчеркнем, что неравенства (5.26) и (5.27) справедливы, если их знаменатель больше нуля. Если в11 + в22 - в12 - в21 < 0, то знак неравенства в выражениях (5.26) и (5.27) необходимо поменять на противоположный.
Для определения ситуаций, приемлемых одновременно как для первого, так и для второго игроков, удобно все найденные приемлемые ситуации представить на единичном квадрате (рис. 5.3).
Размещено на http://www.allbest.ru/
Рис. 5.3
Для случаев, когда а11 + а22 - а12 - а21 0 и b11 + b22 - b12 - b21 0 приемлемые ситуации игроков 1 и 2 составляют трехзвенные зигзаги. Причем, ситуации равновесия во вполне смешанных стратегиях игрока 2 совпадают с поведением игрока 2 в матричной игре с матрицей выигрыша А, а поведение игрока 1 - с поведением игрока 1 в матричной игре с матрицей выигрышей В.
Таким образом, описанное равновесное поведение игроков оказывается ориентированным не столько на максимализацию собственного выигрыша, сколько на минимизацию выигрыша противника. Так, “антагонизм поведения” может возникнуть и при отсутствии “антагонизма интересов”.
В приведенном на рис. 5.3 решении игры три ситуации равновесия, соответствуют точкам R1, R2, R3.
Если бы зигзаги приемлемых ситуаций были одинаковой ориентации, как показано на рис. 5.4, то пересечение приемлемых ситуаций игрока 1 и игрока 2 состояло бы из одной точки R.
Размещено на http://www.allbest.ru/
Рис. 5.4
При решении биматричных игр большей размерности необходимо решать большую систему линейных неравенств, определяемых выражениями (5.6), (5.7) и (5.8), (5.9), а затем таким же конечно-рациональным путем находить точки пересечения приемлемых ситуаций игрока 1 и игрока 2. Причем, любая конечная бескоалиционная игра имеет конечное и нечетное чисто ситуаций равновесия (решений игры). Поиск ситуаций равновесия в этом случае следует осуществлять с применением ПЭВМ.
5.5 Пример решения биматричной игры
Формулировка игры “Борьба за рынки”
Небольшая фирма (игрок 1) намерена сбыть крупную партию товара на одном из двух рынков, контролируемых другой, более крупной фирмой (игрок 2). Для этого оно может предпринять на одном из рынков соответствующие действия (например, развернуть рекламную кампанию). Господствующий на рынках игрок 2 может попытаться воспрепятствовать этому, предприняв на одном из двух рынков предупредительные меры. Игрок 1, не встретивший на рынке препятствий, захватывает его; встретившись с сопротивлением - терпит поражение. Выборы фирмами рынков являются их чистыми стратегиями.
Пусть проникновение игрока 1 на первый рынок более выгодно для него, чем проникновение на второй, но борьба за первый рынок требует больших средств. Например, победа игрока 1 на первом рынке принесет ему вдвое больший выигрыш, чем на втором, но зато поражение на первом рынке полностью его разоряет (проигрыш равен 10), а игрока 2 избавляет от конкурента (выигрыш равен 5).
Описанная биматричная игра может быть задана матрицами выигрышей
Решение игры. В соответствии с выражениями (5.6) и (5.7) приемлемыми ситуациями для игрока 1 будут те, которые удовлетворяют условиям
Рассмотрим три случая:
а) р=1 (X=|1, 0|). В соответствии с выражением (5.10) имеем
Откуда .
б) р = 0 (X=|0, 1|). В соответствии с выражением (5.11) имеем
или .
в) 0 р1 (X=|р, 1 - р|). В соответствии с выражением (5.12) или в развернутом виде (5.19) получаем
Приемлемые ситуации для игрока 2 в соответствии с выражениями (5.26), (5.27) и (5.27) следующие:
а)
б)
в)
Множества всех приемлемых ситуаций игрока 1 и игрока 2 изображены на рис. 5.5 (для игрока 2 соответствующее множество показано пунктиром).
Размещено на http://www.allbest.ru/
Рис. 5.5
Зигзаги приемлемых ситуаций пересекаются в единственной точке , которая и оказывается единственной ситуацией равновесия. Эта ситуация равновесия является ситуацией равновесия в смешанных стратегиях. Таким образом, оптимальными стратегиями по Нэшу являются и . При этом цена игры для игрока 1
.
Цена игры для игрока 2
.
5.6 Метастратегии и метарасширения
Смешанные стратегии определяются как случайные величины, реализующиеся в виде чистых стратегий. Дальнейшее расширение понятия стратегии сводится к пониманию новых, обобщенных стратегий, как функции, в которой исходные стратегии принимаются константами. В качестве аргументов, от которых целесообразно рассматривать функции - стратегии, можно брать стратегии других игроков.
Далее мы ограничимся случаем, когда каждый раз рассматривается функция от стратегии только одного игрока.
Определение 9. В бескоалиционной игре всякая функция Fkij : Xk Xj (которая исходя из стратегии Xk игрока k определяет стратегию Xj игрока j называется метастратегией игрока j (в ответ на стратегию игрока k).
Содержательно всякую метастратегию Fkij можно понимать как способ выбора игроком j некоторой своей стратегии в зависимости от получаемой им информации о стратегии, выбираемой игроком k. Если рассматривать ситуацию в бескоалиционной игре как некоторое соглашение, некоторый договор между игроками, а общую стратегию - как принимаемое на себя в договоре обязательство, то метастратегию можно понимать как своего рода условное обязательство: “в случае если игрок k поступит так-то, я, игрок і, выбираю такую-то свою стратегию, а если этак-то, то такую-то”. Очевидно, множество всех метастратегий і в ответ на стратегию k можно изобразить в степени множеств . Определение 10. Бескоалиционные игры G, с тем же множеством игроков N, что и игра называется метаигрой над игрой (метарасширением игры Г), если для некоторых j, kN
и для любой метастратегии yiYi и любого игрока іI
,
где xk - стратегия игрока k, входящая в ситуацию , Н - функция выигрышей в игре Г.
Очевидно, процесс образования метаигр (метарасширений игр) поддается неограниченному интегрированию: от метаигры можно переходить к ее метаигре (называемой второй метаигрой), от нее к третьей метаигре и т.д. В этом отношении метарасширения игр отличаются большим разнообразием, чем смешанные расширения.
Для метастратегических расширений доказаны следующие важные теоремы.
Теорема 3. Каждая конечная бескоалиционная игра двух лиц имеет в своем первом метарасширении ситуации равновесия.
Доказанная теорема не противоречит той возможности, что ситуацией равновесия может обладать уже сама исходная игра Г.
Теорема 4. Каждая конечная бескоалиционная игра двух лиц имеет в своем третьем метарасширении ситуацию, которая является одновременно ситуацией равновесия и оптимальной по Парето.
Пример. Биматричная игра 2х2 имеет следующие матрицы выигрышей игроков А и В:
В соответствии с выражениями (5.17), (5.18) и (5.19) находим приемлемые ситуации (X,Y) игрока 1:
а) (q может быть в любом интервале [0, 1];
б) (ситуация невозможна);
в) (ситуация невозможна).
В соответствии с выражениями (5.25), (5.27) и (5.28) находим приемлемые ситуации (X,Y) игрока 2:
а) (р может быть любым в интервале [0, 1];
б) (ситуация невозможна);
в) (ситуация невозможна);
Для наглядности на рис. 5.6 изображены зигзаги, описывающие и невозможные ситуации за пределами допустимых изменений вероятностей p,q).
Размещено на http://www.allbest.ru/
Рис. 5.6
Единственной ситуацией равновесия в рассматриваемой игре оказывается ситуация (1,1). В этой ситуации каждый из участников теряет 8. Вместе с тем очевидно, что в ситуации (0,0) каждый игрок теряет лишь по единице. Однако эта ситуация неустойчива, каждый игрок, изменяя в ней произвольным образом свою стратегию, увеличивает свой выигрыш.
Множество всех реализуемых векторов выигрышей для рассматриваемой игры имеет вид, изображенный на рис. 5.7.
Размещено на http://www.allbest.ru/
Рис. 5.7
Очевидно, что ситуации с выигрышами (-1, -1), (-10,0), (0,-10) являются оптимальными по Парето. При этом первая из них, в которой получаются наибольшие выигрыши (-1,-1) для каждого из игроков лучше, чем равновесная.
Противоречие между осуществимостью ситуации, выражаемой в виде равновесности и ее выгодности, которой соответствует оптимальность по Парето, имеет по существу ту же природу, что и противоречие между максиминным и минамаксным выигрышами. Поэтому оно должно разрешаться при помощи аналогичных приемов, состоящих в расширении уже имеющихся стратегий, т.е. переходу к метарасширениям.
Первая метастратегия игрока 2 состоит в выборе им своей второй стратегии в ответ на вторую стратегию игрока 1 и первой стратегии в ответ на первую.
Вторая метастратегия игрока 1 состоит в выборе им второй своей стратегии, если игрок 2 выберет ту же стратегию, что и 1 и в выборе им своей первой стратегии во всех остальных случаях.
Содержательно это можно представить себе так, что игрок 2 исходит из тезиса “око за око”, а игрок 1 - из более изощренных соображений, которые можно расценить как эгоцентризм (“поддерживать тех, кто действует так же, как я) и ксенофобию (“выступаю против всех тех, кто действует иначе, чем я”).
ТЕСТЫ
(В - Верно, Н - Неверно)
В бескоалиционных играх могут рассматривать конфликты двух и более игроков.
В бескоалиционных играх могут рассматриваться конфликты только с нулевой суммой.
Конечная бескоалиционная игра двух игроков с ненулевой суммой называется биматричной игрой.
В бескоалиционных играх принцип максимина не всегда является принципом, по которому находится решение игры.
Ситуация в бескоалиционной игре, приемлемая для всех игроков, называется ситуацией равновесия (оптимальной по Нэшу).
В бескоалиционных играх как оптимальные следует квалифицировать не действия того или иного игрока, а совокупность действий всех игроков.
В бескоалиционной игре решение игры - это, чаще, нахождение ситуаций равновесия.
Игроку в бескоалиционной игре может быть выгодным информировать противника о своей стратегии.
В оптимальной по Парето ситуации игроки могут совместными усилиями увеличить выигрыш какого-либо из игроков, сохранив выигрыши всех остальных игроков.
Ситуации равновесия не отличаются от ситуаций оптимальных по Парето.
Ситуации оптимальные по Парето находить труднее, чем ситуации равновесия в той же бескоалиционной игре.
В бескоалиционной игре кооперация игроков может быть им выгодна.
В теореме Нэша утверждается, что в каждой бескоалиционной игре существует хотя бы одна ситуация равновесия.
Любая конечная бескоалиционная игра имеет конечное и четное число ситуаций равновесия.
Метастратегия понимается как способ выбора игроком j своей стратегии в зависимости от получаемой им информации о стратегии, выбираемой игроком k.
Каждая конечная бескоалиционная игра двух лиц имеет в своей первом метарасширении ситуации равновесия.
Каждая конечная бескоалиционная игра двух лиц имеет в своей третьем метарасширении ситуацию, которая является одновременно ситуацией равновесия и оптимальной по Парето.
(Ответы: 1 - В; 2 - Н; 3 - В; 4 - В; 5 - В; 6 - В; 7 - В; 8 - В; 9 - Н; 10 - Н; 11 - Н; 12 - В; 13 - В; 14 - Н; 15 - В; 16 - В; 17 - В.)
ЗАДАЧИ
І. Найти ситуации оптимальные по Парето и ситуации устойчивые по Нэшу для следующих биматричных игр:
1.
2.
3.
4.
5.
6.
7.
8.
ІІ. Решить бескоалиционную игру “Экологический конфликт”.
Формулировка игры. Два промышленных предприятия (А и В), расположенные вблизи обширного водоема, берут из него воду для технических нужд и после использования сбрасывают ее обратно в водоем. Если суммарный объем сбрасываемой (загрязненной) воды не превышает некоторого предела , то происходит ее естественное очищение, и общий водный ресурс сохраняется. Если же указанный предел нарушен, то загрязненность водоема интенсивно растет. Возникает проблема его восстановления за счет предприятий и уплаты штрафов, общая стоимость чего составляет .
Чтобы избежать неприятных последствий, приходится строить очистные сооружения, состоящие из отдельных стандартных блоков, рассчитанных на определенные объемы пропускаемой через них воды (пусть каждый блок восстанавливает 25% используемой воды). Затраты на приобретение, монтаж и эксплуатацию одного блока равны С.
Суть конфликта, возникающего между предприятиями, сводится к их стремлению обеспечить себе благоприятные условия деятельности путем более свободного расходования природной воды. Это отрицательно влияем на состояние источника и через него - на ход производства, качество продукции обоих предприятий. Все оказывается взаимосвязанным, и появляется заинтересованность в поиске решений, приемлемых для конфликтующих сторон, хотя никакой договоренности между ними не предусматривается.
Математическая модель. Данный конфликт можно представить как бескоалиционную игру двух лиц следующим образом.
Пусть количество воды, потребляемой каждым предприятием в его технологическом цикле равно единице (100 т, 10 цистерн, и т.д.). Количество очищаемой воды составляет 1 - х на предприятии А; 1 - y на предприятии В, где чистые стратегии игрока А = |0; 0,25; 0,5; 0,75; 1|, в зависимости от числа применяемых очистных блоков. Чистые стратегии игрока В = |0; 0,25; 0,5; 0,75; 1|.
Расходы предприятия А составляют:
4С(1 - х), если х + у ;
4С(1 - х) + , если х + у ,
а расходы предприятия В -
4С(1 - у), если х + у ;
4С(1 - у) + , если х + у .
Данные формулы позволяют составить платежные матрицы игроков А и В. Для случая имеем
В А |
В4 |
В3 |
В2 |
В1 |
В0 |
|
А4 |
4С 4С |
4С 3С |
4С+ 2С+ |
4С+ С+ |
4С+ |
|
А3 |
3С 4С |
3С+ 3С+ |
3С+ 2С+ |
3С+ С+ |
3С+ |
|
А2 |
2С+ 4С+ |
2С+ 3С+ |
2С+ 2С+ |
2С+ С+ |
2С+ |
|
А1 |
С+ 4С+ |
С+ 3С+ |
С+ 2С+ |
С+ С+ |
С+ |
|
А0 |
4С+ |
3С+ |
2С+ |
С+ |
Индекс при чистых стратегиях игроков указывает на количество используемых очистных блоков (например А3 - предприятие А использует 3 очистных блока; В0 - предприятие В не использует ни одного очистного блока).
Найти ситуации оптимальные по Парето и ситуации равновесия по Нэшу при следующих исходных данных:
9. С ; 10. С ;
11. 5С = ; 12. 5С = ; ;
13. 4С = ; ; 14. 2С = ; ;
15. 2С = ;; 16. С = 3; ;
17. С = 2; ; 18. С = ; ;
19. С = ; ; 20. С = 4; .
ІІІ. Найти множества всех ситуаций оптимальных по Парето в следующих биматричных играх:
21.
22.
23.
24.
25.
26.
27.
28.
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
Вентцель Е.С. Исследование операций. - М.: Наука, 1980. - 206 с.
Воробьев Н.Н, Теория игр для экономистов-кибернетиков. - М.: Наука, 1985. - 272 с.
Мулен Э. Теория игр с примерами из математической экономики. - М.: Мир, 1985. - 200 с.
Морозов В.В. Сухарев А.Г., Федоров В.В. Исследование операций в задачах и упражнениях. М.: Высшая школа, 1986. - 287 с.
Ермольев Ю.М., Ляшко И.И., Михалевич В.С. Тюптя В.И. Математические методы исследования операций. - К.: Выща школа, 1979. - 312 с.
Таха Х. Введение в исследование операций. Кн.2. - М.: Мир, 1985. - 479 с.
Костевич Л.С., Лапко А.А, Теория игр. Исследование операций. - Минск: Вышэйшая школа, 1982. 229 с.
Размещено на Allbest.ru
Подобные документы
Математическое программирование. Линейное программирование. Задачи линейного программирования. Графический метод решения задачи линейного программирования. Экономическая постановка задачи линейного программирования. Построение математической модели.
курсовая работа [581,5 K], добавлен 13.10.2008Теоретическая основа линейного программирования. Задачи линейного программирования, методы решения. Анализ оптимального решения. Решение одноиндексной задачи линейного программирования. Постановка задачи и ввод данных. Построение модели и этапы решения.
курсовая работа [132,0 K], добавлен 09.12.2008Алгоритм решения задач линейного программирования симплекс-методом. Построение математической модели задачи линейного программирования. Решение задачи линейного программирования в Excel. Нахождение прибыли и оптимального плана выпуска продукции.
курсовая работа [1,1 M], добавлен 21.03.2012Применение методов линейного программирования для решения оптимизационных задач. Основные понятия линейного программирования, свойства транспортной задачи и теоремы, применяемые для ее решения. Построение первичного опорного плана и системы потенциалов.
курсовая работа [280,8 K], добавлен 17.11.2011Постановка задач линейного программирования. Примеры экономических задач, сводящихся к задачам линейного программирования. Допустимые и оптимальные решения. Алгоритм Флойда — алгоритм для нахождения кратчайших путей между любыми двумя узлами сети.
контрольная работа [691,8 K], добавлен 08.09.2010Общее понятие и характеристика задачи линейного программирования. Решение транспортной задачи с помощью программы MS Excel. Рекомендации по решению задач оптимизации с помощью надстройки "Поиск решения". Двойственная задача линейного программирования.
дипломная работа [2,4 M], добавлен 20.11.2010Понятие арифметического точечного пространства. Различные виды плоскостей в пространстве. Общая задача оптимизации. Геометрия задачи линейного программирования. Графический метод решения задачи линейного программирования при малом количестве переменных.
курсовая работа [756,9 K], добавлен 29.05.2014Методы решения задач линейного программирования: планирования производства, составления рациона, задачи о раскрое материалов и транспортной. Разработка экономико-математической модели и решение задачи с использованием компьютерного моделирования.
курсовая работа [607,2 K], добавлен 13.03.2015Оптимизационная задача линейного программирования. Виды задач линейного программирования. Принятие решений на основе количественной информации об относительной важности критериев. Выбор средств разработки. Программный комплекс векторной оптимизации.
дипломная работа [1,3 M], добавлен 27.03.2013Критерий эффективности и функции в системе ограничений. Общая постановка задачи линейного программирования. Составление математической модели задачи. Алгоритмы решения задачи симплексным методом. Построение начального опорного решения методом Гаусса.
курсовая работа [232,4 K], добавлен 01.06.2009