Математические модели теории игр
Характеристика математической модели реальной конфликтной ситуации. Особенность формализации игры. Главный анализ нижней и верхней цены игрового процесса. Седловая точка в платежной матрице. Решение системы в смешанных стратегиях геометрическим методом.
Рубрика | Математика |
Вид | реферат |
Язык | русский |
Дата добавления | 17.06.2015 |
Размер файла | 149,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
1. Математические модели теории игр
На практике часто приходится сталкиваться с задачами, в которых необходимо принимать решения в условиях неопределенности, т.е. возникают ситуации, в которых две стороны преследуют различные цели и результаты действия каждой из сторон зависят от мероприятий противника (или партнера).
Ситуация, в которой эффективность принимаемого одной стороной решения зависит от действий другой стороны, называется конфликтной. Конфликт всегда связан с определенного рода разногласиями (это не обязательно антагонистическое противоречие).
Конфликтная ситуация называется антагонистической, если увеличение выигрыша одной из сторон на некоторую величину приводит к уменьшению выигрыша другой стороны на такую же величину, и наоборот.
В экономике конфликтные ситуации встречаются очень часто и имеют многообразный характер. Например, взаимоотношения между поставщиком и потребителем, покупателем и продавцом, банком и клиентом. Каждый из них имеет свои интересы и стремится принимать оптимальные решения, помогающие достигнуть поставленных целей в наибольшей степени. При этом каждому приходится считаться не только со своими целями, но и с целями партнера и учитывать решения, которые эти партнеры будут принимать (они заранее могут быть неизвестны). Чтобы в конфликтных ситуациях принимать оптимальные решения, создана математическая теория конфликтных ситуаций, которая называется теорией игр. Возникновение этой теории относится к 1944 г., когда была издана монография Дж. фон Неймана «Теория игр и экономическое поведение»
Игра - это математическая модель реальной конфликтной ситуации. Стороны, участвующие в конфликте, называются игроками. Исход конфликта называется выигрышем. Правила игры - это система условий, определяющая варианты действий игроков; объем информации каждого игрока о поведении партнеров; выигрыш, к которому приводит каждая совокупность действий.
Игра называется парной, если в ней участвуют два игрока, и множественной, если число игроков больше двух. Мы будем рассматривать только парные игры. Игроки обозначаются A и B.
Игра называется антагонистической (с нулевой суммой), если выигрыш одного из игроков равен проигрышу другого.
Выбор и осуществление одного из вариантов действий, предусмотренных правилами, называется ходом игрока. Ходы могут быть личными и случайными.
Личный ход - это сознательный выбор игроком одного из вариантов действий (например, в шахматах).
Случайный ход - это случайно выбранное действие (например, бросание игральной кости). Мы будем рассматривать только личные ходы.
Стратегия игрока - это совокупность правил, определяющих поведение игрока при каждом личном ходе. Обычно в процессе игры на каждом этапе игрок выбирает ход в зависимости от конкретной ситуации. Возможно также, что все решения приняты игроком заранее (т.е. игрок выбрал определенную стратегию).
Игра называется конечной, если у каждого игрока имеется конечное число стратегий, и бесконечной - в противном случае.
Цель теории игр - разработать методы для определения оптимальной стратегии каждого игрока.
Стратегия игрока называется оптимальной, если она обеспечивает этому игроку при многократном повторении игры максимально возможный средний выигрыш (или минимально возможный средний проигрыш независимо от поведения противника).
Раздел Теория игр представлен тремя онлайн-калькуляторами:
1. Решение матричной игры. В таких задачах задана платежная матрица. Требуется найти чистые или смешанные стратегии игроков и, цену игры. Для решения необходимо указать размерность матрицы и метод решения.
2. Биматричная игра. Обычно в такой игре задают две матрицы одинакового размера выигрышей первого и второго игроков. Строки этих матриц соответствуют стратегиям первого игрока, а столбцы матриц - стратегиям второго игрока. При этом в первой матрице представлены выигрыши первого игрока, а во второй матрице - выигрыши второго.
3. Игры с природой. Используется, когда необходимо выбрать управленческое решение по критериям Максимакса, Байеса, Лапласа, Вальда, Сэвиджа, Гурвица.
Пример 1. Каждый из игроков, A или B , может записать, независимо от другого, цифры 1, 2 и 3. Если разность между цифрами, записанными игроками, положительна, то A выигрывает количество очков, равное разности между цифрами. Если разность меньше 0, выигрывает B. Если разность равна 0 - ничья.
У игрока A три стратегии (варианта действия): A1= 1 (записать 1), A2= 2, A3= 3, у игрока тоже три стратегии: B1, B2, B3.
B A |
B1= 1 |
B2= 2 |
B3= 3 |
|
A1 = 1 |
0 |
-1 |
-2 |
|
A2= 2 |
1 |
0 |
-1 |
|
A3= 3 |
2 |
1 |
0 |
Задача игрока A - максимизировать свой выигрыш. Задача игрока B - минимизировать свой проигрыш, т.е. минимизировать выигрыш A. Это парная Основные понятия теории игр
В экономической практике часто имеют место конфликтные ситуации. Игровые модели - это, в основном, упрощенные математические модели конфликтов. В отличие от реального конфликта игра ведётся по четким правилам. Для моделирования конфликтных ситуаций разработан специальный аппарат - математическая теория игр. Стороны, участвующие в конфликте, называются игроками.
Каждая формализованная игра (модель) характеризуется:
1. количеством субъектов - игроков, участвующих в конфликте;
2. вариантом действий для каждого из игроков, называемых стратегиями;
3. функциями выигрыша или проигрыша (платежа) исхода конфликта;
Игра, в которой участвуют два игрока A и B называется парной. Если же количество игроков больше двух, то это игра множественная. Мы будем рассматривать модели только парных игр.
Игра, в которой выигрыш одного из игроков точно равен проигрышу другого, называется антагонистической игрой или игрой с нулевой суммой. С рассмотрения моделей антагонистических игр мы и начнём.
Смоделировать (решить) антагонистическую игру - значит, для каждого игрока указать стратегии, удовлетворяющие условию оптимальности, т.е. игрок A должен получить максимальный гарантированный выигрыш, какой бы своей стратегии не придерживался игрок B, а игрок B должен получить минимальный проигрыш, какой бы своей стратегии не придерживался игрок A. Оптимальные стратегии характеризуются устойчивостью, то есть ни одному из игроков не выгодно отклоняться от своей оптимальной стратегии.
Примечание. Различают игры кооперативные и некооперативные, с полной информацией и не полной. В игре с полной информацией перед каждым ходом каждый игрок знает все возможные ходы (стратегии поведения) и выигрыши. В кооперативных играх допускается возможность предварительных переговоров между игроками. Мы будем рассматривать некооперативные игры с полной информацией.
Математическая теория игр является разделом математики, изучающей принятие решений в конфликтных ситуациях.
Определим основные понятия теории игр.
Игра - упрощенная формализованная модель конфликтной ситуации. Игрок - одна из сторон в игровой ситуации. В зависимости от постановки задачи, стороной может выступать коллектив или даже целое государство.
Каждый игрок может иметь свои стратегии. Стратегией i-го игрока x2 называется одно из возможных решений из множества допустимых решений этого игрока.
По количеству стратегий игры делятся на конечные, в которых число стратегий ограничено, и бесконечные, которые имеют бесконечно много различных стратегий.
Каждый из n участников игры может выбирать свою стратегию. Совокупность стратегий x=x1,x2,…,xn, которые выбрали участники игры, называется игровой ситуацией.
Оценить ситуацию x с точки зрения преследуемых ЛПР целей можно, построив целевые функции (или критерии качества), ставящие в соответствие каждой ситуации x числовые оценки f1(x),f2(x),…,fn(x) (например, доходы фирм в ситуации x или их затраты и т. д.).
Тогда цель i- го ЛПР формализуется следующим образом: выбрать такое свое решение xi, чтобы в ситуации x=x1,x2,…,xn число fi(x) было как можно большим (или меньшим). Однако достижение этой цели от него зависит лишь частично, поскольку другие участники игры влияют на общую ситуацию x с целью достижения своих собственных целей (оптимизируют свои целевые функции). Значение целевой функции в той или иной игровой ситуации можно назвать выигрышем игрока в этой ситуации.
По характеру выигрышей игры можно разделить на игры с нулевой и ненулевой суммой. В играх с нулевой суммойсумма выигрышей в каждой игровой ситуации равна нулю. Игры двух игроков с нулевой суммой называются антагонистическими. В этих играх выигрыш одного игрока равен проигрышу другого.
В играх с ненулевой суммой в выигрыше или проигрыше могут оказаться все участники игры.
По виду функции выигрышей игры можно разделить на матричные, биматричные, непрерывные, сепарабельные и т. д.
Матричными играми называются конечные игры двух игроков с нулевой суммой. В этом случае номер строки матрицы соответствует номеру стратегии Ai игрока 1, а номер столбца - номеру стратегии Bj игрока 2.
Элементами матрицы aij является выигрыш игрока 1 для ситуации (реализации стратегий) AiBj. В силу того, что рассматривается матричная игра с нулевой суммой, выигрыш игрока 1 равен проигрышу игрока 2.
Можно показать, что всякая матричная игра с известной матрицей платежей сводится к решению задачи линейного программирования.
Поскольку в прикладных задачах экономики и управления ситуации, сводящиеся к матричным играм, встречаются не очень часто, мы не будем останавливаться на решении этих задач.
Биматричная игра - это конечная игра двух игроков с ненулевой суммой. В этом случае для каждой игровой ситуации AiBj каждый из игроков имеет свой выигрыш aij для первого игрока и bij- для второго игрока. К биматричной игре сводится, например, поведение производителей на рынках несовершенной конкуренции. Анализу этой проблемы посвящена тема 6 настоящего учебного пособия.
По степени неполноты информации, которой обладают ЛПР, игры делятся на стратегические и статистические.
Стратегические игры - это игры в условиях полной неопределенности.
Статистические игры - это игры с частичной неопределенностью. В статистической игре всегда имеется один активный игрок, имеющий свои стратегии и цели. Другим игроком (пассивным, не преследующим своих целей) является природа. Этот игрок реализует свои стратегии (состояния природы) случайным образом, причем вероятность реализации того или иного состояния можно оценить с помощью статистического эксперимента.
Поскольку с теорией статистических игр тесно связана теория принятия экономических решений, то в дальнейшем мы ограничимся рассмотрением только этого класса игр.
2. Формализация игры. Матрица игры
Пусть у игрока A есть m возможных ходов (стратегий) A1, A2,... Am, а у игрока B n возможных ходов (стратегий) B1, B2, ... Bn. Если игрок A сделает ход Ai, а игрок B сделает ход Bj, то эти ходы Ai и Bj однозначно определяют исходы игры aij для игрока А и bij для игрока В. Полные наборы исходов игры записываются в виде платёжных матриц размером mъIn, стратегии игрока А соответствуют строкам матриц, а стратегии игрока В соответствуют столбцам матриц.
В общем случае у каждого игрока своя платёжная матрица и игра называется биматричной. Две матрицы могут быть преобразованы в одну - биматрицу, каждый элемент которой состоит из двух чисел, выигрыша игрока А и проигрыша игрока В. Поскольку мы ограничились рассмотрением антагонистическими играми, при которых выигрыш одного из игроков точно равен проигрышу другого, то на матрицы А и В налагается условие А + В = 0 (или А = - В, aij = - bij ). В этом случае можно ограничиться только одной матрицей - матрицей А. Такие игры называются матричными.
Итак, математической моделью антагонистической игры является матричная игра с матрицей A, в которой ходы (стратегии) игрока A расположены по строкам, а ходы (стратегии) игрока B расположены по столбцам. В самой матрице записаны выигрыши игрока A при соответствующих ходах игроков A и B (отрицательный выигрыш - это проигрыш).
ПРИМЕР 1. Рассмотрим антагонистическую игру, в которой участвуют два игрока, каждый из которых имеет две стратегии. Выигрыши каждого из игроков определены следующими правилами: если оба из игроков выбирают стратегии с одинаковыми номерами, то первый выигрывает одну условную единицу. Если игроки выбирают разные стратегии, то выигрывает второй игрок условную единицу. В этом случае платёжная матрица имеет вид:
А =
ПРИМЕР 2. Игроки A и B играют в следующую игру. Игрок A записывает одно из чисел 6, 7, 9, а игрок B записывает одно из чисел 4, 5. Если сумма чисел четная, то это выигрыш игрока А. Если сумма чисел нечётная, то это выигрыш игрока В (проигрыш игрока А). Найти платёжную матрицу игры А.
Имеем три стратегии первого игрока. А1 = 6, А2 = 7, А3 = 9, В1 = 4, В2 = 5. Матрица игры:
А =
Оптимальные стратегии
С платёжной матрицей A = (aij) связано несколько основных понятий теории игр (игровых моделей).
Определение 1. Нижней ценой игры V* называется величина, являющаяся максиминным значением платёжной матрицы:
V* = max min aij
(сначала находится минимум в каждой строке, а затем из полученных минимумов находят максимум). Нижняя цена игры - это гарантированный выигрыш первого игрока А при любой стратегии игрока В.
Определение 2. Верхней ценой игры V* называется величина, являющаяся минимаксным значением платёжной матрицы:
V* = min max aij
(сначала находится максимум в каждом столбце, а затем из полученных максимумов находят минимум). Верхняя цена игры - это гарантированный проигрыш второго игрока B при любой стратегии игрока A.
В силу того, что игра антагонистическая, всегда V* ? V*. Если V* = V* = V, то просто говорят о цене игры, такая игра называется вполне определённой, игрой с седловой точкой, поскольку значение элемента платёжной матрицы, равное V = V* = V* является минимальным в своей строке и максимальным в своём столбце. Соответствующие этой цене игры стратегии называются оптимальными, поскольку второй игрок не может понизить нижнюю цену игры, а первый игрок не может повысить верхнюю цены игры.
ПРИМЕР 3. Платёжная матрица игры:
А = .
Определим, существует ли седловая точка. Для этого находим минимум в каждой строке матрицы. Минимальным числом в первой строке будет 3, во второй - 4 и в третьей - 2. Из полученных минимумов находим максимум:
V* = max(3,4,2) = 4
Находим максимум в каждом столбце. Это числа 6, 7, 4 соответственно. Из полученных максимумов находим минимум:
V* = min(6,7,4) = 4
Следовательно, исходя из данного выше определения цены игры, в данном случае цена игры V = V* = V* = 4, седловая точка существует, и это есть элемент платёжной матрицы a23 = 4. Ей соответствуют единственная оптимальная стратегии - A2 первого игрока и единственная оптимальная стратегия - B3 второго игрока.
В общем случае в игре может быть несколько седловых точек и, следовательно, несколько оптимальных стратегий (решений) игровой задачи.
ПРИМЕР 4. Задана платёжная матрица игры, необходимо найти оптимальное решение игры.
А =
Определим, существует ли седловая точка. Для этого находим минимумы в каждой строке матрицы. Минимальным числом в первой строке будет 1, во второй это 2 и в третьей тоже 2. Из полученных минимумов находим максимум:
V* = max(1,2,2) = 2
Находим максимум в каждом столбце. Это числа 4, 2, 2 соответственно. Из полученных максимумов находим минимум:
V*=min(4,2,2) = 2
Следовательно, исходя из данного выше определения цены игры, в данном случае цена игры V = V* = V* = 2. Ей соответствуют стратегии A2 , А4 первого игрока, и стратегии В2, B3второго игрока (так как a22= а23 = а32 = а33 = 2). Из приведённого анализа следует, что в рассматриваемой платёжной матрице A существуют четыре седловых точек a22 , а23 , а32 , а33, поскольку каждый из этих элементов является минимальным элементом в своей строке и максимальным элементом в своём столбце.
Данная игра будет иметь четыре оптимальных решения, которыми являются следующие пары стратегий:
· 2-я стратегия первого игрока и 2-я стратегия второго игрока, которым соответствует элемент а22;
· 2-я стратегия первого игрока и 3-я стратегия второго игрока, которым соответствует элемент а23;
· 3-я стратегия первого игрока и 2-я стратегия второго игрока, которым соответствует элемент а32;
· 3-я стратегия первого игрока и 3-я стратегия второго игрока, которым соответствует элемент а33.
Данный пример иллюстрирует тот факт, что конечная антагонистическая игра может иметь множество оптимальных решений (множество пар оптимальных стратегий).
ПРИМЕР 5. Задана платёжная матрица игры A, необходимо найти решение игры.
A =
В данной игре
V* = max (min aij)= 3aij
V* = min (max aij) = 4
Поскольку V* < V* - выполняется соотношение строгого неравенства, следовательно, седловая точка в игре отсутствует, ситуации равновесия не существует. Очевидно, что для данной игры рассмотренный выше подход к нахождению оптимального решения неприменим, а максиминная и минимаксная стратегия игроков не являются решением игры.
Приведённые выше примеры иллюстрируют тот факт, что антагонистические игры делятся на два класса:
1. вполне определённые игры, т.е. те, в которых существует седловая точка, ситуация равновесия и решение игры в чистых стратегиях;
2. не вполне определенные игры, т.е. те, в которых не существует седловой точки, ситуации равновесия и решения игры в чистых стратегиях. Для не вполне определённых игр принцип решения в той форме, для которой он изложен для вполне определённых игр, неприменим.
3. Нижняя и верхняя цена игры
Найдем наилучшую стратегию игрока A, для чего проанализируем последовательно все его стратегии. Выбирая стратегию Ai, мы должны рассчитывать, что игрок B ответит на нее такой стратегией Bj, для которой выигрыш Aбудет минимальным. Поэтому среди чисел первой строки выбираем минимальное, обозначим его , запишем его в добавочный столбец. Аналогично для каждой стратегии Ai выбираем , т.е. бi - минимальный выигрыш при применении стратегии Ai.
В примере 1:
б1 = min {0, -1, -2} = -2;
б 2 = min {1, 0, -1} = -1;
б 3 = min {0, -1, -2} = 0.
Эти числа запишем в добавочном столбце. Какую же стратегию должен выбрать игрок A? Конечно же, ту стратегию, для которой бi максимально. Обозначим . Это гарантированный выигрыш, который может обеспечить себе игрок A, т.е. ; этот выигрыш называется нижней ценой игры или максимином. Стратегия Ai, обеспечивающая получение нижней цены игры, называется максиминной (перестраховочной). Если игрок A будет придерживаться этой стратегии, то ему гарантирован выигрыш ?б при любом поведении игрока B.
В примере 1 . Это означает, что если A будет писать «3», то он хотя бы не проиграет. Игрок Bзаинтересован уменьшить выигрыш A. Выбирая стратегию B1, он из соображений осторожности учитывает максимально возможный при этом выигрыш A. Обозначим . Аналогично при выборе стратегии Bjмаксимально возможный выигрыш A- ; запишем эти числа в добавочной строке. Чтобы уменьшить выигрыш A, надо из чисел в j выбрать наименьшее . Число называется верхней ценой игры или минимаксом. Это гарантированный проигрыш игрока B (т. е. он проиграет не больше, чем в). Стратегия игрока B, обеспечивающая выигрыш ? - в, называется его минимаксной стратегией.
В примере 1:
Это означает, что оптимальная стратегия B - писать «3», тогда он хотя бы не проиграет.
B A |
B1 |
B2 |
B3 |
||
A1 |
0 |
- 1 |
-2 |
-2 |
|
A2 |
1 |
0 |
-1 |
-1 |
|
A3 |
2 |
1 |
0 |
0 |
|
2 |
1 |
0 |
0 0 |
Принцип, диктующий игрокам выбор наиболее «осторожных» минимаксной и максиминной стратегий, называется принципом минимакса. Этот принцип следует из разумного предположения, что каждый игрок стремится достичь цели, противоположной цели противника.
Можно доказать, что , т. е. .
В примере 1 б = в. Если , т.е. минимакс совпадает с максимином, то такая игра называется игрой с седловой точкой. Седловая точка - это пара оптимальных стратегий ( Ai, Bj). В примере 1 игра имеет седловую точку (А3,B3). В этом случае число б = в называется (чистой) ценой игры (нижняя и верхняя цена игры совпадают). Это означает, что матрица содержит такой элемент, который является минимальным в своей строке и одновременно максимальным в своем столбце. В примере 1 это элемент 0. Цена игры равна 0.
Оптимальные стратегии в любой игре обладают важным свойством, а именно - устойчивостью. Это означает, что каждый из игроков не заинтересован в отходе от своей оптимальной стратегии, т. к. это ему невыгодно. Отклонение от оптимальной стратегии игрока А приводит к уменьшению его выигрыша, а одностороннее отклонение игрока В - к увеличению проигрыша. Говорят, что седловая точка дает положение равновесия.
Пример 2. Первая сторона (игрок А) выбирает один из трех типов вооружения - А1, А2, А3, а противник (игрок В) - один из трех видов самолетов: В1, В2, В3. Цель В - прорыв фронта обороны, цель А - поражение самолета. Вероятность поражения самолета В1 вооружением А1 равна 0,5, самолета В2 вооружением А1 равна 0,6, самолетаВ3 вооружением А1 равна 0,8 и т.д., т.е. элемент aij платежной матрицы - вероятность поражения самолета В jвооружением Аi. Платежная матрица имеет вид:
В А |
Вид самолета |
||||
В1 |
В2 |
В3 |
|||
Тип вооружения |
А1 |
0,5 |
0,6 |
0,8 |
|
А2 |
0,9 |
0,7 |
0,8 |
||
А3 |
0,7 |
0,5 |
0,6 |
Решить игру, т.е. найти нижнюю и верхнюю цену игры и оптимальные стратегии. математический игра седловой матрица
Решение. В каждой строке находим минимальный элемент и записываем его в добавочном столбце. В каждом столбце находим максимальный элемент и записываем его в добавочной строке.
В А |
В1 |
В2 |
В3 |
б i |
|
А1 |
0,5 |
0,6 |
0,8 |
0,5 |
|
А2 |
0,9 |
0,7 |
0,8 |
0,7 |
|
А3 |
0,7 |
0,5 |
0,6 |
0,5 |
|
в j |
0,9 |
0,7 |
0,8 |
0,7 0,7 |
В добавочном столбце находим максимальный элемент = 0,7, в добавочной строке находим минимальный элемент = 0,7.
Ответ: = 0,7. Оптимальные стратегии - А2 и В2.
Пример 3. Игра в орлянку. Каждый игрок при своем ходе может выбирать одну из двух стратегий: орел или решка. При совпадении выбранных стратегий А получает выигрыш +1, при несовпадении B получает выигрыш 1 (т. е. А получает выигрыш -1). Платежная матрица:
В А |
В1 (орел) |
В2 (решка) |
|
А1 (орел) |
1 |
-1 |
|
А2 (решка) |
-1 |
1 |
Найти нижнюю и верхнюю цену игры. Имеет ли игра седловую точку?
Решение.
В А |
В1 |
В2 |
||
А1 |
1 |
-1 |
-1 |
|
А2 |
-1 |
1 |
1 |
|
1 |
1 |
-1 1 |
б = -1, в = 1, т. е. А проиграет не больше 1, и B проиграет не больше 1. Так как б ? в, игра не имеет седловой точки. Положения равновесия в этой игре не существует, и оптимального решения в чистых стратегиях найти нельзя.
Пример. Найдите нижнюю цену игру, верхнюю цену игры, определите седловые точки, оптимальные чистые стратегии и цену игры (если они существуют).
Седловая точка
Седловая точка - это пара оптимальных стратегий (Ai, Bj). В этом случае число a=b называется (чистой) ценой игры (нижняя и верхняя цена игры совпадают). Это означает, что матрица содержит такой элемент, который является минимальным в своей строке и одновременно максимальным в своем столбце.
Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры вчистых стратегиях.
Игроки |
B1 |
B2 |
B3 |
B4 |
a = min(Ai) |
|
A1 |
8 |
7 |
0 |
6 |
0 |
|
A2 |
6 |
8 |
5 |
10 |
5 |
|
b = max(Bi ) |
8 |
8 |
5 |
10 |
0 |
Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = (0,5,0) = 5, которая указывает на максимальную чистую стратегию A2.
Верхняя цена игры b = min(bj) = (8,8,5,10) = 5.
Седловая точка (2, 3) указывает решение на пару альтернатив (A2,B3). Цена игры равна 5.
4. Платежная матрица
Парную игру с нулевой суммой удобно исследовать, если она описана в виде матрицы.
Предположим, что игрок A имеет m стратегий (обозначим их А1, А2, …, Am), а игрок B (противник) - n стратегий (B1, B2, …, Bm). Такая игра называется игрой размерности m х n. Пусть игрок A выбрал одну из своих возможных стратегий Ai. Игрок B, не зная результата выбора игрока A, выбрал стратегию Bj. Для каждой пары стратегий (Ai, Bj) определен платеж aij второго игрока первому, т.е. выигрыш игрока A. Выигрышем игрока B будет соответственно (- aij). Никакой дискриминации по отношению ко второму игроку здесь нет, т. к. величины aijмогут быть и отрицательны, тогда -aij > 0. Например, a13 = -2 - выигрыш A, -a13 = 2 - выигрыш B. Такая игра называется матричной; матрица, составленная из чисел aij , называется платежной. В примере 1 платежная матрица имеет вид
.
Строки этой матрицы соответствуют стратегиям игрока A, а столбцы - стратегиям игрока B. Общий вид такой матрицы
B A |
B1 |
B2 |
… |
Bj |
… |
Bn |
|
A1 |
a11 |
a12 |
… |
a1j |
… |
a1n |
|
A2 |
a21 |
a22 |
… |
a2j |
… |
a2n |
|
… |
… |
||||||
Ai |
ai1 |
ai2 |
… |
aij |
… |
ain |
|
… |
… |
… |
… |
… |
… |
… |
|
Am |
am1 |
am2 |
… |
amj |
… |
amn |
ПРИМЕР. Игроки A и B играют в следующую игру. Игрок A записывает одно из чисел 3, 7, 8, а игрок Bзаписывает одно из чисел 4, 5. Если сумма чисел четная, то это выигрыш игрока A. Если сумма чисел нечётная, то это выигрыш игрока B (проигрыш игрока A). Найти платёжную матрицу и оптимальное решение.
Решение. Если сумма чисел чётная, игрок A получает выигрыш +1, иначе игрок B получает выигрыш +1 (т.е. Aполучает выигрыш -1). Платежная матрица:
3 |
7 |
8 |
||
4 |
-1 |
-1 |
1 |
|
5 |
1 |
1 |
-1 |
Далее решение ищем с помощью калькулятора.
Методы упрощения платёжных матриц. Доминирование и дублирование стратегий
Рассмотрим несколько методов упрощения платёжных матриц.
Первый метод, используемый для уменьшения размерности матрицы, основан на одном из важнейших понятий в теории игр - понятии доминирования стратегий.
Если i-я строка поэлементно не меньше (?) j-й строки, то говорят, что i-я строка доминирует над j-й строкой. Поэтому игрок A не использует j-ю стратегию, так как его выигрыш при i-й стратегии не меньше, чем при j-й стратегии, вне зависимости от того, как играет игрок B.
Аналогично, если i-й столбец поэлементно не меньше (?) j-го столбца, то говорят, что j-й столбец доминирует над i-м столбцом. Поэтому игрок B не использует i-ю стратегию, так как его проигрыш (равный выигрышу игрока A) при j-й стратегии не больше (?), чем при i-й стратегии, вне зависимости от того, как играет игрок A. Стратегии, над которыми доминируют другие стратегии, надо отбросить и приписать им нулевые вероятности. На цене игры это никак не скажется. Зато размер матрицы игры понизится. С этого и нужно начинать решение игры.
Частный случай доминирования является дублирование стратегий.
Если платёжная матрица игры содержит несколько одинаковых строк (столбцов), то из них оставляем только одну строку, а остальные строки (столбцы) отбрасываем. Отброшенным стратегиям припишем нулевые вероятности.
Упрощение (уменьшение размерности) платёжных матриц за счёт исключения заведомо невыгодных чистых стратегий возможно в силу справедливости следующей Теоремы о доминирующих стратегиях:
Пусть I - игра, в матрице которой i -я стратегия первого игрока доминирует над i +1, а G - игра, матрица которой получена из матрицы I исключением i + 1 стратегии (строки). Тогда:
1. цена игры I равна цене игры G;
2. оптимальная смешенная стратегия Q*= (q1*,q2*,…,qn*) второго игрока в игре G является также его оптимальной смешанной стратегией в игре I;
3. если P*= (p1*,p2*,…,pi*, p*i+2,…, pm*) оптимальная смешенная стратегия первого игрока в игре G, то его смешенная стратегия P*= (p1*,p2*,…,pi*, p*i+2,…, pm*) является оптимальной в игре I.
Из выше сказанного следует, что как первому, так и второму нет смысла использовать доминируемую стратегию, поэтому все доминируемые стратегии могут быть отброшены, т.е. фактически отброшены строки и столбцы исходной матрицы A, соответствующие этим строкам. Это преобразование уменьшает размерность исходной платёжной матрицы A, тем самым упрощается поиск оптимального решения.
Рассмотрим ряд примеров с использованием калькулятора.
Смешанные стратегии
В общем случае V* ? V* - седловой точки не существует. Оптимальное решение в чистых стратегиях также не существует. Однако, если расширить понятие чистой стратегии введением понятия смешанной стратегии, то удаётся реализовать алгоритм нахождения оптимального решения не вполне определённой игровой задачи, аналогичный рассмотренному выше. В такой ситуации предлагается использование статистического (вероятностного) подхода к нахождению оптимального решения антагонистической игры. Для каждого игрока, наряду с данным набором возможных для него стратегий, вводится неизвестный вектор вероятностей (относительных частот), с которыми следует применять ту или иную стратегию.
Обозначим вектор вероятностей (относительных частот) выбора заданных стратегий игрока A следующим образом:
P = (p1, p2,…, pm),
где pi? 0, p1 + p2 +…+ pm= 1. Величина pi называется вероятностью (относительной частотой) применения стратегии Ai.
Аналогично для игрока B вводится неизвестный вектор вероятностей (относительных частот) имеет вид:
Q = (q1, q2,…, qn),
где qj? 0, q1 + q2 +…+ qn = 1. Величина qj называется вероятностью (относительной частотой) применения стратегии Bj. Совокупность (комбинация) чистых стратегий A1, A2, …Am и B1, B2, …Bn в сочетании с векторами вероятностей выбора каждой из них называются смешанными стратегиями.
Основной теоремой в теории конечных антагонистических игр является Теорема фон Неймана: каждая конечная матричная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.
Из этой теоремы следует, что не вполне определённая игра имеет хотя бы одно оптимальное решение в смешанных стратегиях. В таких играх решением будет пара оптимальных смешанных стратегий P* и Q*, таких, что если один из игроков придерживается своей оптимальной стратегии, то и другому игроку не выгодно отклоняться от своей оптимальной стратегии.
Средний выигрыш игрока A определяется математическим ожиданием:
Если вероятность (относительная частота) применения стратегии отлична от нуля, то такая стратегия называется активной.
Стратегии P*, Q* называются оптимальными смешанными стратегиями, если
MA(P, Q*) ? MA(P*, Q*) ? MA(P*, Q)
В этом случае MA(P*, Q*) называется ценой игры и обозначается через V (V* ? V ? V*). Первое из неравенств (1)означает, что отклонение игрока A от своей оптимальной смешанной стратегии при условии, что игрок B придерживается своей оптимальной смешанной стратегии, приводит к уменьшению среднего выигрыша игрока A. Второе из неравенств означает, что отклонение игрока B от своей оптимальной смешанной стратегии при условии, что игрок A придерживается своей оптимальной смешанной стратегии,приводит к увеличению среднего проигрыша игрока B.
Решение игры в смешанных стратегиях геометрическим методом
Пусть игра задана платежной матрицей
По оси абсцисс отложим единичный отрезок А1 А2, где точкаА1 (0, 0) изображает стратегию А1, А2 (1, 0) - стратегию А2, а каждая промежуточная точка SA этого отрезка изображает смешанную стратегию первого игрока PA = (p1, p2), где p1- расстояние от точки SA до A2, p2-расстояние от точки SA до A1. Выигрыш игрока A будем откладывать на вертикальных отрезках.
Случай 1. Если игрок B применит стратегию В1, то выигрыш игрока A при стратегии А1 равен а11, поэтому на оси ординат отложим отрезок А1В1 = а11. При применении игроком A стратегии А2 выигрыш равен а21, отложим этот отрезок на перпендикуляре из точки А2, обозначим полученную точку В1'. Ордината любой точки М1 отрезкаВ1В1? равна среднему выигрышу игрока A при применении смешанной стратегии SA (действительно, этот выигрыш равен математическому ожиданию случайной величины, т.е. a11p1 + a21p2). Запишем уравнение прямой В1В1?:
, т. е. ,
тогда при x = p2 получим
y = a11 + p2a21 - p2a11 = a11(1-p2) + p2a21 = a11p1 + a21p2
Случай 2. Если игрок B применяет стратегию В2, то аналогично откладываем отрезки а12 и а22 и получаем отрезок В2В2?. Ордината любой точки М2 отрезка В2В2? - выигрыш игрока A, если A применяет смешанную стратегию SA, а B - стратегию В2.
Построим нижнюю границу выигрыша игрока А - ломаную В1 NВ2?. Ординаты точек этой ломаной показывают минимальные выигрыши игрока А при использовании им любой смешанной стратегии. Оптимальное решение игры определяет точка N, в которой выигрыш игрока А принимает наибольшее значение. Ордината точки Nравна цене игры. Проекция этой точки на ось ОХ показывает оптимальную стратегию (р1, р2).
Аналогично находится оптимальная стратегия Q = (q1 , q2) игрока B, только в соответствии с принципом минимакса надо находить верхнюю границу выигрыша, т. е. строить ломаную А2NА1? и брать точку N с наименьшей ординатой.
Абсцисса точки N определяет оптимальную стратегию игрока B, т. е. Q = (q1 , q2).
Пример. Решить игру, заданную платежной матрицей , графоаналитическим способом.
Решение. Нижняя цена игры a = 1,5, верхняя цена игры b = 2. Так как , седловой точки нет. Так как a1 = 1,5, a21 = 2 строим точки B1(0;1,5) и B2(1;2), соединяем их отрезком. Так как a21 = 3, a22 = 1 строим точки B2(0;3) и B2'(1;1), соединяем их отрезком.
Уравнение прямой В1В1?:
, т. е. y = 0,5x + 1,5;
уравнение В2В2?:
, т. е. y = 3-2x.
Найдем точку N пересечения прямых В1В1? и В2В2?, для чего решим систему уравнений:
т. е. N(0,6; 1,8), откуда p2= 0,6; p1= 0,4; г = 1,8 - цена игры. Аналогично строим точки А1(0; 1,5) и А1?(1;3), А2(0; 2) и А2?(1; 1) и находим точку M пересечения прямых А1А1? иА2А2?.
Ответ: смешанная стратегия игрока А: PA= (0,4; 0,6), игрока В: QB = (0,8; 0,2); цена игры 1,8.
5. Методы многокритериальной оптимизации
В практической деятельности часто встречаются задачи, заключающиеся в поиске лучшего (оптимального) решения при наличии различных несводимых друг к другу критериев оптимальности (например, стоимость и надежность). Если такого рода задачи решаются методами математического программирования, то говорят озадачах многокритериальной оптимизации.
Существует несколько методов решения задач векторной оптимизации:
- методы выделения главного критерия,
- метод лексикографической оптимизации,
- метод последовательных уступок,
- человеко-машинные процедуры векторной оптимизации.
В методе выделения главного критерия ЛПР назначает главный критерий, остальные выводятся в состав ограничений. Недостаток метода - не имеет смысла проводить системное исследование, если все критерии, кроме одного, не учитываются.
В методе лексикографической оптимизации предполагается, что критерии, составляющие векторный критерий, могут быть упорядочены на основе отношения абсолютной предпочтительности. При поиске решения как правило используются не все, а лишь наиболее важные критерии, что не всегда может быть оправдано.
В методе последовательных уступок для каждого из проранжированных по важности критериев назначается допустимое отклонение значения критерия от наилучшего среди элементов множества Парето.
Один из распространенных методов векторной оптимизации - метод последовательных уступок.
Простейшие модели принятия решений рассматриваются в курсах математического анализа и оптимизации. В этих моделях ЛПР выбирает свое действие из некоторого множества стратегий, чтобы найти стратегию, доставляющую максимум целевой функции.
Однако встречается довольно много ситуаций в экономике, где действует несколько сторон, преследующих различные интересы. Такого рода ситуации называются конфликтными.
Конфликт может возникнуть также из различия целей, которые отражают не только не совпадающие интересы различных сторон, но и многосторонние интересы одного и того же лица. Например, разработчик эк. политики преследует разнообразные цели, согласуя противоречивые требования, предъявляемые к ситуации (рост объемов производства, повышение доходов, снижение инфляции и т.п.). Конфликт может проявиться не только в результате сознательных действий различных участников, но и как результат действий тех или иных "стихийных сил" (так называемые "игры с природой").
Теория, описывающая конфликтные ситуации с количественной стороны, называется теорией игр.
Существует несколько определений того, что есть теория игр и каковы её задачи.
Теория игр-это теория рационального поведения людей с несовпадающими интересами.
Теория игр- это наука о стратегическом мышлении.
Теория игр- это теория математических моделей принятия оптимальных решений в условиях конфликтов. Это определение подчеркивает математическую природу теории игр.
Сущность теории игр состоит в том, чтобы помочь экономистам понимать и предсказывать то, что будет происходить в экономическом конфликте. Это определение выделяет роль теории игр именно в экономической моделировании.
Теоретико-игровые методы находят применение на всем многообразии экономической проблематики. Например, на микроуровне - это модели процесса торговли (модели торгов, модели аукционов). Теоретико-игровые модели изучают поведение игр на рынках факторов производства. Теоретико-игровые модели возникают в связи с проблемами внутри фирм. На макроуровне с международной экономикой связаны модели конкуренции стран по поводу тарифов и торговой политики, рассматривается взаимодействие в контексте монетарной политики.
Основоположниками теории игр являются Дж. фон Нейман и О. Монгерштейн, систематически изложившие эту теорию в 1944 году в монографии "Теория игр и экономическое поведение". Этот труд заложил фундамент общей теории игр и обосновал возможность анализа огромного массива экономических вопросов с помощью теоретико-игровых моделей. В 1950 году Джон Нэш ввел понятие ситуации равновесия как метода решения бескоалиционных игр.
Материальная модель социально-экономического явления, отражающего черты конфликта, описывает:
- множество заинтересованных сторон, называются игроками;
- возможные действия каждой из сторон называются стратегиями или ходами;
- интересы сторон представленные функциями выигрыша(платежа) для каждого из игроков.
Классификация игр
Различные виды игр можно классифицировать, основываясь на том или ином принципе классификации: по количеству игроков, по количеству стратегий, по характеру взаимодействия игроков, по свойствам функции выигрыша, по количеству ходов и т.д.
В зависимости от количества игроков различают игры двух и n игроков. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения.
По количеству стратегий игры делятся на конечные и бесконечные. Если в игре все игроки имеют конечное число возможных стратегий, то она называется конечной. Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий, игра называется бесконечной.
По характеру взаимодействия игры делятся на бескоалиционные: игроки не имеют права вступать в соглашения, образовывать коалиции; коалиционные (кооперативные) - игроки могут вступать в коалиции. В кооперативных играх коалиции заранее определены.
По свойству функции выигрышей игры делятся на: игры с нулевой суммой, или антагонистические игры, когда общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю, и игры с ненулевой суммой.
По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые и др.
Матричная игра - это конечная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 1, столбец - номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям).
Для матричных игр доказано, что любая из них имеет решение и оно может быть легко найдено путём сведения игры к задаче линейного программирования.
Биматричная игра - это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец - стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице - выигрыш игрока 2).
Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной. Доказано, что игры этого класса имеют решения, однако не разработано практически приемлемых методов их нахождения.
Если функция выигрышей является выпуклой, то такая игра называется выпуклой. Для них разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока. Такая задача решается сравнительно легко.
Размещено на Allbest.ru
Подобные документы
Составление платежной матрицы, поиск нижней и верхней чисты цены игры, максиминной и минимаксной стратегии игроков. Упрощение платежной матрицы. Решение матричной игры с помощью сведения к задаче линейного программирования и надстройки "Поиск решения".
контрольная работа [1010,3 K], добавлен 10.11.2014Проектирование математической модели. Описание игры в крестики-нолики. Модель логической игры на основе булевой алгебры. Цифровые электронные устройства и разработка их математической модели. Игровой пульт, игровой контроллер, строка игрового поля.
курсовая работа [128,6 K], добавлен 28.06.2011Решение дифференциальных уравнений математической модели системы с гасителем и без гасителя. Статический расчет виброизоляции. Определение собственных частот системы, построение амплитудно-частотных характеристик и зависимости перемещений от времени.
контрольная работа [1,6 M], добавлен 22.12.2014Создание математической модели движения шарика, подброшенного вертикально вверх, от начала падения до удара о землю. Компьютерная реализация математической модели в среде электронных таблиц. Определение влияния изменения скорости на дальность падения.
контрольная работа [1,7 M], добавлен 09.03.2016Математические модели технических объектов и методы для их реализации. Анализ электрических процессов в цепи второго порядка с использованием систем компьютерной математики MathCAD и Scilab. Математические модели и моделирование технического объекта.
курсовая работа [565,7 K], добавлен 08.03.2016Основные положения теории математического моделирования. Структура математической модели. Линейные и нелинейные деформационные процессы в твердых телах. Методика исследования математической модели сваи сложной конфигурации методом конечных элементов.
курсовая работа [997,2 K], добавлен 21.01.2014Определение матричных игр в чистых стратегиях. Смешанные стратегии и их свойства. Решения игр матричным методом. Метод последовательного приближения цены игры. Отыскание седлового элемента. Антагонистические игры как первый класс математических моделей.
контрольная работа [855,7 K], добавлен 01.06.2014Методы определения объемов выпуска изделий каждой модели, при которых прибыль будет максимальна Составление математической модели задачи целочисленного программирования. Решение задачи симплекс-методом. Поиск целочисленного решения методом отсечения.
контрольная работа [156,9 K], добавлен 30.01.2011Составление математической модели задачи. Приведение ее к стандартной транспортной задаче с балансом запасов и потребностей. Построение начального опорного плана задачи методом минимального элемента, решение методом потенциалов. Анализ результатов.
задача [58,6 K], добавлен 16.02.2016Сущность математического моделирования. Аналитические и имитационные математические модели. Геометрический, кинематический и силовой анализы механизмов подъемно-навесных устройств. Расчет на устойчивость мобильного сельскохозяйственного агрегата.
курсовая работа [636,8 K], добавлен 18.12.2015