Сравнительный анализ принципов равновесия и компромисса в линейных дифференциальных играх нескольких лиц в программных стратегиях
В статье развивается оригинальная концепция "компромисса" при определении рационального поведения участников многостороннего конфликта. Построен компромиссный набор стратегий, для которого плата игрока оказалась "лучше", чем при равновесии по Нэшу.
Рубрика | Математика |
Вид | статья |
Язык | русский |
Дата добавления | 26.04.2019 |
Размер файла | 199,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
УДК 519.6
Сравнительный анализ принципов равновесия и компромисса в линейных дифференциальных играх нескольких лиц в программных стратегиях
С.В. Лутманов
Пермский государственный университет, Россия, 614990, Пермь, ул. Букирева, 15
mpu@psu.ru.; (342) 239-63-09
Данная работа обобщает результаты, полученные в [1] для игр "в перемещениях", на случай линейных дифференциальных игр в классе программных стратегий. В статье развивается оригинальная концепция "компромисса" при определении рационального поведения участников многостороннего конфликта. Идея концепции "компромисса" состоит в том, что значение платы каждого из игроков, полученное в результате компромиссного управления, должно лежать между нижней и верхней "компромиссными" оценками платы игрока. При этом единоличное уклонение игрока от стратегии, предписываемой компромиссным набором, не позволяет ему получить значение платы лучше (меньше) нижней "компромиссной" оценки. В статье для конкретной линейной дифференциальной игры трех лиц в программных стратегиях построен компромиссный набор стратегий, для которого плата каждого игрока оказалась "лучше" (меньше), чем при равновесии по Нэшу.
Ключевые слова: программные стратегии; равновесие по Нэшу; принцип компромисса.
компромисс конфликт стратегия нэш
Comparative analysis of the principles of balance and compromise in linear differential games of several persons with program strategies
S. V. Lutmanov
Perm State University, Russia, 614990, Perm, Bukirev st., 15
mpu@psu.ru.; (342) 239-63-09
This paper extends the results obtained for “in-terms-of-movements” games in reference [1] to linear differential games rated in the class of program strategies. The original idea of the principle of compromise upon determination of rational behavior of multilateral conflict participants is developed in the paper. The principle of compromise generalizes the balance after Nash in the sense that when the lower and upper compromise assessments coincide, the definition of compromise set of strategies goes into that of the balance after Nash. In this paper, for a specific game of three persons a compromise set of strategies is constructed so that each player's payment has turned out to be better than at the balance after Nash.
Key words: balance after Nash; multilateral conflict participants; principle of compromise program strategies.
Постановка линейной дифференциальной игры нескольких лиц в программных стратегиях© С. В. Лутманов, 2010
В данной работе рассмотрены игры, в которых динамика конфликтно-управляемого объекта описывается системой обыкновенных линейных дифференциальных уравнений, а игроки формируют свои управляющие воздействия на основании информации только о текущем времени.
Игра 1. В игре участвуют игроков. Они управляют точкой в пространстве на промежутке времени . Движение точки описывается обыкновенным векторным линейным дифференциальным уравнением
. (1.1)
Здесь - фазовый вектор - текущее время, - вектор управляющих параметров го игрока, - матрицы размера , , соответственно, непрерывно зависящие от времени . В пространстве для всех задано выпуклое компактное множество , называемое целевым множеством го игрока. В исходный момент времени управляемая точка находится в начале координат. Управление точкой й игрок осуществляет путем выбора в каждый момент времени вектора управляющих параметров из заданного множества . Множества предполагаются компактными, выпуклыми и удовлетворяющими условию . Платой игрока служит расстояние от проекции фазового вектора в конечный момент времени на первые координат до своего целевого множества. Цель игрока состоит в минимизации своей платы.
Стратегию игрока отождествим с правилом, в соответствии с которым он в каждый момент времени назначает вектор управляющих параметров .
Определение 1. Программной стратегией го игрока называется функция вида
(1.2)
Определение 2. Игра 1 называется дифференциальной игрой лиц в программных стратегиях, если при управлении точкой игроки используют только программные стратегии.
Определение 3. Программную стратегию , го игрока будем называть допустимой, если после подстановки функции (1.2) в дифференциальное уравнение
оно удовлетворяет условиям теоремы существования и единственности решения на промежутке времени .
Множество всех допустимых программных стратегий го игрока обозначим символом ,.. Очевидно, что каждому набору допустимых программных стратегий соответствует одно и только одно движение точки, выходящее из начального положения и удовлетворяющее дифференциальному уравнению (1.1) на промежутке времени . Каждое такое движение обозначим символом
. (1.3)
Когда функции (1.2) кусочно-непрерывные или являются интегрируемыми по Лебегу, соответствующие программные стратегии будут допустимыми. Для допустимой ситуации
соответствующее движение точки определяется по формуле Коши [2]
, (1.4)
где - фундаментальная матрица Коши для однородного дифференциального уравнения , а интеграл, при необходимости, понимается в смысле Лебега. Тогда плата го игрока запишется в виде
.
Область достижимости игрока в линейной дифференциальной игре нескольких лиц в программных стратегиях
Рассмотрим дифференциальную игру в программных стратегиях, описанную в предыдущем пункте. Пусть для всех номеров принята программная стратегия . Выбором допустимой стратегии й игрок может перевести управляемую точку из начального положения на множество
в момент времени .
Определение 4. Множество
называется областью достижимости го игрока (при условии, что остальные игроки выбрали стратегии
).
В силу (1.2) справедливо равенство
. (2.1)
В принятых предположениях из (2.1) следует, что область достижимости игрока является выпуклым и компактным множеством в пространстве .
Величина
(2.2)
представляет собой наименьшее расстояние от проекции управляемой точки на первые координат до выпуклого компактного множества , которое может реализовать й игрок в момент времени , управляя точкой с помощью допустимой программной стратегии при условии, что остальные игроки выбрали стратегии
.
Заметим, что
.
Лемма 1. Справедливо равенство
, (2.3)
где .
Доказательство. В силу (2.2) достаточно рассмотреть лишь случай
.
Тогда
.
В книге [2] показано, что
.
Тогда
.
Лемма доказана.
Лемма 2. Пусть
Тогда максимум в равенстве (2.3) достигается на единственном векторе .
Доказательство. Обозначим
.
Легко видеть, что функция при всех и всех удовлетворяет условиям
,
Дальнейшее доказательство дословно повторяет доказательство леммы 2 из работы [1]. Лемма доказана.
Обозначим через , вектор, доставляющий максимум в (2.3).
Теорема 1. Пусть для некоторого номера выполнено неравенство
Тогда, для того чтобы допустимая программная стратегия удовлетворяла условию
,
необходимо, чтобы для нее почти всюду на промежутке выполнялось
. (2.4)
Доказательство. От противного приходим к существованию множества ненулевой меры, для которого справедливо неравенство
.
Тогда в силу леммы 1 имеем
..
Получили противоречие, из которого следует справедливость доказываемой теоремы.
Доказанная теорема выражает лишь необходимые условия оптимальности программной стратегии, найденной из условия (2.4). Тот факт, что эта стратегия действительно оптимальна, можно установить, вычислив величину
по формуле (2.3).
Если выполняется равенство
,
то программная стратегия является минимизирующей.
Равновесие по Нэшу в линейных дифференциальных играх нескольких лиц в программных стратегиях
Ситуация
,
будет равновесной по Нэшу в дифференциальной игре в программных стратегиях, если
для всех .
Выведем условия, которым должна удовлетворять равновесная по Нэшу ситуация для дифференциальных игр в программных стратегиях. Рассмотрим равновесный набор стратегий .
Полагаем,
.
Из леммы 2 и теоремы 1 непосредственно следует утверждение.
Теорема 2. Пусть для равновесной ситуации
,
при всех выполнено неравенство
.
Тогда для всех множество состоит ровно из одного элемента , а программное управление необходимо удовлетворяет условию
.
Приведем один способ построения равновесной ситуации в дифференциальной игре нескольких лиц в программных стратегиях. Для всех определим функцию из условия
(3.1)
Для функции
,
определенной формулой,
(3.2)
строим набор векторов , удовлетворяющий условию
. (3.3)
В силу теоремы 2 искомый равновесный набор программных управлений необходимо вычисляется по формуле
.
Этот набор будет действительно равновесным по Нэшу, если при всех выполняется условие
. (3.4)
Пример 1. Пусть в игре 1 . Движение точки описывается дифференциальными уравнениями
где .
Целевые множества имеют вид
,
.
Рис. 1
Расположение целевых множеств в плоскости показано на рис. 1.
Определить набор программных управлений всех игроков, равновесный по Нэшу.
Решение. Для данного примера условие (3.1) принимает вид
Тогда
Вычислим функции
.
С учетом того, что , из (3.2) выводим
,
,
.
Набор векторов , удовлетворяющий условию (3.3), определяется численно:
,.
При этом
.
Полагаем
. (3.5)
Траектория движения
на промежутке времени показана на рис. 2.
В случае, когда все игроки придерживаются набора стратегий (3.5), управляемая точка займет финальное положение
.
Непосредственно проверяется, что расстояния от точки до целевых множеств игроков соответственно равны
.
и набор программных стратегий действительно является равновесным.
4. Компромиссное управление в линейных дифференциальных играх в программных стратегиях
Ситуация
,
будет компромиссной относительно оценок
, (4.1)
в дифференциальной игре в программных стратегиях, если
для всех .
Приведем условия, которым должна удовлетворять ситуация
в дифференциальной игре в программных стратегиях, являющаяся компромиссной относительно оценок (4.1)
(4.2)
(4.3)
.
Неравенства (4.3) в силу леммы 1 можно усилить, переписав их в виде
. (4.4)
Пример 2. Для игры из примера 1 определить компромиссную относительно векторов
,
ситуацию.
Условия (4.2), (4.4) здесь соответственно принимают вид
.
Компромиссные программные управления будем искать в форме
(4.7)
Приведенные условия определяют компромиссную ситуацию
.
Этой ситуации соответствует траектория управляемой точки, изображенная на рис.3, и финальное положение управляемой точки
.
Непосредственно проверяется, что выполнены неравенства
Таким образом, значения плат игроков удовлетворяют соответствующим верхним компромиссным оценкам.
Проверим, что ни один из игроков-уклонистов не может получить значение платы, лучше (меньше) своей нижней компромиссной оценки. Действительно,
.
Заметим, что принцип компромисса обеспечивает для каждого игрока лучший результат, чем равновесие по Нэшу. Действительно,
Список литературы
1. Лутманов С.В. Сравнительный анализ принципов равновесия и компромисса в играх нескольких лиц "в перемещениях" // Вестн. Перм. ун-та. Сер. Математика. Механика. Информатика. Пермь, 2010. Вып. 2(2). С.46-54.
2. Красовский Н.Н. Игровые задачи о встрече движений. М.: Наука, 1970. 420 с.
Размещено на Allbest.ru
Подобные документы
Обобщенные решения линейных дифференциальных уравнений. Основные примеры построения фундаментальных решений линейных дифференциальных операторов с постоянными коэффициентами, метод преобразования Фурье. Преимущества использования методов спуска.
курсовая работа [1,1 M], добавлен 10.04.2014Понятия и решения простейших дифференциальных уравнений и дифференциальных уравнений произвольного порядка, в том числе с постоянными аналитическими коэффициентами. Системы линейных уравнений. Асимптотическое поведение решений некоторых линейных систем.
дипломная работа [395,4 K], добавлен 10.06.2010Виды дифференциальных уравнений: обыкновенные, с частными производными, стохастические. Классификация линейных уравнений второго порядка. Нахождение функции Грина, ее применение для решения неоднородных дифференциальных уравнений с граничными условиями.
курсовая работа [4,8 M], добавлен 29.04.2013Характеристика уравнений с разделяющимися переменными. Сущность метода Бернулли и метода Лагранжа, задачи Коша. Решение линейных уравнений n-го порядка. Фундаментальная система решений - набор линейно независимых решений однородной системы уравнений.
контрольная работа [355,9 K], добавлен 28.02.2011Приемы и методы качественной теории дифференциальных уравнений на плоскости. Визуализация и анализ инвариантных множеств динамических систем. Теорема о существовании четырех линий равновесия. Первый интеграл. Решение системы первого и второго порядка.
курсовая работа [378,5 K], добавлен 02.04.2016Представления линейных дифференциальных уравнений как средств математического решения практических задач в естествознании. Простейшая модель однородных популяций на примере определения роста численности карасей. Отлов с постоянной и относительной квотой.
курсовая работа [413,2 K], добавлен 11.07.2011Существование и способ построения фундаментального набора решений для систем, состоящих из одного или нескольких неравенств. Метод последовательного уменьшения числа неизвестных. Системы однородных и неоднородных произвольных линейных неравенств.
курсовая работа [69,8 K], добавлен 09.12.2011Основные определения теории биматричных игр. Пример биматричной игры "Студент-Преподаватель". Смешанные стратегии в биматричных играх. Поиск "равновесной ситуации". 2x2 биматричные игры и формулы для случая, когда у каждого игрока имеется две стратегии.
реферат [84,2 K], добавлен 13.02.2011Правила вычисления коэффициентов n-образов. Рассмотрение алгоритмов решения линейных ОДУ с переменными коэффициентами второго и произвольного порядков. Общепринятые способы определения частного решения неоднородного дифференциального уравнения.
книга [1,7 M], добавлен 03.10.2011Оригиналы и изображения функций по Лапласу. Основные теоремы операционного исчисления. Изображения простейших функций. Отыскание оригинала по изображению. Задача Коши для обыкновенных линейных дифференциальных уравнений с постоянными коэффициентами.
дипломная работа [162,3 K], добавлен 27.05.2008