Дифференциальные игры преследования с неполной информацией

Теория дифференциальных игр – это новое математическое направление, возникшее всего лишь несколько лет назад. Она тесно связана с теорией оптимального синтеза, управлением случайными процессами; некоторые её аспекты переплетаются с такими классическими направлениями, как дискретные игры, дифференциальные уравнения, вариационное исчисление.

Предмет изучения в данной работе составляют конфликтные задачи об управлении объектами, которые описываются обыкновенными дифференциальными уравнениями. Такие задачи принято объединять термином дифференциальные игры.

Одной из первых работ в области дифференциальных игр следует считать работу Г. Штейнгауза, опубликованную в 1925 г., в которой он впервые формулирует задачу преследования как дифференциальную игру преследования. После длительного времени в середине 50-х годов математики возобновили исследование дифференциальных игр. Разработанный ими метод построен на «основном» дифференциальном уравнении в частных производных первого порядка для функции значения игры, которое было, по-видимому, впервые получено Р. Айзексом.

Среди работ этого периода следует отметить работы В. Флеминга, содержащие исследование вопросов сходимости значений дискретных игр к решению «основного» уравнения, работы Л. Берковича, в которых выведены необходимые и достаточные условия существования ситуации равновесия в терминах характеристик «основного» уравнения, и конечно же, монографию Р. Айзекса, в которой на многочисленных примерах рассматривается весь метод нахождения решения, построенный на использовании «основного» уравнения.

Первые отечественные работы по дифференциальным играм появились в середине 60-х годов. В соответствии с целью игры и решением можно выделить следующие основные подходы к задаче преследования.

Л.С. Понтрягин и его школа рассматривают задачу преследования, решая ее за преследователя Р, и задачу убегания, решая ее за убегающего Е.

Н.Н. Красовский и его школа оценивают качество преследования по времени, прошедшему от момента начала процесса до момента l-встречи (l>0).

В основу этого метода легло правило экстремального прицеливания, которое в ряде случаев дает ситуацию равновесия.

4 стр., 1808 слов

Исправительные работы

... курсовой работы выступают общественные отношения, возникающие в процессе применения исправительных работ как вида уголовного наказания. Предметом курсовой работы являются правовые, теоретические и практические основы применения исправительных работ. Цель данной работы - рассмотреть исправительные работы как вид уголовного наказания. 1. Сущность наказания в виде исправительных работ Наказание ...

Работа начинается с рассмотрения сведений из теории дифференциальных игр. Раскрывается определение дифференциальной игры, понятия некоторых видов стратегий. Рассматриваются три вида выигрыша в дифференциальных играх: интегральный, терминальный, смешанный. Этот материал составляет первую главу. Затем во второй главе рассматриваются дифференциальные игры с неполной информацией. Исследуются задачи в случае задержки информации о состоянии процесса у преследователя, а так же задачи с фиксированной продолжительностью и задержкой информации у обоих игроков.

1.Основные сведения из теории дифференциальных игр

1.1Определение дифференциальной игры

«дифференциальные игры»

Типичными примерами дифференциальных игр являются сражения, воздушные бои, футбол, преследование судна торпедой. Если один из игроков выключается из игры, мы получаем обычную задачу максимизации.

управлениями

Развитие игры характеризуется движением точки (x,y) в

По окончании партии становится известной численная величина, называемая платой . Целью одного игрока является ее максимизация, а другого – минимизация. Наилучшее значение платы, ее минимакс, будет называться ценой игры. Она равна плате при оптимальном действии обоих игроков. Если один из них станет действовать не оптимально, то его противник получит возможность достичь платы, более выгодной для него, чем цена.

Чтобы получить общую картину, будем обозначать преследователя через Р, а преследуемого – через Е. Пусть Р выбирает u U и Е выбирает v V как функции от x(y).

Если эти функции достаточно просты, то после подстановки их в уравнения движения = f(x,u), = f(y,v) правые части последних становятся функциями от x(y).

Тогда уравнения движения превращаются в систему обыкновенных дифференциальных уравнений. Их можно интегрировать, используя в качестве начальных условий значения (x0 ,y0 ) в момент начала игры. Решение определяется x,y как функции времени t и описывает развитие игры, соответствующее выбранным стратегиям. Теперь становится возможным подсчитать плату. Целью игроков является выбор таких стратегий u(х) и v(y), которые могли бы соответственно минимизировать и максимизировать выигрыш.

Итак, местом действия является

Пусть x R n , y R n , u UR k , v VR l , f(x,u), g(y,v) – вектор-функции размерности n, заданные на Rn U и Rn V соответственно. Рассмотрим две системы обыкновенных дифференциальных уравнений

= f(x,u), (1.1)

= g(y,v) (1.2)

с начальными условиями x0 ,y0 . Игрок Р(Е) начинает движение из фазового состояния x0 (y0 ) и перемещается в фазовом пространстве Rn согласно (1.1) или (1.2), выбирая в каждый момент времени значение параметра u U (v V ) в соответствии со своими целями и информацией, доступной в каждом текущем состоянии.

16 стр., 7543 слов

Правила игры в баскетбол

... баскетбола: для игры в баскетбол нужен был большой и лёгкий мяч, который легко укладывался в руку; бежать с мячом в руках запрещено; мячом может владеть игрок ... этой игре посвящен данный реферат. 1. История баскетбола Баскетбол - командная спортивная игра. Цель игры - забросить мяч в кольцо ... ¾ Нередко судьям приходится разыгрывать в ходе игры спорный мяч. Мяч считается спорным в следующих случаях: ...

Множество Р будем называть множеством стратегий игрока I, а множество Е — множеством стратегий игрока II. Элементы множеств Р и Е будем обозначать соответственно через u(.) и v(.).

На декартовом произведении Р×Е задана вещественная функция К. Тройку Г=<Р, Е, К> будем называть антагонистической игрой в нормальной форме.

Параметры u

Цели в дифференциальной игре определяются с помощью выигрыша, который может различным образом зависеть от реализовавшихся траекторий x(t), y(t).

Игроки I и II одновременно выбирают элементы u(.) Р и v(.) Е. После этого игрок II получает выигрыш, равный К( u(.), v(.) ), а игрок I – выигрыш, равный — К( u(.), v(.) ).

Система S={x 0 ,y0 ;u,v}, где u

Любую траекторию x(t)(y(t)), соответствующую некоторой ситуации {x0 ,y0 ;u,v}, будем называть траекторией игрока Р(игрока Е).

В итоге общий вид типичного решения дифференциальной игры следующий: пространство игры ε разделено некоторым числом сингулярных поверхностей на составляющие области. Внутри каждой области решение может не существовать вовсе, но если оно существует, то удовлетворяет определенным дифференциальным уравнениям с граничными условиями, выполняющимися на сингулярных поверхностях. Оптимальные траектории – пути изображающей точки x в ε при оптимальной игре обеих сторон, — если они в разумном смысле единственны, могут иметь острые углы, только если они пересекают сингулярные поверхности. Кроме того, может случиться, что некоторые области содержат сингулярные многообразия меньшей размерности, чем поверхности, или такие многообразия могут лежать на самих сингулярных поверхностях.

1.2.Стратегии в дифференциальной игре

Существует несколько разных подходов к определению понятия стратегии в дифференциальной игре. Стратегия должна характеризовать поведение игрока во всех информационных состояниях, в которых он может оказаться в процессе игры.

Синтезирующие

синтезирующими.

Программные

программными

Позиционные

позиционными.

Кусочно-программные

кусочно-программные