Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 52
Текст из файла (страница 52)
Задана система уравнений дж' — =и' 1=1, ..., п 9 зп ФОРМУЛИРОВКА РЕЗУЛЬТАТА. ПРИМЕРЫ 341 где управляющий вектор и=(ис,...,и") подчинен условию (и, и) = ~ч" (ис)'(1, т. е. областью управления 17 является единичный шар. Требуется найти лежащую в В оптимальную по быстродействию траекторию, соединяющую точки х, и х,. Пусть х (1), С,(~(1„— оптимальная траектория, являющаяся решением этой задачи и имеющая конечное число участков, попеременно расположенных в открытом ядре области В и на ее границе. Через и (с) обозначим соответствующее оптимальное управление.
Из условия максимума (теоремы 2 и 22) непосредственно вытекает, что ) и (1)(:— 1, и потому параметр с является д л и н о й д у г и на линии х (с). Из этого следует, что линия х (с) является решением поставленной геометрической задачи. Докажем теперь сформулированные выше свойства кривой С. Тот факт, что расположенные в открытом ядре участки кривой х (1) являются прямолинейными отрезками, непосредственно вытекает из теоремы 2. Рассмотрим теперь участок, целиком расположенный на границе области В. Область управления сс определяется одним соотношением сс(и)=(и, и) — 1 =.О.
(100) Далее, функция р (х, и) (см. (6)) имеет вид р(х, и)=(йгабб(х), и). (101) На рассматриваемом участке линии х (1) выполняется соотношение р(х, и)=(йтас(л(х), и)=0. (102) Система УРавнений ДлЯ пеРеменных 7(сс (см. (10)) имеет виД с(7гс,„др Ч7 дсд(х(С)),„д дд(х(С)) с(С дхс А С дхс дхх с(С дх» а=1 1=1,...,п, или иначе (103) — „= Х вЂ” йтас(л(х(с)). 342 процессы ПРи ОГРАниченных кООРдинАтАх (Гл.
е Мы имеем: (104) и потому с)св Р- '0 (в противном случае было бы $ -,~ 0 и тогда максимальное аначение величины (с)с, и) было бы отличным от нуля, что противоречит соотношению (11)). Следовательно, мы можем положить с(с, = — 1 и условие максимума (11) принимает вид (ср, и) =шах=1. Далее, в силу (100), йтай д(и) = 2и, и потому (см.
(104), (8), (101), (106)) (105) (106) — =с(с=Ад — +тд— —— Айгайб(х)+2ъи. (107) дхЯ" др дд 1 = (с(с, и ) = А (и, атей л (х)) + 2т = 2т. Таким обрааом, формула (107) принимает вид с(с = Х йтай Р (х) + и, и потому (см. (103)) с)Х вЂ” „, йтайл(х(С))+ — „, =О.
с(х Это оаначает, что вектор „, = — „, = — — „, йтай Р(х(С)) с(сх (С) дх (С) коллинеарен нормали к поверхности (99), и потому линия х (С) на рассматриваемом участке является гводеэической, причем вектор ее главной нормали — „, паях (с) правлен во внв области В (см. условие в) в теореме 22). Наконец, из условий скачка нетрудно вывести, что кривая х (С) не имеет угловых точек.
Умножая полученное соотношение с(с = )с атай д (х) + 2ти скалярно на и, получаем, в силу (105), (102), ГЛАВА 7 ОДНА СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Предыдущие главы были посвящены решению задачи об оптимальном переводе управляемого объекта из одного заданного положения в другое заданное положение (или на ааданное многообразие). Эту задачу можно трактовать также как задачу об оптимальном достижении управляемым объектом другого, неподвижного объекта. Однако в технике в ряде случаев возникает другая задача — задача преследования управляемым объектом другого, движущегося объекта.
При атом о характере движения второго объекта можно делать самые рааличные предположения. Можно, например, считать, что второй объект также является управляемым (ср. з 28). Пусть при этом фазовое движение первого объекта х описывается системой обыкновенных дифференциальных уравнений а движение второго объекта у — системой уравнений у'=у~(у', уз, ..., у", г', э', ..., з'), ~=1, ..., п, где и* — управляющие параметры первого объекта, э'— управляющие параметры второго объекта, а х и у— векторы одного и того же фазового пространства Х.
Тогда можно ставить следующую задачу. Зная технические возможности объекта у (т. е. соответствующую систему дифференциальных уравнений) и положение ОДНА СТАТИСТИЧЕСКАЯ ЗАДАЧА ~гл. 7 объекта у в каждый момент времеви «, научиться выбирать управление и объектом х в каждый момент времени Т таким образом, чтобы объект х достиг объекта у в кратчайшее время (или оптимально в каком-либо другом смысле); при атом — что очень существенно — не должно предполагаться иэвествым управление объектом у в моменты времени, следующие эа ~. В такой постановке задача преследования пока не решена.
В настоящей главе мы решаем несколько иную задачу преследования. Именно, мы считаем, что известен лишь в е р о я т н о с т н ы й эакон поведения«убвгающвгои объекта у, причем этот аакон предполагается и а рк о в с к и м и описывается уравнением типа Фокера— Планка — Колмогорова. При решении этой эадачи будут использованы некоторые понятия и факты теории вероятностей. В Я 38 и 40 мы сообщаем эти факты, не всегда приводя, однако, полные доказательства, а ограничиваясь в основном небольшими пояснениями. $38.
Понятие о марковском процессе. Дифференциальное уравнение Колмогорова Пусть в и-мерном фаэовом пространстве Л случайно движется некоторая точка, причем если известно ее положение х в момент о, то одноэначно определена вероятность Р(о, х, т, Е) ее нахождения в любом иэмеримом подмножестве Е пространства В в проиавольный момент т ) о. В таком случае процесс движения случайной точки нааывают процессом беа последействия или процессом марковского типа. Полную характеристику движения случайной точки дает функция р (о, х, т, у), (1) равная плотности вероятности Р (о,х, т, Е) в точке у. Функция р (о,х, т, у) удовлетворяет, очевидно, следующему соотношению: ~ р(о, х, т, у)с(у=1 (2) з вв) понятия о мязковском пгоцкссе 345 (здесь, как и всюду в дальнейшем, интегрирование нроиаводится по всему пространству В, если область интегрирования специально не указана). Другое соотношение, смысл которого также ясен, носит название тождества.
лт аркова р(а, х, т, у)=~р(о, х, в, г)р(з, х, т, у)Иг. (3) Случайный процесс называется непрерывным, если за малые промежутки времени лишь с малой вероятностью координаты случайной точки могут получить заметные по величине приращения. Мы потребуем от марковского процесса несколько более сильной непрерывности, а именно: каково бы ни было положительное число 6, имеет место соотношение 11ш — ~ р(а — Ьа, х, а, у)е(у=О.
(4) 1 ав-в Ла ~у — х квв Мы сейчас выведем дифференциальное уравнение, которому (при выполнении некоторых дополнительных условий) удовлетворяет функция р (а, х, т, у). Это уравнение впервые было получено А. Н. Колмогоровым и носит наввание уравнения Колмогорова. Предположим, что: а) частные производные др(в, х, т, у) двр(а, х, т, у) существуют и непрерывны для любых а, х, т) о, у; б) каково бы ни было б ) О, существуют пределы 1пп — ~ (у' — х') р (а — Ла, х, а, у) Ыу = ав вас ~у — х)<в =Ь'(а, х), в=1, 2, ..., и; (5) 11ш — ~ (у' — х') (у' — х') р(а — Ла, х, а, у) Ыу= ав-о йв ~з — х(<в = 2а" (а, х), в, у'= 1, 2, ..., и, (6) ОднА стятистичкскяя ЗАДАчл «гп.
1 зад причем сходимость в соотношениях (5) и (6) р а в н ам е р н а относительно х. Покажем, что в атих предположениях функция р (о, х, т, у) как функция первой пари аргументов удовлетворяет дифференциальному уравнению второго порядка параболического типа (уравнению Колмогорова) д —,+ ~ а" (о, х)д д1д «+ ~ д«(о, х)д— ,— — О. (7) «,«« «-1 Д о к а а а т е л ь с т в о. В силу тождества Маркова (3) мы имеем р (о — д«о, х, т, у) = =) р(о — Ло, х, о, г)р(о, г, т, у)дг.
(8) Используя соотношение (8) и тождество ~ р (о — Ло, х, о, г) Ыг = 1, (9) получаем: р (о — Ьо, х, т, у) — р (о, х, т, у) = =~ р(о — Ло, х, о, г) р(о, г, т, у)дев — р(о, х, т, у) ~ р(о — Ьо, х, о, г) ««г = =') (р(о, г, т, у) — р(о, х, т, у)~ р (о — Ло, х, о, г) «(г. Раабивая интеграл по пространству К на два интеграла соответственно по областям ) г — х ! ( 6 и ~ г — х ~ )6 и раскладывая равность р (о, г, т, у) — р (о, х, т, у) по степеням 㫠— х', находим р (о — Лв, х, т, у) — р (о, х, т, у) Ьо 1 — (р(о, г, т, у) — р(о, х, т, уЦХ ~л — х~ г а Хр(о — Ло, х о, г)Ыг+ ~~ ' ' ' Х ч~ др(о, х, с, у) «=1 Х вЂ” ~ (㫠— х«) р(о — Ло, х, о, г)«(г+ , '* — х((г 347 г гз) ПОНЯТИЕ О МАРКОВСКОМ ПРОЦЕССЕ ме 2 дх1 дЗ ао 1,~ 1 ~» — х!Сб ч1 1 д»р(о, х, т, Р) хр(о — Ьо, х, о, г)дг+ т — д', ' ' х »,1=1 Х вЂ” ~ о[~я — хор(о — Ло, х, о, г)Ыг.
(10) ~» — х~сб Перейдем теперь в соотношении (10) к пределу при Ьо -х О. Первое слагаемое правой части, в силу (4), имеет предел, равный нулю; предел второго слагаемого равен (см. (5)) 61(о ) дРО" *" У) Х дх» третье слагаемое, ввиду (6), в пределе оказывается равным 1,1 1 .Наконец, последнее слагаемое стремится к нулю при 6 -и О.
Так как, однако, левая часть равенства (10) от 6 не зависит, то предел правой части равен п и а" (о, х) — Р— '-,д»-т' '~ + ~ 6'(о, х) 1,1 1 1-1 Отсюда мы заключаем, что и у левой части равенства (10) существует при Ьо- О предел, равный др(о, х, т, Р) до Итак, Функция р (о, х, т, у) является решением уравнения (7). Оказывается, что р (о, х, т, у) яеяяетея фундаментальным решением уравнения (7). Это аначит, что Заз ОДНА СТАТИСТИЧЕСКАЯ ЗАДА'1А 1гл. 7 решение и = и (о, х) уравнения (7), удовлетворяющее наперед заданному начальному условию и(О, х) — —,Р(х), (11) где Р (х) — заданная функция и переменных х', хз, ..., х", выражается по формуле и(о, х) = ~ р(о, х, т, у) Р(у) Ыу.