Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 52
Текст из файла (страница 52)
й 39. Точная постановка статистической задачи В этой главе фазовые координаты управляемой точки мы будем обозначать через г', гз, ..., г" Таким образом, движение точки г в пространстве Й описывается системой обыкновенных дифференциальных уравнений г!=1!(г!, ..., г", и', ..., и'), !'= 1, 2, ..., и, (15) где и', из, ..., и' — управляющие параметры. Как и раньше, функции 1!(г, и) мы будем считать непрерывно зависящими от всех переменных и непрерывно диффсренцируемыми по г', г', ..., г". Предположим, что в пространстве 1! случайно движется фазовая то !Ка !,1, причем так, что процесс ее движения в прос!рапствс 77 есть Аяирковский процесс, удовлетворяющий чсловиям уснлеппои непрерывности.
Как одпк стктнстнчссккя зады!А 1Гл. 7 мы виделн в предыдущем параграфе, вероятностную характеристику этого процесса дает функция р(о,х,т,у), которую мы будем называть плотностью перехода случайной точки Я. Плотность перехода является фундамснтальным рсшснисм уравнения (7). В дальнейшем мы будем считать, что процесс донесения случайной точки заДан срункцией р(о,х,т,у). Относительно коэффициентов уравнения (7) мы здесь сделаем некоторыс предположения. Именно, мы будем считать, что: !) коэффициенты ап(п,х), Ь'(а,х), 1, ! = 1, 2, ..., п, определены, непрерывны и ограничены прп и ) 0 и при любом хате; 2) все собственные значения матрицы !! ам(п,х)!! при этих значениях аргументов ограничены сверху и снизу положительными константами.
Пусть вместе с управляемой точкой г в пространстве )С движется некоторая ее окрестность Х„например, шар или область, ограниченная произвольной гладкой поверхностью, гладко меняющейся вместе с г. Если задан закон управления точкой х, т. е. управляющий параметр и задан как кусочно-непрерывная функция и = и(!) времени 1, то система дифференциальных уравнений (15) однозначно определяет непрерывное движение точки а в простраяство )с Следовательно, если заданы начальные положения управляемой точки а и случа1тной точки Я, то однозначно определяется вероятность встречи точки Я с окрестностью Х, на конечном отрезке времени и ( ! ~ т или на бесконечном отрезке времени о ( ! ( < со и т.
п. Эта вероятность является, таким образом, груни!!ионалом над управлением и(!). Естественно возникает задача о таком выборе управления и(!) точкой а, при котором этот функционал достигает максимального значения. ь1тобы точно сформулировать задачу, введем в рассмотрение неотрицательную и нс превосходящую единицы функцию Ь(!), определенную при 0 ! ( со. Обозначим, далее, через ф„(п,х,т) вероятность того, что случайная точка 1,1, находящаяся в момент времени а и положении х, на отрезке времени и ! ~ т встретится с окрестностью Х, управляемой точки а (предполагается, эзя точнля постлновкл стлтистичвскоп задачи ззв конечно, что началыюе положение точки г, равное г(о), дано).
Ставится следующая задача: выбрать управление и(1) точкой г таким образом, чтобы функционал (! 6) достигал максимального значения. Функция й(1) определяет постановку оптимальной задачи; если, например, 1, о(1~(т, п(1) = то Х =ч)>„(о, х, т), т. е. функционал (16) есть просто вероятность встречи окрестности Х, с точкой >"> на отрезке времени о < > < г. Управление и(1) и соответствующую ему траекторию г(1) системы (!5), обеспечивающие экстремум функционалу (16), будем называть оптимальными. Реи>ение задачи, следовательно, сводится к вычислена>о функционала (16) и последующему применению принципа максимума.
Конечно, функционал (!6) зависит от размеров и формы окрестности Х, управляемой точки г. Как мы увидим в следующем параграфе, для его вычисления надо решать красну>о задачу для параболического уравнения в частных производных (7). При этом нас будет интересовать пе факт существования решения, а эффективная (хотя бы приближенная) формула для решения. Оказывается, что такую формулу можно получить, если окрестность Х, считать м а л о й. Но задача «накрыть» малой управляемой окрестностью случайную точку Я как раз и является естественной. Таким образом, в последующем, начиная с $41 настоящей главы, окрестность Х, мы будем считать малой.
Для простоты мы будем считать, что Х, есть и-мерный шар радиуса е с центром в точке г. Однако вниматель- !Гл т зао ОДНА СТАТИСТИЧВСКАЯ ЗАДАЧА ный читатель увидит, что наши рассуждения н сам результат почти не изменятся, если под Х, понимать произвольную область малого «радиуса», ограниченную гладкой поверхностью, гладко меняющейся вместе с х. 5 40. Сведение вычисления функционала У к решению краевой задачи для уравнения Колмогорова Перед тем как указать подход к вычислению функционала (16), сделаем одно общее замечание, относящееся к произвольному марковскому процессу.
Выделим в пространстве )г фиксированную область Г, ограниченную (и — !)-мерной гладкой поверхностью 5. Обозначим теперь через д(о,х,т,у) плотность вероятности того, что случайная точка, находящаяся в момент о в положении х, окажется в момент т в положении у, не заходя при этом на протяжении всего отрезка времени о (1~ т в область Г. Оказывается, что всюду вне области Г функция д(о,х,т,у) удовлетворяет тому жс уравнепи|о (7), что и функция р(о,х,т,у), и следу1ощим начальному н граничному условиям: !Ип ~ д(о, х, т, у)ду=!1ш ~ р(о,х, т,у)ду=1, (17) +та г '+' а-г д(о, х, т, у)Ыу — 0 при х — »хасим. (18) а-г Строгое доказательство этого факта можно найти в специальной литературе по теории вероятностей.
Мы приведем здесь лишь наводящие соображения, вполне, однако, достаточные для того, чтобы читатель уяснил себе справедливость сформулированного предложения. Соотношение (17) довольно очсвндпо. Справедливость соотношения (18) будет достаточно ясной, если процесс движения случайной точки Я представлять себе как броуновскос движение частицы (такая модель заключает в себе основные черты всякого марковского процесса). Если частица Я находится на гра- 4 40] зб! Вычисления 4рункпионллА т Однако из условия усиленной непрерывности (4) нетрудно вывести соотношение ~ д(о — бо, х, и, у)ду 1+о(пп), (20) а-г которос и дает требуемый результат. До сих пор область Г мй считали фиксированной. Пусть теперь область Г нс фиксирована, а движется с течением времени, т. е.
имеется однопарамстрическое семейство областсй Гь Обозначим через 41 (о, х, т, у) плотность вероятное~и случайной точки 1,1, находящейся в момент и в поло>кении х, быть в момент т в положении у, нс встречаясь на протяжении времени а ~1~ т с движущейся областью Г,. Тогда, очевидно, функция ~ д(п, х, т, у) 4(у (2!) является решением уравнения (7) и удовлетворяет следующему граничному условию: ~4)(п, х, т, р)ду- 0 при хнхВ~Ян. (22) Теперь мы можсм указа гь подход к вычислени4о функционала (16). Пусть движущаяся область Г4 представляет собой окрестность управляемой точки х(!). В соответствии со сказанным в $39 мы будем !Я Л, С, 4!онтрнннн н нр. нице мысленно выделенной в сосуде области Г, то вероятность ее захода в область Г за время а( ! < т равна единице.
Этот факт и выражает соотношение (18). Остается убедиться в том, что функция д (и, х, т, у) всюду вне области Г удовлетворяет уравнению (7). Для этого достаточно вновь внимательно просмотреть вывод уравнения (7), данный в $38, Весь этот вывод базировался на тождестве Маркова (3), которое, очевидно, справедливо и для функции д(п,х,т,у). Кроме тождества Маркова, было также использовано соотношение (9).
В нашем случае ~ 4)(п — Ьп, х, и, у)09 Ф 1. (19) л — г однл стлтистичвскля злдлчл [гл г (24) обозначать ее через Хнц. Положим ф(о, х, т) = 1 — ~ а(о, х, т, у) г!у. Так как уравнение (7) линейно, то функция ф(о,х,т) по переменным о и х удовлетворяет уравнению (7). Да- лее, нз (!7) и (22) следует, что начальное значение функ- ции ф(о, х, т) (при о = «) равно нулю, а краевое значе- ние на границе окрестности Хн,> равно единице: ф (т, х, т) = О, ф (о, х, т) ! = 1. Непосрсдствснно из определения следует, что функ- ция ф(о,х,т) представляет собой вероятность того, что случайная точка 9, находяшаяся в момент времени о в положении х, на отрезке времени о ( ! < т будет «на- крыта» окрестностью Хно управляемой точки а.
Таким образом, функция ф(о, х, т), определенная формулой (23), совпадает с функцией ф„, которая фигурирует в функционале (!6). Следовательно, для вычисления функ- ционала (!6) мы должны решить уравнение л л — + ~ а" (о, х) . + ~ Ь'(о, х) ~ =О (25) ь ! ! 1-1 со следующими начальным и граничным условиями: ф(о, х, т),,»О, (26) ф(о, х, т) — >1 прн х — »хче=Я~. (2?) Как мы уже говорили раньше, мы будем решать эту задачу для случая, когда окрестность Х, управляемой точки г представляет собой шар радиуса е.
Мы увидим, что в этом случае решение задачи (25), (26), (27) пред- ставляется в виде ф(о, х, т) = в"-зЧ" (о, х, т)+ о(е" з) (28) и вычислим функционал е" — ~Ч" (о,х,т), представляющий собой главную часть вероятности ф(о,х,т). Отметим сразу, что формула (28) справедлива лишь при и ) 2. До конца настояшей главы мы предполагаем, что раз- мерность фазового пространства 1« больше двух: и ) 2. $4ц яычислн!ит Функ!!иоиллх т в члстном слР!АР заз $41. Вычисление функционала Х в случае, когда уравнение Колмогорова имеет постоянные коэффициенты (где а44, Ь! — постоянные коэффициенты) при начальных и граничных условия: ! (26), (27), которые в дальнейц!ем мы будем записывать в виде 4)!(т, х, т) = О, 4)(о, х, с) 4 — — 1; (30) (3 !) через 5! мы обозначаем сферу радиуса е с центром в точке г(1). Прежде всего перейдел! от этой задачи к задаче с граничным условием на сфере радиуса е с центром в начале координат.
Для этой цели в пространстве (г,!) введем новыа координаты по формулам (32) г = $ + г (1), о (1 4~' .,з, так что х $+ г(о), у = Ч+ г (з). (ЗЗ! 12 В этом параграфе вероятность лр(о,х,т) и, следовательно, функционал (16) будут приближенно вычислены для одного важного частного случая, а именно, для случая, когда уравнение (25) итиеет постоянные коэффи41иенты. В процессе вычисления будут использованы нскоторые факты из теории интегральных уравнений, а также понятие потенциала двойного слоя. Все это читатель может найти в учебниках по теории дифференциальных уравнений с частныии производными, например, в книге: С. Л. Соболев, «Уравнения математической физики», Гостехиздат, М., 1954.
В соответствующих местах мы приводим нужные определения и формулировки используемых теорем. Итак, мы будем решать уравнение ! ! ! [гл. т однА стАтист!а!ескхя 3АдАчА зе4 При таком преобразовании координат сфера 5 перейдет в сферу Я,, определяемую уравнением у)а 1 (~в)в+ +(~~у з Положим !р(а, $, т) =Ф(а, я+я(а), т). (35) Для функции Ф(а,$,т) сразу же получаем дифференциальное уравнение и П вЂ” ~+ ~~ ап ~ +~~' [Ь! — ап(а)] — Ф=О (36) да дй! дй! дй! г, ! ! !=! п условия (34) !р (т, Ц, т) = О, (37) !р(а, 5, т) 1з = 1. (33) Лля того чтобы решить уравнение (36) при условиях (37), (38), нужны пекоторыс вспомогательные построенияя. Нашим первым шагом будет построение некоторого специального решения уравнения (39) !.! ! с начальным условием Фо(т ь, т) =О.