Учебник - Уравнение Гамильтона-Якоби - Сидоренко В.В., страница 5
Описание файла
PDF-файл из архива "Учебник - Уравнение Гамильтона-Якоби - Сидоренко В.В.", который расположен в категории "". Всё это находится в предмете "теоретическая механика" из 3 семестр, которые можно найти в файловом архиве МФТИ (ГУ). Не смотря на прямую связь этого архива с МФТИ (ГУ), его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 5 страницы из PDF
Чаще всего встречаются интегральныефункционалы (задача Лагранжа)t1I F (q(t ), u(t ), t ) dt(5)t0и терминальные (задача Майера)(6)I (q(t1 ), t1 ) .~ (t ) , доставляющую~ (t ) и отвечающую ему траекторию qУправление uфункционалу I интересующее нас экстремальное значение, будем называтьоптимальным управлением и оптимальной траекторией соответственно.Мы ограничимся рассмотрением интегральных функционалов (5).
Общаяситуация обсуждается в учебниках по теории оптимального управления [8].Пример. Космический аппарат (КА), движущийся по круговой орбитерадиуса R0 , необходимо перевести на круговую орбиту радиуса R1 R0 .Начальная, конечная и все промежуточные орбиты должны лежать в одной итой же плоскости . Маневр осуществляется с помощью электрореактивногодвигателя, расходующего пренебрежимо малое количество рабочего тела, нопотребляющего достаточно много электроэнергии (электропотреблениепропорционально тяге двигателя). Задача оптимального управления состоит вминимизации энергетических затрат.Движение КА описывается уравнениемd 2rm(7)m 2 3 rQdt|r|где m - масса КА, r - координаты его центра масс, - гравитационныйпараметр, Q - реактивная сила ( | Q | Q0 ).Уравнение (7) перепишем в форме (1):dq1dq2(8) q3 , q4 ,dtdtdq3 q1q42 2 u1 ,dtq12q q udq4 32 4 22 .dtq1q1Здесь q1 , q2 - полярные координаты в плоскости , u1 ,u2 - "нормированные"проекции реактивной силы на оси полярной системы координат:QQ(9)u1 r , u 2 .mmМножество допустимых управлений имеет видQ0(10).mМножество начальных условий G0 и терминальное множество G1 определеныусловиямиGu {u | u12 u22 u02 }, u0 q1 (0) R0 , q3 (0) 0, q4 (0) (11)R03иq1 (T ) R1 , q3 (T ) 0, q4 (T ) (12)R13соответственно.
Кроме того, маневр должен удовлетворять естественномуфазовому ограничению(13)q(t ) Gq { q | q1 R3} ,где R3 - радиус Земли.Оптимальное управление должно обеспечивать минимальное значениефункционалаTI u12 u22 dt ,(14)0характеризующего энергозатраты на проведение маневра КА.2. Уравнение Беллмана. В расширенном фазовом пространстве (q, t )введем в рассмотрение функциюS (q, t ) tmin F (q(t ), u(t ), t ) dt .u ( t )Gu , q ( t )Gq , t [ t 0 , t ]t0q ( t 0 )G0 , q ( t ) q(15)Функция S (q, t ) дает минимальное значение выписанного интегральногофункционала на совокупности траекторий, стартующих в момент времени t 0 смножества G0 и достигающих точке q в момент времени t1 .
Если такихтраекторий не существует, то функция S (q, t ) неопределена в данной точке.Функция S (q, t ) обладает следующим свойством: при любом выбореt (0, t t0 )S (q , t ) =(16)minu ( t )Gu , q ( t )Gq , t [ t t , t ]q (t ) qtS(q(tt),tt)F(q(t),u(t),t)dt.t tЗдесь q(t t ) - значение фазового вектора в момент времени t t натраектории, вдоль которой вычисляется интегральный функционал в (16).Если t достаточно мало, то справедливы следующие соотношения:t F (q(t ' ), u(t ), t ) dt F (q, u, t )t O(tt t2),(17)q(t t ) q f (q, u, t ) t O(t 2 ) ,где u - управление в момент t на движении, используемом для вычисленияфункционала в первом из соотношений.
Используя эти соотношения, найдем:(18)S (q, t ) min F (q, u, t )t S (q f (q, u, t ) t , t t ) O(t 2 ) .uGuБудем считать, что функция S (q, t ) дифференцируема по всемаргументам. В этом случаеS (q f (q, u, t ) t , t t ) (19) SS S (q, t ) ( , f (q, u, t )) t O(t 2 ) .t qПосле подстановки выражения (19) в формулу (18) при t 0 можнополучить уравнение в частных производныхSS min F (q, u, t ) ( , f (q, u, t )) .(20)t uGu qУравнение (20) называют уравнением Беллмана. Функция Беллмана S (q, t )удовлетворяет уравнению (20) и условию(21)S (q, t0 ) 0, q G0 .В теории оптимального управления уравнение Беллмана является аналогомуравнения Гамильтона-Якоби.
Для того, чтобы подчеркнуть эту аналогию,перепишем (20) следующим образом:SS max H (q, , u, t ) 0 ,(22)t uGuqгде "гамильтониан"H (q, p, u, t ) (p, f (q, u, t )) F (q, u, t ).(23)является важным объектом теории необходимых условий оптимальности~ (t ) , построенной Л.С.Понтрягиным (п. 3).управления uПредположим, что решение уравнение (22) нам известно. Втерминальном множестве G1 выберем точкуq1 arg min S (q, t ) .(24)qG1и рассмотрим "обратную" задачу Коши(25)q(t1 ) q1 , найти q(t ) при t t1для системы обыкновенных дифференциальных уравненийdq~~(q, t ), t )(26) f (q, udtгде~~(q, t ) arg max H (q, S , u, t ) .(27)uquGu~(t ) и оптимальноеРешение задачи (25) определяет оптимальную траекторию q~~(t ), t ) , минимизирующие функционал I .~(t ) u~(qуправление u3.
Необходимые условия оптимальности. Уже отмечалось, чтоуравнению с частными производными первого порядка от одной неизвестнойфункции может быть сопоставлена некоторая система обыкновенныхдифференциальных уравнений. Уравнению Гамильтона-Якоби соответствуютканонические уравнения Гамильтона. Подобная двойственность существует и втеории оптимального управления.Рассмотрим совокупность 2n дифференциальных уравненийdq H f (q, u, t ) ,(28)dt pdpH,(29)dtqгде гамильтониан H задан формулой (23).~ (t ) достигается~(t ) с управлением uЕсли при движении по траектория qминимальное значение функционала (5), то сопряженная система (29) имеет~(t ) , удовлетворяющее краевым условиям, вид которых определяетсярешение pстроением множеств G0 и G1 , и примечательное тем, что при любом t [t0 , t1 ]~(t ), u~(t ), t ) max H (q~(t ), u, p~(t ), t ).~(t ), p(30)H (quGuДанное утверждение в не вполне строгой форме выражает принципмаксимума Понтрягина - необходимое условие оптимальности траектории~ (t ) [8].~(t ) и управления uqУпражнение.
Управляемый объект, описываемый системой уравненийdq / dt u ( q, u R n ), необходимо перевести из состояния q(t0 ) q0 в состояниеq(t1 ) q1 , обеспечив минимальное значение функционалаt1I L(q(t ), u(t ), t ) dt .(31)t0Показать, что для данной задачи уравнение Беллмана совпадает с уравнениемГамильтона-Якоби механической системы с лагранжианом L (q, q , t ) .ЛИТЕРАТУРА1. Гантмахер Ф.Р. Лекции по аналитической механике. 3-е изд. М.:Физматлит, 2001.2.
Арнольд В.И. Математические методы классической механики. 2-еизд. М.: Наука, 1979. 432 с.3. Лурье А.И. Аналитическая механика. М.: Физматлит, 1961. 824 с.4. Переломов А.М. Интегрируемые системы классической механики иалгебры Ли. М.
- Ижевск: РХД, 2002. 237 с.5. Белецкий В.В. Очерки о движении космических тел. 2-е изд. М.:Наука, 1977. 432 с.6. De Zeeuw P.T., Lynden-Bell D. Best approximate quadratic integrals instellar dynamics. MNRAS, 215 (1985), 713-730.7. Ландау Л.Д., Лифшиц Е.М. Теория поля. 6-е изд. М.: Наука, 1973. 504с.8. Моисеев Н.Н. Элементы теории оптимальных систем. М.: Наука. 1975..