Справочное руководство по небесной механике и астродинамике. Под редакцией Г.Н. Дубошина (564382), страница 111
Текст из файла (страница 111)
Выше написаны и+ д краевых условвй (8.1.23) и (8.!.25). Остальные и — д краевых условий определяются равенствами [4] Х,(х~) — д (в=ч+1, у+2, ..., и). (8.1.31) дЬ 3 а меч ание 1. Если решается вариационная задача для функционала (8.1.27), то необходимо иметь не 2п краевых условий, а 2п+1 (см.
[20]). Недостающее краевое условие имеет [9] ду, (х,) дг. ~~~, Л; (х,) дх~ (8.1.32) 3 а м еч а н и е 2. Если оптнмальное решеняе у*(х) и оптимальное управление и'(х) принадлежат некоторому пространству непрерывных функций, то вместо интегральных уравнений (8.1.28) можно воспользоваться эквивалентными пм дифференциальными уравнениями (8.1.33) которые вместе с (8.1.29) представляют уравнения Эйлера ($1.02) для функции Лагранжа (8.1.30) (см. [20]). 3 а м е ч а н и е 3. Обобщение теоремы Лагранжа, как и сама теорема Лагранжа ($1.02), выражает лишь необходимое условие существования оптимального решения и оптимального управления. й 1.08.
Свойство множителей Лагранжа на ломаных экстремалих. Условие Вейерштрасса — Эрдмана Если вектор управления и(х) претерпевает конечные разрывы в некоторых точках х = аь х =- аь ..., х = аж принадлежащих отрезку [хы х~], то для существования ломаной экстре- мали (экстремали, каждое звено которой также является экстремалью) необходимо, чтобы выполнялось условие Вейерштрасса — Эрдмана. Условие В ейерштр асса — Э р дм а н а. В точках разрыва (в угловых точках) множители Лагранжа Х1(х), Х2(х), ... 704 ч. шн.
ОптимАльные и кРАеВые ЗАДАчи АстРОдинАмики ~$ ЕЗЗ т >гэ, (х) ..., )>„(х) и функция ~ )>~(х),'„должны быть непрерыв! ! ными. Аналитически условие Вейерштрасса — Эрдмана в форме, удобной для задачи Майера, выражается неравенством [20] (Х(х), ~(у*(х), и'(х), х)))(Х(х), г(у*(х), и(х), х)), (8.1.34) которое должно выполняться при любом х я= [хь, х,], в том числе и в угловых точках х = аь х = ам ..., х = иА. В (8.1.34) вектор [(у" (х), и(х), х) вычисляется на минимали у"(х), а вектор управлении и(х) может быть любым, лишь бы удовлетворялись уравнения связи (8.1.24). $1.09. Принцип максимума Понтрягина Пусть движение некоторого управляемого объекта описывается п-мерным дифференциальным уравнением (8.1.35) Вектор-функция 1(у, и) счвтается непрерывной по всем аргументам в (и+и)-мерной области О~+„— — У)( У и непрерывно днфференцируемой по у ~ У.
Если т-мерный управляющий вектор и(х) задан, то при конкретных начальных условиях уравневне (8.1.35) имеет единственное решение. Наряду с уравнением (8.1.35) рассмотрим функционал х, А". [У (х), и (х)] = ~ [ь (У (х), и (х)) йх = х> ~ 1з(у~(х) ° ° ° У (х)> и>(х), ..., им(х))йх> (8.1.38) для которого подынтегральная функция (з(у(х), и(х)) непрерывно дифференцвруема по всем аргументам в й .Рх. В фазовом пространстве У даны две точки, уз и у.
Необходимо найти среди допустимых управлений и(х), переводящих движущийся объект из положения уь в положение у, такое управление и*(х), для которого функционал (8.1.38) принимает наименьшее возможное значение, т. е. Ь [у' (х), и' (х)] = 1п1 1. [у (х), и (х)]. хх> и $1ЛС! ГЛ. 1. СВЕДЕНИЯ ИЗ ВАРИАЦНОННОГО ИСЧИСЛЕНИЯ той В (8.1.37) у*(х) — решение уравнения (8.1.35), удовлетворяющее условиям У (хс) Ус У (х1) У. (8.1.38) Выше было сказано, что ус и у задаются, а значения независимой переменной х, хс и х1 не задаются, а определяются нз (8.1.38) .
Для существования оптимального управления и'(х) и оптимального движения у*(х) необходимо существование ненулевой непрерывной и диффгренциругмой (п + 1) -мерной вектор-функЦии а»е(Х) = (фа(Х), 1[11(Х), ..., 1[1„(Х) ), КОМПОНЕНТЫ КатОРОй удовлетворяют системе дифференциальных уравнений и йЕУ1 е»И д1'»(У(Х), и(Х)) вУ1 ~ (8.1,39) (1=0, 1, 2, „п), хс<х<х,, [ Кроме того, она должна быть такой, что функция О (ау, у, и) = 2„»у»1» (у, и), рассматриваемая как функция и ~(7, достигает при и=и' максимума.
При х=х1 и арс(х1) <О, гг' Ф»(х)1»(у'(х1), и" (х,)) =О. Если ф(х), у(х), и(х) удовлетворяют системам (8.1,35) и п (8.1.39), то функции ага И,С ау»1», рассматриваемые как функ. »=а ции х, являются постоянными и значение х1 моакно заменить любым другим. Чаще всего целесообразно в качестве множества управляющих функцнй (7 рассматривать пг-мерный (открытый или замкнутый) параллелепипед ) и, ! < 1 (з =- 1, 2, ..., т). Если [и,[< 1, то принцип максимума совпадает с необходимым условием Вейерштрасса [2), если же [их~ < 1, то классическое условие Вейерштрасса становится непригодным.
Существует большое число работ, посвященных различным 'аспектам принципа максимума. Среди них основополагающими являются монографии [37), [38). 23 под Род. Г„н. Дусошеие тон ч. Рш. оптимьльные и кРАеВые ВАдАчи АСТРодинАмики [$ гль 5 1.1О. Принцип оптимальности Беллмана Пусть состояние некоторой физической системы определяется и-мерным фазовым вектором у. Пусть, кроме того, имеется семейство преобразований (Т(у, и)) с переменным вектором (ре. шепнем) и, играющим роль параметра и переводящим вектор у в вектор г: л=Т(у,'и). ПРоцесс, состоЯщий из выбоРа йГ Решений иь ин ..., иь, назовем Н-шаговым процессом.
Свяжем с й1-шаговым процессом некоторую скалярную функцию е (у ун ° ° ° ум и~ ггм ° ° ° ин) называемую критерием или функцией дохода. Последовательность допустимых решений иь иь и„..., ил называется политикой (стратегией). Политика, обеспечивающая максимальное значение функции дохода р, называется оптимальной политикой или оптимальной стратегией. Имеет место принцип оптимальности [44). Оптимальная стратегия обладает тем свойством„что каковы бы ни были начальное состояние и принятое начальное решение, последующие решения должны составлять оптимальную стратегию относительно состояния, возникшего в результате первоначального решения.
Из этого принципа выводятся основные уравнения динамического программирования (уравнения Беллмана), которые могут рассматриваться как некоторые рекуррентные соотношения, описывающие многошаговую оптимизацию в предельном случае при неограниченном возрастании числа шагов. Уравнения Белл- мана являются функциональными уравнениями и им можно придать различный вид. Например, если рассматривается задача о максимизации функционала Б (и) = ~ г" (у, и) йх к, прн ограничениях — =0(у, и), у(хО) =с, О~~и~ у, дв то, как показано в (44], решение этой задачи сводится к решению функционального уравнения — внр )Р(с, и) + 6(с, и) — ~, (В.1.40) дк! ОК«<к дг где 1(с,х~) — «функция дохода на бесконечном числе шатова в терминологии Беллмана 144). Глава 2 ОСНОВНЫЕ УРАВНЕНИЯ ДИНАМИКИ ТЕЛ ПЕРЕМЕННОЙ МАССЫ В этой главе приводятся основные сведения из механики переменной массы.
Подробности вывода соответствующих уравнений можно найти в [46) — [50]. й 2.01. Основное уравнение динамики точки переменной массы (уравнение Мещерского) Пусть масса М некоторого тела (рассматриваемого как магериальная точка) изменяется в результате отделения от него частиц. Если движение точки переменной массы происходит в силовом поле г, то уравнение ее движения в векторной форме имеет вид [46), [47) (8.2.01) (8.2.02) и,=У,+о, то уравнению Мещерского можно придать вид М вЂ” = Р+ — (и — о). ае ам, ~И Ф (8.2.03) В некоторых задачах считается, что М~ = М. 23' где о — скорость точки в некоторой неподвижной системе координат Охуг, У~ — относительная скорость отделяющихся частиц, М, — суммарная масса отделяющихся частиц.
Уравнение (8.2.01) называется уравнением и. В. Мещерского, Если вместо относительной скорости У~ ввести абсолютную скорость отделяющихся частиц В координатной форме уравнения Мещерского записываются следующим образом: Е!Е ЛМ! г Ла т М вЂ”, =У+ — !Аи! — — ), е!! Е! ~ Р Лг)' (8.2.04) где х, у, г — координаты материальной точки в неподвижной си- стеме координат Охуг, и!,„и!„, и„— компоненты абсолютной скорости отделяющихся частиц, Х, у, Š— компоненты равнодей- ствующей г' внешних сил. й 2.02. Обобщенное уравнение Мещерского Пусть наряду с отделением частиц происходит присоединение частиц к точке переменной массы.
Тогда уравнение движения а векторной записи имеет вид М вЂ” = Ат+ — У! + — Ут, НВ ИМ! ДМ! В! !Г! ' В! (8.2.05) где Ут — относительная скорость прнсоединяющнхся частиц, Мт — суммарная масса присоединяющихся частиц, Уравнение (8.2.05) может быть названо обобщенным урав- нением Мещерского (46). Другие формы записи уравнения (8.2.05): а) М вЂ” „! =Р+ — (и,— о)-(- — „(и,— о), ВР ВМ! лМ2 б) Абсолютная скорость присоединяющихся частвц ит = = (ит„изт, ит,) в системе координат Охуг определяется векторным равенством из= Уз+ э. Читателю, интересующемуся выводом уравнений Мещерского, рекомендуем книгу А.









