Корн Г.А., Корн Т.М. - Справочник по математике для ученых и инженеров (947387), страница 82
Текст из файла (страница 82)
столбец <л+ 1)Х1, х= х <1) н— в (к, к, ..., представляющая вектор састояния, и, и г матрица.стагбгц гХ|, и — и(1]=(и из ' " и.г п|э д и едставляющая вектор управления, — ь — матрица-строка !Х(в+ 1), Р Р (1> (Ра Р! '' ' Рп) представляющая сопряженный вектор п. П.В.! н П.8.2 можно записать теперь в болеекои( м. акжв п. 14.5.2>. Соотношения п. П.В. н то--= — 01 есть матрица размера (в+!)х(л+ !. 1.
паитиой форме; замети», что -- = — ~ есть дают иа заданную горизонтальную орбиту иенот р о ой целя так, лабы х ((Г) =ар(р+а, к((р)=-г'р: У ((Г) =УР. у (1 р) = о, ог амыи оваиием управляющей пе- Т аким о р б азам, решение задачи завершается програ ь р го |очега т ( р— — () — <() к, чтобы минимизировать оба<ай расход р — о ременной — угла и = и ( ) так, ч о (Г илв просто ~ дб г и кэигчних сас юяний эагисэт явно а з р, э т( и1, ва так как многообразия вача гьнь~х иа гагаг'г~ «ь 1' дхь('й( 1' хь ((0) 10' хз ((р) Махсймиэация гамигзтаниаиа Тюпа ,,> "У "~~.+.<1 (,>- 1 дает дН(ди = 0 или — рг 01пи+ргсо" и=о и Р .
Р сози= — *, з|пи= — — — ' дН др =(<к,и) =- ар д) дх Н(Р, х, и) — Р/ <РРагнгния сэсл~гянил), дН вЂ” — (сопряженные урээнгиия), дх <гамигьтаниан). <| !.0.22> Б. — непрерывно днфференцнруомыэ функция, эагислтчг от уэрэгггииа в процессе абраг зогапня оптимальная траекторги (сгг, также и.
!!.8-1, е), то теория п. !1,8-2 остается без изиенеевя для траектория нлп нх частей, находящихся гну гри аамкнутэй области Х, оэргдггтнэй грагнгниямь (23) Для траекторий и ~астей траекторий, находящихся на граиицг Х, по меиьщей мере одна из ограничений (23) превращается в равенство. Для простотй рассмотрим граничную область РБ, определенную единственным уравнением 5(хч, .гт, ..., хи, и(, ..., и ) =О. (1(Я-24> В втой области применим метод множителей Лагранжа пп, 11.6.2 и 11,8-(,е; таним образоьг, каждая оптамальиан траектория удовлатворяет уравнению (24) и соотношениям п 1!.8-2,а с заменой Н на Р => ->А<(>5, ((х х ... х)щРБ) (11.8-25) где А — множитель Лагранжа. Аналоги ~но 7, ьгожет быть заменена в РБ одним из следую них выражевийг и -! ив<0 р — 7 + р ((> 5<0> = >, + М <(> дх,.
1=0 <П 0-26> ((х,к,...,хи)щР5,0=1,2, ...,л), где а С дБ = й( = Х.'М д'х,. 1=0 Б Б О, 1Ог (!! Д-27> р <1) — множитель Лагранжа. <Ь) Если 5(К> есть первая «з функций (27), содержащая упрввляющуга перемен. иую и явно, то неравенство Б (0 называют ограничением.неравенством К-го порядка. В этом случае оптимальная траектория, эхэдви<аа в граничиуго область РБ, апре. деленную уравнением (24), изнутри Х в момент 1 = 1, должна удовлетворять углагьгм гэагиям (усгогиям скачка) 85|ьг Р.((1 - 0) =- Р; ((, + о) ф ,У, '0 †,„ ->-(тк - ! + 0) 0 =О (г =- 1, 2, ..., л), дв(К '|) дх,.
< 11. 8-28> ",, '(,— о = Н~(, —, .о гх постоянные т — множители Лаграянса, Ь вЂ” произвольная постоянная. 0 Сптнмальная траектория, пакидапи(ая граничную область состояавй в момент ( в первый раз после вхо;кдения в иее при ( = (ь должна удовлетворять угловым условияи дБ (К Р (( — О)=Р.(г +8) — Ь вЂ” ---! <( 1,2...,,л>, ) ( 2 1 З дх( (( г, ' ' "' ' ' <11 8.28> Н ((= (, — 0 = Н )1 =1, +О. Рн ерн" ФУницноиал <2> может рассматриваться как мат и ое пр „ трен нее п ров введен не п.
147 1) к, =ох матрицы столбца к и матрицы строки с=<1, О, О, ..., 0) размера ! Х (и + 1). В (>!.14) рассмотрен случай, когда критерий.функционал определен «а» ск с более общей матрвцей-строкой г. 11 8-0. Ограниченна.неравенства для переменных состанпия. Угловме условия <см тгкхсе п. 11 6.0). (а> Если обласэь Х допустимых систем состояний (х, х, ..., кя) ограничена неравенствами 5((хз, хз, ..., хи, из, иэ, ..., и ) щ 0 (1=1, 2, ..., лг>, (!!823) 11.В.В. 367 И.9 ШЛГОЕЫЕ ЗЛДЛЧИ УПРЛЕЛЕИИЯ ГЛ.
и, МЛКСИМУМЫ И МИИИМУЫЫ 11.9-2. Прея ззояьную постоянную Ь, встречающуюся з обоих ур (- ) ) воязгзют равной нулю, тзя чтя р,. (1) неяр«рызяы з точке выхода. Если оятйызяьязя чрзектзряя яреломля«т«я з гранзчяой обязств ОЗ, соотзет у стз ющей единственному огрзяячеяюз (2«), то 1, 1, н угловое условие (29) заполняется с — О. Есл «девственно« огрзяячеяяе (2«) заменяется двумя нлз лзе т няяыя, члены, соотз«тстзующяз но«мы згрзянче и ( д я няя с ояоянятеяьяыыя яножятеяяыя], прябззляютсз я каждой сумме з уравнениях (Ж), (29), (2В) в (29), Случзв явно зззя- «ялыяс«1 от зр«меня я у ю з чз тся способом я.
И.В-(,«. й (29), (29) з сяеннзяьныз случаях 3 з и е ч з н я з. Отяясятельвя угловых у«лоза сы. (1!.!Л!. 11.8-6. Метод динамического программирования (см. таки(е п.. - ). ( п. 11.0-2). Если задача оптимального управления, поставленная в п. 11.8-1, определяет единственную оптимальную экстремаль для фиксированных х(((р) и переменных х( ((И = Х; (! = 1, 2, ..., и), во минимум критерия-функцвонала (р гп1п [,(хю хз, ...з х„; и,, из, ..., и,) й(ы аз(1), Я (О, ..., и,(1) 7 -=ч;(.)",((.) -' .((.)' ((.) "( ]- "((.и-= (11.8-30] удовлетворяет уравнению с частными пронзводиымн первого порядка в дз] Х, Х „... Х; —, - —, ..., — ] =0 (уравнение Гамильтона — Якоби] з з/ (11.8-3!) где й(-оптимальная (максимизированная) функция Гамильтона из уравне.
ния 17) (см. также п. 11.6-8). быкновевиые дифференциальные уравнения (20) суть соответствующие уравнения характерно и, арактери.тик, и способ получения их решений из полного интеграла уравнения (3!) известен (п. 10.2-4]. Динамическое программирование «погружаетз данную задачу оптвмального управления равления в класс аналогичных задач с различными начальными координатазп(. Уравнение с частнымн производными (31), которое дает решение для всего указанного множества задач, выражает тот факт, что каждал часть оптимальной травкиюрии оатимизирушя критсрий-функционал для соответствующих начальных и конечных точек (принцип оптимальности Беллмаяа).
Из принципа оптимальности можно получить цельную теорию оптимального управления при весьма общих предположениях. Вообще же численное решение ураваення (31) при л) 2 затруднительно (см. [!!.!6] [1!.17], где дннамическое программирование рассмотрено в более общем виде) . 11.й, ШАГОВЪ|Е ЗАДАЧИ УПРАВЛЕНИЯ И ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 11.9-1.
Постановив задачи. Важный класс оптимизационных задач, вклюшаговое управление (что содержит управление непрерывными системамн посредством вычислительных машин) илн шаговую оптнми ац р ур з ию ес сов, может быть сформулирован следующим образом: Система описывается множеством переменных состоянпя х=(х,, хз, ..., хз), образ ющих последовательность зх, зх, ..., "х, ..., так что каждое изме- у пс:)ие состояния даегся урони«ноями состоляия (в этом случае конечно-разиосгнымн, сз(. также п. 20.4-3) Л(зх 1(зх Лети] где «управляющая псременнаяз " «и = — ("'зи,, а'1и, ..., 9««и,) опрсдсляс). последовательность решений (стратегий), изменяющих й-ю свстему состояний в (9+1)-ю. Если задана вачальное состочнне зх (и, возможно, некоторое множество ограшшений-ранено(в нлн неранено(с для переменных состояния н управлеьня), то задача заключается в нахо)кденни оптимальной стратегии 111, Зи, ...
...,Ли, минимизирующей данный критерий Г( — 1 ""= Х 7.(",'")~ (".)= .,(;], л=о (11.9-2) где )Р=1, 2, ...— казачество рассматриваемых шагов (дииамичесное программирование). Как н в случае непрерывных задач оптимального управления, начальные и конечные состояния могут быть либо заданнымн, либо не заданнымн, возможно также обобщить постановку задачи способам, указанным в п. 11.8-1, е. 11.9-2. Принцип оптимальности Беллмаиа (см. также п. 11.8-6). Если зи, зи...,, Ли — некоторая оптимальная стратегия для последовательности состояний х, х, ..., х в некоторой задаче динамического лрограммирова. ния с начальным состоянием 'х, то 'и, зи, ..., и есть оптимальная сглратггил для тгх жг критерия-функции и конечного состояния х, но с иачальныа согтояиигл1 х.
Гели обозначить ш|п хз(Х] через 5(Х), то прпнцнп опти- 1. Л1 Л1 я мальности выражается рекуррентным соотношением (уравнением с частными конечными разностями, п. 20.4-3, Ь) ~(Х)= '"[7 (Х ")+' '8[7(ХЛ]]) (Л'=2,3...,) 'я ~д (Х) = ш!п ]з (Х, зи), (|1.9-3 (,.) 1и где минимум определяется в соответствие с задацпымн ограничениями, Численное решение этого функционального уравнения с неизвестнымн цункцнями Б(Х) заключается в шаговой конструкции класса оптимальных з Л( стратегий для некоторого класса начальных состояний.
Ожидаемая оптимальная стратегия «погруженаз в этом классе. Решение обычно использует вычислительные устройства, но даже в этом случае решение задачи с более чем двумя или тремя переменными состояния х( практически возможно лишь в частных случаях. Ряд примеров и приближенных методов содержится в [11.16), [11.17) в [1!.20] рассмотрено шаговое управ.
ление, аналогичное принципу максимума. 12.1-4. 121 ВВЕЛЕНИЕ Е)) АВА 12 ОПРЕДЕЛЕНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ: СОВРЕМЕННАЯ (АБСТРАКТНАЯ) АЛГЕБРА И АБСТРАКТНЫЕ ПРОСТРАНСТВА (2.1. ВВЕДЕППЕ 12 1 ! Математические модели Физические процессы вообще говоря описываются в терминах операций (наблюдений, экспериментов), связывающих физические объекта, Сложность подлинных физических снтуацвй требует упрощенных описаний с помощью словесных, символических и даже фнзнческих моделей, которые «абстрагируют» подходящим образом выбранные «сушественныю свойства физических объектов и ситуаций.