Галеев Э.М., Тихомиров В.М. - Оптимизация (теория, примеры, задачи) (1050557), страница 30
Текст из файла (страница 30)
Постановка задача Задачей оатимальиего уяравлгнив (в понтрягинской форме) будем называть следующую задачу: > Во(Е) — ппп; В;(6) < О, 1 = 1,...,пт, В;(О = О, 1 = гп + 1,..., гп, (Р) х(1) — Ч>(г,х(1),и(1)) =О >Гг 6 Т, (1) и(1) б ГГ ж 1 6 а, (2) где Е = (х(),и()>1о>11), х б РС'(й»,К"), и б РС(д»>К"), 1о,1, б Ь, 6о < 1, гь — заданный конечный отрезок, У С К' — произвольное множеспю, , Т С Ь вЂ” множество точек непрерывности управления и, В(Π— / Е(1,х(1),и(1)) 61+ф>(1о,х(го)>11 х(1>))> != О» ''>™ ь Здесь РС(Ь, К") — пространство кусочно-непрерывных на отрезке О вектор-функций, соответственно РС'(й», К") — пространство непрерыв- ных вектор-функций, имеющих кусочно-непрерывную производную. Напомним, что кусочио-непрерывной функцией называется функция, имеющая не более конечного числа разрывов первого рода (в точках разрывов ывов существуют конечные пределы слева и справа).
Вектор-функция х = (хо., ., х„) называется фазввай ягргмвиивй, , век- тор-функция и = (ин,, ., и„) называется улравлгнигм. Ограничение (1), являющееся дифференциальным уравнением, называется диффгргнциаль- ммм ограничением. но . Оно должно выполняться во всех точках непрерывно- сти управления и. от . В отличии от задачи Лагранжа имеется ограничение (2) типа включени, ючения, которое должно выполняться во всех точках б а фазовая переменная х = (х„..., х„) может иметь меньшую гладкость.
Частным случаем задачи оптимального управления (Р) является задача, в которой один из концов или даже оба закреплены. Элемент Е, для которого выполнены все указанные условия и о~ра- ничения задачи, называется двяуаяиммм или еше говорят делустимым управляемым лрачгссам. Д стимый управляемый процесс Е = (х(),О(.),Ео,Е~) называется (локально) аямималоиым (или еще говорят оеяималоимм в силовом см оп у смысле ярецессом), если сушествуег 6 > О такое, что Во(Е) В Во(Е) для любого допустимого управляемого процесса Е = (х(),п(), 1о, $~), для которого 11хИ вЂ” У(')11с(а1 < 6. 11о Го1 < 6. 111 — Е~1 < 6.
188 Глава 4. 3 ааачи овтнмальноп» управления 1.2. Формулировка теоремы Теорема. Пусть с' = (х(),й(.),1,1 ) окрестности мнолсества ((1, Е(1)) < 1 б »Ъ 1, дека т афуикцииф., »=О 1 ... б »Х»1, декартово умноженного на !Г, ;, » = , ,...,и», непрерывно ди н и - »внц~ру~~ окрестности Тогда найдутся множители Ла , р - ) ф О, такие, иио для функции Лагранжа »( Л = (з(1,т,и) + р(1)(х — р(1,х,и))) дг+!(1о,х(1о),1»,х(!»)) Л=з( 1, . —,, „,, „(1)) о,х о,1»,х(1»)), где у(г,х,ц) = 2;Л»Я1,х,и), ! = Л. », = Гф»(1«,х(го) 1»,х(1,)) — терминаит, ВыпОлнены условия: а) стационарность по х — уравнение Эйве В(1 х х и) = Т( , х, и = 1, х, а) + р!х — <о(1, х» ц)) — уравнение Эйлера длл лагранжиана д — — Т,.(1)+В.(1) =О УгбТ «=» -р(1)+~.(1) — р(1)р.(1) =О; Ь) трансверсальность па х Ьо(<о) = !ь<»,> ~=> р(1о) = 1,<» > ~ь(1»)= 1*«> «=» р(1)=-1,<ц>; с) оптимальность по н ш'"М х(1),й(1) и) = Ц<,Е(1) ь(1) й(,)) ьои ~( ~ ( )»о) Р(1)»р(1,х(1) и)) = з(1) — р(1)<»(1) д) стационарность ио подвизкным концам выписы подвижных концов огре зка интегрирования) концам (выписывается только для Л»,(1о) = О «=» — У(1о) +!», + !щ»,>х(го) = О », *<ь>х о — О, Л„(1») =О «==» у(1»)+Е», +!ь<»,>х»(Е») =О; е) дополняющая игхсгсткость Л,В,®=О <) неотрицательность » = О, 1, „ б !.
Пряяпнп максимума Поитряп»на в общем случае 189 1З. Доказательство А) Игольчатые вариации, пакет иголок. Проварьнруем процесс С', включив его в конечно-параметрическое семейство, определяемое па- кетом иголок (набором игольчатых вариаций управления й). Для это- го фиксируем натуральное число»»Г, наборы: точек т = (т„...,тп), т, ( тз < ... < т»», управлений о = (э„..., ол), ллин а = (а»,..., ап) (т, Е Т, о» Е !Т, а! > О, » = 1,..., »!). Управление и (1) й(1)~ 1б й»~ О й»». »=» оп 1 6 г."»», ь.
- «, - »ч - »» ~г -;, . - »ь -1» .~>. ~г»: = Д+... + ".. назовем игольчатой вариацией управления й, определяемой пакетом иголок (т, о, а). Некоторые точки т;, могут совпадать. Однако полуинтервалы с»», имеющие длины а„устроены так, что они не пересекаются и прн малом <а! лежат во множестве Т. функция х(1; 1о, хо, а), являющаяся решением уравнения х = »р(1, х, иь) х(1о) = аш называется июльчатой вариацией функции Е, определяемой точкой (1о, хо) и фиксированным пакетом иголок (т,о). Ниже мы покажем„что если точка (1о,хо) нахолитсЯ в окРестности точки (1о хо) (хо: = Е(1о)), то при малом <а< решение дифференциального уравнения действительно существует и определено на всем отрезке с».
В) Теорема существования. Лемма об игольчатой вириации. х = Р(1, х), х(1о) = хо (1о б '"' 1!) Теорема. Предположим, что задача Коши, имеет решение х 6 РС'(1»,1!") на конечном отрезке с», при зтом Р— функция непрерывная и непрерывно дифференциругмал ло х в некоторой окрестности С траектории Гг — — ((1, х(1)) ! 1 б»з). Тогда найдется С' С С вЂ” окрестность»праектории Гг такая, что для любой точки (1о, хо) б С' существует единственное решение х(.; 1о, хо) задачи Коши, определенное на с», лри этом функция х(1;1о,хо) непрерывно диффгреицируема во множестве А х С' и х,,(1;1о,хо)'Ь, о<, > — — й(1,1о), хь (1<1« хо) >„=з<„> = -й(1, 1о)Р(1о, х(1о)), где й(1,1о) — фундаментальная система решений уравнения: й(1,1о) = Е~(1,х(1))й(1,1о), й(1о,1«) = 1 (единичная матрица). Глава 4.
Задача овтимальиого упраалеиия Зто классическая теорема о существовании и непрерывнодифференциру- емой зависимости решения дифференциального уравнения от начальных данных [АТФ, с. !95 — 204[. х~.(й'Ео хо О) = Й(й), хи(й'Ео хо О) = — Й(й)ч(Ео), (2) (3) гдв Й(й): = Й(й, Ео) — фундаментальная система решений уравненшс Й(й) = Р,(й)Й(й), Й(Е ) = Е. Наметим путь доказательства леммы. Если управление Π— непрерывная функция, то угверждеиия леммы сразу вытекают иэ теоремы о сушеспювании и непрерывно дифференцируемой зависимости решения дифференциального уравнения от начальных данных. Если же О кусочно непрерывна, то нужно применить теорему несколько раз на каждом участке непрерывности.
С) Редукция к конечномерной задаче. Снова фиксируем Рй, наборы т и е. Обозначим г: = (йнйо,хо,ан..., а») Е В~+"+», Левона об игольчатой варьшции. Еуусть наборы г и е в накате иголок (г,е,а) фиксированы. Тогда существует г > О, такое, что если 0 < [а! < е, [хо — хо! < е, [йо — йо! < г, то ййч С Т и, гово»в того, функция х(й; йо, хо, а) — решение уравнение (!) — онргдвлгна на отрезке гь, нгнрврыено диффврвнцирувма в некоторой окрестности точки (йн Ео, хо, 0), ори этан [[х('йо,хо,а) — й(Ц дв,! — 0 нри (йо,хо,а) (Ео йо 0) и Л = > Л,В;(х) — ~~~ и г=о 1=! ь Е(й,х(й;йо,хо,а),и (й)) дй+1(йо,хо,йнх(йцйо хо а)) 2.
'рэггй =./ й ! ь ы ы Е(й, х, и) = 2 . Л;Е! (й, х, и), 1(йо хо, 11 х ~ ) = Е Лйф (йо, хо, й ~ х ~ ), вы!=о ! о полнены условия стационарности: Л, = 0; дополняющей нежесткости: ЛоВг(2) = 0 (оо Л! г® ь = 1,..., гл' оо е)), рйа. = О, Е = 1,..., Еч; неотрицательности: Л; > О, ь' = 0,1,...,пь' (оь й)), йьй ~ О, й = 1,...,йу. Й) Преобразование необходимых уагаеий комеч»омер»ой задачи. Обозначим р — решение дифференциального уравнения (а) (ь,) р+рр* = У.' р(Е!) = -1* а 1 Пртшяв машшмума Повтртива в обиты случае 191 Лагранжа для конечномерных задач с равенства~и раве и не яствами. Согласно ему найлугся множители Лагранжа Лою .. 1 ыю ... Л .-.,и», не все равные нулю (л; = лй(г,и), р = рй(т,е)) и такие, что лля функции Лагранжа задачи (Р,, ) Вг(г): = В!(х("йтао,а) итйо,й,) ь г г (й, х(й; йо, хт а), и (й) ) дй + ф! (йо, хо, й н х(й,; йо, хо а)) и и рассмотрим конечномерную задачу с ойраничениями типа равенств и неравенств Во(г) — пцп; Вг(л) < О, о = 1,..., ш~, Вг(г) = О, ь ш тл~ + 1,..., ш, (Р.н) В силу леммы об игольчатой вариации функции В; непрерывно дифференцируемы в некоторой окреспюсги точки л = (Е!,Еь,хо„О) и элемент (х(;йо,хо,а),йо,йь) - (Ю(),[о,Еи) в метрике пространства С(Ыйь) х йй~ при л - Я.
А так как элемент Е доставляет локальный минимум в задаче(Р),таточка л Е йоспилР в Значит, к задаче(Р.») применим принцип Существование и единственность решения уравнения ( ) ра я (а) с к евым условием (Ь|) следует из теоремы существования и единственности решения задачи Коши для линейных систем [АТФ, с. !91[. Из определений функции р и определения функции Й следует, что — (рй) = рй+ рй = Е Й вЂ” РГо Й+ РДЙ = Е Й.
дй йю йь,! йг Йдй Е 'й ( 42)дй — р(Е,)Й(Е,) — р(Ео)Й(Ц) =' -Етй(Е!) — Р(йо) (*) г дй и распишем условия стацнонарности Функции Лагранжа нжа А в точке й, лемму о приращении функционала н формулы из леммы об игольчатой вариации (см. ниже 92): 192 Глава 4. Задачи оптимального управления л (в) = У(тд,к(т)),е)) — У(тз) — Р(тд)(чг(ггпу(тд),ед) — («(т )) — Р = О-- 1(т,й(т ), е.) — 1(т ) — р(т )(уг(тз., й(тз), ез) — чг(тз)) = р. > О, Лаа(а) = ~1«(1)*аа(К(о,йово)д(+(т+1«сева((|ПО,йо,о) = (г) 1. = Е У.йд(+1'.,+Е.,й(Е,) = Га = — („й(Е!) — р(ЕО) + Е„+ Е„ПЯ = — р(Е,) + Е„= о; ЛФО(а) = 1(ЕО) + а( Уа(()ага(1;ЕО,ЮО,О) де+(Ф, + (а,яг,(Е!',Ее,ав,О) = (з) -. 1 ° = -1((О) — ~ У.(1)й(1)ц4О) дг+ 1„— Е„й(Е!)Ф(ЕО) = (а (') = — У(ЕО) + Е„й(Е!)!р(ЕО) + р(ЕО)уг(ЕО) + Ег„— Етй(Е!)р(ЕО) = (ьа) = -1(ЕО) + р(ЕО)й(ЕО) + Еь т — У(Е ) + Еь + (та!(ЕО) = о; (дв) л„(й) = У(Е!) + Е„+ 1«ч й(Е!) = о, Очевидно, что Л ~ О, ибо иначе из определений 1,1 и р следовало бы, что р Ов О, а из соотношений (с,„) тогда следовало бы, что р = О.
А множитель Лагранжа (Л,р) ~ О. Умножением на положительную константу нормируем вектор Л так, чтобы )Л) = 1. Итак, получили: для точек т„..., тн Е Т, управлений е(,..., ин Е ((, существует вектор Л = (ЛО,Л!,...,Л ), 1Л! = 1, такой, что выполняются соотношения а)-Г) принципа максимума Понтрягина с условием оптимальности с) для конечного числа точек т; и управлений о;. Е) Окончание доказательства. Рассмотрим в пространстве К«а"' подмножества К(т, э), т б Т, е б е(, сферы К = (Л б К +' ! (Л( = 1), состоящие из тех векторов Л, для которых выполняются утвержденна а)-() теоремы о принципе максимума Понтрягина, причем в п.с) взято 1 = т, я = е.
Сфера К является компактом, множества К(т,е) С К замкнуты, конечное пересечение П Кп., ~ (д. у=!, „и $1. Прининп максимума Понтрягина в общем случае 193 Лемма о цеитрироаанной системе. Пусть К вЂ” компакт, (К ),е,— система замкнутых подмножеств К, любая конечная подсистема которой имеет непустов пересечение (иентрированная система). Тогда пересечение всех множеств системы (К„) е,! непусто ( П К ~ !о) «ЕА Доказательство.
Обозначим О, — дополнение к К в К (О«д = К !(К ). Тогда О открыто в К. Если Д К, = о, то Ц О, = аеА аЕА () (К ! К,) = К ! П К, = К, т.е. (О,),е,! есть открытое покрытие аЕА «ЕА компакта К. По определению компакта из любого открытого покрытия можно выделить конечное подпокрытие, т. е. можно найти а„... „ан, Ф Ф н и такие, что () О,, = К.