В.М. Алексеев, В.М. Тихомиров, С.В. Фомин - Оптимальное управление (1979) (1155777), страница 56
Текст из файла (страница 56)
Пусть Ь=(В„'$„..., $ ), 1=((„)„..., )„), Р=(ЄЄ.. „Р ) (функции Р; определены в формулировке леммы в п. 4.2.3), и((, а, т, о) и х(Г; („х„а, т, о) имеют тот же смысл, что и в пп. 4.2.3 и 4.2.6. Рассмотрим при аь ) О задачу Коши для системы (и+и+1)-го порядка — / е(П х, и(й а, т, е)) '( х=~ /=ер((,х, я, и((,а,т, о))=~ ' ' ' (, р'((, х, и ((, а, т, е )) (1) х ((,) = х„ я ((,) = О. Уравнения для х здесь не содержат $ и совпадают с (1), (2) п. 4.2.6. Поэтому их решением является х((; („х„а, т, о), а тогда, как легко видеть, Р ((„(„х„а) = $ ((,; („х„а, т, о).
дг ~~о (2) = = Й ((о (о ), а дх дав где /ни ОЫ ~(( т)=~а О у м м — фундаментальная матрица решений системы уравнений в вариациях Следовательно, возможность продолжения этой функции на неположительные аь и непрерывная дифференцируемость в некоторой окрестности (г'„(„х„О) вытекают из леммы о пакете иголок, примененной к системе (1), а значения производных находятся по формулам, аналогичным (10) — (13) п.
4,2.3: (Йп — прямоугольные блоки в матрице Й размерами а х л, а х ш, тха и т х и соответственно). Учитывая„что ф не зависит от $, мы получаем из (3), что (! является решением задачи Коши для махричного дифференциального уравнения н ( Я„012 ) (юр„(О О) (011 Я1а) (т йй (4) ((41 (т, т) Ом (т, т) ) (О Ет ) Решая поочередно четыре матричных уравнения, составляющие (4), имеем сй„((, т)(~((=Ч~„(!) г)м ((, т), й„(т, т)= Е„, откуда ь)„((, т).=()((, т) — фундаментальная матрица системы (3) п. 4.2.3.
Уравнениям Ю„((, т)д(Г = Ь (!) ()„((, т), ();, (т, т) = О, удовлетворяет ()„($, т) =О, и по теореме единственности другого решения не может быть. Далее (()ы(( т)l«(=7~(!) ~!м =7. (!)(!(Г т) ()и((, т) =О~ откуда 8 йм ((, т) = ~ ~„(з) (! (з, т) с(з. В частности, — (г т)=р (т)=(р ( ) ° р ( )) является решением задачи Коши (!8) п. 4.2.3 (см. (!4) в п. 2.5.4; можно убедиться в этом также и непосред- ственно, дифференцируя по т и учитывая свойства фун- даментальной матрицы, описанные в той же теореме п.
2.5.4). Наконец, «()вз(! т)(Ф(=1т(()()м((~ т)=О~ (2за(т~ т)=Ет. откуда ()„((, т)= — Е . Таким образом, (а(~„т) о ) Подставляя в (2) и отделяя то, что относится к $ (1;; 1„х„а, т, о) = Г (1„1„х„сс), мы получаем дГ)д1, = д$(д(, = 1 (1,), др7дг» = 41дг» = (1»» (Гс 1») Ч~ (1») 1)м (11 1») Йг») = = р. (1.)р (1 ) — 1 (г ) дР/дх» = д$!дх, =1«„(1„с,) = — р, (1,), дР!дссь = д$(дх» = й„(1„т») Ь~р (т», о») + +11„(1, т»)'й(( ° .)= — Р.(т )бр(т ° и )+й((т о.) что совпадает с (14) — (17) п.
4.2.3. ° $ 4.3*. Задачи оптимального управления, линейные по фазовым переменным Этот параграф посвящен одному специальному классу задач оптимального управления. Этот класс достаточно важен и с прикладной точки зрения, но для нас ок интересен не только этим. На примере задач с линейной структурой по фазовым переменным можно наиболее отчетливо продемонстрировать одну из самых принципиальных идей всей теории. Речь идет о «скрытой выпуклости», всегда присутствующей в задачах оптимального управления.
Именно она в конечном счете дает возможность записать необходимое условие в виде «принципа максимума», т. е. в форме, характерной для задач выпуклого программирования. И если в предыдущем параграфе мы старались подчеркнуть связь задач оптимального управления с общей теорией гладких экстремальных задач, то здесь на первый план выдвигается их связь с выпуклым анализом. Отметим еще, что (как это и характерно для задач выпуклого программирования) необходимые условия экстремума почти смыкаются здесь с достаточными.
Наконец, и это тоже важно с точки зрения выявления скрытой выпуклости, мы будем в этом параграфе рассматривать измеримые управления, а не только кусочно- непрерывные. 4.3.1. Редукция задачи оптимального управления, линейной по фазовым переменным, к задаче ляпунов- ского типа. Пусть Ь = 11„ 1,) †фиксированн отрезок числовой прямой, а;: Ь вЂ” К", 1= О, 1, ..., т, и А: Л- Л'(К", К") †интегрируем векторные и матричная функции; Й вЂ” топологическое пространство, ),: Ьх 11 — К, 347, 1=0, 1, ..., т, и Р(, .): ЛхИ- Н» — непрерывные -фУнкции; Уо~, У„, 1=0, 1, ..., т,— элементы К»о, с;, 1= 1, 2, ..., т,— числа.
Экстремальная задача 1о(х(.)* и( ))=) (а.ЯхЯ+Ж иЯ))й(+ а + Уо»Х'((о) + Уо»Х (Го) 1П(о х=А(Х)х+Р(1, и(1)), и(1)ЕН, (1) 14(х(.), и( ° ))= ~ (ае(У)х(1)+~;(1, и Я)) й+ Ь +умх(1,)+у„х(1,) ~~с;, в которую величины, связанные с фазовой траекторией х, входят линейно, называется задачей оптимального управления, линейной по оразовым переменным. Она, разу- меется, является частным случаем общей задачи опти- , мального управления из Э 4.2. Однако здесь мы не- сколько расширим совокупность допустимых процессов.
Обозначим через оо множество измеримых (в смысле определения п. 4.2.6) отображений и: Ь- И таких, что функции (о-э~,(1, и(1)) и (от»Р(1, и(о)) ннтегрируемы. Пара (х( ), и ( )) называется допустимым процессом, если х( ); Л вЂ” Й» абсолютно непрерывная вектор-функ- ция (см. п. 2.1.8), и( )Еч4, х (1) = А (1) х (1) + Р (1, и (1)) почти всюду и выполняются неравенства У, (х ( ), и ( ))~~си Допустимый процесс (х( ), и( )) называется оптимальным, если существует такое а) О, что для любого допустимого процесса (х( ), и( )), удовлетворяющего'усло- ' вию 1х( ) — х( ))сиь а»> < а выполнено неравенство У,(х( ), и( ))) Х,(х( ), й( )).
Мы покажем сейчас, что линейная структура. позволяет преобразовать задачу (1) к такому виду, где х( ) и и( ) в некотором смысле разделены (и, в частности, отсутствует дифференциальная связь). Пусть 11(, ) — фундаментальная матрица (п. 2.6.4) решений однородной линейной системы х=А (1) х. (2) 348 В соответствии с формулой (13) и. 2.5.4 х(1)=й(1, 1,)х(1,)+1й(1, )р(, ())г.
(3) с, Подставляя (3), преобразуелс функционалы задачи (1): ,с'с(х( ), и( ))= =1,.;ссрсс.сс ссс+1 сс, ссс...сссс))ссс+~)с(1, и(1))й+у„х(1,)+ с, -~с„[асс, сс сс,сс-'1асс„.ссс., с,>>с.~ са с, с с, = ~ ~ а, (1) й (1, т) Р ( с, и (т)) с(т й + ~ ~с (т, и (т)) Дт -1- сд се +~ ) ас(1)й(1, 1,)й+у„+уий(1;, 1,)) (1,)-). сс + у„. ~ й (1„т) Р (т, и (т)) Нс= сь с,сс, = ~ ~ ~ а; (1) й (1, т) й Р (с, и (т)) -1- с, с +~с(т, и(т))+у„й(1„т)Р(т, и(т)) с(т-(- (с~ «-(1 .,с ссссс ссс с-с,';с-с„а о„ сс)*ссс сю с, = — ~ бс(т, и(т))с(т+бсх(1,), (4) где ссс(т, и),= р;(т) Г (т, и) †)с(т, и), Рс =уос — рс(1о) р,(т) = — у„й ( 1„ т) ~ ас (с) й (с, т) й, Х=О, 1„...,лс. (б) (6) 349 Теперь задача (1) приобретает вид 1«(х( ), и( ))= — ~ б,(1, иЯ)й+)»«х(1,) ш1, Ь У,(х( ), и( ))= — ~ б;(1, и(1))й+()х(1,)~~с,.
Ь (8) Такую задачу мы будем называть задачей ляпуновского типа или просто ляпуновскай зада«си. 4.3,2. Теорема Ляпунова. В установлении связи между задачами оптимального управления и выпуклого программированйя теорема Ляпунова играет ключевую раль. Оиа будет сформулирована здесь для случая векторной функции йч 1« — $«« и меры Лебега т на прямон (с.
Незначительное усовершенствование доказательств позволяет распространить этч теорему на случай праизвольиога пространства с задаинои в нем а-алгеброй Я и произвольной непрерывной (неатамическай) конечной векторной мерой рп Ь- К". В приведенной ниже формулировке Я вЂ” это а-алгебра измеримых по Лебегу подмножеств в 1«, а р(А)= ~ р(1)Н1. А В отличие ат других мест нашей книги, здесь и в следующем пункте нам придется использовать некоторые факты из функционального анализа и теории меры, которые, несмотря на их большое принципиальное зна.чение, обычна не входят в основные университетские курсы. Начнем с определений.
Термины «измеримость», «интегрируемость», «почти всюду» и т. п. далее понимаются в смысле Лебега (для измеримости удобно пользоваться определением, приведенным в п. 4.2.8), Две функции называются эквивалентными, если они совпадают почти всюду. 0 п р е дел е н и е 1, Пусть Л вЂ” произвольный промежуток числовой прямой. Пространствами Е,(Л) и ь„(Ь) называются нормированные пространства, элеыентами которых являются классы эквивалентных между собой функций х: а р«, обладающих конечной нормой, которая задается равенствами: в пространстве 1.,(е»): 1х ( )1=-11х(1) (Й; « в пространстве Е„(А): !!х( )1!=ворога!!х(1)(= 1п( знр 1х(1)/.
(2) ь н, ы (н)=0 1еь' Ф Предложение 1. Пространства Е,(А) и Е„(А) банаховы, причем Е! (Ь) сепарабельно. Пространство Е (А) изометрически изоморфно сопряженному пространству Е,(А)е, такчтозамкнутые шары в нем и-слабо компактны. Доказательство. этих утверждений мы заменим следующими ссылками: полнота и сепарабельность пространства Е,(А) — ) КФ, гл. Ч11, э 11 (существование счетного базиса у меры Лебега на бесконечном промежутке сразу следует из его существования на конечных отрезках, поскольку каждый такой промежуток представйм в виде объединения счетного числа отрезков); компактность в н-слабой топологии замкнутых шаров в пространстве, сопряженном к сепарабельному (КФ; стр.