Ф.П. Васильев - Методы решения экстремальных задач (1125244), страница 21
Текст из файла (страница 21)
Зто значит, что функция (1) при условиях (2), (3) диффереицируема и ее градиент имеет вид (5). 2. Зная формулу градиента, нетрудно расписать методы минимизации применительно к задаче (1) — (3). Например, метод проекция градиента здесь приводит к построению последовательности [иг]л=(иью ..., ил,,) по формулам ил„.,= Р~,. (и;,— а,Ны(хм, гГг„им)), г = О, йг — 1, й = О, 1, ..., где а„) О выбирается, как в З 4 п. 2; [х,]ь = (хыь . хне), [гр<]л=(гг-г,ю, г)гл-г,л) — решения задач (2) и (7) соответствеиио при [иг]=[иг]л. Приведем достаточные условия для того, чтооы градиеит фуикции (1) при ограничениях (2), (3) удовлетворял условию Липшица.
Теорема 2. Пусть выполнены все условия теоремы 1 и пусть функции Ф„рг„, Р „Р;„, Е,"„удовлетворяют условиго Лилшица яо совокупности 7х, и) е= Е" гсУ; с константой Е) О, г = О, У вЂ” 1. Пусть, кроме того, /гг(х, и)/=Аг+А,(х/; А„А,=сопз1==-0, (19) при всех х е Е", и е= Уи и множества Уг из (3) замкнуты и ограничены в Е', г=О, М вЂ” 1. Тогда градиент функции (1) при ограничениях (2), (3) удовлетворяет условию Диггшица.
Доказательство этой теоремы полностью аиалогичио доказательству теоремы 5.2; предлагаем читателю провести его самостоятельно. 3. Используя полученную формулу градиента, выведем необходимые условия оптимальиости для задачи (1) — (3). Теорема 3. Пусть вьтолнены все условия теоремы 1. Пусть [и;„] — оптимальное управление, [хг ] — соответствугогцая ему траектория системы (2), т. е. 1([и,]) = = (п(1 ([ггпу), где нижняя грань берется по всем [иг] из условий (2), (3).
Пусть [фг„] — решение задачи (7), сооглвет- 111 ствуюи(ее управлениио [и;л'(. Тогда необходимо выполняются неравенства (Ны(х;„„~~;„, и;ч), и; — щ,„))0, 1=0, Ф вЂ” 1, (20) при всех и; ~ )'ь для которых направление е= и; — и,,„ является возможным для множества 1~; в точке и;, причем если и; — внутренняя точка множества $'о то (21) Ны(х;„, ф;„, и;,,) =0; функции Н; (х, ф и) опредгляются равенствами (6). Доказательство. Положим в формуле (11) х~= = х;„ф = к)ь„,, и; = и;„; получим и — 1 И= ~ (Н .(х ., ф ., и .), йм>+о(1[Ч1) (22) Пусть и; — произвольная точка из $'о для которой игл + + а(и,— ир,) ен 'г'; при всех а, 0(а(а,. Возьмем в (22) [й„)=(0, ..., О, й; а(и; — и;,), О, ..., 0).
Очевидно, при таком выборе [6„1 управление [и;„Д+ [ЬД ~ У, и в силу оптимальности [и;„] из (22) тогда получим О ~ Ы = (Ны (к;,, яь „ц.,), а (и — и; „)) + о (а !! [йД )1, 0(а(ач. Поделив обе части этого неравенства на а) 0 и перейдя к пределу при а-л-+О, сразу придем к неравенству (20). Если и; — внутренняя точка Ъ'ь то в (20) можно положить ис *и;ч — еН;„(х;„, ф„игч) ~ )г; пРи некотоРом е)0, что сразу приведет к равенству (21). Если ~/;— выпуклое множество, то условие (20), очевидно, выполнено для любого и; ~ Ро Если Р; выпуклы при всех 1=0, 1, ..., йà — 1, то неравенства (20) в силу формулы (5) равносильны одному неравенству ,', Г ([и; 1), [1ц)— — ги; 1),, ) 0 при всех [иД ен У, что совпадает с условием оптимальности из теоремы 2.5. Таким образом, согласно теореме 3 оптимальным может быть лишь управление [и;„) ~ Н, удовлетворяющее условиям (20).
Однако, как связано управление [и„) с экстремальными точками функции Н;(х;„ ф;„ и) на множестве )гь условия (20) на это не дают ответа. В частности, вознякает естественный вопрос: нельзя лн по аналогии е системами с непрерывным временем утверждать, что 1!2 оптимальное УпРавлеиие (иго] УдовлетвоРЯет пРинципУ минимума Н;(х;„ ~;о, и; ) = гп!и Н;(х;„, ор;„, и), 1 = О, У вЂ” 1 инго (23) (чтобы здесь, как и в гл.
6 из 14), можно было говорить о принципе максимума, нужно изменить знаки функций Нь о)л). Ведь необходимое условие оптимальности тем ценнее, чем меньше управлений, подозрительных на оптимальность, оно выделяет. В этом смысле условие (23) явно имело бы преимущество перед условиями (20), так как неравенства (20) могут выполняться не только в тех точках, где имеет место (23), но и в других точках, в которых, например, Нь,(хо„ф;„и;о) = О.
К сожалению, оказывается, в управляемых системах с дискретным временем принцип минимума, вообще говоря, не имеет места: на оптимальном управлении функция Н;(х;„, ор;„ и) может и не достигать своего абсолютного минимума по и енГо П р имер 1. Пусть фазовое состояние системы описывается двумя координатами (хь у;), 1=0, 1, 2, причем х;„= х;+ 2ио уьп = — х';+ у; -)- ио 1= О, 1; хо=3' уо=О. Пусть требуется минимизировать функцию 1 (и„и,) = = — уо = ор (х„у,) при условии [и;) = (ио, и,) (( = = Ки„и,): ) и; ~ ( 5, 1= О, 1).
Нетрудно вычислить явное выражение ( (и,, ио) = 3 (и,-+ 2)' — и',-+ 6. Отсюда следует, что оптимальное управление (и,о, и„) имеет вид: и,о = = — 2, и„=5 (возможность и,„= — 5 предоставляем читателю рассмотреть самостоятельно). Оптимальная траектория тогда такая: х,„=З, х,о= — 1, х„=9; у,о=О, у,о = — 5, у,„= — 19; минимальное значение функционала равно 1„= — 19.
Составим функцию Н;(х;, уо орп, оро;) =ори(х;+2и;)+ +оги( — х;+у;+и]). Система (7) здесь имеет внд фь '-о=фи 2фо~хь оРо, — = огоь 1= 1, О, ф„=ор„=О, ф„= р„= Подставив сюда оптимальные (х;„, у;о), получим орцо =О, о)чоо = — 2, ор„= — 1, фо„=- — 1. Тогда Но(х„, у,„„, ф„,„ огооо, и) = — (и+2)'+7. Как видим., на оптимальном уп 113 равлении и=иьь= — 2 функция Н. (х,„, у„, ф1ь„, фьь„и) достигает своего абсолютного максимума, в то время как ее минимальное значение при ~ и ~ ~ 5 достигается в точке и=5. Таким образом, для управляемых систем с дискретным временем принцип минимума, вообше говоря, не имеет места.
4. Рассмотрим задачу оптимального управления линейными дискретными системами: минимизировать функцию (1) при условиях (2), (3), если Е,(хи и;) = А;х; + В,и; + [и ! = О, Ж вЂ” 1, (24) где Аи Вь [; — заданные матрицы порядков пхп, пхт и и х 1 соответственно. Теорема 4. Пусть функции Е,', Ф удовлетворяют условиям теоремы !. Тогда функция (1) при условиях (2), (3), (24) дифференцируема в И [О, М! и ее градиент Т ([и;)) в точке [и;1 вычисляется по формуле 7 ([и;!)=(Еш(хь ир)+Вс'фи (=О, й1 — 1), (25) где [х1=(х„..., хн) — решение задачи (2), соответствую- и(ее выбранному управленшо [иД, а [ф)=(ф „..., фн,) определяется из условий т о )!ц-1=А ф — Еы(хи и;), =О, 51 — 1, фн,=Ф„(х,), (26) матрицы А~, В; получены транспонированием матриц т т А,, Во Если, кроме того, Ф„р,'„Е';„удовлетворяют условию Липшии,а по совокупности (х, и) ~ Е" эсЕ', то градиент Т ([и1!) удовлетворяет условию Липшица на всем пространстве (.,[О, Ж1.
Формулы (25), (26) вытекают из теоремы 1; условие Липшица для градиента доказывается аналогично тому, как это делалось в теореме 5.3. Укажем достаточные условия выпуклости и сильной выпуклости функции (1) при условиях (2), (3), (24). Теорема 5. Пусть выполнены условия (24), функция Ф(х) выпукла по х на Е", а г","(х, и) выпукла по совокупности переменных (х, и), т.
е. Е,'(ах+(! — а)у, аи+(1 — а) о) ( ( аГ"; (х, и) + (1 — а) г "; (у, о) (27) 114 при любых х, уенЕ", и, оенЕ',ая[0, !1и !=0, с]! — 1. Тогда функция (1) вьтукла на Е;[О, М). Если при этом функции Ф, Е," удовлетворяют условиям теоремы 1, множество [сс, 1=0, Лс — 1, ьыпуклы, то для оптимальности управления [и; ! необходимо и достаточно, чтобы (с';„(хса, иса) -1- В[ с[!с„ис — иса) =» О, (28) ис вн 1!о с'=О, !1! — 1. Лок аз атель ство. Решение задачи (2), (24), очевидно, обладает свойством х, (а [ис!+ (1 — а) [ос!) =ах!([ис!)+(1 — а)хс ([ос]), !=О, М, при любых а и любых [ис], [ос) ~ Е„'[О, М1.
Тогда выпуклость функции (!) на Аз[0, Ж) является простым следствием выпуклости Ф(х) и условия (27). Условие оптимальности (28) вытекает из теоремы 2.5 и формулы (25). С помощью теоремы 3.8 аналогично доказывается Теорем а 6. Пусть выполнены условия (24), функция Ф(х) выпукла по хан Е" и, кроме тога, Е," (ах+ (! — сс) у, оси + (1 — а) о) ( ( аГ] (х, и) + (1 — а) Е] (у, о) — сс (1 — а) и ] и — о,", м=сопз]) О, при лсобых х, у ~ Е", и, о а= Е', аен [О, !! и !=О, с[С вЂ” 1. Тогда функция (1) сильно выпукла на Ь;[О, сЧ1 и задача (1) — (3), (24) имеет, и притолс единственное, реисение на любом замкнутом выпуклом множестве (с: — Е,[0, М). и-с Упражнения.
1. Доказать, что !([ис]]та ~ ]и,] + с=о и-с ] хс ]а+тай, сс, р, у= сопз1, при условиях 12), (24) =о дважды дифференннруема в !.гз [О, !т'!. Доказать, что если при этом а, р, т)0, то 1([сн)) выпукла, а если сс)0, О, уссо, то сильно выпукла на Ь" 10, сч]. 2. Пусть выполнены все условия теоремы 5. Доказать, что тогда условие (23) является необходимым и достаточным условием оптимальности в задаче (1) — (3), (24). 1!В 9 7. Оптимальное управление процессом нагрева стержня Рассмотренные в гл. 6, 7 из !4! и Я 1.2 — !.5 задачи оптимального управления относились к управляемым системам, описываемым обыкновенными дифференциальными уравнениями.
В приложениях также возникает большое количество задач оптимального управления процессами, описываемыми длффереициальными (или интегро-дифференциальными) уравнениями с частными производными. Таким задачам посвящена обширная литература, для широких классов таких задач исследованы вопросы сущесзвования и единственности оптимального управления, получены необходимые и достаточны.
условия оптимальности, разоаботаны методы их решения 122, 23, 28, 46 — 48, 50, 52, 54, 55, 59, 62, 63, 92 — 96, 103, !08, !14, 120, !23, 124, 129, !31 — 133, 142, 146, 147, 149 — 152, 155, 166, 170 — 180, 200, 201, 208, 214, 227, 23!) и др. Ниже будут рассмотрены некоторые из таких задач. В этом параграфе мы займемся задачами оптимального управления процессами, описываемыми параболическими уравнениями. Такие задачи возникают при изучении управляемых процессов теплопроводности, диффузии, фильтрации и т.
д. 146 — 48, 59, 93, 95, 213!. 1. Будем рассматривать задачу, которая в теплофизических терминах может быть сформулирована следующим образом. Имеется однородный стержень 0 (з( 1, левый конец з=О которого теплоизолирован, на правом конце з==! происходит теплообмен с внешней средой и, кроме того, в стержне имеются источники (или стоки) тепла.