Ф.П. Васильев - Методы решения экстремальных задач (1981) (1158203), страница 21
Текст из файла (страница 21)
Заметим, что (1) представляет собой функцию Ж' переменных и„и„..., их !. Если функции Р! (х, и) непрерывны, а Р1, Ф полунепрерывны снизу по совокупности переменных (х, и) енЕ" х$'!, множества 1~! замкнуты и ограничены в Е', !=О, У вЂ” 1, то функция 1([и!]) полу- непрерывна снизу н существование оптимального управ!от где х,. = [х,',, хо), и! =(и!, ..., и[), функции Р! = [Е! Е,".) Е>о Ф пРедполагаютса известными, заданное множество из Е', натуральное число У)1 и начальная точка а заданы. Задача (1) — (3) уже изучалась нами выше: в 5 7.1 [4] с помощью динамического программирования исследовалась проблема синтеза для этой задачи.
В настоящем параграфе сформулируем достаточные условия дифференцируемости, выпуклости функции (1) при условиях (2), (3), а также выведем необходимые условия оптимальности. Будем пользоваться следующими обозначениями: ления [и; ], на котором функция (1) достигает своей нижней грани при условиях (2), (3), следует из теооемы и1. для приближенного решения задачи (1) — (3) могут быть использованы методы гл.
5 из [4]. Из-за большого числа переменных задачу (!) — (3), по-виднмому, удобнее рассматривать в пространстве 1.[[0, йг], считая функцию (1) завксящей от Ьг векторных переменных игь и„..., ин г. Выведем формулу градиента функции (1) при условиях (2), (3) в пространстве Я[0, Ж]. Теорема 1. Пусть функции гг, Рг, Ф непрерывны по совокупноспш своих аргументов вместе со своими частными производными по гггргмгнным х, и при хе:-Е", ив= 1'ь г=О, йг' — 1. Кроме того, пусть /Рг(х+Ьх, и+)г) — сг(х, и)/.,(Е.[/Ьх~г,+/й/г) (4) при всех х, х+Ьх и всех и, и+5 ен Уг, 1=0, Ьг — 1. Тогда функция (1) при условиях (2), (3) непрерывна и диффергнциругма в норме 1,.г '[О, Ьг], причем гг градиент П ([иг]) в пачке [иг]е= Н представим в види П ([иг]) = [Ны (хь фг, иг), г'= О, Л/ — 1[ ~ Е, '[О, й(], (5) гдг Н; (х, гр, и) = Р";(х, и) + (ф Рг (х, и)), Ны =[Нг„ь ..., На, (6) [х;] = (хы ..., хь) — дискретная траектория задачи (2), соотвгтствуюгцая выбранному управлению [иг] ~ Н, а вектор-функция [г)гг] = (г[г г, гры ..., фь г) опргдглягтся из условий грг г = Н;„ (хг, грг, гц), г = О, М вЂ” 1, грн г = Ф,(хн).
(7) Доказательство. Пусть [иг], [иг]+[)гг] ен Н и пусть [хг] и [х;]+[Ьх,] — соответствующие этим управлениям дискретные траектории задачи (2), а ! ([иг]) и 1([и;]+ [)гг]) = = Т ([иг]) + ЬУ вЂ” соответствующие значения функции (!). Из (2) следует, что приращение [Ьхг] удовлетворяет условиям Ьхн,=р;(х;+Ьхь и;+йг) — Рг(хг, иг), 1=0, Ьà — 1, Ьхо=О (8) Так как Ф(х+Ьх) — Ф(х)=(Ф (х+6 Ьх), Ьх), 0(6:а 1. 106 то из (1) получим Я вЂ” ! ЛУ =,У, ~ Р1 (х, + Лхь и! + Ь!) — Р) (хь и )1+ !=0 +(Ф,(хл), Лхм>+Ям где (9) Й! = (!рл (хм+ 6 Лхл) — Ф (хх), Лхл>, (10) С учетом соотношений (7), (8) имеем (ОР (хл), Лхл> = (!)!ч т, Лхх> = М вЂ” ! = Х [<!рь Лх!+~> - (ф!- Лх!>! = кг а М вЂ” 1 (ф!, Р!(х!+Лхь и!+Й!) — Р!(х„и!)>— с=о М вЂ” 1 — 'У', (Н!„(хп !р!, и!), Лх,).
г=о Подставляя полученное выражение в (9) и используя функци!о Н;(х, ф и), получим следующее представление для приращения функции: Ф вЂ” ! Л) = ~ ', (Н! (х; + Лх!, ф!, и! + Ь!) — Н! (хо !Р!, и!)— с=о — (Н!„(хь ф!, и,), Лх!>]+Ям Из формулы конечных приращений следует Н!(х;+Лх!, !рь и!+)!!) = = Н!(хр, фь и!)+(Н!„(х!+8~ Лхс, !Р!, и!+81!!), Лх;)+ +(Н„(х;+8Лх! ф!, и!+6)!!), 1!!>, 0(8!(1, 1=О, У вЂ” 1. Подставим это равенство в предыдущее представление для И; будем иметь л — ! Л) =,У, (Ны(хь!р!, и!), 1!!>+Я, В =%!+Йа+Йз (11) !=0 М вЂ” 1 )с, = ~ (Н,„(х!+ О; Лхь !Р!, и!+ ОА)— гг а — Н;„(хь !р!, и!), Лх;), (12) М вЂ” 1 Йз= У, '(Нс„(х!+О!Лхь чр!, и!+ОА)— а=о — Н!.
(х! ф!, и!), й!>. (13) !08 Для оценки остаточного члена Р формулы (11) нам понадобится одна лемма, представляющая собой дискретный аналог леммы 2.2. Лемма 1. Если некоторые величины фь !=0, )Ч, удовлетворяют неравенством О=-.ф,=аа, О~ф;+,=а+Ь Я гр„, !'=О, )у — 1, (14) т=в то справедлива оценка 0(ф!(а(1+Ь)!, 1 О, У, если вхе и — 1 0 =- <р;, ( а+ Ь ~ч , '!р, О,Ф вЂ” 1; О~фи! =а г= (16) пю верна оценка О~ф!~а(1+Ь!»н — ' — ', г=О, А! — 1. (17) Доказательство можно провести по индукции.
При й-0 по условию Ок фа~а. Если неравенство 0(ф (а(1+Ь)'" верно при всех т О, г, то из (14) следу! ет 0(ф!!!~а+Ь,У, а(1+Ь)'"=а(1+Ь)+'. Аналогично са можно убедиться, что из (16) вытекает оценка (17). Продолжим доказательство теоремы 1. Из соотношений (8) для 1Лх!1 с учетом условия (4) имеем ~Ахи!~= 'Я (Ьх е,— Ах ) ( 1 св ,У', (АР„(х, и„) — Ах ) ~ )л!=О и — ! ((1+Е) Я !Ах !+Е ~ ,'Ь !. и=О т=.О и — ! Полагая в (14), (15) а=-Е ~ч~~ ~Ь!), Ь=(1+Е), !р;=1!!х!(, !са получим оценку и — ! )Ах!1~аС! ~', 18!~, Сд=Е(2+Цн, !'=О, М.
(18) !. о НО Из условий теоремы следует непрерывность функций Ф„ Н;„, Нг„по совокупности своих аргументов. Тогда с учетом опенки (18) из выражений (10), (12), (13) заключаем, что остаточный член )с в формуле (!1) имеет порядок о() [Йг] '). Таким образом, в формуле (11) прирашеиия функции первое слагаемое является линейной ограниченной функцией иа );[О, йГ] относительно [аг], а второе слагаемое имеет порядок о(1[йг]~).
Зто значит, что функция (1) при условиях (2), (3) диффереицируема и ее градиент имеет вид (5). 2. Зная формулу градиента, нетрудно расписать методы минимизации применительно к задаче (1) — (3). Например, метод проекция градиента здесь приводит к построению последовательности [иг]л=(иью ..., ил,,) по формулам ил„.,= Р~,. (и;,— а,Ны(хм, гГг„им)), г = О, йг — 1, й = О, 1, ..., где а„) О выбирается, как в З 4 п. 2; [х,]ь = (хыь .
хне), [гр<]л=(гг-г,ю, г)гл-г,л) — решения задач (2) и (7) соответствеиио при [иг]=[иг]л. Приведем достаточные условия для того, чтооы градиеит фуикции (1) при ограничениях (2), (3) удовлетворял условию Липшица. Теорема 2. Пусть выполнены все условия теоремы 1 и пусть функции Ф„рг„, Р „Р;„, Е,"„удовлетворяют условиго Лилшица яо совокупности 7х, и) е= Е" гсУ; с константой Е) О, г = О, У вЂ” 1.
Пусть, кроме того, /гг(х, и)/=Аг+А,(х/; А„А,=сопз1==-0, (19) при всех х е Е", и е= Уи и множества Уг из (3) замкнуты и ограничены в Е', г=О, М вЂ” 1. Тогда градиент функции (1) при ограничениях (2), (3) удовлетворяет условию Диггшица. Доказательство этой теоремы полностью аиалогичио доказательству теоремы 5.2; предлагаем читателю провести его самостоятельно.
3. Используя полученную формулу градиента, выведем необходимые условия оптимальиости для задачи (1) — (3). Теорема 3. Пусть вьтолнены все условия теоремы 1. Пусть [и;„] — оптимальное управление, [хг ] — соответствугогцая ему траектория системы (2), т. е. 1([и,]) = = (п(1 ([ггпу), где нижняя грань берется по всем [иг] из условий (2), (3). Пусть [фг„] — решение задачи (7), сооглвет- 111 ствуюи(ее управлениио [и;л'(.
Тогда необходимо выполняются неравенства (Ны(х;„„~~;„, и;ч), и; — щ,„))0, 1=0, Ф вЂ” 1, (20) при всех и; ~ )'ь для которых направление е= и; — и,,„ является возможным для множества 1~; в точке и;, причем если и; — внутренняя точка множества $'о то (21) Ны(х;„, ф;„, и;,,) =0; функции Н; (х, ф и) опредгляются равенствами (6). Доказательство. Положим в формуле (11) х~= = х;„ф = к)ь„,, и; = и;„; получим и — 1 И= ~ (Н .(х ., ф ., и .), йм>+о(1[Ч1) (22) Пусть и; — произвольная точка из $'о для которой игл + + а(и,— ир,) ен 'г'; при всех а, 0(а(а,. Возьмем в (22) [й„)=(0, ..., О, й; а(и; — и;,), О, ..., 0).
Очевидно, при таком выборе [6„1 управление [и;„Д+ [ЬД ~ У, и в силу оптимальности [и;„] из (22) тогда получим О ~ Ы = (Ны (к;,, яь „ц.,), а (и — и; „)) + о (а !! [йД )1, 0(а(ач. Поделив обе части этого неравенства на а) 0 и перейдя к пределу при а-л-+О, сразу придем к неравенству (20). Если и; — внутренняя точка Ъ'ь то в (20) можно положить ис *и;ч — еН;„(х;„, ф„игч) ~ )г; пРи некотоРом е)0, что сразу приведет к равенству (21). Если ~/;— выпуклое множество, то условие (20), очевидно, выполнено для любого и; ~ Ро Если Р; выпуклы при всех 1=0, 1, ..., йà — 1, то неравенства (20) в силу формулы (5) равносильны одному неравенству ,', Г ([и; 1), [1ц)— — ги; 1),, ) 0 при всех [иД ен У, что совпадает с условием оптимальности из теоремы 2.5. Таким образом, согласно теореме 3 оптимальным может быть лишь управление [и;„) ~ Н, удовлетворяющее условиям (20).
Однако, как связано управление [и„) с экстремальными точками функции Н;(х;„ ф;„ и) на множестве )гь условия (20) на это не дают ответа. В частности, вознякает естественный вопрос: нельзя лн по аналогии е системами с непрерывным временем утверждать, что 1!2 оптимальное УпРавлеиие (иго] УдовлетвоРЯет пРинципУ минимума Н;(х;„ ~;о, и; ) = гп!и Н;(х;„, ор;„, и), 1 = О, У вЂ” 1 инго (23) (чтобы здесь, как и в гл.
6 из 14), можно было говорить о принципе максимума, нужно изменить знаки функций Нь о)л). Ведь необходимое условие оптимальности тем ценнее, чем меньше управлений, подозрительных на оптимальность, оно выделяет. В этом смысле условие (23) явно имело бы преимущество перед условиями (20), так как неравенства (20) могут выполняться не только в тех точках, где имеет место (23), но и в других точках, в которых, например, Нь,(хо„ф;„и;о) = О. К сожалению, оказывается, в управляемых системах с дискретным временем принцип минимума, вообще говоря, не имеет места: на оптимальном управлении функция Н;(х;„, ор;„ и) может и не достигать своего абсолютного минимума по и енГо П р имер 1. Пусть фазовое состояние системы описывается двумя координатами (хь у;), 1=0, 1, 2, причем х;„= х;+ 2ио уьп = — х';+ у; -)- ио 1= О, 1; хо=3' уо=О.
Пусть требуется минимизировать функцию 1 (и„и,) = = — уо = ор (х„у,) при условии [и;) = (ио, и,) (( = = Ки„и,): ) и; ~ ( 5, 1= О, 1). Нетрудно вычислить явное выражение ( (и,, ио) = 3 (и,-+ 2)' — и',-+ 6. Отсюда следует, что оптимальное управление (и,о, и„) имеет вид: и,о = = — 2, и„=5 (возможность и,„= — 5 предоставляем читателю рассмотреть самостоятельно). Оптимальная траектория тогда такая: х,„=З, х,о= — 1, х„=9; у,о=О, у,о = — 5, у,„= — 19; минимальное значение функционала равно 1„= — 19.