Понтрягин Л.С. - Принцип максимума в оптимальном управлении - 2004, страница 5
Описание файла
DJVU-файл из архива "Понтрягин Л.С. - Принцип максимума в оптимальном управлении - 2004", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 5 - страница
Следовательно, управление и(1) не является оптимальным в отношении функционала 1. Итак, оказывается, что если отрицательное направление оси уо со. держится внутри конуса С, то управление и(1) не оптимально. Теперь мы рассмотрим случай, когда отрицательное направление оси уо не лежит внутри конуса С. М) Предположим, что отрицательное направление оси ув ие лежит внутри конуса С. Тогда существует гиперплоскость Г, отделяюшая конус С от отрицательной полУоси Уг (см. Н) $5). ПУсть фо, фь ..., ф,— кооР- динаты гиперплоскости Г, причем знак нх выбран так, что конус С лежит в отрицательном полупространстве атой гиперплоскости Г, а отрицательная полуось уе — в положительной части. Пусть М вЂ” некоторая вариация Макшейна и а — некоторое действительное число такие, что, применяя вариацию У(М, а), мы получаем управление и'(1), для которого ф(У(М, и) ) лежит в конусе С.
Тогда (ф(У (М, а)), Ф) ч,, О. Перенося вектор ф из момента времени 11 в момент времени 1, являющийся точкой непрерывности управления и(1) (см. А), В) $4), получим (о(1(х(1), и) — гт(х(1), и (1))), ф(1)) ~О для одночленной вариации Макшейна М(1; о; о; е). Переписывая последнее соотношение в терминах функции К, получим К(х(1), Ф(1), о) <К(х(1), ф(1), и(1)), т. е. К(х(1), Ф(1), и(1))) К(х(1), ф(1), э). Таким образом, мы доказали принцип максимума для точек непрерывности управления и(1). Для точек разрыва управления и(1) принцип максимума получается при помощи предельного перехода.
Таким образом, теорема ( доказана. Сформулируем теперь дополнение к принципу максимчма. Д о п о л н е н и е к п р н н ц и п у м а к с и м у м а. Д'ля оптимального управления и(1) и соответствующей ему траектории х(1) существует такая гиперплоскость Г (см. М)), (проходящая через точку х(11), с координатами ф(1,) =(ф,(1,), ..., ф„(1,)), что (1(х(11), и(11)). ф(1~))=0, т. е. К(х(1~), ф(1~), и(1,)) =О. Последнее равенство выполняется для лроизволоиого 1, т, е. К (х(1), ср(1), и(1)) во О. Кроме того, сро(1) — нелоло. жителоная постоянная величина. Докажем зто утверждение. Поскольку вектор а/(х(1,), и(1,)) лежит в конусе С, то выполняется неравенство (см. М)) (аф(>с(11), и(1с)), ф(1~)) = аЦ(х(1,), и(1~)), сз(1~)) ~(0.
а так как а может принимать значения обоих знаков, то (7(х(1,), и(1,)), т(1,))=0, т. е, К (х(1,), 4 (1,), и (1,)) = О. Покажем теперь, что функция К(1) = К(х(1), Ф(1). и(1)) постоянна. Пусть 1о (1о ( 1о (1с, причем иа полуинтерввле 1о (1( 1о функция и(1) непрерывна. Докажем, что на этом полуинтерваяе функция К(1) постоянна. Возьмем две произвольные точки то и т~ полуинтервала 1о (1 = 1о. В силу (9) гл. ! имеем К(х(то), сР(то), и(то)) — К(х(то), сР(то), и(т,)) ~ О, — К(х(т~), Ф(т,), и(т))+К(х(т,), ф(т,), и(то))~(0. Прибавляя к обеим частям этих неравенств разность К(т1) — К(то), получим неравенства — К(х(т,), ср(то), и(с,))+ К(х(т,), ср(т,), и(т,)) в" ~К(т,) — К(то) ~(К(х(т,), ф(т,), и(т,))— — К (х (то) Ф (то) и (т,)). (17) Далее, так как функция К(х(1), ср(1), и(т)) переменного 1 на отрезке 1о ., 1( 1о непрерывна и имеет производную, равную нулю в точке 1 = т в силу (7), (8) гл.
1, К (т1) — К ( со) то ! ' 1 ') стремится к нулю при т1 — то-о-О. Слес| — то довательио, функция К(1) имеет производную, равную нулю в каждой точке т интервала 1о (1( 1о. и потому К(1) = сопэ( на полуинтервале 1о ( 1.Я. 1о. Пусть то — точка разрыва функции и(1). Докажем, что, тем не менее, функция К(1) непрерывна в ней, т. е. докажем, что К(то) = К(то 0) = К(то+ 0). ЗО (Величины К(то — 0), К(то+ 0) сушествуют, так как по условию существуют пределы слева и справа и(то — О), и(то+0).) Равенство К(то) = К(то — 0) выполняется в силу определения из А) $1.
Докажем равенство К(то) = К(то+ 0). Из условия (9) гл. 1 вытекает К(то) =К(х(то) Ф(то), и(то)) ~> ~К(х(то) ф(то), и(то+0)) К(го+0). Для доказательства обратного неравенства предполо- жим, что точка т~ стремится к то справа. Тогда К(х(т,), $(т,), и(т,))-~К(то+ 0). К(х(т,), с$>(т,), и(то — 0))- К(то — 0), причем для всех т~ в силу условия (9) гл.
1 имеем К(х(т,), ф(т,), и(т,))) К(х(т1), ор(т,), и(то — 0)), следовательно. К (то + 0) о К (то — 0). Из доказанного вытекает постоянство функции К(х(1), орО)), и(1)) иа всем отрезке 1о (1( 1ь а так как в конце отрезка она равна нулю, то функция зта равна нулю всюду, Из системы уравнений (8) гл. ! следует, что чоо О, так как К(х, оР, и) не зависит от хо, так что фо — посто- янная величина. Пусть е = ( — 1, О, ..., 0) — вектор, направленный по оси ро в отрицательном направлении.
Тогда произведе- ние (е, ор) неотрицательно, (е, о~Д) О, так как вектор ор разделяет отрицательную полуось уо и конус С и направлен в противоположную от С сто- рону. Следовательно, фо(11) ( О. ГЛАВА 4 ЗАДАЧА БЫСТРОДЕЙСТВИЯ Пусть К" — и-мерное евклидово векторное простран ство, так что вектор х~ Р" записывается в виде х=(х', хо, ..., х").
Допустим, что в пространстве Р" задана управляемая система (см. $1) х'=~'(х', к', ..., х", и), ионЫ, или, в векторной записи, х = г (х, и), и ен о). Предположим, что существует управление и((), пере- водящее вектор хо в вектор хь т. е. уравнение имеет решение х(г), удовлетворяющее условиям »®=хо, х(~,)=х, для некоторых значений 1о ( Гь Тогда возникает задача: найти такое управление и'(1), для которого переход из состояния хо в состояние х, происходит за кратчайшее время. Это и есть задача быстродействия. Для задачи быстродействия функционал ь записы. вается в виде т. е. функция (о(х, и) определяется соотношением ~о (» «) — 1 Таким образом, функция К(х, ~Р, и) в задаче быстро действия записывается в виде К(х, ~р, «)=з~о+ф.~'(х, и), а=1, ..., п.
А) Положим Н (х, ~~, и) = ф г (х, и), а = 1, ..., п. Тогда функция К записывается в форме К(х, ор, и) =фо+ Н(», ф, и), условие максимума (см. (9) гл. 1) принимает вид Н(х(Г), ор(Г), о) <Н(х(0, Ф(Г), «(Г)), а системы уравнений (7) и (8) (см. гл. 1) получают внд дН[», Ф, я) оФк дН(», Ф, и) (3) д»~ Из дополнения к принципу максимума следует, что функция ~р (1) — ненулевая. Это и есть принцип максимума для задачи быстро. действия. $ 9.
Линейная задача быстродействия Задача быстродействия называется линейной, если управляемая система (1) записывается в следующем простом виде: »=А»+ и, (4) а множество ь), которому принадлежит управление и, является выпуклым многогранником пространсгва Р". Здесь А есть линейное отображение пространства Р" в себя илн, в случае координатной записи, А является квадратной матрицей порядка п, а х — одностолбцовая матрица высоты и.
В линейном случае уравнение (3) переписывается в виде Ч»= — ~1 А, (б) где справа стоит произведение однострочной матрицы ф длины и на квадратную матрицу А порядка и. Для получения некоторых результатов характера единственности мы будем налагать на управляемую систему (4) нижеследующие условия В) и С), роль которых выяснится в дальнейшем. В) Пусть тв — некоторый вектор из Я", имеющий направление какого-либо из ребер многогранника й; тогда вектор в не принадлежит никакому истинному подпространству пространства Р", ияварнантному относительно оператора А. Условие это равносильно тому, что векторы ~»-1 (б) линейно независимы.
В самом деле, если бы существовало истинное подпространство Ф пространства К", инвариантное относи- зз тельно А, то все векторы (6) принадлежали бы пространству й н, следовательно, были бы линейно зависимы, так как й имеет размерность меньше и. Напротив. если бы векторы (6) были бы линейно зависимы, т. е.
если бы имело место соотношение сои+ с,Аю+ ... + с„,А" 'а~ =О, (7) то, выбирая наименьшую степень р, входяшую в соотношение (7), мы нз последнего соотношения (7) получили бы А |в=бр,А 'а~+... +Ьоа~, н векторы тв, Атс, ..., Аа-'тв все содержались бы в некотором истинном подпространстве й размерности р, ннвариантном относительно оператора А.
С) Выпуклый многогранник й содержит начало координат О ен 1с" и не состоит только нз нуля. В линейном случае функция Н(х, ф, и) записывается в виде Н(х, Ч, и)=чАх+(ф, и). (8) Здесь фАх представляет собой произведение трех матриц, где ф есть однострочная матрица длины и, А— квадратная матрица порядка л, х — одностолбцовая матрица высоты и, а скалярное произведение (фи) = фи есть произведение однострочной матрицы ф на одно- столбцовую матрицу и. Из формулы (8) следует, что функция Н(х, ф,и) переменного и достигает своего максимума вместе с функцией (ф,и). Максимум функции (ф,и) переменного и при заданном ф обозначим Р(ф). Из условия С) следует, что величина Р(ф) неотрицательна: Р (ч) :в ').
В силу принципа максимума (см, А)) оптимальное управление и(1) должно быть выбрано так, чтобы функ* цня Н(х(1), ф(1), и), как функция переменного и, достигала своего максимума при и = и(1). А зто значит, что оптимальное управленне и(1) удовлетворяет условию (ф(1), и '1)) = Р(ф(1)).
(9) 1)) Рассмотрим линейные системы уравнений (10) и ч = — 1А. (11) Решения уравнений (!0) и (11) тесно связаны между собой. Именно, если х = х(Е) есть решение уравнения (10), а ~1=зр(Е) — решение уравнения (11), то скаляр- ное произведение (ф(Е),х(Е)) постоянно: (Ф (Е). х (Е)) = Ц> (Е) х (Е) = сопз1. (12) Для доказательства етого продифференпируем ска- лярное произведение (ф(Е),х(Е)).
В силу уравнений (10) и (11) получаем †,"„ (4: (Е), х (Е)) = ((р (Е), х (Е)) + (ф (Е), х (Е)) = = — 4> (Е) Ах (Е) + Ф (Е) Ах (Е) = О. Пусть у,(Е)= (у,'(Е), ..., у",(Е)), Е=1, ..., п, (13) — фундаментальная система решений уравнения (10), удовлетворяющая начальным условиям (ЕЕ(Е,) = Ь|, а ф'(Е)=(ф,'(Е), ... ф'(Е)), Е=1, 2, ..., и — фундаментальная система решений уравнения (11), удовлетворяющая начальным условиям ф,'(Е,) =б,.
Тогда мы имеем 'Ф' (Е) ЕЕЕ (Е) = б' (14) при произвольном Е. Действительно, при Е = Ее равенство (14) имеет место„ а, следовательно, в силу соотношения (12) оно выполняется для произвольного Е. Е) Решим уравнение х = А» + и (Е) (15) при помощи вариации постоянных, исходя из фундаментальной системы (13). Именно, пусть х (Е) = у, (Е) с" (Е) а = 1, ..., и, — решение уравнения (15). Подставляя это решение в уравнение (15), получаем ЕЕ. (Е) 5 (Е) = и (Е).