Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 87
Текст из файла (страница 87)
Из условия электрической прочности напряжение, подводимое к цепи якоря, должно быть ограничено: !и„(< А. 470 Методы тео ии оптимального п авления. Часть 111 Рне. 2.!. К постановке залачн оптннального управленна гй, — = г (Хи Хз,..., Х, Ии Из,..., И ), ! = 1, Л, или векторным уравнением (2.1) б'х — = Г(х, и), й здесь х =(х,,к„,..,х„) и г =(7,, У2,...,7„') — п-мерные векторы, н =(и„из,...,и )— и-мерный вектор управления. Вектор х называют фазовым вектором системы, или вектором состояния.
Будем полагать, что вектор управления и может принимать свои значения из некоторого множества У . В отличие от множества, рассмотренного в параграфе !.5, У может быть любым множеством и-мерного евклидова пространства, например, оно может состоять нз совокупности изолированных точек. На рис. 2.2 при лг = 2 изображен пример множества У, состоящего из четырех изолированных точек. В этом, кстати, заключается существенное отличие принципа максимума от вариационного исчисления (см. З! .5).
Из-за принятого способа построения вариаций в вариационном исчислении У может быть только областью в классическом смысле этого слова, т.е. когда оно удовлетворяет свойству связности. Будем предполагать, что в уравнениях (2.!) функции !; (г =!,п) непрерывны по всем своим переменным и непрерывно дифференцируемы по переменным х О = 1,и).
В качестве допустимых управлений рассматриваются кусочно- непрерывные функции и„(г) (и =1,гл), удовлетворяющие условию и (г) н У. Пусть требуется осуществить поворот вала двигателя на некоторый заданный угол. Интуитивно ясно, что существует бесконечное множество функций и„(г), которые решают поставленную задачу, т.е, обеспечивают поворот вала двигателя на заданный угол. Но тогда естественно поставить еще одну задачу: среди функций и„(г), решающих первую задачу, найти наилучшую в каком-либо смысле, например, осуществляющую поворот на заданный угол за минимально возможное время или с минимальной затратой энергии. Сформулируем задачу оптимального управления.
Рассмотрим объект или процесс, который описывается системой дифференциальных уравнений Глава 2. П инцип максим а Пон агина 471 Рне. 2.2. П раме р множества 0 Векторное пространство с декартовыми координатами х>,хз,...,х„будем называть фазовым пространством системы (2.1) и обозначать Х. Каждому вектору х в фазовом пространстве соответствует некоторая точка (фазовая точка). Если задан векгоР ц(1) и начальное Условие х(1о) = х =(х>,хз,...,х„), то системУ УРавнений о о о о (2.1) можно решить. Разным вектор-функциям ц(1) будут соответствовать различные решения х(1) уравнений(2.!), т.е. выбором вектора ц(1) можно управлять движением системы. Решению х(1), 1! <1<1,, в фазовом пространстве Х соответствует некоторая линия, которая называется фазовой траекторией системы.
Пусть в фазовом. пространстве Х заданы две точки х =(х,,хз,...,х„) и о о о о х =(х„хз,...,х„). Рассмотрим следующую задачу. требуется среди допустимых ! ! ! ! управлений ц(1), 1о <1<1>, те. кусочно-непрерывных вектор-функций ц(1)ес! (мо.не><ты >о и 1! не фиксированы), переводящих фазовую точку системы (2.1) из заданного начального положения х (х(1о)=х ) в заданное конечное положение х о о ! (х( 1!) = х ), найти управление и траекторию, доставляющие минимум функциона>у ,> =) 1о(х>,хз,...,х„,и>,из,...,и„)с(1.
>» Управление ц(1) и траектория х(1), решающие поставленную задачу, называются (2.2) рывными по всем своим переменным. оптимальными. Выбором функции А(х,ц) функционалу (2.2) можно придавать различный физи- ческий смысл. Если, например, функция А(х,ц) задает секундный расход топлива, то функционал (2.2) выражает общий расход топлива, затрачиваемый на движение от точки х до точки х'. Ниже особое внимание уделяется частному случаю, когда До = 1.
В атом случае функционал >> .1 =) >11=1,-1, (2.3) >» задает время движения. Управление и траектория, минимизирующие функционал (2.3), называются оптичольными по быс>продействию. дДо(х, ц) Будем предполагать, что функции А(х,ц) и ' (> = 1,п) являются непредх, 472 Методы тео ии оптимального п авления. Часть 1П 2.1.2. НЕОБХОДИМОЕ УСЛОБИЕ ОПТИМАЛЬНОСТИ Введем (и+1)-мерный вспомогательный вектор у(г)=(уо(г), у,(г),..., ~рп(г)), определяемый уравнениями: — =О, ЕЧ'о дг (2.4) сй~,,~ д7,,(х,и) аг,, д», Если задано управление и(г), начальная точка и, в соответствии с уравнениями (2.1), определена траектория х(1), то система уравнений (2.4) принимает вид — =О, аМо аг (2.5) г(Ч~,(г) чп 4~,(х(г),и(Г)) =-з ~р, ' ',1=1,п, Н(Чг,х,и) = ~у,Л(х,и).
ю=о Функцию Н(Чг, х, и) называют функцией Гамильтона. Непосредственной проверкой убеждаемся, что уравнения (2.4) могут быть записаны в виде — =О, иЧ'о Й с1у, дН(~р, х,и) , (=1,п. Й д», (2.7) Аналогичным образом можно показать, что уравнения (2.1) могут быть записаны следующим образом; гз», дН(ц, х, и) о'1 дЧ/, При фиксированных Чг и х функция Н(у,х,и) становится функцией вектора управления и .
Обозначим М(Чю,х)= вир Н(Чг,х,и). ьеп Если точная верхняя грань значений функции Н(Чг,х,и) как функции вектора и достигается в некоторой точке, принадлежащей множеству ЕГ, то зир Н(Чг,х,и) = шах Н(Чг,х,и). ныг ьчи Теорема 2.1 (принцип максимума Понтрягина). Пусть и((), го < г < Ь вЂ” допустимое управление, а х(г) — соответствуюгцая ему траектория, переводяи1ие фазовую точку х системы (2.!) из заданного начального положения х в заданное коо печное положение х~, так что х(зо) = х, х(Ь) = х1.
Если и(Г) и х(Г) — оптимальное т.е. является системой линейных однородных уравнений. Из теории дифференциальных уравнений известно, что такая система при любых начальных условиях имеет единственное решение, причем функция у(1), являющаяся решением уравнений (2.5), непрерывна по г. Введем функцию Глава 2. П инцип максим ма Пон ягина 473 (2.12) ЧП и ннс управление и оптимальная траектория, то найдется непрерывная вектор-функция це(Е), удовлетворяюиЕая уравнениям (2.7), что: 1) в каэкдый момент времени е, ее, < е <ею функция н(це(е), х(е),ц), рассматриваемая как функция переменного и, достигает в точке и = н(е) максимума Н(че(е), х(е), ц(е)) = М(че(е), х(е)); (2.8) 2) выполнено условие нетривиальности решения системы уравнений (2.7) че(е) е 0; (2.9) 3) в конечный момент времени е, че (е,)<0, М(ц (е,),х(е,))=0. (2.1 О) Можно показать (см.
параграф 1.5), что если выполняются соотношения (2.7) и (2.8), то функции цеь(е) и М(це(е), х(е)), рассматриваемые как функции времени е, постоянны. Поэтому соотношения (2.10) можно проверять не обязательно в конеч- ный момент времени е!, а в любой момент времени е н(ее,е!). Отметим, что теорема 2.1 задает необходимые условия сильного минимума функ- ционала (2.2) в рассматриваемой задаче на условный минимум. Доказательство принципа максимума в том обшем виде, как он сформулирован выше, в работе не приводится.
Однако, если множество У задайтся неравенствами )и (<А, е'=1,т, (2.1 1) то практически все условия теоремы 2,! следуют из рассмотренной в параграфе 1.5 задачи Майера вариационного исчисления. При этом вектору це =(цев,цен...,це„) в задаче Майера соответствуют множители Лагранжа Ль,Х,,...,Х„(уравнения (2.4) совпадают с уравнениями (1.75)), функции Н(це,х,ц) — функция Н1().в, Х,,..., Л„, иняз,..., ии). Некоторые дополнительные условия, которые имеются на первый взгляд в задаче Майера, представляют собой подробно записанное (с применением множителей Лагранжа) условие максимума функции Не .
Отметим далее; как пока- зывает анализ приведбнного в параграфе! .5 вывода необходимых условий минимума функционала, его можно повторить практически при любом способе задания области У . Необходимо только, чтобы (Е была областью в классическом смысле этого сло- ва, т.е, удовлетворяла свойству связности. Единственное отличие теоремы 2.1 от условий оптимальности, приведенных в па- раграфе 1.5, заключается в следуюшем: в соответствии с теоремой 2.! цее(е) = сопя < О, а в задаче Майера Хв(е) = -1. Однако зто отличие не столь сущест- венно. Теоремой 2.1 вектор це(е) зададтся с точностью до произвольного постоянно- го положительного множителя.
Действительно, легко установить, что если следую- щие функции ер(е), х(е), ц(е) удовлетворяют условиям теоремы 2.1, то и функции )ар(Е), х(Е), ц(Е), где к = сопя! > О, также удовлетворяют условиям теоремы 2.1. По- этому при е!еь(е) в0 всегда выбором к можно добиться выполнения соотношения цев(е) = -1. Отметим, что ситуация, когда цее(е) = О, встречается редко и связана с понятием анормальности вариационной задачи (5].
Получим из теоремы 2.1 необходимые условия оптимальности в задаче на быст- родействие. Положим 7в =! . Тогда функция (2.6) принимает вид л Н(Це, х, н) = Цг в + ~ Че,7, (х, ц) . гм 474 Методы тео ин оптимального п веления. Часть 1П Введем и-мерный вектор цг =(ц!!,ц!з,...,ц!,) и функшоо ь Й(цг,х,о) =~ цг,7;(х,а). ~м В соответствии с уравнениями (2.7) вектор ц! (г) задавтся уравнениями —, (! =1,и) . с(ц!, дй(цю, х, и) ф дх, (2.13) (2.14) Обозначим М(!р,х) = знрЙ(цг,х,н) . ььо Из (2.12) и (2.13) следует, что если М(цю,х) = Н(цг,х,и ), то М(цю,х) = Й(цю,х,в ) . Пусть н(г) и х(г) — оптимальные по быстродействию управление и траектория. Как следует из (2.8), (2.10), (2.12) и (2.13), в этом случае Й(цз (г), х(г), н(г)) = М(ц! (г), х(г)) = М(ц! (г), х(г))-ц!о = -ц!о > О.
Полученный результат сформулируем в виде ешв одной теоремы. Теорема 2.2 (аринина максимума в задачах на быстродействие). Пусть п(г) и х(г), гь < ! ьг!, — допустимое управление и соответствующая ему траектория, пе- реводящие фиговую точку из заданного начального положения х в заданное конеча ное положение х . Если управление п(Г) и траектория х(Г) являются оптимальны! ми по быстродействию, то найдется непрерывная вектор-функция ц! (г) = (цю! (1), ц!з (г),..., ц!„(г)), удовлетворяющая уравнениям (2.14), что: 1) в каждый момент времени г, гв < г < г!, функция Й(ц! (г), х(г), н), рассматриваемая как функция переменного и, достигает в точке ц = н(г) максимума Й(цг(г), х(г), н(г)) = М(цг(г), х(г)); (2.15) 2) выполнено условие нетривиальности решения системы уравнений (2.14) цю(г) в О; 3) в конечный момент времени г, М(цю(г!),х(Г!)) > О, (2,16) Как и в случае теоремы 2.1, отметим, что если выполнены соотношения (2.14) и (2.! 5), то функция М(ц!(г), х(г)) постоянна.
Поэтому соотношения (2.16) можно про- веРЯть в любой момент вРемени г н 1гь,г!1. Проанализируем теорему 2.1. Покажем, что она содержит «полную систему усло- вий», т.е. число условий совпадает с обшим числом неизвестных. При решении задачи необходимо найти п функций х,(г), (и+ 1) функций ц!,(г) и т функций и,(г), т.е. всего 2п+! + т неизвестных функций. Для определения ука- занных функций можно воспользоваться и, уравнениями движения (2.1), (и+1) уравнениями (2.7) и т условиями максимума (2.8). Условия максимума (2.8) позво- ляют в каждый момент времени г определить управления и (г).