54676_47af5332d12a983f86c22596d809b788 (842909), страница 8
Текст из файла (страница 8)
Если(3.19)зависит явно от и, то оно играет роль совместного ограничения на управляющие и фазовые переменные, аналогичногоравенствучить(3.18)(3 .18)одну(3.11).изОднако в этом случае следует либо исклюкомпонентчерез остальные (п- 1)х,выразивраз(3 .19)ееспомощьюкомпонент, либо присоединитьв качестве граничного условия точкахЕсли же выражениеещевектораt = t0илиt = tk ·не содержит явно и, то его можнопродифференцироватьиподставитьусловиех = f(x,u,t). Эту процедуру можно повторять до тех пор, покаполученное выражение не будет явно зависеть от и.
Если явная зависимость от и получится после /-кратного дифференцирования функцииSпо временито соотношениеt,(3.18)будем называть ограничением l-го порядка типа равенства, наложенного на фазовые переменные. В этом случае l-я полнаяпроизводная по времени от функцииSиграет роль ограничения на управляющие и фазовые переменные, аналогичногоусловию вида(3 .11):d S(x,u,t) =Оdt1•1(3.20)Кроме того, в этой задаче необходимо либо исключитьпонент вектора х, выразив их через остальныеэтого вектора с помощью системы изlком( п - l) компонентl уравненийS(x,t) = О;dS(x,t)dt= О·1ds1- (x,t)dtl-1либо рассматривать системуные условия в точке72t = t0(3 .21)(или'=(3.21)0'как дополнительные граничt = tk ).3.5. Методфункции штрафовЧасто встречаются задачи, в которых на управляющее воздейIствие ui{t) наложено ограничение вида и i(t)1~ uimaxпри uimax > О.Приближенно эти ограничения можно учесть, вводя соответствующие функции штрафа.
Точный подход учета таких ограничений разработан Валентайном.Идея метода функции штрафов заключается во введении таких дополнительных членов в минимизируемый показатель качества,которыепринарушенииограничений,наложенныхнауправляющие воздействия, приводят к существенному увеличению значения функционала. После того как такие члены введены,задача оптимизации решается без учета ограничений.В качестве примера рассмотрим задачу, в которой траекториядля х=f(х, и,t),соединяющая точки х 1 и х2 , должна быть найдена так, чтобы минимизировать показатель качестваtkJf= L(x,u ,t)dt.toДопустим, единственное управляющее воздействиено удовлетворять ограничениюu(t)долж- 1 :::; и :::; 1.При образовании функции штрафа рассмотрим новый показатель качестваtkJ1f= J + g(u)dt,toгдеg(и) -при l и(t)Iфункция штрафа: малая, если lи(t) I< 1,и значительная> 1.После этого ищется решение, которое минимизирует функционалJ 1 уже без учета ограничений.Метод функций штрафа особенно полезен в некоторых численных схемах нахождения оптимальных решений.В1937г.
Валентайн показал, что введение некоторых дополнительныхпеременныхпреобразуетограничения типанеравенств, налагаемые на управляющие воздействия, в ограничениятипа равенств .Допустим, что в системе хпонент щ, J= 1, ... , r,= f( x , и, t)содержится r комна каждую из которых наложено ограничение вида73(3 .22)Неравенства(3.22)можнопреобразоватьограничений типа равенств, если ввестиrвсовокупностьдополнительных пере(t); j = 1, ... , r, и предположить,времени t, t0 ::; t ::; tk, выполняется условиеменных v1что в каждый момент(3.23)гдеv1 (t) -переменная, которая стремится к нулю, еслиu/t)достигает любого из своих пределов: и J min или и J max; когда щ(t)располагается между этими пределами, переменная v1 (t) являетсяконечной величиной, например, при щ(t) = О v/t) имеет значение.Jи jminu jmax.Поскольку функции v1 (t), определенные по соотношению (3.23),образуют ограничения типа равенств, то найти уравнения Эйлера Лагранжа не представляет труда.
В частности, можно ввестидополнительных переменныхXn+r + jXn+r+1, ..• , Xn+2r,таких что= V j (t) ,} = 1, ... , r.Кроме того, можно определитьr величинC.(u.)=(u.+u.· )(и.1max -u.)-v~=O,J JJ1mmJJr(3.24)С/щ) как1·=1, ... ,r.(3 .25)Таким образом, можно ввести в дополнение к обычным множителям Лагранжаp(t) другие r множителей µ1 (t) , ... , µr(t) иобразовать функциюrLi =L+ Lµ JCJ,(3.26)J=lа также функцию ГамильтонаrH=L+pTJ+ Lµ JCJ'J=lиспользуя которую нетрудно получить уравнения Эйлерагранжа.74-ЛаТак как функции и1(t)могут иногда достигать своей верхнейили нижней границы на конечном отрезке времени, синтез на основе вариационного исчисления становится довольно сложным.Валентайн,однако,показал,чтонеобходимыеусловияпопрежнему выполняются всякий раз, когда задача остается невырожденной.
В частности, условие Вейерштрасса непосредственноприводит к принципу максимума Понтрягина.3.6.Ограничения в виде неравенствна управляющие переменныеПусть вместо ограничения типа С( и, t)=О в виде равенствазадано подобное ограничение в виде неравенстваС(и,*Если определить Н =t) ~ О.т -L + р f, то(3.27)вариацию критерия качестваможно записать так:tk8J =аныkf ди 8udt= f 8Н* (х, р, и, t)dt,toгде р(3 .28)toопределяется по уравнению--=-трдL-т=- - -рдi8/-(3.29)дiпри(3.30)Предполагается, что конечное времяtk фиксировано, а терминальные ограничения отсутствуют.Если управление и (t) минимизирует критерий качества, то длявсех допустимых значений8u(t) должнобыть8J ~О.Отсюда75следует, что 8Н* ~ О для всех t и всех допустимых 8u(t).
Такимобразом,С(и, t) ~ О,вкаждойточке,удовлетворяющейусловиюоптимальное управление и обладает следующимисвойствами:8Н* = дН* 8и ~О;8С= дС 8и~О.ди(3.31)диДругими словами, это означает, что величина он* не должнаулучшаться при любой допустимой вариации 8и .В действительности справедливо более сильное утверждение, что функция н* должна быть минимизирована (максимизирована функция -Н*) на множестве всех возможных значенийи.Эта формулировка известна как принцип максимумаЛ.С.
Понтрягина. Сейчас обсуждается частный случай задачи,когдаотсутствуюттерминальныеограничения ивариацииявляются слабыми.Если определить гамильтониан системы следующим образом:Н=L+ рт f+µС,(3 .32)то необходимое условие экстремума функции Гамильтона Н будет иметь вид(3.33)Уравнение(3.33)совпадает с уравнением(3.13),определяющим условие оптимальности в задаче с ограничением в виде равенств, причем в данном случае дополнительно требуется, чтобымножитель принимал следующие значения:~ О, если С = О;(3.34)µ { = О если С :;t: О.'Положительный знак множителяµ при С=О может быть интерпретирован как требование, чтобы производная по определению76дН* лдL-Т дfди = ди + р дибыла такой, при которой лучшее значение Н * могло быть достигнуто только за счет нарушения ограничений.При расширении рассматриваемого класса задач можно ис-пользовать как гамильтониан н*, так и расширенный гамильтониан Н. Переход от одной функции к другой не вызывает затруднений .Если оптимальная траектория состоит из участков, одни из которых лежат на границе допустимой области ( Свнутри допустимой области(С <=О), а другие-О), то эти участки должны бытьсостыкованы так, чтобы были удовлетворены все необходимыеусловия.В точках стыковки управление и может быть как непрерывным, так и разрывным.
Если управление разрывно, то точка стыковки называется угловой. Такое название возникло из-за разрывности производных по времени нескольких или всех фазовыхкоординат.Угловой точкой может оказаться любая точка, но более вероятно, что это будет точка соединения участков траектории, а непромежуточная точка, лежащая внутри допустимой области.В действительности отсутствует метод, с помощью которогоможно было бы априори установить существование угловыхточек.Рассмотрим пример минимизации траектории нормы при нали-чии мягкого(f llиll2dt <С)и жесткого (lи(t)I::;; 1) ограничений.Пусть необходимо минимизировать критерий качествапри условияхх = g(t)u,гдеg(t) -заданная функция времени;77lиU)I::;; 1,т.
е.-1::;; u(t)::;; 1 или -1 -и::;;О,-1::;;иО.Гамильтонианы системы имеют следующий вид:н* = .!.llиll2 + pgu;2Н = _!.ll и ll 2 + pgu + µ 1 (и -1) + µ 2 (-и -1).2Необходимые условия оптимальности.р-ан*- 0'-- --ахоткудаp(t) = р(Т) = а х(Т),2ан*-аи= и + а 2 g(t)x(T).При этом должны выполняться такие условия :ан*1) если ди > О, то необходимо выбрать и0пг= -1(чтобы бьшоан*-- 8и ~ О для всех допустимых 8и, удовлетворяющих lи(t)I::;; 1);диан*2) если - - = О,ди3)еслиан*- - < О,дито-1 <и0пг < 1;то и0пг=+1.ан*Так как - - = и + а 2 gx(T), из приведенных условий следуетди-1 при -1 + а 2 gx(T) > О, т. е.
при а2 gx(T) > 1;И0пг = + 1 при 1 + а 2 gx(T) < О, т. е. при а 2 gx(T) < -1;2ан*-а gx(T) при = О и -1::;; a2 gx(T)::;; 1.ди78На рис.3 .2показана типичная программа оптимального управления с ограничениями типа насыщения и на расход энергии .ИоптРис.3.2. Типичная программа оптимального управления при наличииограничения типа насыщения и ограничения на расход энергииТипичное изменение множителейµ1(t)иµ 2 (t) длязадачи сограничением типа насыщения и ограничения на расход энергииµ1 (t) =µ2(t){О=показано на рис.µ(t)-[1 + а 2 g(t)x(T)], t 1 ~ t ~ t2 ;для остальных моментов времени;[-l+a 2 g(t)x(T)], t3 ~t~t4 ;{Одля остальных моментов времени3.3.µ i(t)Рис.
3.3. Типичное изменение множителейµ1 (t)и ~ (t) для задачис ограничением типа насыщения и ограничения на расход энергии79Итак, уравнения Эйлера выведены для условий, когда режимные ограничения отсутствуют. Учет ограничений в форме равенств в классическом вариационном исчислении возможен с помощью известных множителей Лагранжа.При наличии ограничений в форме неравенств должны дополнительно соблюдаться так называемые уравнения трансверсальности, которые отражают условия наилучшего сопряжения линийоптимального режима (экстремалей) с линиями режимных ограничений в зонах, где сказываются режимные ограничения в форменеравенств. Число уравнений трансверсальности равно числу указанных точек сопряжения экстремалей, поэтому в сложных задачах число уравнений трансверсальности может быть очень большим.