XV Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление (1081425), страница 23
Текст из файла (страница 23)
Подставляя преобразованное выражение в (6.38), получаем ((д — р~)()' (х,д,д) — 1,;~(х,д,д))) =О. Снова применим теорему, Лагранжа: ((д' — у')(а — д')~„",„,(х,д,д~)) = О, (6.39) где у; . некоторое число между д и д'(а). Если ~„",„, (а, д(а), у) у'= у'= О для значений д между д'(а) и у'(а), то из равенства (6.39) вытекает, что д'(а) = ~р'(а), так как равенство д = д'(а) в силу теоремы Лагранжа невозможно при д~(а) у- ~о~(а).
Таким образом, при достаточно общих предположениях об интегранте функционала (~",„,(х, р(х),д) ф О при любом д) график функции д(х) в точках сопряжения касается графика функции р(х), или, другими словами, производная функции д(х) должна быть непрерывной. Условие непрерывности производной функции дает дополнительные уравнения, необходимые для определения зкстремалей. Пусть, например, решается зада~а (6.36), (6.37) в классе функций д(х) Е С' (хм хе] с фиксированными значениями на 6.3. Некоторые задачи е ограничениями 181 концах у(х1) = ун у(хз) = уэ.
Предположим, что график искомого решения включает в себя один участок границы у = ~р(х) (см. рис. 6.4). Если найдено общее решение уравнения Эйлера и тем самым получено уравнение семейства экстремалей для функционала задачи, то для построения решения нужно определить: — абсциссы о, и 6 точек сопряжения графиков экстремалей с границей множества допустимых значений: — две постоянные интегрирования на левом участке, соответствующем экстремали; две постоянные интегрирования на правом участке, соответствующем экстремали. Всего имеются шесть неизвестных, для определения которых нужны шесть уравнений.
Два уравнения это краевые условия у(х1) = ум у(хз) = уз. Два уравнения вытекают из непрерывности искомой функции в точках сопряжения: у(а) = ~р(а), у(д) = ~р(6). И два уравнения это условия непрерывности производной функции у(х) в точках сопряжения; у~(а) = ~р (а), у (6) = ~р (6). Пример 6.2. Найдем кривую наименьшей длины, соединятощую точки А(а, ул) и В(Ь, ун) П: .
-.-,В и не заходящую внутрь круга Р Л (рис. 6.6). М' Формально ограничение в по- О о 6 х ставленной задаче не относится к тому типу ограничения (6.37), которое мы рассмотрели. Однако отметим., что в приведенных выше рассуждениях, главным в которых был анализ точек сопряжения, используются только локальные свойства функции ~р(х).
Поэтому все полученные результаты будут верны и в данной задаче. В поставленной зада зе в предположении, что искомая кривая является графиком функции, функционал можно записать 182 6. ВЛРИЛЦИОННЪ|Е |ИЕТОДЪ| следующим образом: ,7[у] = 1+ (у')з дт.. а Метод, примененный нами в задаче с ограничениями на значения допустимых функций, можно использовать и в задачах другого рода задачах с управлением. Рассмотрим задачу о минимизации функционала Й'2 1[и,и) = 1' (Х,х,и)с|1 (6АО) Так как интегрант рассматриваемого функционала зависит только от у~, его экстремалями являются прямые у = Сна+ Сэ (это, впрочем, очевидно).
Ксли круг Р не пересекается с отрезком АВ, то решение задачи — функция, графиком которой является указанный отрезок АВ. Если же круг Р пересекается с отрезком АВ, то решение задачи следует искать в виде кривой, составленной из отрезков, сопряженных с дугой окружности дР, ограничивающей круг Р. Поскольку ~'~„, = (1+ (у')э) ' ф О, кривая должна быть гладкой в точках сопряжения, т.е.
отрезки, стыкующиеся с дугой окружности ВР, являются отрезками касательных к этой окружности (см. рис. 6.6). Имеются два кандидата в кривые наименьшей длины: один -" кривая, расположенная выше отрезка АВ (кривая АМ%В на рис. 6.6), другой — ниже (кривая Ам'Х'В на рис. 6.6). Выбор из двух кандидатов зависит от расположения центра круга Р по отношению к отрезку АВ: центр и искомая кривая наименьшей длины располагаются по разные стороны от прямой АВ. Отметим, что обе кривые соответствуют двум точкам минимума рассматриваемого функционала, определенного на множестве кусочно гладких функций, графики которых не пересекают круг Р. Эта задача была решена в 1871 г. Тодхантером.
ф 183 6.3. Некоторые задачи с ограничениями в классе непрерывных функций х(1), удовлетворяющих краевым условиям тИ1) = яы туг) = жг, и в классе непрерывных функций и(с) (управлений), подчиняю- щихся ограничению (6.41) и(с) < к, Й = сопв$. Предложенная задача может быть сведена к задаче с ограничениями в виде равенств. Для этого нужно ввести вспомогательную функцию я(1) по формуле я =Й вЂ” и и заменить ограничение (6.41) эквивалентным ему ограничением гг+и — 1с = О. (6.42) Тогда исходная задача будет эквивалентна задаче Лагранжа с иелевым функиионалои 1~х,и,г~)= 1 (1,х,и)Ж и уравнением связи (6.42) (см. 4.1). Этот подход может использоваться и в случае, когда вместо ограничения вида (6.41) в задаче ставится ограничение в виде двойного неравенства Й1 < и(с) < йг. (6.43) Введя вспомогательную функцию я, такое ограничение можно заменить эквивалентным ограничением в виде равенства (и — к1)(кг — и) — зг = О.
184 6. ВАРИАЦИОННЫЕ МЕТОДЫ Рассмотренный подход фактически исчерпывает возможности классического вариационного исчисления в задачах с ограничениями, приводящими к поиску экстремума в замкнутой области. Успех здесь в основном определяется тем, удается ли с помощью некоторых искусственных приемов заменить в ограничениях неравенства равенствами. Иногда способ такой замены подсказывается самой постановкой задачи. Но даже если такое преобразование в задаче удалось осуществить, преобразованная задача может не иметь решения в классе гладких (и даже непрерывных) функций.
Показательной в этом смысле является линейная зада та, к изучению которой мы переходим. 6.4. Линейные задачи оптимального управления Среди управляемых систем, пожалуй, самое широкое применение в различных областях техники находят так называемые линейные управляемые систпемы, т.с. автономные системы с линейным законом движения (6.44) ж = Ах + Ви, где и = (хм ..., х„): и = (им ..., и„); А = (а,у) и В = (Ьд,) числовые матрицы типов пхп, и пхг соответственно. Наиболее популярной в классе линейных управляемых систем является задача оптимального оыстродейстпвия, тэь задача оптимального управления, в которой в каюстве целевого функционала взято время достижения системой некоторого состояния х(1з) = ж .
Это иллюстрируют системы автоматического управления., которые поддерживают заданный режим (или заданное движение) объекта, преодолевая действие различного рода возмущающих сил. Для таких систем обычно составляют уравнения возмуияенного двиэсения [ЧПЦ вида х = Т(х,и), 6.4. Линейные задачи оптимального управления 185 х(гп) = х у'= О. (6.45) Задачей системы управления является обеспечение таких управляющих воздействий, которые в кратчайший срок возвращают систему в заданный режим, т.е. х(Ьг) = О. (6.46) Так как отклонения системы от установившегося режима обычно ма.лы, то правые части уравнений возмущенного движения можно приближенно заменить линейными выражениями, используя формулу Тейлора. Полученные линейные уравнения вида (6.44) обычно называют уравнениями переоео приближения [НП1] для возмущенного движения.
Рассмотрим частный случай системы (6.44), .когда управление одно, т.е. и(е) = и(г) -- скалярная функция, г = 1. Такая система имеет вид х1 = ~~~ ав х, +Ь1к, г=1 (6.47) х„= ~~ а х +Ь„и. В качестве целевого функционала возьмем время ~г достижения системой положения равновесия х,(ег) = О, 1 = 1, и., т.е. 1~х,и) = аг — > шш (6.48) а на управление и(ь') наложим ограничение (6.49) )и! < 1. в которых фазоеме копре)пииты х; представляют собой откло- нения координат объекта от их зна ~ений в заданном режиме (возянущения), причем в начальный момент времени 1~ пола- гают, что 186 а влрийционные мктоды Попробуем с помощью вариационных методов решить линейную задачу оптпиллальноео управления, которая определяется соотношениями (6.45) — (6.49).
Полагаем, что х(г) е Е С Дг~.,1з),1гг"), и(г) Е С~1п12]. Задача (6.45) — (6.49) является частным случаем задачи (6.40), (6.43). Как было установлено (см. 6.3), экстремум может достигаться лишь на функциях, составленных из участков энстремалей и участков границы области упрае,ления (6.49). е1тобы найти экстремэли задачи, являющейся задачей Лагранжа е форме Понтряеина, запишем лаеранжиан гг н Цх,х,и) — 1+ ~г Л;(г)(х,; — ~ а,ухо — Ь;и).
г=1 г'=1 Необходимое условие экстремума вне границы области (6.49) есть уравнения Эйлера (6.22), (6.23). В линейном случае система (6.22) преобразуется к виду Лг = — Л1а1г Лзазг .. — Лоалгг ? = 1г пг т в матричной форме она имесет вид Л = — А Л, или (6.50) Л = — Л А, т где Л =(Лы ..., Л„); А= (а, ) -- матрица системы (6.47) типа п х п.
Второе уравнение (6.23) примет вид В' = — ~ ~Л,(1)5; =О, или Л(е) В =О, (6.51) т где В = (5ы ..., 5„) — — столбец коэффициентов при управлении и в (6.47). Продифференцируем равенство 16.51): (6.52) Л В=О. 6.4. Линейные задачи оптимального управления 187 т Исключим из зтого равенства Л, используя соотношение (6.50) и свойства операции транспонирования. В результате получим Л АВ=О.
(6.53) Снова продифференцируем (6.53) и затем исключим Л ., используя (6.50). Получим Л АЯВ=О. Повторяя операцию дифференцирования и — 1 раз с последую'т щим исключением Л ., приходим к следующей системе алгебрат ических уравнений относительно Л: Л В=О, Л АВ=О, Л А~В= О, (6.54) Л'Ав-'В = О. Эта система имеет единственное нулевое решение в том случае, когда ранг матрицы системы равен количеству неизвестных и., т.е. П8 (В, АВ, ..., Аа 1В) = и. (6.55) *В литературе термин „управляемвл система" имеет различное толкование. Случай, когда выполняется соотношение (6.55), является основным в теории линейных управляемых систем (без флзовьат ограничений).
Это соотношение . необходимое и достаточное условие управляемости такой системы. Систему называют управляемой*, если для любых начального и коне чного состпояний системы существует хотя бы один допустимый процесс., 188 6. ВАРИДЦИОННЫК МЬтОДЫ переводящий систему из заданного начального состояния в заданное конечное состояние. Свойство управляемости системы означает, что задача уврпвлсния для этой системы имеет решение при любых краевых условиях. Таким образом, в случае выполнения соотношения (6.55) уравнение Эйлера имеет единственное решение Л(й) = О. Этому решению соответствует лагранжиан Цх,х,ц) = 1, который совпадает с лагранжианом задачи, получающейся из исходной отбрасыванием дифференциальных связей (6.47).