Лекции по ОУ (1050564), страница 4
Текст из файла (страница 4)
Множество U может быть задано всевозможными способами, в томчисле с помощью равенств или неравенств, например{}U = x(t )∈ C [a, b] : x 2 (t ) ≤ α ,U = {x(t )∈ C [a, b] : x(t ) = 1}.Задача минимизации функционалаF ( x ) → min, x ∈ Uэквивалентна задаче максимизации(2.1.5)− F ( x ) → max, x ∈Uв том смысле, что множества глобальных, локальных, строгих или нестрогихрешений этих задач соответственно совпадают. Это позволяет переносить результаты, полученные для задач минимизации, на задачи максимизации и наоборот.
Поэтому несколько основных теорем из теории оптимизации функционалов [3], которые будут приведены ниже, сформулированы для задачи минимизации. Все эти теоремы являются обобщением известных результатов конечномерной оптимизации, в частности оптимизации функции одной переменной.Теорема 2.1.1. Пусть U – выпуклое множество в C [a, b], F ( x ) выпуклыйфункционал, определенный на U . Тогда всякая точка локального минимумаF ( x ) одновременно является точкой его глобального минимума на U , причемэта точка единственная, если F ( x ) – строго выпуклый.Теорема 2.1.2. Пусть F ( x ) – дифференцируемый в точке x = x0 (t ) функционал, причем x0 (t ) – внутренняя точка области его определения.
Если F ( x )достигает минимума при x = x0 (t ) , то вариация функционала F ( x ) в этойточке обращается в ноль:δF ( x0 ) = 0 .Теорема 2.1.3. Пусть U – выпуклое, ограниченное, замкнутое множество в C [a, b], F ( x ) – выпуклый, непрерывный функционал, заданный на множестве U . Тогда F ( x ) достигает на U своего минимума.В общем случае задача минимизации (2.1.5) может не иметь решения, т.е.может не существовать точки x0 , принадлежащей области определения функционала, для которой выполняется неравенство (2.1.1). В этом случае имеетсмысл несколько другая постановка задачи оптимизации, задача отыскания16нижней грани функционала. Аналогично вместо задачи максимизации ставитсязадача отыскания верхней грани.Определение 2.1.10.
Число m называется нижней гранью функционалаF ( x ) на множестве U , если:1) F ( x ) ≥ m при всех x ∈U ,2) для любого ε > 0 найдется точка xε ∈ U , для которой F ( xε ) < m + ε .Нижняя грань обозначаетсяinf F ( x ) = m .x∈UОпределение 2.1.11. Число M называется верхней гранью функционалаF ( x ) на множестве U , если:1) F ( x ) ≤ M при всех x ∈U ,2) для любого ε > 0 найдется точка xε ∈ U , для которой F ( xε ) > M − ε .Верхняя грань обозначаетсяsup F ( x ) = M .x∈UОпределение 2.1.12.
Последовательность xk ∈ U называется минимизирующей для функционала F ( x ) на множестве U , еслиlim F ( xk ) = m .k →∞Определение 2.1.13. Последовательность xk ∈ U называется максимизирующей для функционала F ( x ) на множестве U , еслиlim F ( xk ) = M .k →∞Легко показать, что из существования нижней грани вытекает существование минимизирующей последовательности, а из существования верхней грани вытекает существование максимизирующей последовательности. Нижняягрань существует не для всякого функционала. Чтобы существовала нижняягрань, функционал должен быть ограничен снизу.
Имеет место следующая теорема.Теорема 2.1.4. Пусть на множестве U задан ограниченный снизу функционал J ( x ) . Тогда реализуется одна из двух возможностей:1) существует элемент x0 (t )∈U , на котором достигается минимумфункционала J ( x ) ,2) существует нижняя грань функционала J ( x ) .Аналогичная теорема имеет место для ограниченного сверху функционала и его верхней грани.Теорема 2.1.4 имеет важное значение. Она говорит о том, что задача отыскания наименьшего значения ограниченного снизу функционала всегда имеетсмысл.
А именно или мы можем найти точное решение задачи (когда существует минимум), или можем найти приближенное решение (когда существует17нижняя грань). Во втором случае в качестве приближенного решения можновзять любой член минимизирующей последовательности с достаточно большимномером, так как он будет мало отличаться от нижней грани.Задачи отыскания экстремума функционала относятся к теории вариационного исчисления, где устанавливаются условия, при которых функционалдостигает минимального или максимального значения, а также исследуютсяметоды отыскания точек экстремума. Примером задачи вариационного исчисления является так называемая простейшая задача вариационного исчисления,которая состоит в нахождении экстремума функционалаbJ ( x ) = F (t , x(t ), x& (t ))dt∫(2.1.6)aна множестве непрерывно дифференцируемых функций, удовлетворяющихграничным условиямx(a ) = A, x(b ) = B.Если будем рассматривать функционал (2.1.6) на функциях, которые удовлетворяют дифференциальному уравнениюdx= f ( x, u , t ) ,dtто простейшая задача вариационного исчисления будет задачей оптимальногоуправления.2.2.
Постановка задачи оптимального управленияРассмотрим процесс управления (1.3.1), (1.3.2) и рассмотрим множествопар ( x, u ) в которых u = u (t ) (t ∈ [t 0 , t1 ] ) – допустимое управление, x = x(t ) – соответствующая этому допустимому управлению траектория при начальном условии x(t0 ) = x0 , т.е. решение задачи Коши (1.3.1), (1.3.2). Такие пары будем называть допустимыми. В каждый заданный момент времени t пара ( x(t ), u (t ))полностью характеризует исследуемый процесс. При этом естественно возникает вопрос: как найти такое допустимое управление, при котором изучаемыйобъект обладал бы необходимыми свойствами, чтобы весь процесс управлениябыл в некотором смысле наилучшим, оптимальным? Для определения качествапроцесса на множестве пар ( x, u ) задается функционал J ( x, u ) , который называется критерием качества управления. Таким образом, каждой паре ( x, u ) ставится в соответствие число J ( x, u ) – значение функционала.
Следует отметить,что критерий качества в каждой конкретной прикладной задаче имеет вполнеопределенный смысл, например J ( x, u ) может определять величину расхода топлива, величину различных энергетических затрат, может означать время перемещения траектории из одной точки фазового пространства в другую и т.д.18Цель задачи оптимального управления объектом – это нахождение экстремума (минимума или максимума) критерия качества J ( x, u ) .
В дальнейшем будем рассматривать задачи нахождения минимума J ( x, u ) , поскольку отысканиемаксимума может быть сведено к отысканию минимума. Теперь дадим точнуюпостановку одной достаточно простой задачи оптимального управления (ЗОУ).Задача оптимального управления состоит в нахождении такого допустимогоуправления u (t ) и соответствующей траектории x(t ) , удовлетворяющей задачеКоши (1.2.1), (1.2.2), при которых критерий качества J ( x, u ) , рассматриваемыйна множестве допустимых пар, достигает минимального значения.В краткой форме эта ЗОУ обычно записывается следующим образом:dx= f ( x(t ), u (t ), t ), t ∈ [t 0 , t1 ],dtx(t0 ) = x0 ,u (t ) ∈ U , t ∈ [t0 , t1 ],J ( x, u ) → min .(2.2.1)(2.2.2)(2.2.3)(2.2.4)Решение сформулированной задачи называется оптимальным управлением и оптимальной траекторией.
Эта задача является задачей с закрепленнымлевым концом траектории, поскольку задано начальное условие (2.2.2). В тоже время – это задача со свободным правым концом траектории, поскольку наx(t1 ) не наложено никаких ограничений.Рассмотрим обобщение задачи (2.2.1) – (2.2.4). Пусть в фазовом пространстве E n заданы множества X 0 , X 1 . Предположим, что за начальное состояние x0 системы (2.2.1) можно брать любую точку из X 0 , и будем рассматривать те допустимые управления, при которых правые концы соответствующих траекторий будут принадлежать множеству X 1 . В этом случае можносформулировать ЗОУ с подвижными концами, а именно, задача оптимальногоуправления с подвижными концами состоит в отыскании допустимого управления и соответствующей траектории, выходящей из множества X 0 и заканчивающейся в множестве X 1 , которые доставляют минимум критерию качестваJ ( x, u ) .
В краткой форме эта задача записывается следующим образом:dx= f ( x(t ), u (t ), t ), t ∈ [t 0 , t1 ],dtx(t0 ) ∈ X 0 ,x(t1 ) ∈ X 1 ,(2.2.5)(2.2.6)(2.2.7)u (t ) ∈ U , t ∈ [t0 , t1 ],(2.2.8)J ( x, u ) → min .(2.2.9)19В том случае, когда множество X 1 состоит из одной точки ( X 1 = {x1}), мыбудем иметь задачу с закрепленным правым концом траектории. Если множество X 0 (или X 1 ) совпадает со всем фазовым пространством E n , то говорят, чтолевый (или правый) конец траектории свободен.
В этом случае мы имеем задачу со свободным левым (или со свободным правым) концом.Задачу оптимального управления (2.2.5) – (2.2.9) можно рассматриватькак задачу оптимизации функционала J ( x, u ) при ограничениях (2.2.5) – (2.2.8).Характерным для ЗОУ является наличие дифференциальной связи (2.2.5)(уравнение процесса). Изменяя ограничения (2.2.6) – (2.2.8), можно получатьразличные ЗОУ для системы (2.2.5) и критерии качества (2.2.9). Так, например,кроме условий (2.2.6), (2.2.7), или вместе с ними можно задать граничные условия в видеϕ( x(t0 ), x(t1 )) = 0 ,где ϕ – заданная функция переменных ( x1 , K xn , y1 , K yn ) . Получим более сложные для исследования задачи, если добавим ограничение на управление в видеg (u (t ), t ) ≤ 0 ,где g – заданная функция переменных (u1 , Ku m , t ) , или ограничение на фазовыепеременныеh( x(t ), t ) ≤ 0 ,где h – заданная функция переменных ( x1 , K xn , t ), или смешанные ограниченияq( x(t ), u (t ), t ) ≤ 0 ,где q – заданная функция переменных ( x1 , K xn , u1 , Kum , t ).В рассмотренных задачах предполагалось, что t0 , t1 – фиксированныечисла.
Вместе с тем возможны ситуации, когда начальный и конечный моментывремени t0 ,t1 неизвестны и подлежат определению. Если при этом критерий качества имеет видJ ( x, u ) = t1 − t 0 ,то мы имеем задачу быстродействия, которая состоит в том, чтобы найти допустимое управление, при котором соответствующая траектория попадает измножества X 0 в X 1 за минимальное время.Критерии качества в ЗОУ с фиксированными t0 ,t1 в большинстве случаевзадаются функционалами следующих видов:1) интегральныйt1J ( x, u ) = F ( x(t ), u (t ), t )dt ,∫t0202) терминальныйl ( x(t 0 ), x(t1 )) ,3) смешанный (или функционал Больца)t1J ( x, u ) = ∫ F ( x(t ), u (t ), t )dt + l ( x(t 0 ), x(t1 )) ,t0где F, l – заданные функции.2.3.
Дискретные задачи оптимального управленияДо сих пор рассматривались непрерывные процессы, которые моделируются системой дифференциальных уравнений. В таких процессах время изменяется непрерывно в пределах какого-то промежутка. Если же время можетпринимать лишь дискретное множество значений, например t = 0,1,K, T − 1, томы будем иметь дело с дискретным объектом управления.Часто дискретные процессы называют многошаговыми. В каждый моментвремени (или на каждом шаге) такие процессы характеризуются двумя набораTTми переменных: x(t ) = ( x1 (t ), K, xn (t )) и u (t ) = (u1 (t ),K, um (t )) . Это соответственно вектор состояния и вектор управления.