Деменков Н.П. Вычислительные аспекты решения задач оптимального управления (2007) (1253737), страница 17
Текст из файла (страница 17)
Для подобного класса задач128∂2 H∂ui2≡ 0 ∀ i.В оптимальном по быстродействию управлении линейными стационарными объектами вырожденность проявляется в неединственности оптимального управления. Вырожденность может проявлятьсяв отношении систем, которые не являются L-управляемыми.В случае оптимального по расходу топлива управления линейными стационарными объектами вырожденность также означаетнеединственность. Вырожденность может проявляться в отношении систем, имеющих одну и более степеней интегрирования, илидля систем, которые не являются L-управляемыми.В случае ограниченного по амплитуде управления линейнымистационарными объектами, показатель качества которых имеетподынтегральное выражение, представленное квадратичной формой только от координат состояния (это не касается функцииуправления), в пространстве состояний могут появиться вырожденные гиперповерхности, на которых оптимальное управление неявляется релейным.4.3.
Соседние экстремали и вторая вариацияПрименение методов теории поля для решения задач оптимального управления состоит в систематическом варьированиинезаданных (свободных) начальных (или конечных) условий и вычислении соответствующих оптимальных решений из начальной(или конечной) точки. Вычисления продолжаются до тех пор, покачасть фазового пространства, находящаяся в окрестности противоположной точки, не будет достаточно густо покрыта оптимальными решениями, после чего оптимальное решение может бытьполучено путем интерполяции.Описанная процедура – один из способов решения уравненияГамильтона–Якоби–Беллмана.
Она носит название метода характеристик и является полезной при формировании оптимальногонелинейного закона управления с обратной связью в задачах терминального управления, если все оптимальные траектории вычисляются в обратном направлении, начиная с терминальной гиперповерхности.129Основная трудность, связанная с этими методами, заключаетсяв выборе начального приближения, т. е. в нахождении такой первоначальной оценки незаданных условий на одном конце, котораяприводила бы к решению, достаточно близкому к заданным условиям на противоположном конце.
Причина указанной трудностисостоит в том, что экстремальные решения часто оказываютсявесьма чувствительными к небольшим изменениям незаданныхграничных условий. Эта чрезмерная чувствительность являетсяпрямым следствием природы уравнений Эйлера–Лагранжа, которые представляют собой уравнения для функций влияния.Ввиду указанной трудности с выбором начальных значенийметод непосредственного интегрирования обычно практическипригоден для нахождения соседних экстремальных решений лишьпосле того, как одно экстремальное решение уже получено какимлибо другим методом (например, градиентным методом).Пусть найдена некоторая вектор-функция управления u (t ), которая удовлетворяет всем необходимым условиям первого порядкадля оптимальности управления в задаче Больца при заданном времени окончания процесса:x = f ( x , u , t ), где x (t0 ) = x0 ; t0 , tk − заданы ;(4.39)⎛ ∂G∂H т∂φ ⎞p т = −, p (tk ) = ⎜+ ν т ⎟ , t = tk ;⎝ ∂x∂x ⎠∂x(4.40)∂H=0;∂u(4.41)φ[ x (tk )] = 0;(4.42)tkJ = G[ x (tk )] + ∫ L( x , u , t )dt ;(4.43)H = L + pт f .(4.44)t0130Управление u (t ), удовлетворяющее соотношениям (4.39) –(4.42), называется экстремальным управлением, а соответствующая ему траектория – экстремальной траекторией (экстремалью).Экстремальное управление не обязательно минимизирует (максимизирует) выбранный критерий качества, поскольку оно удовлетворяет лишь необходимым условиям оптимальности.
Экстремальные управления важно рассмотреть потому, что оптимальноеуправление находится среди экстремальных.Напомним, что расширенный (вспомогательный) критерий качества для данной системы выражается уравнениемtkJ1 = G[ x (tk )] + ν φ[ x (tk )] + ∫ [ H ( x , u , p, t ) − p т x ]dt.т(4.45)t0Рассмотрим теперь малые отклонения от экстремальной траектории, возникающие вследствие малых возмущений в начальномсостоянии δx (t0 ) и в конечных условиях δp (tk ).Естественно ожидать, что малые возмущения в начальных иконечных условиях приведут к появлению возмущений (вариаций)δx (t ), δp (t ), d ν, удовлетворяющих линеаризованным в окрестности экстремальной траектории уравнениям (4.39) – (4.42), т. е.δx =∂f∂fδx +δu ;∂x∂u(4.46)т⎛ ∂f ⎞∂2 H∂2 Hδp = − 2 δx − ⎜ ⎟ δp −δu ;∂x ∂u⎝ ∂u ⎠∂x(4.47)т⎛ ∂f ⎞∂2 H∂2 Hδx + ⎜ ⎟ δp +δu = 0;∂x ∂u⎝ ∂u ⎠∂u 2отклонение δx (t0 ) задано;(4.48)(4.49)131⎡⎛⎢⎜ 2∂ Gδp (tk ) = ⎢⎜ 2 +⎢ ⎜ ∂x⎢⎜⎣⎢⎝⎤⎛ ∂φ ⎞ ⎞∂ ⎜ νт ⎟ ⎟т⎥⎝ ∂x ⎠⎛ ∂φ ⎞⎟ δx + ⎜ ⎟ d ν ⎥ ;⎥⎝ ∂x ⎠∂x⎟⎥⎟⎠⎦⎥t =t(4.50)k⎡ ∂φ ⎤отклонение δφ = ⎢ δx ⎥⎣ ∂x ⎦ t = t k(4.51)задано.С другой стороны, можно рассмотреть разложение в ряд критерия качества и ограничений с точностью до членов второго порядка малости по δx , δu (поскольку члены первого порядка малости обращаются в нуль, если траектория удовлетворяет уравнениям (4.39) – (4.45)).К такому же результату можно прийти, если разложить в рядрасширенный критерий качества с точностью до членов второгопорядка, а все ограничения – с точностью до членов первого порядка малости относительно δx , δu .
Таким образом,⎡⎛⎛ ∂φ ⎞ ⎞ ⎤∂ ⎜ νт ⎟ ⎟ ⎥⎢2⎜⎝ ∂x ⎠∂ G1⎟ δx ⎥δ 2 J1 = ⎢δx т ⎜ 2 ++∂x2⎢⎜ ∂x⎟ ⎥⎢⎜⎝⎟⎠ ⎥⎣⎢⎦⎥t =tk⎛∂ Htk⎜1∂x 2+ ∫ [δx т δu т ] ⎜2t⎜ ∂2 H0⎜⎝∂u ∂x2∂ H⎞∂x ∂u ⎟ ⎡ δx ⎤⎟ ⎢ ⎥ dt∂ 2 H ⎟ ⎣ δu ⎦⎟∂u 2 ⎠2при выполнении условийδx =132∂f∂fδx +δu ,∂x∂u(4.52)где отклонение δx (t0 ) задано ;⎡ ∂φ ⎤δφ = ⎢ δx ⎥ ,⎣ ∂x ⎦ t =tkгде отклонение δφ задано.Нас интересуют соседние экстремальные траектории, поэтомунужно определить δu (t ) так, чтобы величина δ 2 J1 достигала минимума при одновременном удовлетворении условий (4.46), (4.49)и (4.51).
Такая задача относится к задачам оптимизации линейноквадратичного типа. Вводя множители δp и δν (такое обозначение для множителей выбрано преднамеренно), получим присоединенную двухточечную краевую задачу, которая описывается уравнениями (4.46) – (4.51).Уравнения (4.46) – (4.51) определяют линейную двухточечнуюкраевую задачу, поскольку коэффициенты при δx и δu вычисля∂ 2 H (t )ются на экстремальной траектории. Полагая, что матрица∂u 2невырождена для t0 ≤ t ≤ tk , можно разрешить (4.48) относительноотклонения δ u (t ) и выразить его через δx (t ) и δp (t ):⎛ ∂2 H ⎞δu (t ) = − ⎜ 2 ⎟⎝ ∂u ⎠−1т⎛ ∂2 H⎞⎛ ∂f ⎞upδ+δ⎜⎟.⎜⎝ ∂u ⎟⎠⎜⎝ ∂u ∂x⎟⎠(4.53)Подстановка выражения (4.53) в (4.46) и (4.47) дает следующее:δx = A(t )δx − B(t )δp;(4.54)δp = −C (t )δx − Aт (t )δp,(4.55)где133∂f ∂f ⎛ ∂ 2 HA(t ) =−⎜∂x ∂u ⎜⎝ ∂u 2∂f ⎛ ∂ 2 H ⎞B (t ) =∂u ⎜⎝ ∂u 2 ⎟⎠C (t ) =−1−1⎞ ∂2 H;⎟⎟⎠ ∂u ∂xт⎛ ∂f ⎞⎜⎝ ∂u ⎟⎠ ;∂2 H ∂2 H ⎛ ∂2 H−⎜∂x 2 ∂x ∂u ⎜⎝ ∂u 2−1⎞ ∂2 H.⎟⎟∂∂ux⎠В этой задаче можно также считать, что отклонения от экстремальной траектории вызваны возмущениями δx (t0 ) и d ν (вместоδ x (t0 ) и δp ).
При таком подходе необходимо определить значение d ν , которое соответствует желаемому значению δp .4.3.1. Оптимальный закон управления по соседним траекториямБудем искать решения уравнений (4.51) – (4.55) методом прогонки в видеδp (t ) = S (t )δx (t ) + R (t )δν;(4.56)δφ = R т (t )δx (t ) + Q(t )δν.(4.57)Здесь δν и δφ – векторы с постоянными бесконечно малымикомпонентами; S (t ), R (t ), Q(t ) – матричные функции. Очевидно,что эти матрицы должны быть такими, чтобы удовлетворять соотношениям (4.50) и (4.51), т. е.⎡⎢ 2∂ GS (tk ) = ⎢ 2 +⎢ ∂x⎢⎢⎣134⎛ ∂φ ⎞ ⎤∂ ⎜ νт ⎟ ⎥⎝ ∂x ⎠ ⎥;∂x 2 ⎥⎥⎥⎦t =tk(4.58)⎡ ∂φ ⎤R (tk ) = ⎢ ⎥ ;⎣ ∂x ⎦ t =tk(4.59)Q(tk ) = 0.(4.60)Продифференцировав (4.56) и (4.57) по времени, считая δν иδφ постоянными величинами, получим ν;δp (t ) = S δx + S δx + Rd(4.61) ν.0 = R т δx + R т δx + Qd(4.62)Подставив выражение для δp из (4.55) в (4.54), получимδx = ( A − BS )δx − BRd ν,(4.63)а, подставив последнее выражение в (4.62), получимR т + R т ( A − BS )δx + (− R т BR + Q )d ν = 0.Подставив выражение (4.61) в (4.55) и исключив из них предварительно отклонения δx и δp с помощью соотношений (4.56) и(4.63), получим(−C − Aт S − SA + SBS − S )δx − [( Aт − SB) R + R ]d ν = 0.Если рассматривать это уравнение как тождество, справедливое при произвольных значениях δx и δν , то очевидно, что коэффициенты при δx и δν должны обращаться в нуль:S = − SA − Aт S + SBS − C ,или135т∂ f ⎛ ∂f ⎞∂2 H−⎜ ⎟ S −+S = − S∂x ⎝ ∂x ⎠∂x 2⎡ ∂f ⎛ ∂ 2 H ⎞ т ⎤ ⎛ ∂ 2 H ⎞ −1 ⎡ ∂ 2 H ⎛ ∂f ⎞ т ⎤⎥⎢+ ⎢S++S ⎥.⎢ ∂u ⎜⎝ ∂u ∂x ⎟⎠ ⎥ ⎜⎝ ∂u 2 ⎟⎠ ⎢ ∂u ∂x ⎜⎝ ∂u ⎟⎠ ⎥⎣⎦⎣⎦(4.64)Соотношения (4.58) – (4.60) являются граничными условиямидля матричных дифференциальных уравнений (4.64).
Если интегрировать дифференциальные уравнения (4.64) от t = tk до t = t0 ,то выражения (4.56) и (4.57) будут представлять собой граничныеусловия, эквивалентные терминальным граничным условиям(4.47) – (4.51), заданным в более ранние моменты времени. Такимобразом, терминальные границы условий (4.56) и (4.57) переносятся назад на более раннее время.Итак, получимS = − SA − Aт S + SBS − C ;(4.65)R = − ( Aт − SB ) R;(4.66)Q = R т BR.(4.67)Проинтегрировав уравнения (4.65) – (4.67) от tk до t0 , можноразрешить уравнение (4.57) в точке t = t0 и найти таким образом необходимое значение dν для обеспечения нужного отклонения δφ :d ν = Q −1 (t0 )[δφ − R т (t0 )δx (t0 )].(4.68)Если dν из (4.68) подставить в (4.56) при t = t0 , то получимδp (t0 ) = [ S (t0 ) − R (t0 )Q −1 (t0 ) R т (t0 )]δx (t0 ) + R(t0 )Q −1 (t0 )δφ.136Далее можно найти δx (t ) и δp (t ) путем интегрирования уравнений (4.54) и (4.55) вперед (т.