Громов Ю.Ю. и др. - Специальные разделы теории управления, оптимальное управление динамическими системами, страница 7
Описание файла
PDF-файл из архива "Громов Ю.Ю. и др. - Специальные разделы теории управления, оптимальное управление динамическими системами", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр PDF-файла онлайн
Текст 7 страницы из PDF
4.4) и такого постоянного вектора µ = (µ1 , µ 2 , ..., µ l )T , что выполняются следующие условия.1. Вектор-функции x*(t), u*(t), λ (t ) и вектор a* удовлетворяют системеdx1* ∂H (t , x* (t ), u * (t ), λ (t ), a* ) =;∂λ idt*** λd i∂H (t , x (t ), u (t ), λ (t ), a ) =−∂xidt(i = 0, n) .(23)2. Функция H (t , x* (t ), u , λ (t ), a* ) переменного u ∈ U m при каждом t ∈ [t 0 , t1 ] , т.е.
при фиксированных x* и λ и прификсированном векторе а* достигает при u = u*(t) минимума):H (t , x* (t ), u * (t ), λ (t ), a* ) = H * (t , x* (t ), λ (t ), a* ) == min H (t , x* (t ), u, λ (t ), a* ) .u∈U(24)mСлучай максимума функционала J[u, a] сводится к задаче в данной постановке путем рассмотрения функционалаJ1[u, a] = − J [u, a] .З а м е ч а н и е . В отличие от классической формулировки принципа максимума Л.С.
Понтрягина в данном случае операция max в (24) заменена на min. В соответствии с такой заменой необходимое условие (24) можно было бы назвать принципом минимума. Следует обратить внимание, что в данном случае λ 0 ≥ 0 , тогда как в классической формулировке λ 0 ≤ 0 .Таким образом, оптимальное управление определяется какu * (t ) = u * (t , x* (t ), λ (t ), a* ) = arg min H (t , x* (t ), u, λ (t ), a* ) . (25)u∈U mПринцип максимума, следовательно, утверждает, что оптимальное управление u*(t) в каждый момент времени t мини~мизирует проекцию фазовой скорости ~x& = f (t , x, u) управляемого процесса (т.е. проекцию скорости изображающей точки~~x ∈ X n+1 ) на направление, задаваемое вектором λ (t ) ; напомним, чтоH=n~∑ λi fi = λT ~x& = λT f (t , x, u, a) –i =0скалярное произведение векторов λ (t ) и ~x& .3. Сопряженные переменные λ i (t ) и функция H (t , x * (t ), u * (t ), λ (t ), a * ) непрерывны вдоль оптимальной траектории(аналог условия Эрдмана-Вейерштрасса классического вариационного исчисления).4.
Условия трансверсальности. Для концевых точек (t 0 , x 0 ) , (t1 , x1 ) и вектора параметров а* при произвольных вариациях концевых точек и параметров выполняются обобщенные условия трансверсальностиt1nr t1∂Hδaρ dt = 0 . Hδt − λ i δxi + dL +∂i =0ρ =1 t 0 aρ t∑∑∫(26)0Здесь dL – полная вариация функции L(t 0 , t1 , x 0 , x1 , µ, a) , определяемой уравнением (17):dL =+n∂L∂L∂Lδt0 +δt1 +δxi (t0 ) +∂t0∂t1∂xi (t 0 )i =0∑n∂Lr∂L∑ ∂xi (t1 )δxi (t1 ) + ∑ ∂aρ δaρ ,i =0ρ =1(27)где δt 0 , δt1 , δxi (t 0 ), δxi (t1 ), δaρ – произвольные вариации концевых точек и параметров.Обобщенные условия трансверсальности (26) с учетом выражения (27) приводят в силу независимости δt0, δt1, δti(t0),δti(t1), δaρ к следующим 2n + 2 + r соотношениям:∂L− H +∂t0 δt 0 = 0 ; t0(28)∂L H + δt1 = 0 ;∂t1 t1∂L λi +∂xi(29) δxi (t 0 ) = 0 (i = 1, n) ; t0∂L − λi +∂xi(30) δxi (t1 ) = 0 (i = 1, n) ; t1(31) ∂L t1 ∂H (32) ∂a + ∫ ∂a dt δaρ = 0 (ρ = 1, r ) .ρρt0Если какое-либо конечное условие xi (t 0 ), xi (t1 ) или параметр aρ закреплены (не варьируются), то соответствующаявариация равна нулю: δz = 0 ( z = t 0 , t1 , xi (t 0 ), xi (t1 ), aρ ) .
Если какое-либо конечное условие xi (t0 ) , xi (t1 ) или управляющийпараметр aρ свободны, то равен нулю коэффициент при свободной вариации δz в (30) – (32).Таким образом, совокупность условий, выражающих принцип максимума (23), (25), условий трансверсальности (26),дают необходимые условия оптимальности программного управления.Условия принципа максимума позволяют среди множества всех траекторий и управлений, переводящих систему из(t0 , x0 ) в (t1 , x1 ) , выделить те отдельные, вообще говоря, изолированные траектории и управления, которые могут быть оптимальными.В формулировке принципа максимума участвует 2n + 2 + m + 1 неизвестных функцийx0 (t ), x1 (t ), ..., xn (t ) : λ 0 (t ), λ1 (t ), ..., λ n (t ) ; u1 (t ), ..., u m (t ) , для определения которых имеется (n + 1) дифференциальныхуравнений физической системы (11), (20), (n + 1) дифференциальных уравнений сопряженной системы (18) и m конечныхсоотношений для u j , вытекающих из (24).Следовательно, для (2n + 2 + m) неизвестных функций имеется (2n + 2 + m) соотношений.
Если известны все начальныеусловия~x0 = ~x (t 0 ) = (Φ, x1 (t 0 ), x2 (t 0 ), ..., xn (t 0 ))T ;λ 0 = λ (t 0 ) = (λ 0 (t 0 ), λ1 (t 0 ), λ 2 (t 0 ), ..., λ n (t 0 )) T(33)и фиксированное значение управляющего параметра а, то система (23) может быть проинтегрирована. Однако начальный иконечный моменты времени t0, t1, начальное и конечное значения вектора фазовых координатx 0 = ( x10 , ..., xn 0 ), x1 = ( x11 , ..., xn1 ) , начальное и конечное значения вектора сопряженных переменных λ 0 = (1, λ10 , ..., λ n 0 ) ,λ 1 = (1, λ11 , ..., λ n1 ) , постоянный вектор µ = (µ1 , µ 2 , ..., µ l ) и вектор управляющих параметров a = (a1 , a2 , ..., ar ) для оптимального решения заранее неизвестны.
Они могут быть определены из условий трансверсальности (28) – (32) и граничныхусловий (12). В самом деле, для определения (2 + 4n + l + r) неизвестных t 0 , t1 , x 0 , x1 , λ 0 , λ 1 , µ, a имеется два условия (28),(29), 2n условий (30), (31), r условий (32) и l условий (12); кроме того, 2n соотношений вида x(t1 ) = ϕ1 (t 0 , t1 , λ 0 , x 0 ) ,λ (t1 ) = ϕ 2 (t 0 , t1 , λ 0 , x 0 ) будут получены в результате интегрирования системы (23).
Таким образом, для полученной краевой задачи имеется достаточное число соотношений, позволяющих считать ее, по крайней мере, теоретически разрешимой.Необходимо также отметить, что принцип максимума дает глобальный минимум. Численные методы решения краевых задачприведены в [20, 23].4.4. Некоторые следствия принципа максимума1. Непосредственным следствием системы (23) и условия (24) является выполнение между точками разрыва функцииu(t) соотношенияdH ∂H=.dt∂t(34)Это условие для автономных систем (т.е. систем, не зависящих явно от t) приводит к первому интегралу: H = const вдольвсей оптимальной траектории, хотя в общем случае условие (34) неверно, условия скачка обоснованы и получены.2.
В большинстве практических случаев λ 0 > 0 (так называемый нормальный случай), и поэтому без нарушения общности в силу однородности функции H по переменным λi можно принять λ0 = 1.П р и м е ч а н и е . Из-за однородности H по λi управление u из (25) определяется не самими величинами λi, а их отношениями к одной из них, например, к λ0. Это эквивалентно принятию λ0 = 1. Случай λ0 = 0 является особым (анормальным)и здесь не рассматривается.3.
Условия (24), (25) принципа максимума позволяют найти оптимальные значения всех m компонент вектора u.Если минимум H по u достигается во внутренней точке множества Um и функции fi дифференцируемы по u, то u *j определяются из условия∂H∂u j= 0 ( j = 1, m) .(35)u = u*Это условие совместно с (23) образует условие Эйлера-Лагранжа классического вариационного исчисления для задачи (11) –(13)[24 – 27].П р и м е ч а н и е . Минимум H по u далеко не всегда достигается во внутренней точке множества U m , а в тех случаях,когда он достигается во внутренней точке, последняя не обязательно является стационарной (рис. 7). Типы минимизирующих точек довольно разнообразны. Из них особо следует отметить случаи нестрогого минимума, так как принцип максимума не позволяет для них однозначно определить u*.
Этот случай в теории оптимального управления является особым.а – внутренний min H(u) в стационарной точке; б, в – граничный min H(u);г – граничный min H(u); uс1, uс2 – стационарные точки локальных max и min;д – внутренний min H(u) в угловой точке; uс3 – точка перегиба;е – две изолированные минимизирующие точки 2 и 3; ж – нестрогий min H(u)на отрезке 4 – 5 и изолированный min H(u) в точке 6Если функция H достигает минимального значения в точке на границе ГU m области U m , то условие (35) не являетсяболее необходимым в этой точке. При этом возможны три случая:а) множество U m описывается системой связей в виде равенствχ S (u1 , u 2 , ..., u m ) = 0 ( s = 1, 2, ..., ν < m) ;(36)тогда минимум H при условиях (36) находится методом неопределенных множителей Лагранжа;б) множество U m задано системой неравенствℵs1 (u1 , u 2 , ..., u m ) ≤ 0 ( s1 = 1, 2, 3, ...) ;(37)тогда задача сводится на каждом шаге интегрирования к проблеме нелинейного программирования;в) множество U m является ограниченной областью, не имеющей границ (например, замкнутой двумерной поверхностью типа сферы или эллипсоида в трехмерном пространстве).
Для всякой непрерывной функции H(u), имеющей непрерывные частные производные, заданной на замкнутой поверхности и выраженной через параметрические координаты этой поверхности, точка максимума H по этим параметрическим координатам принадлежит к числу решений (35), где роль u j играют параметрические координаты поверхности.П р и м е р . Пусть H (u1 , u 2 , u3 ) задана на сфере. Тогда замена u1 = r sin θ cos ϕ , u2 = r sin θ sin ϕ , u3 = r cos θ приводит к~~H (u1 , u 2 , u3 ) = H (θ, ϕ, r ) – периодической функции с периодом 2π по θ и ϕ и в точке минимума H = H имеют месторавенства~~∂H ∂H==0.∂θ∂ϕ4. Условия (35) определяют лишь внутреннюю стационарную точку функции H. Если u* = u удовлетворяет системе(35) и доставляет минимум функции H(u), то должны быть выполнены необходимые условия второго порядка: матрица частных производных второго порядка функции H(u) ∂ 2 H (38)H uu = (i, j = 1, m) ∂ui ∂u j должна быть неотрицательно определенной в точке u* минимума функции H(u).Положительная определенность матрицы Нuu при выполнении условий (35) в точке u* является достаточным условиемдля относительного (но не абсолютного!) минимума H(u) в этой точке.