Громов Ю.Ю. и др. - Специальные разделы теории управления, оптимальное управление динамическими системами, страница 15
Описание файла
PDF-файл из архива "Громов Ю.Ю. и др. - Специальные разделы теории управления, оптимальное управление динамическими системами", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр PDF-файла онлайн
Текст 15 страницы из PDF
В концевых точках t1 , t q и точках разрыва t j вы-полняются соотношения, обобщающие условия трансверсальности и условия Эрдмана–Вейерштрасса (см. п. 9.2):1) при t = t1 ∂F ( j ) ∂L n ∂F (1) ∂L+∑= 0;−x&i =0;∂t1 i =1 ∂x&i∂xi (t1 ) ∂x&i t =t1t =t1(153)2) при t = t j ( j = 2, 3, ..., q − 1)∂L∂xi (t −j ) ∂F ( j −1) ∂F ( j ) ∂L+= 0;−=0;+∂xi (t j ) ∂xi (t ) t =t + ∂x&i (t ) t =t −jj(154)n n ∂L∂F ( j ) ∂F ( j −1) +∑x&i −∑x&i =0;∂t j i =1 ∂x&i t =t − i t =t +j i =1 ∂x&ij(155)3) при t = tqn ∂F ( q −1) ∂L∂F ( q −1) ∂L−∑+x&i = 0; =0.∂t g i =1 ∂x&i∂xi (t q ) ∂x&i ttq(156)qДля задач с фиксированными величинами разрывов (скачков) краевые условия типа (146) включают соотношения видаg k ≡ xi (t −j ) − xi (t +j ) − ∆(i j ) ,(157)где ∆(i j ) – постоянная (величина скачка xi в момент времени t j ), i = 1, n, j = 2, q − 1, k = 1, p .Тогда при t = t j ( j = 2, q − 1) условия (154) и (155) имеют видn n ∂L∂F ( j ) ∂F ( j −1) +∑x&i −∑x&i =0;∂t j i =1 ∂x&i t =t + i =1 ∂x&i t =t −jj ∂F ( j ) ∂L−∂xi (t j ) ∂x&i t =t +j ∂F ( j −1) +=0. ∂x&i t =t −j(158)(159)Контрольные вопросы1.
Перечислите необходимые условия оптимальности.2. Приведите физическую интерпретацию задачи с разрывами.Глава 11ЗАДАЧА ЛАГРАНЖА И ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ11.1. Принцип Лагранжа для задачи ЛагранжаЗадачей Лагранжа называется следующая экстремальная задача в пространстве Ξ = C 1 (∆, R n ) × C (∆, R r ) × R 2 :Β 0 (x(⋅), u(⋅), t 0 , t1 ) → inf ′ ;(з)Φ (x(⋅), u(⋅), t 0 , t1 ) = x& (t ) − ϕ(t , x(t ), u(t )) = 0 ;(1)Β i (x(⋅), u (⋅), t 0 , t1 ) ≤ 0, i = 1, m′ ;(2)Β i (x(⋅), u(⋅), t 0 , t1 ) = 0, i = m′ + 1, m ,(3)гдеΒ i (x(⋅), u(⋅), t 0 , t1 ) =t1∫ f i (t, x, u) dt + ψ i (t0 , x(t0 ), t1 , x(t1 )),i = 0, m .t0Здесь ∆ – заданный конечный отрезок, t0 , t1 ∈ ∆, fi : R × Rn × × Rr → R – функции n + r + 1 переменных,ψ i : R × R n × R × R n → R – функции 2n + 2 переменных, ϕ : R × R n × R r → R n вектор-функция n + r + 1 переменных.Ограничение (1) называется дифференциальной связью, вектор-функция x(⋅) = ( x1 (⋅), ..., xn (⋅)) – фазовой переменной,вектор-функция u(⋅) = (u1 (⋅), ..., u r (⋅)) – управлением.Четверка(x(⋅), u(⋅), t 0 , t1 )называетсяуправляемымпроцессомвзадачеЛагранжа,еслиx(⋅) ∈ C 1 (∆, R n ), u(⋅) ∈ C (∆, R r ) , t 0 , t1 ∈ int ∆, t 0 < t1 , и всюду на отрезке [t 0 , t1 ] выполняется дифференциальная связь (1), идопустимым управляемым процессом, если эта четверка является управляемым процессом и, кроме того, выполнены ограничения (2), (3).Допустимый управляемый процесс ξˆ = (xˆ (⋅), uˆ &(⋅), tˆ0 , tˆ1 ) называется оптимальным (в слабом смысле) процессом, илислабым минимумом в задаче (з), если существует такое δ > 0 , что для любого допустимого управляемого процессаξ = (x(⋅), u(⋅), t 0 , t1 ) , удовлетворяющего условию ξ − ξˆ < δ , выполнено неравенство Β(ξ) ≥ Β(ξˆ ) .ΞПравило решения.1.
Составить функцию Лагранжа:Α(x(⋅), u(⋅), t 0 , t1 ; p(⋅), λ ) =t1m m= λ i f i (t , x, u) + p(t )(x& − ϕ(t , x, u)) dt + λ i ψ i (t 0 , x(t 0 ), t1 , x(t1 )) ,i =0t0 i = 0∫∑∑λ = (λ 0 , λ1 , ..., λ m ), p (⋅) ∈ C 1 ([t 0 , t1 ], R n* ) .2. Выписать необходимые условия оптимального в слабом смысле процесса ξˆ = (xˆ (⋅), uˆ (⋅), tˆ0 , tˆ1 ) :а) стационарности по x – уравнение Эйлера:−d ˆLx& (t ) + Lˆ x (t ) = 0 ⇔ p& (t ) =dtm∑ λ i fˆix (t ) − p(t ) ϕˆ x (t )∀t ∈ [tˆ0 , tˆ1 ]i =0для лагранжианаL=m∑ λ i f i (t , x, u) + p(t )(x& − ϕ(t, x, u)) ;i =0б) трансверсальности по x:Lˆ x& (tˆk ) = (−1) k lˆx (tk ) ⇔ p (tˆk ) = (−1) km∑ λ i ψˆ ix(t ) ,ki =0k = 0, 1для терминантаl=m∑ λ i ψ i (t0 , x(t0 ), t1 , x(t1 )) ;i =0в) стационарности по u:Lˆu (t ) = 0 ⇔m∑ λ i fˆiu (t ) − p(t ) ϕˆ u (t ) = 0∀t ∈ [tˆ0 , tˆ1 ] ;i =0г) стационарности по t k :ˆ = 0 ⇔ (−1) k +1Αtkmm∑ λ i fˆi (tˆk ) + ∑ λ i (ψˆ iti =0i =0kˆ ix (t ) xˆ& (tˆk )) = 0, k = 0, 1+ψk(условие стационарности по t k выписывается только для подвижных концов);д) дополняющей нежесткостиλ i Β i (ξˆ ) = 0, i = 1, m′ ;е) неотрицательностиλ i ≥ 0, i = 0, m′ .3.
Найти допустимые управляемые процессы, для которых выполняются условия п. 2 с множителями Лагранжа λ иp (⋅) , одновременно не равными нулю. При этом бывает полезно отдельно рассмотреть случаи λ 0 = 0 и λ 0 ≠ 0 . Во второмслучае можно положить λ 0 , равным единице или любой другой положительной константе.4. Среди всех найденных в п.
3 допустимых экстремальных процессов отыскать решение или доказать, что решениянет.Предлагаем проверить, что правило решения составлено в полном соответствии с общим принципом Лагранжа.Набор условий для нахождения оптимального процесса является полным. Действительно, для определения неизвестныхфункций x(⋅), p(⋅), u(⋅) мы имеем систему из дифференциальных уравнений (1) и условий б), в). Выражая из последнего (разумеется, когда это можно сделать, например, если выполнены условия теоремы о неявной функции) u(⋅) через x(⋅) и p(⋅) ,мы получаем систему из 2n скалярных дифференциальных уравнений.
Ее общее решение зависит от 2n произвольных постоянных и еще от множителей Лагранжа λ i , среди которых m независимых. Добавляя сюда еще t0 и t1 , получаем всего 2n + m+ 2 неизвестных. Для их определения мы имеем 2n условий трансверсальности б), m условий дополняющей нежесткости изаданных ограничений (3) и два условия стационарности по t k . Таким образом, число неизвестных совпадает с числом уравнений. (Разумеется, разрешимости полученной системы уравнений указанное обстоятельство не гарантирует.)11.2. Принцип максимума в форме ЛагранжаЗадачей оптимального управления (в понтрягинской форме) будем называть следующую задачу в пространствеKC (∆, R n ) × KC (∆, R r ) × R 2 [14]:1Β 0 (x(⋅), u(⋅), t 0 , t1 ) → inf ;x& (t ) = ϕ(t , x(t ), u(t )) ;(з)(1)u(t ) ∈ U ∀t ∈ [t 0 , t1 ] ;(2)Β i (x(⋅), u(⋅), t 0 , t1 ) ≤ 0, i = 1, m′ ;(3)Β i (x(⋅), u(⋅), t 0 , t1 ) = 0, i = m′ + 1, m ,(4)гдеΒ i (x(⋅), u(⋅), t 0 , t1 ) =t1∫ f i (t, x(t ), u(t )) dt + ψ i (t0 , x(t0 ), t1 , x(t1 )),i = 0, m .t0Здесь ∆ – заданный конечный отрезок, t 0 , t1 ∈ ∆ , fi : R × Rn × × Rr → R – функции n + r + 1 переменных,ψ i : R × R n × R × R n → R – функции 2n + 2 переменных; ϕ : R × R n × R r → R n – вектор-функция n + r + 1 переменных, U –произвольное множество из R r .
Частным случаем задачи (з) является задача, в которой один из концов или даже оба закреплены.Вектор-функция x(⋅) называется фазовой переменной, u(⋅) – управлением. Уравнение (1), называемое дифференциальной связью, должно выполняться во всех точках непрерывности управления u(⋅) на интервале (t 0 , t1 ) (это множество будетобозначаться через T).Четверка (x(⋅), u(⋅), t 0 , t1 ) называется управляемым процессом в задаче оптимального управления, еслиx(⋅) ∈ KC 1 (∆, R n ), u(⋅) ∈ KC (∆, R r ) и выполняются дифференциальная связь (1) и ограничение типа включения (2).
Управ-ляемый процесс является допустимым, если, кроме того, выполняются соотношения (3) и (4).Допустимый управляемый процесс ξˆ = (xˆ (⋅), uˆ (⋅), tˆ0 , tˆ1 ) называется (локально) оптимальным (или еще говорят оптимальным в сильном смысле процессом), если существует δ > 0 такое, что для всякого допустимого управляемого процессаξ = (x(⋅), u(⋅), t 0 , t1 ) , для которого(x(⋅), t 0 , t1 ) − (xˆ (⋅), tˆ0 , tˆ1 )C ( ∆ , R n )×R 2<δвыполняется неравенство Β 0 (ξ) ≥ Β 0 (ξˆ ) .Правило решения.1.
Составить функцию Лагранжа:t1 mΑ = λ i f i (t , x, u) + p(t )(x& − ϕ(t , x, u)) dt +t0 i = 0∫∑+m∑ λ i ψ i (t0 , x(t0 ), t1 , x(t1 )) ;i =0λ = (λ 0 , λ1 , ..., λ m ), p(⋅) ∈ KC 1 ([t 0 , t1 ], R n* ) .2. Выписать необходимые условия оптимальности процесса ξˆ = ( xˆ (⋅), uˆ (⋅), tˆ0 , tˆ1 ) :а) стационарности по x – уравнение Эйлера:−d ˆLx& (t ) + Lˆ x (t ) = 0 ⇔ p& (t ) =dtm∑ λ i fˆix (t ) − p(t )ϕˆ x (t ) ,i =0для лагранжианаL=m∑ λ i f i (t , x, u) + p(t )(x& − ϕ(t , x, u)) ;i =0б) трансверсальности по x:Lˆ x& (tˆk ) = (−1) k lˆxk ⇔ p(tˆk ) = (−1) km∑ λ i ψˆ ixi =0k, k = 0, 1 ,для терминантаl = l (t 0 , x0 , t1 , x1 ) =m∑ λ i ψ i (t0 , x0 , t1 , x1 ) ;i =0в) оптимальности по u – принцип минимума в лагранжевой форме:min Lˆ (t , xˆ (t ), x&ˆ (t ), u) = Lˆ (t , xˆ (t ), x&ˆ (t ), uˆ (t )) ⇔u∈U m⇔ min λ i f i (t , xˆ (t ), u) − p(t ) ϕ(t , xˆ (t ), u) =u∈U i =0∑=m∑ λ i f i (t , xˆ (t ), uˆ (t )) − p(t ) ϕ(t, xˆ (t ), uˆ (t ))i =0или в гамильтоновой (понтрягинской) форме в виде принципа максимума:max H (t , xˆ (t ), u, p(t )) = H (t , xˆ (t ), uˆ (t ), p(t )) ,u∈UгдеH (t , x, u, p) = pϕ(t , x, u ) −m∑ λ i f i (t , x, u) –i =0функция Понтрягина;г) стационарности по t k :ˆ = 0 ⇔ (−1) k +1Αtkmm∑ λ i fˆi (tˆk ) + ∑ λ i (ψˆ iti =0i =0k+ ψˆ ixk x&ˆ (tˆk )) = 0 ⇔⇔ Hˆ (tˆk ) = (−1) k +1 lˆt k , k = 0, 1(условие стационарности выписывается только для подвижных концов);д) дополняющей нежесткостиλ i Β i (ξˆ ) = 0, i = 1, m′ ;е) неотрицательностиλ i ≥ 0, i = 0, m′ .3.