Громов Ю.Ю. и др. - Специальные разделы теории управления, оптимальное управление динамическими системами (955108), страница 12
Текст из файла (страница 12)
Первый тип необходимых условий оптимальностидля граничных участков траекторииДля простоты рассматривается случай, когда лишь одно из ограничений типа (72) выполняется в виде равенства (например, ограничение φ1 ). Пусть это ограничениеφ1 (t , x) = 0(77)таково, что полная производная по времениdφ1 (t , x) ∂φ1 ∂φ1∂φ ∂φ x& = 1 + 1 f (t , x, u)+=dt∂t ∂x ∂x∂t(78)содержит управление u явно.Необходимое и достаточное условие того, что (77) имеет место на некотором ненулевом отрезке [t1′ , t 2′ ] , вводится вуравнениеdφ (t , x) ∂φ1 ∂φ1 φ& 1 = 1=+ f (t , x, u) = φ& 1 (t , x, u) = 0dt∂t ∂x (79)H 1 = H + βφ& 1 (t , x, u) ,(80)Составляется гамильтониан H1 для граничных участковгдеH = λ0 f0 +n∑ fiλi ;i =1β = 0 на участках, где φ1 > 0; β ≠ 0 на участках, где φ1 = 0 .Теперь необходимые условия для граничного участка совпадают с необходимыми условиями п.
8.3 с заменой в условиях (95), (97), (101) функции ℵ на φ& 1 . Отличие этой задачи от задачи п. 8.2 заключается в условиях, накладываемых на переменные в точках выхода траектории на границу и схода с нее. В этих точках сопряженные переменные λ i (t ) могут претерпевать разрывы. Если имеется всего два участка, то сопряженные переменные непрерывны. При этом условие φ1 (t , x) = 0может толковаться либо как связь, наложенная на начальные значения (t 0 , x 0 ) , либо как связь, наложенная на конечныезначения (t1 , x1 ) , в зависимости от порядка следования участков с φ1 > 0 и φ1 = 0 .При трех участках, если сначала идет граничный участок, затем участок с φ1 > 0 и далее снова граничный участок,множители тоже непрерывны вдоль всей траектории.
При всех других порядках следования участков, если последних больше трех, сопряженные переменные имеют разрыв типа скачка. Этот скачок в значениях λ i (t ) можно осуществить на любомконце граничного участка, при этом на другом конце множители уже могут быть выбраны непрерывными (выбор конца, накотором происходит скачок, не имеет значения).
Если этот конец выбран в момент времени t 2′ , то условия скачка имеют видλ + (t 2 ) = λ − (t 2 ) − C∂φ1 (t 2 );∂xH + (t 2′ ) = H −1 (t 2′ ) + Cφ1− (t 2′ ) = 0 ,∂φ1 (t 2′ );∂t(81)(82)(83)где С – произвольная постоянная; индексы «+» и «–» обозначают пределы справа и слева, соответственно.Если условия (81) подставить в (82), то коэффициент при С будет φ& 1 и, таким образом, условие (82) не зависит от С, асодержит только значения λ− (t 2′ ) .
После указанной подстановки уравнение (82) может быть использовано в качестве эквивалентного необходимого условия.В данной задаче решение x(t ), λ (t ) не зависит от λ i 0 , С как от параметровx = x(t , λ i 0 , C ); λ = λ (t , λ i 0 , C ) .В каждой точке разрыва непрерывности сопряженных переменных должна добавляться новая константа С. Величина Сне может быть определена заранее из необходимых условий и является дополнительным параметром, определяющим точкусхода. Поскольку число граничных участков заранее неизвестно, задача становится проблемой с переменным числом параметров, что существенно усложняет ее практическое решение даже с помощью ЭВМ.П р и м е р 3.
Пусть имеются три участка оптимальной траектории, следующие в таком порядке:1 участок – траектория в открытой области, φ1 > 0 ;2 участок – граничная траектория, φ1 = 0 ;3 участок – снова траектория в открытой области, φ1 > 0 .Необходимые условия в конечной точке дают (n + 1) уравнение относительно (n + 2) неизвестных λ i 0 , t1 , C . Условия(82), (83) иβ(t 2′ + 0) = 0(84)определяют точку t 2′ и дают дополнительное уравнение относительно неизвестных λ i 0 , t1 , C . Задача, таким образом, свелась к нахождению решения (n + 2) уравнений с (n + 2) неизвестными.Если участков больше, чем три, задача сводится к многоточечной краевой проблеме.7.4. Второй тип необходимых условий для оптимальностиуправления на граничных участкахПусть tвх – момент входа траектории на границу допустимой области, tсх – момент схода с этой границы. Гамильтониан H 2 для граничных участков может быть представлен в следующем виде:H 2 = λ0 f0 +n∑ λ i f i + β1φ1 + β 2φ& 1 = H + β1φ1 + β 2 φ& 1 ,i =1где β1 = β2 = 0, если φ1 > 0 ; β1 ≠ 0, β 2 ≠ 0 , если φ1 = 0 , а φ& 1 определяется правой частью соотношения (78).На граничном участке (т.е.
при t вх ≤ t ≤ t сх ) вдоль оптимальной траектории выполняются условияtT ∂H 2 ∂H 2 x& = , λ& = − , φ1 = 0, φ& 1 = 0 .λ∂ ∂x (85)Оптимальное управление на граничном участке определяется из условия минимума H по u ∈ U1m (t , x) , где U1m (t , x) – тачасть значений u из области U m , которая удовлетворяет условию φ1 (t , x, u) = 0 .Если минимум H по u в области U1m (t , x) достигается в ее внутренней точке, то∂H 2 ∂H∂ &=+ β2(φ(t , x, u)) = 0, φ1 (t , x) = 0, φ& 1 (t , x, u) = 0 .∂u∂u∂uЗначения вектора λ и гамильтониана H 2 непрерывны в точке входа на границу допустимой области:λ (t вх + 0) = λ (t вх − 0); H 2 (t вх + 0) = H 2 (t вх − 0) .Остальные недостающие граничные условия могут быть найдены из общих условий трансверсальности (см.
п. 4.3). Вчастности, из этих условий следует, что при t = t1 ∂L λ (t1 ) = ∂x T; L = Φ (t1 , x(t1 )) + µ T q(t1 , x(t1 )) ;t = t1∂L+ H 2 (t1 ) = 0 (если t1 – не задано).∂t1Кроме того, к этим условиям надо добавить заданное граничное условие (76):q(t1 , x(t1 )) = 0 .Контрольные вопросы1. Необходимые условия оптимальности.2. Первый тип необходимых условий оптимальности для граничных участков траектории.3. Второй тип необходимых условий для оптимальности управления на граничных участках.Глава 8НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИУПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ОДНОВРЕМЕННОФАЗОВЫЕ КООРДИНАТЫ x И УПРАВЛЕНИЕ uПри рассмотрении технических систем часто встречаются задачи, в которых допустимые значения управляющих функций не должны превосходить пределов, зависящих от текущего состояния системы.Ограничения рассматриваемого типа можно записать в видеℵ(t , x, u) ≤ 0 ,(86)где ℵ явным образом зависит от состояния x и управления u.
Принцип максимума, сформулированный в п. 4.3, справедливлишь для неравенств типаℵi (t , u) ≤ 0 ,(87)т.е. не содержащих фазовых координат x явно.Ниже приводится формулировка принципа максимума, пригодная для ограничений типа (86).8.1. Краткая формулировка задачиПусть эволюция системы S описывается векторным дифференциальным уравнениемdx= f (t , x, u) ,dt(88)где x = ( x1, x2 , ..., xn )T – n-мерный вектор состояния; u = (u1, u2 , ..., um )T – m-мерный вектор управления.На значения управляющего вектора u наложены ограниченияℵ(t , x, u) ≥ 0 ,(89)где ℵ = (ℵ1 , ℵ2 , ..., ℵv1 )T – v1 -мерный вектор, причем число связей, одновременно удовлетворяющихся в виде равенств, непревосходит m.Область U m допустимых значений u зависит от t, x: U m = U m (t , x) и задается уравнением (89). Предполагается, чтовектор u явно входит в уравнение (89).В начальный момент времени t = t0 задано состояние системыx(t 0 ) = x 0 .(90)Необходимо перевести систему S из состояния x0 в некоторое конечное состояние, определяемое соотношениямиq(t1 , x(t1 )) = 0 ,(91)где q = (q1 , q 2 , ..., ql2 ), l 2 ≤ n + 1 .Требуется найти такой допустимый кусочно-непрерывный вектор u(t), удовлетворяющий (89), что функционалJ [u] = Φ (t1, x(t1 )) +t1∫ f0 (t , x, u)dt(92)t0принимает минимальное значение на решениях системы (88).Решения x(t) системы (88) предполагаются непрерывными и обладающими, по крайней мере, абсолютно непрерывнымипроизводными.
Точки tα , где одна или более компонент вектора u терпят разрыв первого рода, называются угловыми точками. Точки t s , в которых изменяется знак «>» на «=» (или наоборот) в одном или нескольких ограничениях (89), называются точками соединения.8.2. Типы граничных условийЗадача, в которой Φ (t1, x(t1 )) ≡ 0 , а граничные условия (97) имеют видxi (t1 ) − xi1 = 0 (i = 1, l2 ≤ n)(93)xi (t1 ) − xi1 = 0 (i = 1, l 2 − 1 ≤ n) ,(94)илиt1 − t зад = 0 ,где xi1 , t зад – заданные числа, называется иногда простейшей.При l2 = n условия (93) приводят к задаче с закрепленным правым концом и свободным временем. При l2 < n условия(93) приводят к задаче с частично свободным правым концом и свободным временем t1 . Условия типа (94) относятся к задаче с закрепленным временем t1 = tзад и частично свободным правым концом траектории.8.3.
Необходимые условия оптимальностиЕсли u * (t ) ∈ U m (x, t ) [ U m определяется условиями (89)] является управлением, минимизирующим функционал J[u], тонайдутся такие постоянные числа λ 0 = 1, µ = (µ1 , ..., µ l2 )T , не все равные нулю, и такие одновременно не обращающиеся внуль переменные векторы λ(t ) = λ1 (t ), ..., λ n (t ))T (непрерывный на [t 0 , t1 ] ) и β(t ) = (β1 (t ), ..., βv1 (t ))T (непрерывный на [t 0 , t1 ]всюду, за исключением, быть может, точек разрыва управления u(t), где, однако, у него существуют единственные право- илевосторонние пределы), что на [t 0 , t1 ] имеют место соотношенияTTTdλ ∂H ∂H ∂ℵ = − − β = − 1 ;dt ∂x ∂x ∂x T(95)Tdx ∂H 1 ∂H = = ;dt ∂λ ∂λ (96)β jℵ j = 0 ( j = 1, v1 ) ,(97)гдеβ≤0.(98)Для всех фиксированных (t , x, λ ) и u, удовлетворяющих (89), выполняется принцип максимума (см.