Громов Ю.Ю. и др. - Специальные разделы теории управления, оптимальное управление динамическими системами, страница 12
Описание файла
PDF-файл из архива "Громов Ю.Ю. и др. - Специальные разделы теории управления, оптимальное управление динамическими системами", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 12 страницы из PDF
Первый тип необходимых условий оптимальностидля граничных участков траекторииДля простоты рассматривается случай, когда лишь одно из ограничений типа (72) выполняется в виде равенства (например, ограничение φ1 ). Пусть это ограничениеφ1 (t , x) = 0(77)таково, что полная производная по времениdφ1 (t , x) ∂φ1 ∂φ1∂φ ∂φ x& = 1 + 1 f (t , x, u)+=dt∂t ∂x ∂x∂t(78)содержит управление u явно.Необходимое и достаточное условие того, что (77) имеет место на некотором ненулевом отрезке [t1′ , t 2′ ] , вводится вуравнениеdφ (t , x) ∂φ1 ∂φ1 φ& 1 = 1=+ f (t , x, u) = φ& 1 (t , x, u) = 0dt∂t ∂x (79)H 1 = H + βφ& 1 (t , x, u) ,(80)Составляется гамильтониан H1 для граничных участковгдеH = λ0 f0 +n∑ fiλi ;i =1β = 0 на участках, где φ1 > 0; β ≠ 0 на участках, где φ1 = 0 .Теперь необходимые условия для граничного участка совпадают с необходимыми условиями п.
8.3 с заменой в условиях (95), (97), (101) функции ℵ на φ& 1 . Отличие этой задачи от задачи п. 8.2 заключается в условиях, накладываемых на переменные в точках выхода траектории на границу и схода с нее. В этих точках сопряженные переменные λ i (t ) могут претерпевать разрывы. Если имеется всего два участка, то сопряженные переменные непрерывны. При этом условие φ1 (t , x) = 0может толковаться либо как связь, наложенная на начальные значения (t 0 , x 0 ) , либо как связь, наложенная на конечныезначения (t1 , x1 ) , в зависимости от порядка следования участков с φ1 > 0 и φ1 = 0 .При трех участках, если сначала идет граничный участок, затем участок с φ1 > 0 и далее снова граничный участок,множители тоже непрерывны вдоль всей траектории.
При всех других порядках следования участков, если последних больше трех, сопряженные переменные имеют разрыв типа скачка. Этот скачок в значениях λ i (t ) можно осуществить на любомконце граничного участка, при этом на другом конце множители уже могут быть выбраны непрерывными (выбор конца, накотором происходит скачок, не имеет значения).
Если этот конец выбран в момент времени t 2′ , то условия скачка имеют видλ + (t 2 ) = λ − (t 2 ) − C∂φ1 (t 2 );∂xH + (t 2′ ) = H −1 (t 2′ ) + Cφ1− (t 2′ ) = 0 ,∂φ1 (t 2′ );∂t(81)(82)(83)где С – произвольная постоянная; индексы «+» и «–» обозначают пределы справа и слева, соответственно.Если условия (81) подставить в (82), то коэффициент при С будет φ& 1 и, таким образом, условие (82) не зависит от С, асодержит только значения λ− (t 2′ ) .
После указанной подстановки уравнение (82) может быть использовано в качестве эквивалентного необходимого условия.В данной задаче решение x(t ), λ (t ) не зависит от λ i 0 , С как от параметровx = x(t , λ i 0 , C ); λ = λ (t , λ i 0 , C ) .В каждой точке разрыва непрерывности сопряженных переменных должна добавляться новая константа С. Величина Сне может быть определена заранее из необходимых условий и является дополнительным параметром, определяющим точкусхода. Поскольку число граничных участков заранее неизвестно, задача становится проблемой с переменным числом параметров, что существенно усложняет ее практическое решение даже с помощью ЭВМ.П р и м е р 3.
Пусть имеются три участка оптимальной траектории, следующие в таком порядке:1 участок – траектория в открытой области, φ1 > 0 ;2 участок – граничная траектория, φ1 = 0 ;3 участок – снова траектория в открытой области, φ1 > 0 .Необходимые условия в конечной точке дают (n + 1) уравнение относительно (n + 2) неизвестных λ i 0 , t1 , C . Условия(82), (83) иβ(t 2′ + 0) = 0(84)определяют точку t 2′ и дают дополнительное уравнение относительно неизвестных λ i 0 , t1 , C . Задача, таким образом, свелась к нахождению решения (n + 2) уравнений с (n + 2) неизвестными.Если участков больше, чем три, задача сводится к многоточечной краевой проблеме.7.4. Второй тип необходимых условий для оптимальностиуправления на граничных участкахПусть tвх – момент входа траектории на границу допустимой области, tсх – момент схода с этой границы. Гамильтониан H 2 для граничных участков может быть представлен в следующем виде:H 2 = λ0 f0 +n∑ λ i f i + β1φ1 + β 2φ& 1 = H + β1φ1 + β 2 φ& 1 ,i =1где β1 = β2 = 0, если φ1 > 0 ; β1 ≠ 0, β 2 ≠ 0 , если φ1 = 0 , а φ& 1 определяется правой частью соотношения (78).На граничном участке (т.е.
при t вх ≤ t ≤ t сх ) вдоль оптимальной траектории выполняются условияtT ∂H 2 ∂H 2 x& = , λ& = − , φ1 = 0, φ& 1 = 0 .λ∂ ∂x (85)Оптимальное управление на граничном участке определяется из условия минимума H по u ∈ U1m (t , x) , где U1m (t , x) – тачасть значений u из области U m , которая удовлетворяет условию φ1 (t , x, u) = 0 .Если минимум H по u в области U1m (t , x) достигается в ее внутренней точке, то∂H 2 ∂H∂ &=+ β2(φ(t , x, u)) = 0, φ1 (t , x) = 0, φ& 1 (t , x, u) = 0 .∂u∂u∂uЗначения вектора λ и гамильтониана H 2 непрерывны в точке входа на границу допустимой области:λ (t вх + 0) = λ (t вх − 0); H 2 (t вх + 0) = H 2 (t вх − 0) .Остальные недостающие граничные условия могут быть найдены из общих условий трансверсальности (см.
п. 4.3). Вчастности, из этих условий следует, что при t = t1 ∂L λ (t1 ) = ∂x T; L = Φ (t1 , x(t1 )) + µ T q(t1 , x(t1 )) ;t = t1∂L+ H 2 (t1 ) = 0 (если t1 – не задано).∂t1Кроме того, к этим условиям надо добавить заданное граничное условие (76):q(t1 , x(t1 )) = 0 .Контрольные вопросы1. Необходимые условия оптимальности.2. Первый тип необходимых условий оптимальности для граничных участков траектории.3. Второй тип необходимых условий для оптимальности управления на граничных участках.Глава 8НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИУПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ОДНОВРЕМЕННОФАЗОВЫЕ КООРДИНАТЫ x И УПРАВЛЕНИЕ uПри рассмотрении технических систем часто встречаются задачи, в которых допустимые значения управляющих функций не должны превосходить пределов, зависящих от текущего состояния системы.Ограничения рассматриваемого типа можно записать в видеℵ(t , x, u) ≤ 0 ,(86)где ℵ явным образом зависит от состояния x и управления u.
Принцип максимума, сформулированный в п. 4.3, справедливлишь для неравенств типаℵi (t , u) ≤ 0 ,(87)т.е. не содержащих фазовых координат x явно.Ниже приводится формулировка принципа максимума, пригодная для ограничений типа (86).8.1. Краткая формулировка задачиПусть эволюция системы S описывается векторным дифференциальным уравнениемdx= f (t , x, u) ,dt(88)где x = ( x1, x2 , ..., xn )T – n-мерный вектор состояния; u = (u1, u2 , ..., um )T – m-мерный вектор управления.На значения управляющего вектора u наложены ограниченияℵ(t , x, u) ≥ 0 ,(89)где ℵ = (ℵ1 , ℵ2 , ..., ℵv1 )T – v1 -мерный вектор, причем число связей, одновременно удовлетворяющихся в виде равенств, непревосходит m.Область U m допустимых значений u зависит от t, x: U m = U m (t , x) и задается уравнением (89). Предполагается, чтовектор u явно входит в уравнение (89).В начальный момент времени t = t0 задано состояние системыx(t 0 ) = x 0 .(90)Необходимо перевести систему S из состояния x0 в некоторое конечное состояние, определяемое соотношениямиq(t1 , x(t1 )) = 0 ,(91)где q = (q1 , q 2 , ..., ql2 ), l 2 ≤ n + 1 .Требуется найти такой допустимый кусочно-непрерывный вектор u(t), удовлетворяющий (89), что функционалJ [u] = Φ (t1, x(t1 )) +t1∫ f0 (t , x, u)dt(92)t0принимает минимальное значение на решениях системы (88).Решения x(t) системы (88) предполагаются непрерывными и обладающими, по крайней мере, абсолютно непрерывнымипроизводными.
Точки tα , где одна или более компонент вектора u терпят разрыв первого рода, называются угловыми точками. Точки t s , в которых изменяется знак «>» на «=» (или наоборот) в одном или нескольких ограничениях (89), называются точками соединения.8.2. Типы граничных условийЗадача, в которой Φ (t1, x(t1 )) ≡ 0 , а граничные условия (97) имеют видxi (t1 ) − xi1 = 0 (i = 1, l2 ≤ n)(93)xi (t1 ) − xi1 = 0 (i = 1, l 2 − 1 ≤ n) ,(94)илиt1 − t зад = 0 ,где xi1 , t зад – заданные числа, называется иногда простейшей.При l2 = n условия (93) приводят к задаче с закрепленным правым концом и свободным временем. При l2 < n условия(93) приводят к задаче с частично свободным правым концом и свободным временем t1 . Условия типа (94) относятся к задаче с закрепленным временем t1 = tзад и частично свободным правым концом траектории.8.3.
Необходимые условия оптимальностиЕсли u * (t ) ∈ U m (x, t ) [ U m определяется условиями (89)] является управлением, минимизирующим функционал J[u], тонайдутся такие постоянные числа λ 0 = 1, µ = (µ1 , ..., µ l2 )T , не все равные нулю, и такие одновременно не обращающиеся внуль переменные векторы λ(t ) = λ1 (t ), ..., λ n (t ))T (непрерывный на [t 0 , t1 ] ) и β(t ) = (β1 (t ), ..., βv1 (t ))T (непрерывный на [t 0 , t1 ]всюду, за исключением, быть может, точек разрыва управления u(t), где, однако, у него существуют единственные право- илевосторонние пределы), что на [t 0 , t1 ] имеют место соотношенияTTTdλ ∂H ∂H ∂ℵ = − − β = − 1 ;dt ∂x ∂x ∂x T(95)Tdx ∂H 1 ∂H = = ;dt ∂λ ∂λ (96)β jℵ j = 0 ( j = 1, v1 ) ,(97)гдеβ≤0.(98)Для всех фиксированных (t , x, λ ) и u, удовлетворяющих (89), выполняется принцип максимума (см.