Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения, страница 21
Описание файла
PDF-файл из архива "Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 21 страницы из PDF
При указанных значениях Tфункция (28) определена для всех векторов p, принадлежащих конусу&%K(T ) = p ∈ E n : Φ(p, T ) < 0 .V (p, T ) =190Конус K(T ), 0 T < T0 , содержит искомый вектор p0 ; при T → T0 −0конус K(T ) стягивается к лучу%&L(p0 ) = p ∈ E n : p = λp0 , λ 0 .Выпишем градиент и матрицу вторых частных производных потенциала V (p, T ):Vp (p, T ) = p −Φp (p, T ),Φ(p, T )(p, T ) = E −Vpp%&Φp (p, T ) = x0 − ξ(p, T )Φpp (p, T ) Φp (p, T )(Φp (p, T ))∗+,Φ(p, T )Φ2 (p, T )∂ξ(p, T )Φpp (p, T ) = −∂p∗(p, T )VpT∂ξ(p, T ) c(e−T A p) 1+ 2Φ (p, T ) .=Φ(p, T )∂TΦ (p, T ) p(p, T ) является симметричной и положительно опредеМатрица Vppлённой в конусе K(T ).
Функция V (p, T ) → +∞ при стремлении точки p ∈ K(T ) к границе конуса K(T ) и при p → ∞. Эта функция вконусе K(T ) имеет единственную точку минимума p = p(T ), котораяудовлетворяет условиюVp (p(T ), T ) ≡ p −x0 − ξ(p, T )= 0.Φ(p, T )(29)Уравнение (29) – новая (градиентная) форма уравнения проектирования; мы будем использовать это уравнение, имеющее градиентнуюформу, вместо уравнения (27).
Решение p = p(T ) ∈ K(T ) уравнения (29) удовлетворяет условию нормировки p = 1 (проверить!).Таким образом,Vp (p(T ), T ) ≡ 0∀T ∈ [0, T0 ),(30)V (p(T ), T ) = min V (q, T )∀T ∈ [0, T0 ).(31)q∈K(T )Соотношение (30) приводит к дифференциальному уравнению проектированияdpx0+ VpT (p, T ) = 0, p,(32)Vpp(p, T )=−dTx0 T =0191которое записано с помощью потенциала (27). Роль уравнения (32)аналогична роли уравнения (26). Характерной особенностью задачи (32) является то, что её решение p = p(T ), принадлежащее конусу K(T ), обладает экстремальным свойством (31).
Совместное использование задачи (32) (её численное интегрирование с большим шагом)и экстремального свойства (31) (минимизация потенциала V (p, T ) прификсированном T в конусе K(T ) с целью устранения погрешностичисленного интегрирования задачи (32)) позволяет построить эффективные вычислительные процедуры для нахождения решения p(T ),которое при значениях T , близких к T0 , T < T0 , доставляет весьмахорошее приближение к точному решению (p0 , T0 ) рассматриваемойлинейной задачи быстродействия. Полученное приближение уточняется методом (8).Затронутый в разделах 4.18, 4.19 круг вопросов более подробнообсуждается в [7].1925Задача оптимального управления с линейной динамикой и терминальным функционалом5.20Исследование терминальной задачи оптимального управления с линейной динамикой на фиксированном отрезке времениРассмотрим задачу оптимального управления4 с линейной динамикой на фиксированном отрезке времени [t0 , t1 ] со свободным правымконцом x(t1 ) ∈ M1 ≡ E n⎧ẋ = Ax + u,⎪⎪⎨x(t0 ) ∈ M0 ∈ Ω(E n ),(1)⎪⎪⎩ ϕ(x(t1 )) → min .u(·)∈УUКласс допустимых управлений УU состоит из всех измеримых наотрезке [t0 , t1 ] функций, причём u(t) ∈ U для почти всех t ∈ [t0 , t1 ].Критерий качества в задаче (1) имеет так называемую терминальнуюформу: J = ϕ(x(t1 )), где ϕ(·): E n → E 1 – заданная функция.
Простейшими примерами выбора терминальной функции ϕ(·) являются:1) ϕ(x) = x2 ;2) ϕ(x) = x − a2 , где a ∈ E n – известный вектор;3) ϕ(x) = (a, x), где a ∈ E n – известный вектор;&%4) ϕ(x) = max x1 ; . . . ; xn , где x = (x1 , . . . , xn )∗ ∈ E n .Теорема 20.1 (теорема существования). Пусть в терминальнойзадаче управления (1) множество M0 ∈ Ω(E n ), область управленияU ∈ Ω(E n ), терминальная функция ϕ(·) определена и непрерывнав E n . Тогда в классе допустимых управлений УU существует оптимальное управление для рассматриваемой задачи (1).2 Класс допустимых управлений УU состоит из интегрируемых поЛебегу функций, принимающих значения из компакта U . Поэтому в4 Принаписании этого раздела использованы материалы [20].193соответствии с теоремой об основных свойствах интеграла множестводостижимости рассматриваемого управляемого объектаX(t) ≡ X(t, t0 , M0 ) = e(t−t0 )A M0 +te(t−s)A У dst0является непустым компактом для любого t ∈ [t0 , t1 ].
В частности,X(t1 ) ∈ Ω(E n ). По теореме Вейерштрасса [12] функция ϕ(x) достигает на множестве X(t1 ) своего минимального значения:min ϕ(x) = min ϕ(x1 ),x∈X(t1 )x∈X(t1 )x1 = argmin ∈ X(t1 ).x∈X(t1 )Допустимое управление, переводящее объект в точку x1 в моментвремени t = t1 , является оптимальным.Определение 20.1. Будем говорить, что пара (x(t), u(t)) удовлетворяет принципу максимума Понтрягина на отрезке [t0 , t1 ], если длявекторной функции ψ(t), определяемой задачей Кошиψ̇ = −A∗ ψ,ψ(t1 ) = −ϕ (x(t1 )),(2)выполнены следующие два условия:а) условие максимума:(u(t), ψ(t)) = c(U, ψ(t))для почти всехt ∈ [t0 , t1 ],б) условие трансверсальности на множестве M0 :(x(t0 ), ψ(t0 )) = c(M0 , ψ(t0 )).Разумеется, в рассматриваемой паре (x(t), u(t)) второй элементu(t) – допустимое управление, а первый элемент x(t) – траектория,отвечающая этому управлению.
Понятно, что условия а) и б) являются информативными лишь при ненулевом векторе ψ(t0 ).Лемма 20.1. Пусть функция ϕ(·) непрерывно дифференцируемав E n ; X ⊂ E n – выпуклое множество; x∗ ∈ X – точка глобальногоминимума функции ϕ(·) на множестве X, т.е. ϕ(x∗ ) = min ϕ(x), илиx∈Xϕ(x) − ϕ(x∗ ) 0∀x ∈ X.(3)Тогда имеет место неравенство(ϕ (x∗ ), x − x∗ ) 0194∀x ∈ X.(4)2 Выберем произвольную точку x ∈ X. В силу выпуклости множества X отрезок [x∗ , x] ⊂ X, т.е.x∗ + λ(x − x∗ ) ∈ X∀λ ∈ [0, 1].(5)Из (3), (5) следует неравенствоϕ(x∗ + λ(x − x∗ )) − ϕ(x∗ ) 0,которое на основании формулы Тейлора можно переписать в видеλ(ϕ (x∗ ), x − x∗ ) + ō¯(λ) 0,λ → +0.Почленное деление на λ > 0 и переход к пределу при λ → +0 впоследнем неравенстве даёт(ϕ (x∗ ), x − x∗ ) 0∀x ∈ X,т.е.
неравенство (4) установлено. Лемма 20.1 доказана.Теорема 20.2 (теорема о необходимых условиях оптимальности). Пусть в задаче (1) множество M0 ∈ conv Ω(E n ), область управления U ∈ Ω(E n ), терминальная функция ϕ(·) непрерывно дифференцируема в E n , пара (x(t), u(t)), t0 t t1 , решает задачу оптимального управления (1). Тогда пара (x(t), u(t)) удовлетворяет принципумаксимума Понтрягина на отрезке [t0 , t1 ].2 Множество достижимости X(t1 ) является выпуклым компактом. При доказательстве этой теоремы для правого конца траекторииx(t1 ) ∈ X(t1 ) будут рассмотрены следующие два случая :1) x(t1 ) ∈ ∂X(t1 ),2) x(t1 ) ∈ int X(t1 ).В первом случае x(t1 ) ∈ ∂X(t1 ) при ϕ (x(t1 )) = 0 задача Коши (2)имеет решение ψ(t) ≡ 0, при этом условия а) и б) Определения 20.1очевидным образом выполняются. При ϕ (x(t1 )) = 0 имеем ψ(t1 ) = 0,и применение леммы 20.1 при x∗ = x(t1 ), X = X(t1 ), x ∈ X(t1 ) даёт(ϕ (x(t1 )), x − x(t1 )) 0∀x ∈ X(t1 ),или(−ϕ (x(t1 )), x − x(t1 )) ≡ (ψ(t1 ), x − x(t1 )) 0 ∀x ∈ X(t1 ),195т.е.
ненулевой вектор ψ(t1 ) является опорным вектором к множествудостижимости X(t1 ) в его граничной точке x(t1 ). Последнее неравенство на основании леммы об эквивалентной формулировке принципамаксимума влечёт выполнение условий а) и б) Определения 20.1.Во втором случае x(t1 ) ∈ int X(t1 ) имеем ϕ (x(t1 )) = 0; тогдазадача Коши (2) имеет решение ψ(t) ≡ 0, при этом условия а) и б)Определения 20.1 очевидным образом выполняются. Теорема 20.2 онеобходимых условиях оптимальности в задаче (1) доказана.Лемма 20.2. Для выпуклой непрерывно дифференцируемой в E nфункции ϕ(·) имеет место неравенствоϕ(x2 ) − ϕ(x1 ) (ϕ (x1 ), x2 − x1 )∀x1 , x2 ∈ E n .(6)2 Для выпуклой функции выполняется неравенствоϕ(λx2 + (1 − λ)x1 ) λϕ(x2 ) + (1 − λ)ϕ(x1 ) ∀x1 , x2 ∈ E n ,∀λ ∈ [0, 1],из которого получаемϕ(x1 + λ(x2 − x1 )) ϕ(x1 ) + λ[ϕ(x2 ) − ϕ(x1 )],ϕ(x1 + λ(x2 − x1 )) − ϕ(x1 ) ϕ(x2 ) − ϕ(x1 ),λλ ∈ (0, 1].Применение формулы Тейлора даёт(ϕ (x1 ), x2 − x1 ) +ō¯(λ) ϕ(x2 ) − ϕ(x1 ),λλ → +0,откуда, выполняя предельный переход при λ → +0, получаем неравенство (6).Теорема 20.3 (теорема о достаточных условиях оптимальности).
Пусть в задаче (1) M0 ∈ conv Ω(E n ), U ∈ Ω(E n ), функция ϕ(·) –выпуклая непрерывно дифференцируемая в E n , пара (x(t), u(t)) удовлетворяет принципу максимума Понтрягина на отрезке [t0 , t1 ]. Тогда пара (x(t), u(t)), t ∈ [t0 , t1 ], решает задачу оптимального управления (1).2 Множество достижимости X(t1 ) является выпуклым компактом. При доказательстве этой теоремы будут рассмотрены два случая.1) Пусть ϕ (x(t1 )) = 0. Применяя неравенство (6) при x1 = x(t1 ),x2 = x ∈ X(t1 ), получаемϕ(x(t1 )) ϕ(x) ∀x ∈ X(t1 ),196что доказывает оптимальность исследуемого решения.2) Пусть ϕ (x(t1 )) = 0.
Тогда, принимая во внимание то, что пара(x(t), u(t)) удовлетворяет принципу максимума Понтрягина на отрезке[t0 , t1 ] (см. Определение 20.1), получаем что вектор5ψ(t1 ) = −ϕ (x(t1 )) = 0является опорным вектором к множеству достижимости X(t1 ) в егограничной точке x(t1 ) на основании леммы об эквивалентной формулировке принципа максимума, т.е. выполняется неравенство(ψ(t1 ), x − x(t1 )) 0или∀x ∈ X(t1 ),(ϕ (x(t1 )), x − x(t1 )) 0∀x ∈ X(t1 ).Привлекая неравенство (6) при x1 = x(t1 ) и x2 = x, отсюда получаемϕ(x) − ϕ(x(t1 )) (ϕ (x(t1 )), x − x(t1 )) 0 ∀x ∈ X(t1 ),таким образом,ϕ(x) − ϕ(x(t1 )) 0 ∀x ∈ X(t1 ),что доказывает оптимальность исследуемого решения.
Теорема 20.3полностью доказана.Пример 20.1. Рассмотрим линейную задачу оптимального управления с терминальным функционалом при свободном правом концетраектории x(t1 ) ∈ E 2 :⎧ẋ = u, x, u ∈ E 2 ,⎪⎪⎪⎨ x1 (0) = −5, x2 (0) = 1,u ∈ U = {u ∈ E 2 : |u1 | 1, |u2 | 1},⎪⎪⎪⎩ ϕ(x(1)) = x(1)2 → min .u(·)∈УU5 Обратимособое внимание на равенствоψ(t1 ) = −ϕ (x(t1 )),которое можно рассматривать как условие трансверсальности в конечный моментвремени t1 в задаче управления (1) со свободным правым концом траектории. Записанное соотношение связывает значение сопряжённой переменной в момент времени t1 справым концом траектории.197Здесь [t0 , t1 ] = [0, 1], U – квадрат, 0 0−5A=, M0 =,0 01M1 = E 2 .Класс допустимых управлений УU состоит из всех измеримых на отрезке [0, 1] функций, причём u(t) ∈ U для почти всех t ∈ [0, 1].