Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения (1155776), страница 12
Текст из файла (страница 12)
рисунок 10.3): ψ – вектор нормали к гиперплоскости Γψ (прямой, проходящей через общую точку (−π, 0)∗множеств X(π) и M1 ), которая “разделяет” множества X(π) и M1 .Напомним, что в рассматриваемом примере момент времени t = πесть первый момент касания множества достижимости X(t) с множеством конечных состояний M1 .Основная лемма. Пусть1) M0 , M1 ∈ conv Ω(E n );101x22ππX(π)M1ψ−5π−3π−ππ x10−πΓψ−2πРисунок 10.32) t1 − t0 = min, т.е. t1 − t0 – оптимальное время перехода из M0в M1 в рассматриваемой задаче быстродействияẋ = Ax + u,x(t0 ) ∈ M0 ,x(t1 ) ∈ M1 .Тогда существует такая сопряжённая переменная ψ(t), для которой вусловии управляемости реализуется знак равенства:c(X(t1 ), ψ(t1 )) + c(M1 , −ψ(t1 )) = 0,или, в более подробной записи,t1c(U, ψ(s)) ds + c(M1 , −ψ(t1 )) = 0.c(M0 , ψ(t0 )) +t02 Доказательство.
По условию основной леммы"X(t1 ) M1 = ∅,"X(t) M1 = ∅ при t0 t < t1 .(14)(15)Условие (14) на основании теоремы об управляемости, часть 2), равносильно условиюc(X(t1 ), ψ(t1 )) + c(M1 , −ψ(t1 )) 0102∀ψ(t1 ) ∈ S.(16)Рассмотрим последовательность {tk }, t0 < tk < t1 ; tk → t1 − 0 приk → ∞. Из (15) следует, что"(17)X(tk ) M1 = ∅ ∀k.Так как X(tk ), M1 ∈ conv Ω(E n ), то из (17) в силу следствия изсвойства 14◦ , раздел 2.5,∀k∃ pk ∈ S: c(X(tk ), pk ) + c(M1 , −pk ) < 0.(18)Из последовательности {pk } единичных векторов выберем сходящуюся к некоторому вектору p∗ ∈ S подпоследовательность; не изменяяобозначений, будем считать, что pk → p∗ при k → ∞.
Используянепрерывность опорной функции по совокупности двух аргументов,непрерывную зависимость множества достижимости X(t) от t, предельные соотношения tk → t1 , pk → p∗ (k → ∞) и выполняя в (18)переход к пределу при k → ∞, получаем неравенствоc(X(t1 ), p∗ ) + c(M1 , −p∗ ) 0.(19)Полагая в (16) ψ(t1 ) = p∗ , запишем неравенствоc(X(t1 ), p∗ ) + c(M1 , −p∗ ) 0.(20)Сравнение (19) с (20) приводит к равенствуc(X(t1 ), p∗ ) + c(M1 , −p∗ ) = 0,p∗ ∈ S,которое доказывает утверждение основной леммы с сопряжённой переменной ψ(t), удовлетворяющей условию ψ(t1 ) = p∗ .
Основная леммадоказана.Выше мы проиллюстрировали утверждение основной леммы наконкретном примере. В разделе 3.11 основная лемма будет использована при доказательстве теоремы о необходимых условиях оптимальности в форме принципа максимума Понтрягина для линейнойзадачи быстродействия.Упражнение 10.4. Показать, что утверждение основной леммыбез предположения о выпуклости компактов M0 и M1 неверно. Рассмотреть пример, в котором n = 2, A = O, t0 = 0, −11M0 = {0}, U = S1 (0), M1 =,, t1 = 1.00103Замечание 10.1. Анализ доказательства основной леммы показывает, что её второе условие можно заменить следующим: существуетпоследовательность {tk }, сходящаяся к t1 , такая, что""X(t1 ) M1 = ∅, X(tk ) M1 = ∅ ∀k.Это замечание объясняет, почему сформулированный принцип максимума Понтрягина, доказательство которого опирается на основнуюлемму, является только необходимым условием оптимальности, нов общем случае не является достаточным условием оптимальностив линейной задаче быстродействия.
Геометрическая идея построениясоответствующих примеров связана с тем, что множество достижимости X(t) может (после первого момента t1 встречи с M1 ) оторваться" от множества M"1 в некоторый момент t = t2 > t1 (при этомX(t2 ) M1 = ∅, и X(t) M1 = ∅ при малых t−t2 > 0); впоследствииповторная встречамножепри некотором t = t3 > t2 может произойти""ства достижимости X(t) с M1 (X(t3 ) M1 = ∅; X(t) M1 = ∅ прималых t − t3 < 0). В таких ситуациях на отрезках [t0 , t1 ], [t0 , t2 ], [t0 , t3 ]в случае выпуклости компактов M0 , M1 имеет место утверждение основной леммы.Упражнение 10.5. Проиллюстрировать замечание 10.1 конкретными примерами.3.11Принцип максимума Понтрягина.
Теорема о необходимых условиях оптимальности в линейнойзадаче быстродействия3.11.1 Постановка задачиРассмотрим линейную задачу быстродействия⎧⎪⎪ ẋ = Ax + u,⎨x(t0 ) ∈ M0 ,⎪ x(t1 ) ∈ M1 ,⎪⎩t1 − t0 → min,(1)определяемую набором исходных данных {A, M0 , M1 , У = УU , t0 }.Напомним, что M0 , M1 , U ∈ Ω(E n ). Изучим сейчас основной вопроснашего курса – теорему о необходимых условиях оптимальностидля линейной задачи быстродействия (1) (принцип максимума Понтрягина).
При доказательстве этой теоремы существенно используетсяосновная лемма, доказанная в разделе 3.10.1043.11.2 Основная леммаВ случае M0 , M1 ∈ conv Ω(E n ), t1 − t0 = min, существует сопряжённая переменная ψ(t), для которой выполняется равенствоc(X(t1 ), ψ(t1 )) + c(M1 , −ψ(t1 )) = 0.3.11.3(2)Принцип максимума ПонтрягинаРассмотрим пару(x(t), u(t)),t0 t t 1 ,где1) u(t) ∈ У, т.е. u(t) – допустимое управление, определённое наотрезке t0 t t1 , причём в каждый момент времени t ∈ [t0 , t1 ]значение u(t) ∈ U ,2) x(t) – траектория, отвечающая управлению u(t), т.е. ẋ(t) =Ax(t) + u(t) для почти всех t ∈ [t0 , t1 ], и удовлетворяющая краевым условиям x(t0 ) ∈ M0 , x(t1 ) ∈ M1 .Будем говорить, что эта пара (x(t), u(t)) удовлетворяет принципу максимума Понтрягина на отрезке [t0 , t1 ], если существует такая сопряжённая переменная ψ(t) (ненулевое решение сопряжённогоуравнения ψ̇ = −A∗ ψ), что выполнены следующие три условия:а) условие максимума:(u(t), ψ(t)) = c(U, ψ(t))для почти всехt ∈ [t0 , t1 ],б) условие трансверсальности на множестве M0 :(x(t0 ), ψ(t0 )) = c(M0 , ψ(t0 )),в) условие трансверсальности на множестве M1 :(x(t1 ), −ψ(t1 )) = c(M1 , −ψ(t1 )).Геометрический смысл условий а), б), в) указан на рисунке 11.1.Содержанием настоящего подраздела 3.11.3 является введение терминологии, разъясняющей, что подразумевается, когда говорят, что“пара (x(t), u(t)) удовлетворяет принципу максимума Понтрягина наотрезке [t0 , t1 ]”.105ψ(t)u(t)x(t) −ψ(t1 )M0Ux(t0 )x(t1 )ψ(t0 )M1Рисунок 11.13.11.4 Теорема о необходимых условиях оптимальности в формепринципа максимума ПонтрягинаТеорема 11.1 (основная теорема линейной теории быстродействия).
Пусть1) M0 , M1 ∈ conv Ω(E n ),2) пара (x(t), u(t)), t0 t t1 , решает линейную задачу быстродействия (1), т.е.u(t) ∈ У, x(t0 ) ∈ M0 , x(t1 ) ∈ M1 , t1 − t0 = min .Тогда пара (x(t), u(t)) удовлетворяет принципу максимума Понтрягина на отрезке [t0 , t1 ].Структура сформулированной теоремы отражена на рисунке 11.2.парыОптимальностьx(t), u(t) , t0 t t1Выполнение принципа=⇒ максимума Понтрягинадля этой парыРисунок 11.22 По условиям теоремыX(t1 ) ≡ X(t0 , t1 , M0 ), M1 ∈ conv Ω(E n ),"t1 − t0 = min,X(t0 , t1 , M0 ) M1 = ∅.106В соответствии с основной леммой существует сопряжённая переменная ψ(t), с которой выполнено равенство (2):c(X(t1 ), ψ(t1 )) + c(M1 , −ψ(t1 )) = 0,здесь X(t1 ) = X(t0 , t1 , M0 ) – множество достижимости.
Покажем,что с этой же сопряжённой переменной ψ(t) выполняются условия а), б), в) принципа максимума Понтрягина.Вычитая из (2) почленно очевидное равенство(x(t1 ), ψ(t1 )) + (x(t1 ), −ψ(t1 )) = 0,получаем.c(X(t1 ), ψ(t1 )) − (x(t1 ), ψ(t1 )) +.+ c(M1 , −ψ(t1 )) − (x(t1 ), −ψ(t1 )) = 0.(3)Каждая из двух разностей в левой части (3) неотрицательна; это следует из определения опорной функции и включенийx(t1 ) ∈ X(t1 ),x(t1 ) ∈ M1 .Поэтому каждая из этих разностей равна нулю, т.е.c(M1 , −ψ(t1 )) − (x(t1 ), −ψ(t1 )) = 0,(4)c(X(t1 ), ψ(t1 )) − (x(t1 ), ψ(t1 )) = 0.(5)Равенство (4) доказывает справедливость условия в) принципа максимума Понтрягина (условие трансверсальности на множестве M1 ).Покажем теперь, что равенство (5) влечёт выполнение условий а), б)принципа максимума Понтрягина.Используя лемму о сопряжённой переменной (раздел 3.10, формулы (5) и (7) при t = t1 ), запишем условие (5) в форме. t1.c(M0 , ψ(t0 ))−(x(t0 ), ψ(t0 )) +c(U, ψ(s))−(u(s), ψ(s)) ds = 0.
(6)t0Так как x(t0 ) ∈ M0 , тоc(M0 , ψ(t0 )) − (x(t0 ), ψ(t0 )) 0;107(7)так как u(s) ∈ U , s ∈ [t0 , t1 ], тоc(U, ψ(s)) − (u(s), ψ(s)) 0, s ∈ [t0 , t1 ]иt1.c(U, ψ(s)) − (u(s), ψ(s)) ds 0.(8)(9)t0Из (6), (7) и (9) следуют равенстваc(M0 , ψ(t0 )) − (x(t0 ), ψ(t0 )) = 0,t1.(10)c(U, ψ(s)) − (u(s), ψ(s)) ds = 0.(11)t0Равенство (10) равносильно условию б) принципа максимума Понтрягина (условию трансверсальности на множестве M0 ). Из условий (11) и (8) следует, чтоc(U, ψ(s)) − (u(s), ψ(s)) = 0 для почти всехs ∈ [t0 , t1 ].Последнее утверждение доказывает условие а) принципа максимума Понтрягина (условие максимума).3.11.5Лемма об эквивалентной формулировке принципа максимума Понтрягина в терминах множеств достижимостиX(t) и управляемости Z(t).
Геометрическая интерпретация сопряжённой переменной ψ(t)В этом пункте мы не будем предполагать оптимальности пары(x(t), u(t)), t0 t t1 , и выпуклости компактов M0 , M1 .Лемма. Пусть M0 , M1 ∈ Ω(E n ). Равносильны следующие дваусловия:I. Пара x(t), u(t)), t0 t t1 , удовлетворяет принципу максимума Понтрягина с сопряжённой переменной ψ(t).II. Выполняются равенства(x(t), ψ(t)) = c(X(t), ψ(t)),t0 t t1 ,(12)(x(t), −ψ(t)) = c(Z(t), −ψ(t)),t0 t t1 ,(13)с сопряжённой переменной ψ(t).108ЗдесьX(t) = X(t0 , t, M0 ) – множество достижимости,Z(t) = Z(t, t1 , M1 ) – множество управляемости,ψ(t) – сопряжённая переменная(в каждом из условий I и II участвует одна и та же сопряжённаяпеременная).2 Проверим сначала, что условие I влечет условие II.