14-16 лекции (Лекции А.В. Дмитрука), страница 4
Описание файла
Файл "14-16 лекции" внутри архива находится в папке "Лекции А.В. Дмитрука". PDF-файл из архива "Лекции А.В. Дмитрука", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 4 страницы из PDF
Тогда (27) даетβj cj = 0, откуда в силулинейной независимости векторов cj вытекает, что все βj = 0, и тогда нарушеноусловие нетривиальности.Итак, α > 0, поэтому полагаем α = 1, и тогда (25)–(27) превращаются в равенства−ψ̇ = A∗ ψ − Qx − P ∗ u,(28)B ∗ ψ − P x − Ru = 0,Xψ(0) = Sx(0) +βj cj .(29)(30)Если считать, что равенство Cx(0) = 0 задает подпространство M ⊂ IRn , то условиетрансверсальности (30) может быть записано так: ψ(0) − Sx(0) ⊥ M.Обратим внимание, что усиленное условие Лежандра позволяет выразить из равенства (29) управление u через x и ψ : u = R−1 (B ∗ ψ − P x). Подставив этовыражение в (23) и (28), мы получим систему линейных однородных уравнений относительно 2n− мерного переменного (x, ψ) видаẋ = A(t) x + B(t) ψ,ψ̇ = C(t) x + D(t) ψ,(31)с некоторыми измеримыми ограниченными матрицами A, B, C, D.На правом конце имеются n условий: x(T ) = 0, а ψ(T ) свободно; на левом такжеесть n условий: x(0) ∈ M (m условий) и ψ(0) − Sx(0) ⊥ M (n − m условий).Итого 2n краевых условий.Напомним, что для нахождения сопряженной точки T0 нас интересует ненулевоеu ∈ L2 [0, T ], удовлетворяющее соотношениям (17), (18), (28)–(30).
Во что превращается нетривиальность u при переходе к системе (31) относительно x, ψ ?Лемма 5. Нетривиальность функции u(t) эквивалентна нетривиальности парыфункций (x(t), ψ(t)).Доказательство. Если u(t) ≡ 0, то в силу (17) x(t) ≡ 0, тогда (28), (29)превращаются в (240 ), откуда в силу управляемости ψ(t) ≡ 0, ч.т.д.Обратно: если x(t) ≡ ψ(t) ≡ 0, то в силу (29) u(t) ≡ 0.213Итак, для нахождения T0 нам надо искать ненулевую пару функций (x(t), ψ(t)),удовлетворяющую однородной системе (31), условиям на левом концеx(0) ∈ M,ψ(0) − Sx(0) ⊥ M,(32)и условию x(T ) = 0 на правом конце.Это можно сделать, например, следующим образом. Пусть 2n− мерные векторы(fi , gi ), где fi ∈ IRn , gi ∈ IRn , i = 1, .
. . , n, образуют базис в подпространствеM × M ⊥ ⊂ IR2n . Из вектор-столбцов fi составим n × n− матрицу F, а из векторстолбцов gi составим n×n− матрицу G. Для любого i пара функций (xi (t), ψi (t)),удовлетворяющая системе (31) и условиям xi (0) = fi , ψi (0) − Sxi (0) = gi , будетненулевой, и эти пары образуют базис в пространстве решений системы (31) с условиями (32) на левом конце. Любая нетривиальная линейная комбинация таких партакже будет ненулевой, и нам остается лишь найти такую комбинацию, у которойx(T ) = 0.
Для этого надо рассмотреть матричные решения X(t), Ψ(t) системы (31)с начальными условиями X(0) = F, Ψ(0) − SX(0) = G, и искать первую точку T,в которойdet X(T ) = 0 .(33)Это и есть уравнение для нахождения сопряженной точки T0 .Пусть теперь T0 найдена. Что будет при T > T0 ? Будет ли сразу Ω иметьотрицательные значения на KT , или какое-то время продержится Ω ≥ 0 ?Вообще говоря, возможно и то, и другое. Для упрощения ситуации примем ещеодно предположение. Будем называть систему (23) вполне управляемой, если онауправляема на любом отрезке [T 0 , T ], 0 ≤ T 0 < T (а не только для T 0 = 0 ).Лемма 6.
Пусть система (23) вполне управляема. Тогда ∀ T > T0 найдетсяu ∈ KT , для которой Ω(u) < 0.Доказательство. Пусть û 6= 0 есть решение уравнения Э–Л для Ω на KT0 .Как мы знаем, Ω(û) = 0. Возьмем любое T > T0 и продолжим û(t) и соответствующий x̂(t) нулем на [T0 , T ]. Тогда û ∈ KT , и по-прежнему Ω(û) = 0.
Мыутверждаем, что на отрезке [0, T ] функция û уже не является решением уравненияЭ–Л. Действительно, если уравнение Э–Л выполнено c некоторой функцией ψ(t), тов силу (28), (29) на отрезке [T0 , T ] получаем соотношения (24), из которых в силууправляемости системы (23) на этом отрезке следует, что на нем ψ(t) = 0, и в частности, ψ(T0 ) = 0. Но так как по условию x̂(T0 ) = 0 и пара x̂, ψ удовлетворяетна [0, T0 ] однородной системе (31), то x̂(t) = 0, ψ(t) = 0 на всем отрезке [0, T0 ], атогда и û(t) = 0, противоречие. Итак, û не удовлетворяет необходимому условиюминимума для Ω на KT .
Поскольку Ω(û) = 0, найдется u ∈ KT , для которойΩ(u) < 0.2Итак, для вполне управляемой системы положение сопряженной точки T0полностью определяет "знак" функционала Ω на подпространстве KT :если T < T0 , то Ω положительно определен на KT ,если T = T0 , то Ω ≥ 0 на KT , и ∃ û ∈ KT : û 6= 0,а если T > T0 , то ∃ u ∈ KT : Ω(u) < 0.14Ω(û) = 0,Покажем, что в задачах КВИ полная управляемость всегда есть. Для простейшейзадачи КВИ система (23) имеет вид ẋ = u. Управляемость этой системы (даже дляслучая x ∈ IRn ) очевидна. Можно проверить и критерий из леммы 4. Здесь система(24) ψ̇ = 0, ψ = 0 − уже сама содержит равенство ψ = 0.Для задач КВИ со старшими производными система (23) имеет видẋ1 = x2 ,ẋ2 = x3 ,.... .ẋk−1 = xk ,ẋk = u.Непосредственная проверка управляемости на любом отрезке не совсем очевидна.Проверим критерий из леммы 4.Для этого напишем "укороченную" функциюH = ψ1 x2 + ψ2 x3 + .
. . + ψk−1 xk + ψk u, и тогда система (24) имеет вид−ψ̇1 = 0,−ψ̇2 = ψ1 ,−ψ̇3 = ψ2 ,.... .− ψ̇k = ψk−1 ,Hu = ψk = 0.Из последнего равенства ψk = 0, двигаясь по цепочке влево, получаем ψk−1 =0, ψk−2 = 0, . . . , ψ2 = 0, ψ1 = 0.Таким образом, изложенная выше теория применима по крайней мере ко всемзадачам КВИ.В заключение этой темы рассмотрим несколько примеров.В примере 1 (см.
выше) имеем H = ψu − 12 u2 , l = − 12 x2 (0), поэтому ψ̇ = 0,ψ − u = 0, откуда u = ψ = const , и так как мы ищем ненулевое решение, считаемu(t) = 1, x(t) = t − T (с учетом концевого условия x(T ) = 0), и тогда условиетрансверсальности ψ(0) = −x(0) дает 1 = T. Наименьшее решение этого уравненияесть T0 = 1.Пример 2 (гармонический осциллятор).ZTΩ=(−x2 + u2 ) dt,ẋ = u,x(0) = x(T ) = 0.0Здесь уравнение Э–Л есть ψ̇ = −x, ψ − u = 0, откуда ẍ = −x. Ненулевое решение этого уравнения с начальным значением x(0) = 0 с точностью до множителяесть x(t) = sin t, и первая точка T, в которой выполнено правое граничное условиеsin T = 0 есть T0 = π .Пример 2’.
Тот же пример, но со свободным левым концом x(0). Здесь попрежнему ẍ = −x, но на левом конце имеется условие трансверсальности ψ(0) = 0,т.е. ẋ(0) = 0, что дает x(t) = cos t. Первая точка T, в которой выполнено правоеграничное условие cos T = 0 есть T0 = π/2 .Пример 3.Z2Ω = s x (0) +T(−x2 + u2 ) dt,015ẋ = u,x(T ) = 0.Здесь опять ẍ = −x, и с учетом правого граничного условия x(t) = sin(t − T ).Условие трансверсальности дает ẋ(0) = s x(0), т.е. cos T = −s sin T, или− ctg T = s.Если s = 0, то наименьшее T = π/2 (как и найдено ранее в примере 20 ) .Если s > 0, то T0 > π/2 (что согласуется с тем, что s > 0 улучшает положительность Ω), и при s → +∞ сопряженная точка T0 → π − 0.Если же s < 0, то T0 < π/2 (что согласуется с тем, что s < 0 ухудшает положительность Ω), и при s → −∞ сопряженная точка T0 → 0 + .Пример 4.Z TΩ=(−x2 + u2 ) dt,ẍ = u,x(0) = ẋ(0) = x(T ) = ẋ(T ) = 0.0Здесь для приведения к каноническому виду мы должны написатьẋ = y,ẏ = u,x(0) = y(0) = x(T ) = y(T ) = 0.Тогда H = ψx y + ψy u − 21 (−x2 + u2 ), поэтому −ψ̇x = x,откуда x(4) = x, и значит−ψ̇y = ψx ,ψy − u = 0,x(t) = a cos t + b sin t + A ch t + B sh t,ẋ(t) = −a sin t + b cos t + A sh t + B ch t.Из условий x(0) = ẋ(0) = 0 получаем a + A = 0, b + B = 0, поэтомуx(t) = a(cos t − ch t) + b(sin t − sh t),ẋ(t) = −a(sin t + sh t) + b(cos t − ch t).Нетривиальность функции u(t) с учетом концевых условий эквивалентна нетривиальности функции x(t), которая эквивалентна нетривиальности пары (a, b).При каких T существует ненулевая пара (a, b), для которой x(T ) = 0 и ẋ(T ) = 0 ?Эти два равенства представляют собой линейную однородную систему уравнений относительно (a, b), поэтому определитель этой системы должен равняться нулю:(cos T − ch T )2 + (sin T − sh T )(sin T + sh T ) = 0,что приводит к уравнению cos T ch T = 1, или, что то же самое, cos T = 1/ch T .Нетрудно показать, что при T ≤ π/2 и тем более при π/2 ≤ T ≤ 3π/2 левая частьздесь меньше правой, поэтому ближайшее решение этого уравнения T0 ∈ (3π/2, 2π).Пример 5.
x ∈ IR2 , u ∈ IR2 ,Z TΩ=(−x21 + u21 + u22 ) dt,ẋ = u,0x(T ) = 0,x1 (0) + kx2 (0) = 0.Здесь H = ψ1 u1 + ψ2 u2 − 21 (−x21 + u21 + u22 ), l = β(x1 (0) + kx2 (0)), поэтому−ψ̇1 = x1 , −ψ̇2 = 0 , ψ1 − u1 = 0, ψ2 − u2 = 0. Отсюда ẍ1 = −x1 , ẍ2 = 0, т.е.x1 = a cos t+b sin t, x2 = ct+d. Условия трансверсальности ψ1 (0) = β, ψ2 (0) = kβ16дают ẋ2 (0) = k ẋ1 (0). Отсюда и из левого граничного условия x1 (0) + kx2 (0) = 0получаем c = kb, a + kd = 0, и таким образом (в случае k 6= 0 ),x1 = a cos t + b sin t,x2 = b (kt) − a/k .Мы ищем такое T, чтобы существовала ненулевая пара (a, b), для которой выполнялись бы концевые равенства x1 (T ) = 0, x2 (T ) = 0.
Это опять линейнаяоднородная система уравнений, определитель которой должен равняться нулю:kT cos T + k −1 sin T = 0, т.е.1− ctg T = 2 .k TОчевидно, первое решение этого уравнения T0 (k) ∈ (π/2, π). При изменении k отнуля до +∞ точка T0 (k) монотонно убывает от π до π/2 , т.е. |k| работает наухудшение положительности Ω. (Как увидеть это заранее?)Литература[ИТ] А.Д.
Иоффе, В.М. Тихомиров. Теория экстремальных задач. М., Наука, 1974.[АТФ] В.М. Алексеев, В.М. Тихомиров, С.В. Фомин. Оптимальное управление.М., Наука, 1979, Физматлит, 2006.[КФ] А.Н. Колмогоров, С.В. Фомин. Элементы теории функций и функционального анализа. М.: Наука, 1968.[ОПУ] Оптимальное управление. Коллективная монография кафедры ОПУ (подред. Н.П. Осмоловского и В.М.
Тихомирова), М., МЦНМО, 2008.17.