Сотсков А.И., Колесник Г.В. Оптимальное управление в примерах и задачах (2002) (1249284), страница 5
Текст из файла (страница 5)
Действительно, этоне могло произойти раньше, так как тогда бы изменился на положительный.знак скорости (ψ 1 − ψ 2 ) и равенство ψ1(t*) = ψ2(t*) было бы невозможно.Также не могло это произойти позже (или вовсе не произойти), так как тогдав момент t* изменится знак разности (ψ1(t) – ψ2(t)), капитал начнет убывать,увеличивая по абсолютной величине разность и, тем самым, исключаявыполнение равенств k(t') = k' при t' > t* или ψ1(T) = ψ2(T).Как только достигаются равенства k0 + t* = k*, ψ1(t*) = ψ2(t*), при t > t* онидолжны сохраняться.
Действительно, если, например, на каком-то интервале,ближайшем к точке t* разность (ψ1(t) – ψ2(t)) > 0, то k вырастет по.сравнению с k* и, значит, (ψ 1 − ψ 2 ) > 0 на этом интервале. Возрастаниеразности будет поддерживать управление u = 1, что приведет к ещебольшему возрастанию разности. В результате будет нарушено условиетрансверсальности.Во втором случае получаем экстремаль, состоящую из двух участков:rtk(t) = k0 + t, b(t) = e (b0 +t∫[f(k0 + τ) – C(τ, ψ2(0))] dτ при t ∈[0, t*],0rtk(t) ≡ k*, b(t) = e (b(t*) +t∫[f(k*) – C(τ, ψ2(0))] dτ при t ∈[t*, T].t*Неизвестные ψ2(0) и t* находятся из условий k0 + t* = k* и b(T) = bT.Неизвестное ψ1(0) находится из условия ψ1(T) = ψ2(T) путем интегрированияуравнения (2.23).28ku = –1k*u=0u = +1bРис.
2.8.Легко определить, какой из двух случаев реализуется: если k0 + T ≤ k*, тоимеем экстремаль первого типа, если k0 + T > k*, то имеем экстремальвторого типа, причем точкой переключения управления с u = 1 на u = 0является t* = k* – k0.Аналогичный анализ можно провести для случая k0 > k*.Результирующие фазовые траектории (b(t), k(t)) приведены на рисунке 2.8.8. С и н т е з о п т и м а л ь н ы х у п р а в л е н и й . Рассмотрим задачу:t1max ∫ (ux + u2/2) dt0x& = –x+ u,4t∈[0, t1], t1 = 4 ln 2,u: | u | ≤ 1, x(0) = x0 , x(t1) – свободно.Функция Понтрягина H и сопряженная система имеют вид:H= ψ0 (ux + u2/2) + ψ1 (–ψ& 1 = – ψ0 u + ψ1 /4,x+ u),4ψ1(t1) = 0,где ψ0 = const ≤ 0.Исследуем вырожденный случай.
Если ψ0 = 0, то из сопряженной системыполучаем ψ1(t) ≡ 0, что невозможно. Поэтому ψ0 < 0.Положим далее ψ0 = –1. Условие максимума функции H по u даетсоотношение (опустим индекс 1 у ψ1 ):– ux – u2/2 + ψ u → max.29Получаем, чтоu = 1, если ψ – x ≥ 1,u = –1, если ψ – x ≤ –1,u = ψ – x , если –1 < ψ – x < 1.В частности, при t = t1 условие трансверсальности позволяет разбитьтерминальное множество {(t, x): t = t1 , x∈R} на три части:А = {x: x ≤ – 1}, u(t1) = +1,B = {x: x ≥ 1}, u(t1) = – 1,C = {x: –1 < x < 1}, u(t1) = – x(t1).Переключение с одного режима на другой происходит на линияхX+: ψ – x = 1 и X– : ψ – x = –1.Чтобы выписать эти условия и построить линии X+ и X– положим u = ψ – xи проинтегрируем систему :ψ& = 5ψ /4 – x,(2.24)x& = ψ – 5x /4с граничными значениями x(t1) = x1 ∈ C, ψ(t1) = 0.Собственные числа и собственные векторы матрицы системы равны:λ1 = 3/4, h1 = (2, 1); λ2 = – 3/4; h2 = (1, 2).Тогда общее решение системы имеет видψ(t) = 2C1 e3t/4 + C2 e –3t/4,x(t) = C1 e3t/4 + 2C2 e –3t/4,откуда, с учетом условия трансверсальности получаем36tψ(t) = 2C1 e 4 (1 – e 43t4x(t) = C1 e (1 – 4 e6(t −t )4 1Из условия x(t1) = x1 находим C1: C1 = – x1 eРазность (ψ – x) при этом равна:ψ – x = C1 e3t/43t/4+ 2C1 eОбозначим для простоты z = ee6(t −t )4 13− 4 ( t1 −t )( t1 − t )3− 4 t1= – x1 e),)./3.3− 4 ( t1 −t )(1 + 2 e6(t −t )4 1)/3.(2.25)– "новое время".
Тогда z = 1 при t = t1 иz = e –3ln2 = 2–3 при t = 0.Решение для x(t) и для разности ψ – x при этом можно записать в виде:X = – x1(z – 4z –1)/3,ψ – x = – x1(z + 2z –1)/ 3.Выразим из первого соотношения x1 и подставим во второе, затемприравнивая его + 1 и – 1, получим линии переключения:30xu = –12Область B:u = –1X–11/801 zОбласть C:u = – x1(z + 2z –1)/3–1X+–2u = +1Область А:u = +1Рис. 2.9.X+ = (z2 – 4)/ (z2 + 2), X– = (– z2 + 4)/ (z2 + 2).Как видим, X – = – X+ .Теперь может быть построена картина фазовых траекторий (рис. 2.9).1. Если x1 = 0, то из системы (2.24) с граничными значениямиx(t1) = 0, ψ(t1) = 0получаем решение ψ(t) ≡ 0, x(t) ≡ 0, u(t) ≡ 0.2. В зоне С при малых |x1| малы будут и значения |X|, поэтому траекторииx(t), выходящие (попятным движением) из точки x1, не достигают линийпереключения X – и X+; управление будет определяться из (2.25) какu(t)= – x1(z + 2z –1)/3.3.
Если значения x1 лежат в зоне С, но |x1| достаточно велико, точкапересечения траектории x(t) = –x1(z – 4z –1)/3 и линии переключения X+,например (при x1 < 0), находится из равенства:– x1(z2 – 4)/3z = (z2 – 4)/ (z2 + 2),откуда z2 + 3z/x1 + 2 = 0. Корни этого уравненияz1,2 = −3±2 x19−2.4 x1231Выбор конкретной точки переключения определяется краевым условием.Например, при x1 = –1 допустимой является только z = 1. При x1 = – 0.9годится корень z ~ 0.8.
Знак x1 определяет знак точки переключения X, амомент z не зависит от знака x1.4. Выше и ниже оси z картина симметричная. Переключения имеют толькотраектории выходящие из зоны С.5. Ниже линии X+ имеем ψ – x > 1, откуда u ≡ +1. При этом траектории x(t)идут согласно уравнению x& = –x+ 1 до момента переключения или до4конца.Выше линии X– ψ – x < –1 и там u ≡ – 1.
Траектории идут согласноуравнению x& = –x– 1 до момента переключения или до конца.46. Наконец, заметим, что переключение возможно не более одного раза, таккак величина (ψ – x) монотонна, причем ее производная по времени имееттакой же знак, как и x1. Например, если x1 < 0 в зоне С и ψ – x = +1, тоточка находится на линии X+. Но в силу монотонности (ψ – x) становитсядалее меньше 1, то есть, траектория x(t) остается в области, порождаемоймножеством С.Упражнения1. Найти оптимальное управление в задачах:1а).
∫ ( x& 2 − x )dt + x2(1) → min.0Tб). ∫ u 2 dt + T → min;x& = u; x(0) = 1; x(T) = 0;T – не фиксировано.0Tв). ∫ (1 − u )xdt → max; x& = (u – β)x; x(0) = a; 0 ≤ u ≤ 1; β ≤ 1; T – фиксировано.0Tx 2 (T )г). ∫ ( u + x )dt +→ min;2022x& = u – x; x(0) = 0;T – фиксировано.Tд). ∫ ( u − x ) 2 dt → min; x& = ρ(u – x); x(0) = x0; x(T) = x1; T – фиксировано.02πе).
∫ udt + x2(2π) → min; –1 ≤ u ≤ 2; x&1 = – x2; x& 2 = x1 + u; x1(0) = –2; x2(0) = –1.02. В задаче2∫ (2 x − 3u − au2)dt → max;x& = x + u; x(0) = 5; 0 ≤ u ≤ 2;032исследовать оптимальный процесс при различных значениях параметраa∈[0, 1].3. Найти оптимальное управление в задаче на быстродействиеT → min; x(0) = x01; x& (0) = x02; x(T) = 0; x& (T) = 0; | u | ≤ 1,если изменение состояния системы происходит согласно закону:а).
x&& + 2 x& + x = u;б). x&& + π2 x = π u;в). x&& = x + u;4. Найти оптимальное потребление с(t) в модели Рамсея в непрерывномвремени:T∫e− βtU ( c )dt → max;s& = ρs – c; s(0) = s0 > 0; s(T) = 0;00 ≤ c ≤ s; β < ρ; ρ > 1; T – фиксировано, если:а). U(c) = ln c;б). U(c) = c1– μ; μ < 1.333. Фазовые ограничения в задаче оптимального управления.В рассмотренной нами выше постановке задачи оптимального управленияпредполагалось, что область изменения фазовой координаты x(t)неограничена и совпадает со всем пространством Rn.
Однако на практикечасто встречаются задачи, в которых имеются ограничения на множестводопустимых состояний системы. Особенно это актуально в экономическихзадачах, где часто накладываются ограничения на неотрицательностьфазовыхпеременных(например,объемавыпуска,величиныпроизводственной мощности и т.д.). Поэтому рассмотрим далее постановкузадачи оптимального управления, учитывающую наличие фазовыхограничений. Моменты t0, t1, а также начальное состояние x0 будем считатьфиксированными.Пусть требуется найти максимум функционала:t1J(x(⋅), u(⋅)) = ∫ F (t , x (t ), u (t ))dt + Ф0 (x(t1)) → max,(3.1)t0если закон изменения состояния системы имеет вид:x& (t ) = f (t , x (t ), u(t )) ,(3.2)и дополнительно наложены фазовые ограничения:g(t, x(t)) ≥ 0; t ∈ [t0, t1],(3.3)где g : R × Rn → Rs – непрерывно-дифференцируема по совокупностиаргументов.Рассмотрим лагранжиан данной задачи:L(t, x(t), u(t), ψ(t), μ(t), λ0) = H(t, x(t), u(t), ψ(t), λ0) + (μ(t), g(t, x(t)))(3.4)где H(t, x(t), u(t), ψ(t), λ0) – функция Понтрягина; μ(t) = (μ1(t), …, μs(t)) ∈ Rn –множитель Лагранжа, соответствующий ограничению (3.3) .Тогда для данной задачи справедлива следующая теорема.Т е о р е м а .
Пусть (x*(t), u*(t)) – оптимальный процесс в задаче (3.1) –(3.3). Тогда найдутся не равные одновременно нулю множитель λ0 ≥ 0 ивектор-функции ψ(t) = (ψ1(t), …, ψn(t)) ∈ Rn и μ(t) = (μ1(t), …, μs(t)) ∈ Rsтакие, что:а). всюду на [t0, t1] выполнено условие принципа максимума:u*(t) ∈ Arg max (H(t, x*(t), u(t), ψ(t), λ0));(3.5)34б). cопряженная функция ψ(t) удовлетворяет системе дифференциальныхуравнений:∂Lψ& i (t ) = −; i = 1,…, n ,(3.6)∂x i (t )(где L – лагранжиан задачи) и условия трансверсальности на правом конце(2.7), в данной постановке имеющие вид:ψi(t1) = λ0∂Φ 0 ( x * (t1 ));∂x i (t1 )в). выполнены условия дополняющей нежесткости и неотрицательностимножителя Лагранжа μ(t):μi(t) gi(t, x(t)) = 0; μi(t) ≥ 0;i = 1,…, s.(3.7)Примеры1.
Найти оптимальное управление в задаче [1]:J(u, x) =11∫ (u22+ x 2 )dt → min;0x& = u; x(0) = 1; u ∈ R;x(t) ≥ c ∀t ∈ [0, 1].Р е ш е н и е . При отсутствии фазового ограничения оптимальное управлениев данной задаче можно найти, используя принцип максимума для задачи сосвободным правым концом, описанный в предыдущем разделе.Оптимальным решением задачи будет являться :e t + e 2 −t;x*(t) =e2 +1u*(t) = x& *(t).(3.8)Функция x*(t) монотонно убывает и достигает минимального значения приt = 1:x*(1) =2e.e2 + 12e, решение задачи с фазовым ограничением будетe2 + 12eПредположим, что с > 2 . Применим необходимыеe +1Очевидно, что при с ≤совпадать с (3.8).условия экстремума.