Диссертация (Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)), страница 11
Описание файла
Файл "Диссертация" внутри архива находится в папке "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)". PDF-файл из архива "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 11 страницы из PDF
Если выполнены условия теоремы 5, то функция управления задается формулойu1 (t) =1,0 ≤ t < τ,0,τ ≤ t ≤ T.(3.5.18)Для данного варианта функции управления будем решать дифференциальные уравнения из сопряженной системы сначала на интервале времени [τ, T ], а затем на интервале времени [0, τ ].На первом этапе исследования, рассмотрим дифференциальные уравненияотносительно сопряженных параметров pk (t) на интервале [τ, T ] с граничными условиями в точке t = T .1) Начнем с решения уравнения относительно функции p0 (t).(1)(0)С учетом граничных условий (условие трансверсальности) p0 (T ) = ψ0 (T )получаем(1)(0)p0 (t) = ψ0 (T )eλ0 (t−T ) ,(3.5.19)где τ ≤ t ≤ T .2) Переходим к следующему уравнению относительно функции p2 (t), по форме это уравнение совпадает с уравнением (3.5.4).
Решение данного уравнения имеетвид (3.5.6)(1)p2 (t)=eλ2 t −λ2 T (0)eψ2 (T ) + B2ZTt57e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 ,(3.5.20)где τ ≤ t ≤ T .3) Уравнение относительно функции p1 (t), определяемое при управлении u1 (t) =0, τ ≤ t ≤ T , по форме совпадает с уравнением (3.5.12) (1) (1)(2)(1)(1)(1)ṗ1 (t) = λ1 p1 (t) − A1 α1 k1α1 −1 (t) l0 ρp0 (t) + l0 (1 − ρ)p2 (t) .Выпишем известное нам решение этого дифференциального уравнения в виде(3.5.15), с учетом новых пределов изменения аргумента t:Z Th(1)(0)(1)(1)λ1 t−λ1 Tp1 (t) = eψ0 (T )e+ A1 α1e−λ1 z3 k1α1 −1 (z3 ) l0 ρψ0 (T )eλ0 (z3 −T ) + (3.5.21)tZ Ti(2)λ2 (z3 −T ) (0)λ2 z 3+l0 (1 − ρ)(eψ2 (T ) + e B2e(−δ−λ2 )z4 k2α2 −1 (z4 ) dz4 ) dz3 ,z3где τ ≤ t ≤ T .На основе соотношений (3.5.19)–(3.5.21) можно выписать явные представления для сопряженных параметров p0 (t), p1 (t), p2 (t) при t ∈ [τ, T ]:(1)(0)p0 (t) = ψ0 (T )eλ0 (t−T ) ,hR T −λ z α1 −1(1)(1)(0)λ1 t−λ1 T1 3p(1)ψ0 (T )e+ A1 α1 t ek1 (z3 ) l0 ρψ0 (T )eλ0 (z3 −T ) +1 (t) = eiR T (−δ−λ )z α2 −1(2)λ2 (z3 −T ) (0)λ2 z 32 4+l(1−ρ)(eψ(T)+eBek(z)dz)dz2 z3443022R T (−δ−λ )z α2 −1λ2 t −λ2 T (0)2 1p(1)(t)=eeψ(T)+Bek(z)dz211222t(3.5.22)Используя представление (3.5.22) зафиксируем значения функций pk (t) в точке t = τ ,(1)(0)p0 (τ ) = p0 (τ ) = ψ0 (T )eλ0 (τ −T ) = p0,τ ,hR T −λ z α1 −1(1)(1)(0)λ1 τ−λ1 T1 3p1 (τ ) = p(1)ψ0 (T )e+ A1 α1 τ ek1 (z3 ) l0 ρψ0 (T )eλ0 (z3 −T ) +1 (τ ) = eiR T (−δ−λ )z α2 −1(2)λ2 (z3 −T ) (0)λ2 z 32 4+l(1−ρ)(eψ(T)+eBek(z)dz)dz443 = p1,τ2 z3022R T (−δ−λ )z α2 −1λ2 τ −λ2 T (0)2 1p2 (τ ) = p(1)(τ)=eeψ(T)+Bek(z)dz= p2,τ211222τ(3.5.23)Теперь найдем решение сопряженных дифференциальных уравнений на интервале времени [0, τ ] при управлении u1 (t) = 1, 0 ≤ t ≤ τ .
Граничные условия вточке t = τ определяется из свойства непрерывности сопряженных функцийpk (τ ) = pk,τгде k = 0, 1, 2.Величины pk,τ , k = 0, 1, 2 задаются явным образом при помощи равенств (3.5.23).581. Рассмотрим известное нам ранее уравнение (3.5.2) относительно функции(0)p0 (t). С учетом нового граничного условия p0 (τ ) = p0,τ получаем(0)p0 (t) = p0,τ eλ0 (t−τ ) ,где 0 ≤ t ≤ τ.(3.5.24)2. Следующее уравнение относительно функции p2 (t) по форме совпадает суравнением (3.5.4). Общее решение этого уравнения представляется в виде (3.5.5).(0)С учетом нового граничного условия p2 (τ ) = p2,τ получаем аналогично формуле(3.5.6)(0)p2 (t)=eλ2 tp2,τ e−λ2 τ + B2τZe(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 ,(3.5.25)tгде 0 ≤ t ≤ τ .3.
Рассмотрим дифференциальное уравнение относительно сопряженного параметра p1 (t), по форме совпадающее с (3.5.7). Общее решение этого уравнения имеетуже известный нам вид (3.5.8)(0)При новом граничном условии p1 (τ ) = p1,τ получаем(0)p1 (t) = p1,τ eA1 α1Rτtα −1k1 1(z2 ) dz2 +λ1 (t−τ ),(3.5.26)для 0 ≤ t ≤ τ .Из равенств (3.5.24), (3.5.25), (3.5.26) следует, что решения сопряженныхуравнений при значениях параметра времени 0 ≤ t ≤ τ имеют следующий вид:(0)p0 (t) = p0,τ eλ0 (t−τ ) ,Rα −1(0)A1 α1 tτ k1 1 (z2 ) dz2 +λ1 (t−τ )(3.5.27)(t)=pep,1,τ1p(0) (t) = eλ2 t p e−λ2 τ + B R τ e(−δ−λ2 )z1 k α2 −1 (z ) dz .2,τ2 t1122Объединяя соотношения (3.5.22) и (3.5.27), получаем представления для сопряженных параметров для варианта, когда функция управления имеет одну точкупереключения τ ∈ [0, T ] и задается формулой (3.5.18):(0)p0 (t) = p0,τ eλ0 (t−τ ) ,(0)Rτα1 −1p1 (t) = p1,τ eA1 α1 t k1 (z2 ) dz2 +λ1 (t−τ ) ,p(0) (t) = eλ2 t p e−λ2 τ + B R τ e(−δ−λ2 )z1 k α2 −1 (z ) dz , t ∈ [0, τ ]2,τ2 t112259(3.5.28)(1)(0)p0 (t) = ψ0 (T )eλ0 (t−T ) ,hRT (1)(1)(0)(1)p1 (t) = eλ1 t ψ0 (T )e−λ1 T + A1 α1 t e−λ1 z3 k1α1 −1 (z3 ) l0 ρψ0 (T )eλ0 (z3 −T ) +iR T (−δ−λ )z α2 −1(2)λ2 (z3 −T ) (0)λ2 z 324k2 (z4 ) dz4 ) dz3+l0 (1 − ρ)(eψ2 (T ) + e B2 z3 e (0)RTλ2 tp(1)ψ2 (T )e−λ2 T + B2 t e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 , t ∈ [τ, T ]2 (t) = e(3.5.29)где величины p0,τ , p1,τ , p2,τ заданы соотношениями (3.5.23).Теорема 5 доказана.Теорема 6.
Предположим, что в исходной задаче оптимального управленияфункция Q(t) = Q(p0 (t), p1 (t), p2 (t)) удовлетворяет условию:Q(t) < 0, 0 ≤ t < τ ;Q(t) > 0τ < t ≤ T.Тогда решение системы сопряженных уравнений определяется формулами:(0)p0 (t) = p0,τ eλ0 (t−τ ) ,hR τ −λ z α1 −1(0)(1)λ1 t−λ1 τ1 3p1,τ e+ A 1 α1 t ek1 (z3 ) p0,τ l0 ρeλ0 (z3 −τ ) +p1 (t) = eiR τ (−δ−λ )z α2 −1(2)λ2 (z3 −τ )λ2 z 32 4(1−ρ)(pe+eBek(z)dz)dz+l2,τ2 z344302p(0) (t) = eλ2 t p2,τ e−λ2 τ + B2 R τ e(−δ−λ2 )z1 k α2 −1 (z1 ) dz1 , t ∈ [0, τ ];22t(1)(0)p0 (t) = ψ0 (T )eλ0 (t−T ) ,Rα −1(1)(0)A1 α1 tT k1 1 (z2 ) dz2 +λ1 (t−T )p(t)=ψ(T)e,11p(1) (t) = eλ2 t ψ (0) (T )e−λ2 T + B R T e(−δ−λ2 )z1 k α2 −1 (z ) dz , t ∈ [τ, T ],2 t11222где p0,τ , p1,τ , p2,τ имеют вид(0)p0,τ = ψ0 (T )eλ0 (τ −T ) ,(0)RTα1 −1p1,τ = ψ1 (T )eA1 α1 τ k1 (z2 ) dz2 +λ1 (τ −T )p = eλ2 τ e−λ2 T ψ (0) (T ) + B R T e(−δ−λ2 )z1 k α2 −1 (z ) dz 2,τ2 τ1122Доказательство.
Если выполнены условия теоремы 6, то функция управления задается формулой60u1 (t) =0,0 ≤ t < τ,1,τ ≤ t ≤ T.(3.5.30)Как и для предыдущего варианта управления с одним переключением (3.5.18), найдем решения сопряженных уравнений. Рассмотрим сначала интервал [τ, T ]. Поскольку на этом интервале функция управления u1 (t) = 1, система сопряженных уравнений совпадает по форме с системой (1). Граничные условия в точке t = T представляют собой условия трансверсальности.
Такая задача Коши уже была решена выше навсем интервале времени [0, T ], и это решение было представлено формулами (3.5.10).Отсюда следует, что решение системы сопряженных уравнений для функции управления (3.5.30) на интервале [τ, T ] также имеет вид (3.5.10) при значениях параметравремени τ ≤ t ≤ T .Зафиксируем t = τ и выпишем значения сопряженных переменных в точкеt = τ , исходя из формул (3.5.10)(1)(0)p0 (τ ) = p0 (τ ) = ψ0 (T )eλ0 (τ −T ) = p0,τ ,(1)(0)RTα1 −1p1 (τ ) = p1 (τ ) = ψ1 (T )eA1 α1 τ k1 (z2 ) dz2 +λ1 (τ −T ) = p1,τp (τ ) = p(1) (τ ) = eλ2 τ e−λ2 T ψ (0) (T ) + B R T e(−δ−λ2 )z1 k α2 −1 (z ) dz = p22 τ112,τ222(3.5.31)Далее, найдем решения сопряженных уравнений на интервале времени [0, τ ]. На этоминтервале функция управления u1 (t) = 0, система сопряженных уравнений по формесовпадает с системой (3.5.11).
Граничные условия в точке t = τ определяются изсвойства непрерывности сопряженных функций. Именно,(0)pk (τ ) = pk (τ ) = pk,τ ,k = 0, 1, 2.(3.5.32)Решение системы сопряженных уравнений для функции управления u1 (t) = 0 навсем интервале [0, T ] было представлено формулами (3.5.16). Отсюда следует, чторешение этой системы для функции управления (3.5.30) на интервале времени [0, τ ]также имеет форму (3.5.16) с учетом изменения граничных условий.Таким образом, можно выписать представление для сопряженных параметров для варианта, кода функция управления имеет одну точку переключения и задается формулой (3.5.30)61(0)p0 (t) = p0,τ eλ0 (t−τ ) ,hR τ −λ z α1 −1(1)(0)−λ1 τλ1 t1 3(z)p0,τ l0 ρeλ0 (z3 −τ ) +kpe+Aαep(t)=e 131,τ1 1 t1(3.5.33)iR τ (−δ−λ )z α2 −1(2)λ2 (z3 −τ )λ2 z 32 4(z)dz)dzkeB+l(1−ρ)(pe+e44322,τ 02z3p(0) (t) = eλ2 t p2,τ e−λ2 τ + B2 R τ e(−δ−λ2 )z1 k α2 −1 (z1 ) dz1 , t ∈ [0, τ ];22t(1)(0)p0 (t) = ψ0 (T )eλ0 (t−T ) ,Rα −1(1)(0)A1 α1 tT k1 1 (z2 ) dz2 +λ1 (t−T ),p(t)=ψ(T)e11p(1) (t) = eλ2 t ψ (0) (T )e−λ2 T + B R T e(−δ−λ2 )z1 k α2 −1 (z ) dz , t ∈ [τ, T ].112 t222(3.5.34)Теорема 6 доказана.Итак, завершен первый этап исследования сопряженных уравнений.
Соотношения (3.5.10) и (3.5.16) определяют решение этих уравнений для вариантов, когда функция управления не имеет переключений, а соотношения (3.5.28), (3.5.29) и(3.5.33),(3.5.34) — для вариантов, когда функция управления имеет одну точку переключения τ , 0 < τ < T . Во всех вариантах сопряженные переменные выражаютсячерез функции состояний системы k1 (t), k2 (t), которые пока неизвестны. В следующих разделах будут найдены решения системы уравнений дифференциальной связидля различных вариантов функции управления. После этого появится возможностьподставить выражения для функций k1 (t), k2 (t) в указанные соотношения для сопряженных функций и определить явные аналитические представления для сопряженных переменных p0 (t), p1 (t), p2 (t).3.6Решение системы сопряженных уравнений для функцийуправления с произвольным конечным числом точек переключенияРассмотрим далее вариант, в котором число точек переключения управления на данном интервале времени [0, T ] является произвольным и конечным.
Как и ранее, предполагается, что точки переключения изолированы, и в этих точках функция переключения Q(p0 (t), p1 (t), p2 (t)) изменяет знак. Обозначим точки переключения черезτ1 , τ2 , ..., τn , 0 < τ1 < τ2 < ... < τn−1 < τn < T , τ0 = 0, τn+1 = T . Аналитические62представления решений систем уравнений дифференциальной связи будут зависетьот того, является ли число переключений n четным или нечетным, а также от знака функции Q(p0 , p1 , p2 ) на интервале времени [0, τ1 ), который в дальнейшем будетназываться начальным.
Таким образом, необходимо рассмотреть следующие случаи.1. Число переключений n = 2m − 1, m ≥ 1 - заданное целое число;Q(p0 , p1 , p2 ) > 0 при 0 ≤ t < τ1Q(p0 , p1 , p2 ) < 0 при τ1 < t < τ2..............................................Q(p0 , p1 , p2 ) < 0 при τ2m−1 < t ≤ τ2m = T .2)Число переключений n = 2m, m ≥ 1 - заданное целое число;Q(p0 , p1 , p2 ) > 0 при 0 ≤ t < τ1Q(p0 , p1 , p2 ) < 0 при τ1 < t < τ2..............................................Q(p0 , p1 , p2 ) > 0 при τ2m < t ≤ τ2m+1 = T .3)Число переключений n = 2m − 1, m ≥ 1 - заданное целое число;Q(p0 , p1 , p2 ) < 0 при 0 ≤ t < τ1Q(p0 , p1 , p2 ) > 0 при τ1 < t < τ2..............................................Q(p0 , p1 , p2 ) < 0 при τ2m−1 < t ≤ τ2m = T .4) Число переключений n = 2m, m ≥ 1 - заданное целое число;Q(p0 , p1 , p2 ) < 0 при 0 ≤ t < τ1Q(p0 , p1 , p2 ) > 0 при τ1 < t < τ2..............................................Q(p0 , p1 , p2 ) > 0 при τ2m < t ≤ τ2m+1 = T .Для каждого из указанных случаев, в которых характеризуется поведениефункций переключений Q(p0 , p1 , p2 ), можно выписать явное представления для функции оптимального управления u1∗ (t), которое определяется из условия максимумафункции Понтрягина.1.
Число переключений n = 2m−1, m ≥ 1, функция переключений Q(p0 , p1 , p2 )принимает положительные значения на начальном интервале.1, τ2j−2 ≤ t < τ2j−1 ,j = 1, 2, .., m;u1∗ (t) =0, τ≤t<τ ,j = 1, 2...., m.2j−1(3.6.1)2jГрафическое представление данной функции управления приведено на рисунке 3.63Рис. 3: Структура оптимального управления в случае 1, n = 2m − 1 (3.6.1).2. Число переключений n = 2m, m ≥ 1, функция переключений Q(p0 , p1 , p2 )принимает положительные значения на начальном интервале.j = 1, 2, .., m + 1;1, τ2j−2 ≤ t < τ2j−1 ,u1∗ (t) =0, τ≤t<τ ,j = 1, 2, ..., m.2j−1(3.6.2)2jГрафическое представление данной функции управления приведено на рисунке 4.Рис.