Диссертация (Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)), страница 13
Описание файла
Файл "Диссертация" внутри архива находится в папке "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)". PDF-файл из архива "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 13 страницы из PDF
Отметим, что решение сопряженных уравнений на интервале [τ2m , T ], не входящем в указанный набор интервалов,определено формулой (3.6.12), а граничные условия в точке t = τ2m задаются равенством (3.6.13). Именно, при j = m(2m−1)pi(τ2m ) = pi,τ2m ,как было учтено в формулах (3.6.14), определяющих решение сопряженных уравнений на интервале [τ2m−1 , τ2m ].Функция управления на указанных интервалах между переключениями определена формулой (3.6.3). С учетом граничных условий (3.6.15) получаем решение70системы сопряженных уравнений.(2j−1)p0(t) = p0,τ2j eλ0 (t−τ2j ) ,hR τ2j −λ z α1 −1(1)−λ1 τ2jλ1 t1 3p(2j−1)p1,τ2j e+ A1 α1 t ek1 (z3 ) l0 ρp0,τ2j eλ0 (z3 −τ2j ) +(t) = e1iR τ2j (−δ−λ )z α2 −1(2)λ2 (z3 −τ2j )λ2 z 32 4(z)dz)dzek+l(1−ρ)(ep+eB4432,τ2j2 z320R τ2j (−δ−λ )z α2 −1λ2 t −λ2 τ2j2 1p(2j−1)(z)dz,τ2j−1 ≤ t ≤ τ2jep+Bk(t)=ee112,τ2222jt(3.6.16)Зафиксируем значения найденных при помощи формул (3.6.16) функций в точкеt = τ2j−1(2j−1)pi(τ2j−1 ) = pi,τ2j−1 ,i = 0, 1, 2.(3.6.17)Зададим граничные условия к системе сопряженных уравнений на интервале [τ2j−2 , τ2j−1 ]:(2j−2)pi(τ2j−1 ) = pi,τ2j−1 ,i = 0, 1, 2.При заданных граничных условиях (3.6.17) решение системы сопряженныхуравнений имеет вид(2j−2)(τ2j−1 ) = p0,τ2j−1 eλ0 (t−τ2j−1 ) ,p0(2j−2)R τ2j−1α1 −1k1(z2 ) dz2 +λ1 (t−τ2j−1 )p1(τ2j−1 ) = p1,τ2j−1 eA1 α1 t,Rτλ2 tp(2j−2) (τp2,τ2j−1 e−λ2 τ2j−1 + B2 t 2j−1 e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 , t ∈ [τ2j−2 , τ2j−1 ].2j−1 ) = e2(3.6.18)Таким образом, формулы (3.6.12), (3.6.16) и (3.6.18) полностью определяют явныепредставления для сопряженных функций в случае, когда функция управления нарассматриваемом интервале [0, T ] определяется соотношением (3.6.2).Теорема 8 доказана.Теорема 9.
Предположим, что в исходной задаче оптимального управленияфункция переключений Q(t) удовлетворяет условиям 3, а соответствующая функцияуправления u1∗ (t) задается формулой (3.6.3). Тогда решение системы сопряженныхуравнений определяется формулами(2j−1)(t) = p0,τ2j eλ0 (t−τ2j ) ,p0(2j−1)R τ2jα1 −1p1(t) = p1,τ2j eA1 α1 t k1 (z2 ) dz2 +λ1 (t−τ2j ) ,Rτ−λ2 τ2jp(2j−1) (t) = eλ2 t p+ B2 t 2j e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 , τ2j−1 ≤ t ≤ τ2j .2,τ2j e271где значения pi,τ2j , i = 0, 1, 2 определяются на интервале [τ2j , τ2j+1 ], при t = τ2j , j =(0)1, 2, ..., m, причем pi,τ2m = ψi (T ), i = 0, 1, 2;(2j−2)p0(t) = p0,τ2j−1 eλ0 (t−τ2j−1 ) ,h (2j−2)Rτ(1)p 1(t) = eλ1 t p1,τ2j−1 e−λ1 τ2j−1 + A1 α1 t 2j−1 e−λ1 z3 k1α1 −1 (z3 ) l0 ρp0,τ2j−1 eλ0 (z3 −τ2j−1 ) +iR τ2j−1 (−δ−λ )z α2 −1(2)λ2 (z3 −τ2j−1 )λ2 z 32 4k2 (z4 ) dz4 ) dz3e+l0 (1 − ρ)(ep2,τ2j−1 + e B2 z3Rτp(2j−2)(t) = eλ2 t e−λ2 τ2j−1 p2,τ2j−1 + B2 t 2j−1 e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 ,τ2j−2 ≤ t ≤ τ2j−12где значения pi,τ2j−1 определяются равенствами(2j−1)pi,τ2j−1 = pi(τ2j−1 ), i = 0, 1, 2, j = 1, 2, ..., m;Доказательство.
Рассмотрим случай , когда количество переключений нечетно n = 2m − 1 и функция управления задается формулой (3.6.3). С учетом заданныхзначений в точке t = T (условий трансверсальности) решение системы сопряженныхуравнений (3.4.9) на крайне правом интервале времени [τ2m−1 , T ] имеет вид аналогичный случаю 2 (3.6.12).Естественно, что при этом, в отличие от формул (3.6.12), сопряженные функ(2m−1)ции на крайне правом интервале времени [τ2m−1 , T ] обозначаются через pi(t),i = 0, 1, 2.Найдем явные представления для сопряженных функций в случае 3 на произвольных интервалах между переключениями: сначала на интервале [τ2j−1 , τ2j ], азатем на интервале [τ2j−2 , τ2j−1 ], где j = m, m − 1, ..., 1.
Предположим, что заданызначения сопряженных функций в точке переключения t = τ2j . Именно,(2j−1)pi(τ2j ) = pi,τ2j ,(0)где pi,τ2j - известная величина, причем pi,τ2m = pi,T = ψi (T ), i = 0, 1, 2.Тогда решения сопряженных уравнений на интервале [τ2j−1 , τ2j ] определяетсяследующими соотношениями, по своей аналитической форме аналогичным соотношениям (3.6.7), (3.6.11) и (3.6.12).(2j−1)p0(t) = p0,τ2j eλ0 (t−τ2j ) ,(2j−1)R τ2jα1 −1p1(t) = p1,τ2j eA1 α1 t k1 (z2 ) dz2 +λ1 (t−τ2j ) ,Rτ−λ2 τ2jp(2j−1) (t) = eλ2 t p+ B2 t 2j e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 , τ2j−1 ≤ t ≤ τ2j .2,τ2j e2(3.6.19)72(2j−1)Зафиксируем значения найденных функций pi(2j−1)pi(τ2j−1 ) = pi,τ2j−1 ,(t) в точке t = τ2j−1i = 0, 1, 2.(3.6.20)Зададим граничные условия для системы сопряженных уравнений на интервале[τ2j−2 , τ2j−1 ] с помощью соотношения(2j−2)pi(τ2j−1 ) = pi,τ2j−1 ,i = 0, 1, 2,(3.6.21)где величины pi,τ2j−1 , i = 0, 1, 2 определяются равенством (3.6.20).С учетом граничных условий (3.6.21) и вида функций управления на интервале [τ2j−2 , τ2j−1 ] решение системы сопряженных уравнений на этом интервале времениимеет аналитический характер, аналогичный характеру функций, представленныхсоотношениями (3.6.9),(3.6.16).(2j−2)p0(t) = p0,τ2j−1 eλ0 (t−τ2j−1 ) ,hR τ2j−1 −λ z α1 −1(1)−λ1 τ2j−1λ1 t1 3p(2j−2)+ A 1 α1 tek1 (z3 ) l0 ρp0,τ2j−1 eλ0 (z3 −τ2j−1 ) +p1,τ2j−1 e(t) = e1iR τ2j−1 (−δ−λ )z α2 −1(2)λ2 (z3 −τ2j−1 )λ2 z 32 4+l(1−ρ)(ep+eBek(z)dz)dz2,τ2j−12 z344302Rτp(2j−2)(t) = eλ2 t e−λ2 τ2j−1 p2,τ2j−1 + B2 t 2j−1 e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 ,τ2j−2 ≤ t ≤ τ2j−12(3.6.22)Таким образом, формулы (3.6.19)-(3.6.22) полностью определяют явные представления для сопряженных функций в случае, когда функция управления на рассматриваемом интервале [0, T ] определяется соотношением (3.6.3).Теорема 9 доказана.Теорема 10.
Предположим, что в исходной задаче оптимального управленияфункция переключений Q(t) удовлетворяет условиям 4, а соответствующая функцияуправления u1∗ (t) задается формулой (3.6.4). Тогда решение системы сопряженныхуравнений определяется формулами(2j−1)p0(t) = p0,τ2j eλ0 (t−τ2j ) ,(2j−1)R τ2jα1 −1p1(t) = p1,τ2j eA1 α1 t k1 (z2 ) dz2 +λ1 (t−τ2j ) ,Rτ−λ2 τ2jp(2j−1) (t) = eλ2 t p+ B2 t 2j e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 , τ2j−1 ≤ t ≤ τ2j ,2,τ2j e2где значения pi,τ2j , i = 0, 1, 2 определяются на интервале [τ2j , τ2j+1 ], при t = τ2j , j =731, 2, ..., m;(2j−2)p0(t) = p0,τ2j−1 eλ0 (t−τ2j−1 ) ,hR τ2j−1 −λ z α1 −1(1)λ1 t−λ1 τ2j−11 3p(2j−2)(t) = ep1,τ2j−1 e+ A 1 α1 tek1 (z3 ) l0 ρp0,τ2j−1 eλ0 (z3 −τ2j−1 ) +1iR τ2j−1 (−δ−λ )z α2 −1(2)λ2 (z3 −τ2j−1 )λ2 z 32 4(z)dz)dzkBe+l(1−ρ)(ep+e4432 z32,τ2j−120Rτp(2j−2)τ2j−2 ≤ t ≤ τ2j−1(t) = eλ2 t e−λ2 τ2j−1 p2,τ2j−1 + B2 t 2j−1 e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 ,2где значения pi,τ2j−1 определяются равенствами(2j−1)pi,τ2j−1 = pi(τ2j−1 ), i = 0, 1, 2,j = 1, 2, ..., m + 1,(0)причем pi,τ2m+1 = ψi (T ), i = 0, 1, 2.Доказательство.Рассмотрим случай , когда количество переключений четно n = 2m и функция управления задается формулой (3.6.4).
С учетом заданных значений в точкеt = T (условий трансверсальности) решение системы сопряженных уравнений (3.4.7)на крайне правом интервале времени [τ2m , T ] имеет вид аналогичный случаю 1 (3.6.5).С учетом общих результатов, полученных для случая 1 а именно, формул(3.6.9)-(3.6.11), выпишем представления для сопряженных функции в случае 4 напроизвольных интервалах между переключениями [τ2j−2 , τ2j−1 ], [τ2j−1 , τ2j ].
Как и впредыдущих случаях, предположим, что заданы значения сопряженных функций внекоторой точке переключения t = τ2j , j = m, m − 1, ..., 2, 1. Именно,(2j−1)pi(τ2j ) = pi,τ2j ,i = 0, 1, 2,(3.6.23)где j - некоторое фиксированное число, j = m, m − 1, ..., 1. В этом случае решение системы сопряженных уравнений на интервале времени [τ2j−1 , τ2j ] с граничнымиусловиями (3.6.23) имеет вид(2j−1)p0(t) = p0,τ2j eλ0 (t−τ2j ) ,(2j−1)R τ2jα1 −1p1(t) = p1,τ2j eA1 α1 t k1 (z2 ) dz2 +λ1 (t−τ2j ) ,Rτ−λ2 τ2jp(2j−1) (t) = eλ2 t p+ B2 t 2j e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 , τ2j−1 ≤ t ≤ τ2j .2,τ2j e2(3.6.24)(2j−1)Зафиксируем значения найденных функций pi(2j−1)pi(τ2j−1 ) = pi,τ2j−1 ,74(t) в точке t = τ2j−1i = 0, 1, 2.(3.6.25)Зададим граничные условия для системы сопряженных уравнений на интервале[τ2j−2 , τ2j−1 ] с помощью соотношения(2j−2)pi(τ2j−1 ) = pi,τ2j−1 ,i = 0, 1, 2,(3.6.26)где величины pi,τ2j−1 , i = 0, 1, 2 определяются равенством (3.6.21).
С учетом граничных условий (3.6.26) и вида функций управления на интервале [τ2j−2 , τ2j−1 ] решение системы сопряженных уравнений на этом интервале времени имеет аналитический характер, аналогичный характеру функций, представленных соотношениями(3.6.9),(3.6.16),(3.6.22).(2j−2)p0(t) = p0,τ2j−1 eλ0 (t−τ2j−1 ) ,hR τ2j−1 −λ z α1 −1(1)λ1 t−λ1 τ2j−11 3p(2j−2)(t)=epe(z)l0 ρp0,τ2j−1 eλ0 (z3 −τ2j−1 ) ++Aαek1,τ311112j−1tiR τ2j−1 (−δ−λ )z α2 −1(2)λ2 (z3 −τ2j−1 )λ2 z 32 4(z)dz)dzkBe+l(1−ρ)(ep+e4432 z32,τ2j−120 (2j−2)Rτp 2(t) = eλ2 t e−λ2 τ2j−1 p2,τ2j−1 + B2 t 2j−1 e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 ,τ2j−2 ≤ t ≤ τ2j−1(3.6.27)Формулы (3.6.24)-(3.6.27) определяют вид сопряженных функций исследуемой системы на интервалах времени [τ2j−1 , τ2j ],[τ2j−2 , τ2j−1 ], j = m, m − 1, ..., 1, τ0 = 0для случая 4.Теорема 10 доказана.Таким образом, в данном разделе получены явные решения системы сопряженных уравнений в рассматриваемой задаче оптимального управления.
Представления для сопряженных функций p0 (t), p1 (t), p2 (t) получены для функций управления с произвольным конечным числом переключения на всех интервалах между переключениями.3.7Решение системы уравнений дифференциальной связи дляфункции управления без переключений и с одним переключениемНачнем исследование системы уравнений дифференциальной связи (3.3.14).В соответствии с принятыми ранее предположениями рассмотрим четыре основных варианта поведения функции Q(p0 , p1 , p2 ) на интервале [0, T ].751)Q(p0 , p1 , p2 ) > 0при t ∈ [0, T ];(3.7.1)2)Q(p0 , p1 , p2 ) < 0при t ∈ [0, T ];(3.7.2)3)4)Существует точка τ ∈ [0, T ] такая, чтоQ(p0 , p1 , p2 ) > 0при 0 ≤ t < τ,Q(p0 , p1 , p2 ) < 0при τ < t ≤ T ;(3.7.3)Существует точка τ ∈ [0, T ] такая, чтоQ(p0 , p1 , p2 ) < 0при 0 ≤ t < τ,Q(p0 , p1 , p2 ) > 0при τ < t ≤ T.(3.7.4)Для каждого из указанных вариантов известно выражение для оптимальногоуправления и можно решить уравнения дифференциальной связи относительно k0 (t),k1 (t), k2 (t).