Диссертация (Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)), страница 12
Описание файла
Файл "Диссертация" внутри архива находится в папке "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)". PDF-файл из архива "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 12 страницы из PDF
4: Структура оптимального управления в случае 2, n = 2m (3.6.2).643. Число переключений n = 2m−1, m ≥ 1, функция переключений Q(p0 , p1 , p2 )принимает отрицательные значения на начальном интервале.j = 1, 2, .., m;0, τ2j−2 ≤ t < τ2j−1 ,u1∗ (t) =1, τ≤t<τ ,j = 1, 2, ..., m.2j−1(3.6.3)2jГрафическое представление данной функции управления приведено на рисунке 5.Рис. 5: Структура оптимального управления в случае 3, n = 2m − 1 (3.6.3).4.
Число переключений n = 2m, m ≥ 1, функция переключений Q(p0 , p1 , p2 )принимает отрицательные значения на начальном интервале.j = 1, 2, .., m + 1;0, τ2j−2 ≤ t < τ2j−1 ,u1∗ (t) =1, τ≤t<τ ,j = 1, 2, ..., m.2j−1(3.6.4)2jГрафическое представление данной функции управления приведено на рисунке 6.Функция управления u1∗ (t) имеет ступенчатый вид для всех четырех, приведенных выше, вариантов, определяемых формулами (3.6.1)-(3.6.4).Найдем общие представления решений системы сопряженных уравнений (3.4.7)для четырех вариантов поведения функции управления u1∗ (t) с произвольным конечным числом точек переключения. Отметим, что в исходной задаче оптимальногоуправления с закрепленным левым и свободным правым концом траектории условия трансверсальности в левом конце интервала времени [0, T ] неинформативны.
Длянахождения решений системы сопряженных уравнений можно использовать толькоусловия трансверсальности в правом конце интервала времени [0, T ] (3.4.9). Такимобразом, в дальнейшем будем полагать, что значения сопряженных переменных вточке t = T являются известными.65Рис.
6: Структура оптимального управления в случае 1, n = 2m (3.6.4).Правые части сопряженных уравнений (3.4.7) зависят от функции управления u1 (t), а также от функций состояний k1 (t), k2 (t). Все эти функции имеют различные аналитические представления на различных интервалах между точками переключения управления. В связи с этим решения системы сопряженных уравненийнеобходимо строить последовательно на интервалах между точками переключенияуправления, начиная с крайне правого интервала [τn , T ]. Для задания граничныхусловий необходимо использовать свойство непрерывности сопряженных функцийp0 (t), p1 (t), p2 (t), которое выполняется во всех точках t ∈ [0, T ], в том числе и в точках переключения управления.Введем обозначения для различных аналитических представлений функцииpi (t) на различных интервалах между моментами переключений(0)pi (t), 0 ≤ t ≤ τ1 ,(1)pi (t), τ1 ≤ t ≤ τ2 ,pi (t) =.........p(n) (t), τn ≤ t ≤ T,ii = 0, 1, 2.
Предполагается, что 0 = τ0 , T = τn+1 .Теперь найдем решения системы сопряженных уравнений для указанных выше четырех вариантов поведения функции переключений Q(p0 , p1 , p2 ) и соответствующих вариантов структуры функции управления u1∗ (t) (3.6.1)-(3.6.4).Заметим предварительно, что для каждого из этих вариантов в разделах 3.7и 3.8 будут найдены явные представления функций состояний k0 (t), k1 (t), k2 (t) на66всех интервалах между переключениями. Таким образом, функции k0 (t), k1 (t), k2 (t),от которых зависят решения сопряженных уравнений, можно считать известными.Теорема 7. Предположим, что в исходной задаче оптимального управленияфункция переключений Q(t) удовлетворяет условиям 1, а соответствующая функцияуправления u1∗ (t) задается формулой (3.6.1). Тогда решение системы сопряженныхуравнений определяется формулами(2j−1)p0(t) = p0,τ2j eλ0 (t−τ2j ) ,hR τ2j −λ z α1 −1(1)λ1 t−λ1 τ2j1 3p(2j−1)(t)=epe(z)l0 ρp0,τ2j eλ0 (z3 −τ2j ) ++Aαek1,τ311112jtiR τ2j (−δ−λ )z α2 −1(2)λ2 (z3 −τ2j )λ2 z 32 4(z)dz)dzkBe+l(1−ρ)(ep+e4432 z32,τ2j20Rτp(2j−1)τ2j−1 ≤ t ≤ τ2j(t) = eλ2 t e−λ2 τ2j p2,τ2j + B2 t 2j e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 ,2где значения pi,τ2j , i = 0, 1, 2 определяются на интервале [τ2j , τ2j+1 ], при t = τ2j ,(0)j = 1, 2, ..., m, причем pi,τ2m = ψi (T ), i = 0, 1, 2;(2j−2)p0(t) = p0,τ2j−1 eλ0 (t−τ2j−1 ) ,(2j−2)R τ2j−1α1 −1k1(z2 ) dz2 +λ1 (t−τ2j−1 )p1(t) = p1,τ2j−1 eA1 α1 t,Rτ−λ2 τ2j−1p(2j−2) (t) = eλ2 t p+ B2 t 2j−1 e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 , τ2j−2 ≤ t ≤ τ2j−1 ,2,τ2j−1 e2где значения pi,τ2j−1 определяются равенствамиpi,τ2j−1 = p2j−1(τ2j−1 ), i = 0, 1, 2, j = 1, 2, ..., m.iДоказательство.
Рассмотрим случай, кода число переключений нечетноn = 2m − 1 и функция управления задается формулой (3.6.1). С учетом заданных(0)значений в точке t = T (условий трансверсальности (3.4.9)) p1 (T ) = ψi (T ), i = 0, 1, 2решение системы сопряженных уравнений (3.4.7) на крайне правом интервале времени [τ2m−1 , T ] имеет вид(0)p(2m−1)(t) = ψ0 (T )eλ0 (t−T ) ,0hR T −λ z α1 −1(0)(1)(0)λ1 t−λ1 T1 3p(2m−1)(t)=eψ(T)e+Aαek(z)l0 ρψ0 (T )eλ0 (z3 −T ) +31 1 t111iR T (−δ−λ )z α2 −1(2)λ2 (z3 −T ) (0)λ2 z 32 4+l(1−ρ)(eψ(T)+eBek(z)dz)dz244322z3 0RT(0)p(2m−1)(t) = eλ2 t e−λ2 T ψ2 (T ) + B2 t e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 ,τ2m−1 ≤ t ≤ T.2(3.6.5)67(2m−1)Зафиксируем значения сопряженных функций pi(t), i = 0, 1, 2 в точке переклю-чения t = τ2m−1 .
Имеем(2m−1)pi(τ2m−1 ) = pi,τ2m−1 ,i = 0, 1, 2.(3.6.6)Полученные значения p0,τ2m−1 , p1,τ2m−1 , p2,τ2m−1 будут задавать граничные условия длясистемы сопряженных уравнений на интервале времени [τ2m−2 , τ2m−1 ]. Решение системы сопряженных уравнений на этом интервале имеет видp(2m−2)(t) = p0,τ2m−1 eλ0 (t−τ2m−1 ) ,0R τ2m−1(2m−2)α1 −1k1(z2 ) dz2 +λ1 (t−τ2m−1 )p1(t) = p1,τ2m−1 eA1 α1 t,Rτ−λ2 τ2m−1p(2m−2) (t) = eλ2 t p+ B2 t 2m−1 e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 , τ2m−2 ≤ t ≤ τ2m−1 .2,τ2m−1 e2(3.6.7)Теперь получим последовательно решения сопряженных уравнений на интервалахмежду переключениями: сначала на интервале [τ2j−1 , τ2j ], а затем на интервале [τ2j−2 , τ2j−1 ],j = m, m − 1, ..., 1.
Пусть заданы граничные значения сопряженных функций в точкеt = τ2j :(2j−1)pi(τ2j ) = pi,τ2j ,(3.6.8)где j - некоторое фиксированное число, j = m, m − 1, ..., 1, причем(2m−1)pi(0)(τ2m ) = pi,τ2m = pi,T = ψi (T ),i = 0, 1, 2.Функция управления на указанных интервалах между переключениями определена формулой (3.6.1). С учетом граничных условий (3.6.8) получаем решение системы сопряженных уравнений на интервале [τ2j−1 , τ2j ]. Общий вид решения аналогичен (3.5.28)-(3.5.29).(2j−1)p0(t) = p0,τ2j eλ0 (t−τ2j ) ,hR τ2j −λ z α1 −1(1)λ1 t−λ1 τ2j1 3p(2j−1)(t)=epe+Aαek(z)l0 ρp0,τ2j eλ0 (z3 −τ2j ) +1,τ2j1 1 t311iR τ2j (−δ−λ )z α2 −1(2)λ2 (z3 −τ2j )λ2 z 32 4+l(1−ρ)(ep+eBek(z)dz)dz2,τ2443022jz3Rτp(2j−1)(t) = eλ2 t e−λ2 τ2j p2,τ2j + B2 t 2j e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 ,τ2j−1 ≤ t ≤ τ2j2(3.6.9)(2j−1)Зафиксируем значения сопряженных функций pi(2j−1)pi(τ2j−1 ) = pi,τ2j−1 ,68(t) в точке t = τ2j−1 :i = 0, 1, 2.(3.6.10)Принимая во внимание вид управления на интервале [τ2j−2 , τ2j−1 ] и граничные условия (3.6.10), получаем аналогично (3.6.7)p(2j−2)(t) = p0,τ2j−1 eλ0 (t−τ2j−1 ) ,0(2j−2)R τ2j−1α1 −1k1(z2 ) dz2 +λ1 (t−τ2j−1 ),p1(t) = p1,τ2j−1 eA1 α1 tRτ−λ2 τ2j−1p(2j−2) (t) = eλ2 t p+ B2 t 2j−1 e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 , τ2j−2 ≤ t ≤ τ2j−1 .2,τ2j−1 e2(3.6.11)Формулы (3.6.9)-(3.6.11) определяют вид сопряженных функций исследуемойсистемы на интервалах времени [τ2j−1 , τ2j ],[τ2j−2 , τ2j−1 ], j = m, m − 1, ..., 1 для случая1.
Теорема 7 доказана.Теорема 8. Предположим, что в исходной задаче оптимального управленияфункция переключений Q(t) удовлетворяет условиям 2, а соответствующая функцияуправления u1∗ (t) задается формулой (3.6.2). Тогда решение системы сопряженныхуравнений определяется формулами(2j−1)p0(t) = p0,τ2j eλ0 (t−τ2j ) ,hR τ2j −λ z α1 −1(1)λ1 t−λ1 τ2j1 3p(2j−1)(t) = ep1,τ2j e+ A1 α1 t ek1 (z3 ) l0 ρp0,τ2j eλ0 (z3 −τ2j ) +1iR τ2j (−δ−λ )z α2 −1(2)λ2 (z3 −τ2j )λ2 z 32 4+l(1−ρ)(ep+eBek(z)dz)dz2,τ2j4432 z302Rτp(2j−1)τ2j−1 ≤ t ≤ τ2j(t) = eλ2 t e−λ2 τ2j p2,τ2j + B2 t 2j e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 ,2где значения pi,τ2j , i = 0, 1, 2 определяются на интервале [τ2j , τ2j+1 ], при t = τ2j , j =1, 2, ..., m;(2j−2)p0(t) = p0,τ2j−1 eλ0 (t−τ2j−1 ) ,(2j−2)R τ2j−1α1 −1k1(z2 ) dz2 +λ1 (t−τ2j−1 )p1(t) = p1,τ2j−1 eA1 α1 t,R τ2j−1 (−δ−λ )z α2 −1−λ2 τ2j−1p(2j−2) (t) = eλ2 t p2 1e+Bek(z)dz, t ∈ [τ2j−2 , τ2j−1 ],2,τ211222j−1tгде значения pi,τ2j−1 определяются равенствами(2j−1)pi,τ2j−1 = pi(τ2j−1 ), i = 0, 1, 2;(0)j = 1, 2, ..., m + 1 причем pi,τ2m+1 = ψi (T ), i = 0, 1, 2.Доказательство.
Рассмотрим случай 2, когда число переключений четноn = 2m и функция управления задается формулой (3.6.2). С учетом заданных значений в точке t = T (условий трансверсальности (3.4.9)) решение системы сопряженных69уравнений (3.4.7) на крайне правом интервале времени [τ2m , T ] имеет вид(2m)(0)p0 (t) = ψ0 (T )eλ0 (t−T ) ,(2m)(0)α1 −1RTp1 (t) = ψ1 (T )eA1 α1 t k1 (z2 ) dz2 +λ1 (t−T ) ,p(2m) (t) = eλ2 t ψ (0) (T )e−λ2 T + B R T e(−δ−λ2 )z1 k α2 −1 (z ) dz , t ∈ [τ , T ].112m2 t222(3.6.12)Зафиксируем значения сопряженных функций в точке переключения t = τ2m .Имеем(2m)pi(τ2m ) = pi,τ2m ,i = 0, 1, 2.(3.6.13)Полученные значения p0,τ2m , p1,τ2m , p2,τ2m будут задавать граничные условиядля системы сопряженных уравнений на интервале времени [τ2m−1 , τ2m ].
Решениесистемы сопряженных уравнений на этом интервале имеет видp(2m−1) (t) = p0,τ eλ0 (t−τ2m ) ,2m0hRτ (2m−1)(1)(t) = eλ1 t p1,τ2m e−λ1 τ2m + A1 α1 t 2m e−λ1 z3 k1α1 −1 (z3 ) l0 ρp0,τ2m eλ0 (z3 −τ2m ) +p1iR τ2m (−δ−λ )z α2 −1(2)λ2 (z3 −τ2m )λ2 z 324+l0 (1 − ρ)(ep2,τ2m + e B2 z3 ek2 (z4 ) dz4 ) dz3Rτp(2m−1)(t) = eλ2 t e−λ2 τ2m p2,τ2m + B2 t 2m e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 ,τ2m−1 ≤ t ≤ τ2m2(3.6.14)Теперь получим последовательно решения сопряженных уравнений на интервалах между переключениями: сначала на интервале [τ2j−1 , τ2j ], а затем на интервале[τ2j−2 , τ2j−1 ], j = m, ..., 1. Пусть заданы граничные значения сопряженных функцийв точке t = τ2j :(2j−1)pi(τ2j ) = pi,τ2j ,(3.6.15)где j - некоторое фиксированное число, j = m, ..., 1.