Диссертация (Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)), страница 10
Описание файла
Файл "Диссертация" внутри архива находится в папке "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)". PDF-файл из архива "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 10 страницы из PDF
Рассмотрим вариант, когда вспомогательная функция Q(t)отрицательна на всем временном интервале t ∈ [0, T ]. В этом случае функция управления не имеет переключений и задается равенством u1 (t) = 0, t ∈ [0, T ]. Запишемсистему дифференциальных уравнения для сопряженных переменныхṗ0 (t) = λ0 p0 (t)hi(1)(2)α1 −1ṗ(t)=λp(t)−Aαk(t)lρp(t)+l(1−ρ)p(t)11 11 1 10200ṗ (t) = λ p (t) − B e−δt α k α2 −1 (t)22 22(3.5.11)2 2Заметим, что уравнения относительно p0 и p2 из системы (3.5.11) по формесовпадают с соответствующими уравнениями из системы (3.5.1).
Функция k2 (t), входящая в уравнение относительно p2 , имеет единое аналитическое представление наинтервале времени [0, T ], хотя определяется при другом управлении u1 (t). Таким образом, аналитические формы решений уравнений относительно p0 и p2 , входящих всистему (3.5.11), совпадают с аналитическими формами решений соответствующихуравнений из системы (3.5.1).Найдем аналитическое представление для функции p1 (t). Рассмотрим отдельно уравнение относительно p1 (t) из системы (3.5.11).hi(1)(2)ṗ1 (t) = −A1 α1 k1α1 −1 (t) l0 ρp0 (t) + l0 (1 − ρ)p2 (t) +λ1 p1 (t)(3.5.12)Подставим в уравнение (3.5.12) уже известные решения уравнений относительнофункций p0 и p2 из системы (3.5.11), задаваемые формулами (3.5.3) и (3.5.6).
Прификсированной функции k1 (t), соответствующей рассматриваемому варианту управления, уравнение (3.5.12) является линейным неоднородным дифференциальным уравнением первого порядка. Решение этого уравнения находится классическим методом,известным в теории дифференциальных уравнений: сначала решатся соответствующее ему линейное однородное уравнение, а затем используется метод вариации по53стоянной. Общее решение уравнения (3.5.12) имеет вид:Z tih(1)(2)λ1 te−λ1 z3 k1α1 −1 (z3 ) l0 ρp0 (z3 ) + l0 (1 − ρ)p2 (z3 ) dz3 (3.5.13)C1 − A1 α1p1 (t) = e0Учитывая условие трансверсальности (см.
глава 2, п.2.4 соотношение (8)), получаемZ Tih(1)(2)(0)λ1 t−λ1 Tp1 (t) = eψ1 (T )e+ A1 α1e−λ1 z3 k1α1 −1 (z3 ) l0 ρp0 (z3 ) + l0 (1 − ρ)p2 (z3 ) dz3t(3.5.14)Можно заметить, что уравнение для сопряженного параметра p1 (t) зависит от параметров p0 (t) и p2 (t). Подставим найденный выражения (3.5.3) и (3.5.6) в формулу(3.5.14), получаемp1 (t) = eλ1 tZh(1)−λ1 Tψ0 (T )e+ A1 α1Te−λ1 z3 k1α1 −1 (z3 )(1)(0)l0 ρψ0 (T )eλ0 (z3 −T ) + (3.5.15)t(2)+l0 (1λ2 (z3 −T )− ρ)(e(0)ψ2 (T )λ2 z 3+eZTB2ie(−δ−λ2 )z4 k2α2 −1 (z4 ) dz4 ) dz3z3Объединяя соотношения (3.5.3), (3.5.6), (3.5.15), получаем решение системысопряженных уравнений для второго вида управления без переключений u1 (t) = 0,t ∈ [0, T ]:(0)p0 (t) = ψ0 (T )eλ0 (t−T ) ,hRp1 (t) = eλ1 t ψ0(1) (T )e−λ1 T + A1 α1 T e−λ1 z3 k1α1 −1 (z3 ) l0(1) ρψ0(0) (T )eλ0 (z3 −T ) +tiR T (−δ−λ )z α2 −1(2)λ2 z 3λ2 (z3 −T ) (0)24k2 (z4 ) dz4 ) dz3ψ2 (T ) + e B2 z3 e+l0 (1 − ρ)(eRp2 (t) = eλ2 t e−λ2 T ψ2(0) (T ) + B2 T e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1t(3.5.16)Теорема 4 доказана.Теперь рассмотрим варианты, когда функция управления имеет одну точкупереключения.Сделаем некоторые общие замечания о характере сопряженных функций.
Отметим сразу, что, если управление u1 (t) имеет одну точку переключения τ ∈ [0, T ],то каждая функция pk (t), k = 0, 1, 2, задается различными аналитическими выражениями на интервалах [0, τ ] и [τ, T ].Введем обозначение для таких аналитических выражений(0)pk (t), 0 ≤ t ≤ τ,pk (t) =k = 0, 1, 2.p(1) (t), τ ≤ t ≤ T,k54(3.5.17)Зафиксируем явные представления для функции u1 (t) на интервалах времени(0)[0, τ ), [τ, T ].
Функция pk (t) представляет собой решение дифференциального уравнения относительно pk (t) (сопряженного уравнения) на интервале времени [0, τ ] при(1)заданном представлении функции управления, а функция pk (t) представляет собойрешение того же самого уравнения относительно pk (t) на интервале времени [τ, T ],но уже при другом представлении функции управления. При этом в силу непрерывности сопряженного параметра pk (t) имеет место равенство значений этих функцийв точке переключения(0)(1)pk (τ ) = pk (τ ).Учитывая, что в данной задаче условие трансверсальности задает граничноезначение каждой функции pk (t) в точке t = T , можно предложить следующий методопределения функции pk (t) на всем временном интервале [0, T ].1) Рассматривается дифференциальное уравнение относительно функции pk (t)(сопряженное уравнение) на интервале времени [τ, T ] с граничным условием в точкеt = T , определяемом условием трансверсальности(0)pk (T ) = ψk (T ).При этом предполагается, что функция управления на этом интервале времени задана явно.
Конкретный вид функции управления определяется из условиямаксимума функции Понтрягина. В рассматриваемом варианте проблемы при отсутствии особого управления функция управления может иметь только одну из двухвозможных аналитических форм: u1 (t) = 1 или u1 (t) = 0 при всех t ∈ [τ, T ].2) Находится решение данного дифференциального уравнения относительноpk (t) на отрезке времени [τ, T ] с указанным выше граничным условием в точке t = T .(1)Полученное решение обозначается через pk (t), τ ≤ t ≤ T . По определению, величина(0)ψk (T ) представляет собой производную терминального слагаемого целевого функционала и может явно зависеть от значений функций состояний k0 (t), k1 (t), k2 (t),вычисляемых в точке t = T , то есть величин k0 (T ), k1 (T ), k2 (T ).
На данном этапе исследования функции состояний еще не известны. Однако в дальнейшем будутполучены аналитические решения уравнений дифференциальной связи, и функцииk0 (t), k1 (t), k2 (t) будут определены при всех значениях t ∈ [0, T ] для каждого рассматриваемого вида функции управления. При этом в аналитических представленияхдля функций состояний k0 (t), k1 (t), k2 (t) будет учитываться зависимость от значенияточки переключения τ . Таким образом, величины k0 (t), k1 (t), k2 (t) можно условно55полагать известными.3) Рассматривается дифференциальное уравнение относительно функции pk (t)(сопряженное уравнение) на интервале времени [0, τ ] с граничным условием в точкеt = τ , определяемым условием непрерывности в точке переключения(1)pk (τ ) = pk (τ ).При этом предполагается, что функция управления на этом интервале времени задана явно, и ее конкретный вид также определяется из условия максимумафункции Понтрягина.
Функция управления на этом интервале также может иметьтолько одну из двух возможных аналитических форм : u1 (t) = 1 или u1 (t) = 0 сучетом переключения в точке τ .4) Находится решение данного дифференциального уравнения относительноpk (t) на отрезке времени [0, τ ] с указанным выше граничным условием в точке t = τ .(0)Полученное решение обозначается через pk (t), 0 ≤ t ≤ τ .Таким образом, определяется функция pk (t) в варианте управления с переключением, задаваемая формулой (3.5.11). Еще раз отметим, что в полученные аналитические представления для функции pk (t) будет входить явная зависимость отзначения точки переключения τ .Перейдем к реализации изложенного метода. Найдем явные представлениядля сопряженных переменных для двух вариантов, когда функция управления имеетодну точку переключения.Теорема 5. Предположим, что в исходной задаче оптимального управленияфункция Q(t) = Q(p0 (t), p1 (t), p2 (t)) удовлетворяет условию:Q(t) > 0, 0 ≤ t < τ ;Q(t) < 0,τ < t ≤ T.Тогда решение системы сопряженных уравнений определяется формулами:(0)p0 (t) = p0,τ eλ0 (t−τ ) ,(0)Rτα1 −1p1 (t) = p1,τ eA1 α1 t k1 (z2 ) dz2 +λ1 (t−τ ) ,p(0) (t) = eλ2 t p e−λ2 τ + B R τ e(−δ−λ2 )z1 k α2 −1 (z ) dz , t ∈ [0, τ ]2,τ2 t112256(1)(0)p0 (t) = ψ0 (T )eλ0 (t−T ) ,h (1)Rp1 (t) = eλ1 t ψ0(1) (T )e−λ1 T + A1 α1 T e−λ1 z3 k1α1 −1 (z3 ) l0(1) ρψ0(0) (T )eλ0 (z3 −T ) +tiR T (−δ−λ )z α2 −1(2)λ2 (z3 −T ) (0)λ2 z 324k2 (z4 ) dz4 ) dz3+l0 (1 − ρ)(eψ2 (T ) + e B2 z3 e (0)RTλ2 tp(1)ψ2 (T )e−λ2 T + B2 t e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 , t ∈ [τ, T ]2 (t) = eгде величины p0,τ , p1,τ , p2,τ имеют вид(0)p0,τ = ψ0 (T )eλ0 (τ −T ) ,hRp1,τ = eλ1 τ ψ0(1) (T )e−λ1 T + A1 α1 T e−λ1 z3 k1α1 −1 (z3 ) l0(1) ρψ0(0) (T )eλ0 (z3 −T ) +τiR T (−δ−λ )z α2 −1(2)λ2 (z3 −T ) (0)λ2 z 32 4(z)dz)dzek+l(1−ρ)(eψ(T)+eB4432 z3202Rp2,τ = eλ2 τ e−λ2 T ψ2(0) (T ) + B2 T e(−δ−λ2 )z1 k2α2 −1 (z1 ) dz1 = p2,ττДоказательство.