Диссертация (Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)), страница 7
Описание файла
Файл "Диссертация" внутри архива находится в папке "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)". PDF-файл из архива "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 7 страницы из PDF
Имеем1,0k̇0 = −(ν + µ0 )k0 + LL0,0ρA1 k1α1 (1 − u1 )k̇1 = −(ν + µ1 )k1 + A1 k1α1 u1k̇ = −(ν + µ )k + L1,0 (1 − ρ)A k α1 (1 − u )22 21 11L2,0(3.3.13)(1)Введем для удобства дополнительные обозначения ν + µj = λj , j = 0, 1, 2; l0 =(1)l2 =L1,0.L2,0(1)L1,0,L0,0(1)При этом коэффициенты λj , j = 0, 1, 2; l0 , l2 предполагаются известны-ми. Тогда система (3.3.13) принимает вид(1)k̇0 = −λ0 k0 + l0 ρA1 k1α1 (1 − u1 )k̇1 = −λ1 k1 + A1 k1α1 u1k̇ = −λ k + l(1) (1 − ρ)A k α1 (1 − u )22 21 112(3.3.14)Система соотношений (3.3.14) представляет собой систему дифференциальных уравнений первого порядка относительно функций k0 (t), k1 (t), k2 (t), выполняющих вданной математической модели роль состояний.
Полученные уравнения являютсяразрешенными относительно производных k̇0 , k̇1 , k̇2 , и их правая часть зависит отпараметра управления u1 . Таким образом, система дифференциальных уравнений(3.3.14) образует дифференциальную связь в рассматриваемой задаче оптимальногоуправления.4. Как уже отмечалось, начальные значения для параметров, характеризующих состояние системы , предполагаются заданными.37Таким образом, получена следующая задача оптимального управления в канонической форме для трехсекторной модели экономики, где управлением являютсяудельные Zинвестиции в фондосоздающий сектор.Te−δt A2 θ2 k2α2 (t) dt + e−δT ψ(k0 (T ), k1 (T ), k2 (T )) −→ max1.0— целевойфункционал смешанного типа с интегральной и терминальной частями;(1)k̇0 = −λ0 k0 + l0 ρA1 k1α1 (1 − u1 )2.
k̇1 = −λ1 k1 + A1 k1α1 u1k̇ = −λ k + l(1) (1 − ρ)A k α1 (1 − u )22 2211 1— дифференциальная связь;3. k0 (0) = k0,0 ,k1 (0) = k1,0 ,k2 (0) = k2,0— начальные условия на основные параметры (состояния системы);i1 (t)4. 0 ≤ u1 (t) =≤ 1 , 0 ≤ t ≤ T — ограничения на допустимое управA1 k1α1 (t)ление.Дополнительно обозначим B2 = A2 θ2 . Постоянная величина B2 является известной. Тогда интегральная часть целевого функционала будет иметь видRTB2 e−δt k2α2 (t)dt.0Последующая часть данной работы будет посвящена исследованию поставленной задачи оптимального управления при помощи принципа максимума Понтрягина. Отметим , что для такого исследования полезно использовать работу [46].В этой книге специально и подробно рассматриваются различные аспекты применения принципа максимума Понтрягина для решения задач оптимального управлениядинамическими экономическими системами.383.4Необходимые условия экстремума в задаче оптимальногоуправления в форме принципа максимумаВыпишем вновь поставленную задачу оптимального управления в аналитическойформеZ1.TB2 e−δt k2α2 (t) dt + e−δT ψ(k0 (T ), k1 (T ), k2 (T )) −→ max;(3.4.1)0(1)k̇0 = −λ0 k0 + l0 ρA1 k1α1 (1 − u1 )k̇1 = −λ1 k1 + A1 k1α1 u1k̇ = −λ k + l(1) (1 − ρ)A k α1 (1 − u )122 21 12(3.4.2)3.k0 (0) = k0,0 ,(3.4.3)4.0 ≤ u1 (t) ≤ 1, 0 ≤ t ≤ T.2.k1 (0) = k1,0 ,k2 (0) = k2,0 ;(3.4.4)Задача (3.4.1)–(3.4.4) представляет собой классическую задачу оптимальногоуправления с фиксированным интервалом времени, закрепленным левым и свободным правым концами траектории.Перейдем к анализу данной задачи методом принципа максимума Понтрягина.Заметим предварительно, что в формулировке необходимых условий экстремума для задачи оптимального управления участвуют вспомогательные параметры,которые по своему математическому содержанию представляют собой множителиЛагранжа.
В рассматриваемой экстремальной задаче (3.4.1)–(3.4.4) такими параметрами являются величина λ∗0 ∈ R, соответствующая целевому функционалу, ивектор-функция p(t) = (p0 (t), p1 (t), p2 (t)), обычно называемая сопряженной переменной, соответствующая ограничению дифференциальной связи (3.4.2). Для определения функций p0 (t), p1 (t), p2 (t) существуют специальные соотношения, называемыесопряженными уравнениями, которые будут получены и исследованы.Кроме того, функции p0 (t), p1 (t), p2 (t) должны удовлетворять граничным условиям, которые в теории называются условиями трансверсальности.
Эти соотношениятакже будут получены ниже.Специально отметим, что центральное место в системе необходимых условийэкстремума занимает так называемое условие максимума некоторой вспомогательной функции, которая называется функцией Понтрягина. Данное условие позволяет39определить общую структуру или аналитическое устройство функции, задающей оптимальное управление (в данной задаче таковой является функция u1∗ (t)).Сформируем и докажем общее утверждение о системе необходимых условийэкстремума в рассматриваемой задаче оптимального управления.Теорема 2.
Пусть (k0∗ (t), k1∗ (t), k2∗ (t); u1∗ (t)) - оптимальный управляемыйпроцесс, то есть решение задачи оптимального управления (3.4.1)-(3.4.4). Тогда найдутся не равные нулю одновременно множители Лагранжа λ∗0 ∈ R, (p0 (t), p1 (t), p2 (t)),t ∈ [0, T ] такие, что выполняются следующие соотношения.1. Сопряженные уравнения (система дифференциальных уравнений относительно функций (p0 (t), p1 (t), p2 (t))) :ṗ0 (t) = λ0 p0 (t),hi(1)(1)α1 −1ṗ1 (t) = λ1 p1 (t) − A1 α1 k1 (t) l0 ρp0 (t) + l2 (1 − ρ)p2 (t) (1 − u1 (t)) − A1 α1 k1α1 −1 (t)u1 (t),ṗ (t) = λ p (t) − B e−δt α k α2 −1 (t).22 222 2при k0 (t) = k0∗ (t), k1 (t) = k1∗ (t),k2 (t) = k2∗ (t) ; u1 (t) = u1∗ (t).2. Условия трансверсальности (система граничных условий к сопряженнымуравнениям в точке t = T ) :(0)p0 (T ) = e−δT ψk(1) (k0 (T ), k1 (T ), k2 (T )) = ψ0 (T ),0(0)p1 (T ) = e−δT ψk(1) (k0 (T ), k1 (T ), k2 (T )) = ψ1 (T ),(3.4.5)1(0)p2 (T ) = e−δT ψk(1) (k0 (T ), k1 (T ), k2 (T )) = ψ2 (T ),2при k0 (t) = k0∗ (t), k1 (t) = k1∗ (t),k2 (t) = k2∗ (t).3.
Условие максимума Понтрягинаmax H(t, k0 , k1 , k2 ; u1 , p0 , p1 , p2 ) = max − [λ0 k0 p0 + λ1 k1 p1 + λ2 k2 p2 ] + B2 e−δt k2α2u1 ∈Uu1 ∈U(1)(2)(1)(2)+A1 k1α1 [l0 ρp0 + l0 (1 − ρ)p2 ] + A1 k1α1 [−l0 ρp0 + p1 − l0 (1 − ρ)p2 ]u1= H(t, k0 , k1 , k2 ; u1∗ , p0 , p1 , p2 ),при k0 (t) = k0∗ (t), k1 (t) = k1∗ (t),k2 (t) = k2∗ (t) ; u1 (t) = u1∗ (t),где U = {u : 0 ≤ u ≤ 1} - множество допустимых значений параметра управления u1 = u1 (t).Доказательство.40Основываясь на общем представлении функции Понтрягина в классическойзадаче оптимального управления приведенном в монографиях [2],[19], выпишем конкретное выражение для этой функции в рассматриваемой задаче(1)H(t, k0 , k1 , k2 , u1 , p0 , p1 , p2 , λ∗0 ) = p0 [−λ0 k0 + l0 ρA1 k1α1 (1 − u1 )] + p1 [−λ1 k1 + A1 k1α1 ]u1(1)+ p2 [−λ2 k2 + l2 (1 − ρ)A1 k1α1 (1 − u1 )] − λ∗0 B2 e−δt k2α2 .Как известно [19], в классической задаче оптимального управления с фиксированныминтервалом времени, закрепленным левым и свободным правым концами траектории величина λ∗0 6= 0.
Поскольку в данной экстремальной задаче целевой функционалисследуется на максимум, можно выбрать в качестве λ∗0 любое отрицательное число.В связи с этим в дальнейшем будем полагать λ∗0 = −1. Перейдем к анализу необходимых условий в форме принципа максимума.(1)H(t, k0 , k1 , k2 , u1 , p0 , p1 , p2 ) = −λ0 k0 p0 + l0 ρA1 k1α1 p0 (1 − u1 ) − λ1 k1 p1(2)+A1 k1α1 p1 u1 − λ2 k2 p2 + l0 (1 − ρ)A1 k1α1 p2 (1 − u1 ) + B2 e−δt k2α2Преобразуем функцию Понтрягина, выделив члены, явно зависящие от параметрауправления u1 :H(t, k0 , k1 , k2 , u1 , p0 , p1 , p2 ) = −[λ0 k0 p0 + λ1 k1 p1 + λ2 k2 p2 ] + B2 e−δt k2α2(1)(2)(1)(2)+A1 k1α1 [l0 ρp0 + l0 (1 − ρ)p2 ] + A1 k1α1 [−l0 ρp0 + p1 − l0 (1 − ρ)p2 ]u1Для проведения дальнейших аналитических выводов введем дополнительныеобозначения для функций, определяющих форму задачи оптимального управления(3.4.1)-(3.4.4).
Обозначим через f0 (t, k, u1 ) = B2 e−δt k2α2 (t) подынтегральную функцию(интегрант) целевого функционала, а черезϕ(t, k, u1 ) = (ϕ0 (t, k, u1 ), ϕ1 (t, k, u1 ), ϕ2 (t, k, u1 ))Tвектор-функцию, компоненты которой задают правые части уравнений дифференциальной связи (знак "Т"является символом транспонирования). Имеем(1)ϕ0 (t, k, u1 ) = −λ0 k0 + l0 ρA1 k1α1 (1 − u1 ),ϕ1 (t, k, u1 ) = −λ1 k1 + u1 A1 k1α1 ,ϕ (t, k, u ) = −λ k + l(1) (1 − ρ)A k α1 (1 − u ).212 21 11241Получим представления для нескольких вспомогательных объектов. Сначаланайдем выражение для матрицы частных производных вектор-функции ϕ(t, k, u1 ) =(ϕ0 (t, k, u1 ), ϕ1 (t, k, u1 ), ϕ2 (t, k, u1 ))T по векторной переменной k = (k0 , k1 , k2 )(1)0−λ0l0 ρA1 α1 k1α1 −1 (1 − u1 )α1 −1ϕk (t, k, u1 ) = 00 −λ1 + A1 α1 k1 u1(1)α1 −10 l2 (1 − ρ)A1 α1 k1 (1 − u1 ) −λ2Необходимые вспомогательные конструкции, а именно, транспонированная матрицачастных производных ϕ∗k (t, k, u1 ) = ϕTk (t, k, u1 ) и ее произведение на вектор сопряженных переменных p = (p0 , p1 , p2 )T , имеют вид−λ000∗(1)(1)α−1α−1α−1111ϕk (t, k, u1 ) = l0 ρA1 α1 k1 (1 − u1 ) −λ1 + A1 α1 k1 u1 l2 (1 − ρ)A1 α1 k1 (1 − u1 )00−λ2−λ0 p0ϕ∗k (t, k, u1 )p = l0(1) ρA1 α1 k1α1 −1 (1 − u1 )p0 + [−λ1 + A1 α1 k1α1 −1 u1 ]p1 + l2(1) (1 − ρ)A1 α1 k1α1 −1 (1 − u1 )p2 −λ2 p2Определим также вектор частных производных интегранта по векторному аргументуk = (k0 , k1 , k2 )T .f0,k (t, k, u1 ) =0;0;B2 e−δt α2 k2α2 −1TТеоретическая форма сопряженного уравнения (или уравнения Эйлера для лагранжиана) в задаче оптимального управления имеет вид (см.