Диссертация (Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)), страница 18
Описание файла
Файл "Диссертация" внутри архива находится в папке "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)". PDF-файл из архива "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 18 страницы из PDF
В разделах 3.7 и 3.8 былиопределены явные представления для указанных параметров состояний как решения системы дифференциальной связи (3.3.14) при различных вариантах структуры функции управления u1 (t). Таким образом, появляется возможность подставитьвыражения для функций k0 (t), k1 (t), k2 (t) в выражениях для сопряженных переменных и получить для функций p0 (t), p1 (t), p2 (t) явные аналитические представления для рассматриваемых вариантов структуры функции управления.
Выполнимуказанную подстановку для каждого из основных вариантов поведения функцииQ(p0 (t), p1 (t), p2 (t)), 0 ≤ t ≤ T , и соответствующих им четыре основных вариантовструктуры функции управления i1 (t).1) Для первого варианта, когда функция Q(p0 (t), p1 (t), p2 (t)) удовлетворяетусловию Q(p0 (t), p1 (t), p2 (t)) > 0 при всех t ∈ [0, T ], известно решение уравненийдифференциальной связи (3.3.14), имеющее вид (3.7.14). Из (3.5.10) с учетом (3.7.14)следует явное представление для сопряженных переменных.(0)p0 (t) = ψ0 (T )eλ0 (t−T ) ,−1R(0)ψ1 (T )eA 1 α1Tte−λ1 (1−α1 )z21−α1k1,0A− λ11A+ λ11dz2 +λ1 (t−T )p1 (t) =α2 −1k2,0(0)λtT(−δ−λα)t(−δ−λα)−λT222222p2 (t) = eeψ2 (T ) + B2 −δ−λ2 α2 e−e(3.9.1)2) Теперь выпишем явный вид сопряженных переменных p0 (t), p1 (t), p2 (t)для второго варианта, когда функция Q(p0 (t), p1 (t), p2 (t)) удовлетворяет условиюQ(p0 (t), p1 (t), p2 (t)) < 0 при всех t ∈ [0, T ].
При этом условии, система уравнений дифференциальной связи (3.3.14) имеет решение, определяемое соотношением (3.7.24).100Подставляя (3.7.24) в формулы (3.5.16), получаем(0)p0 (t) = ψ0 (T )eλ0 (t−T ) ,hR T α1 −1 −λ α z (1) (0)(1)−λ1 Tλ1 tψ(T)e+Aαk1,0 e 1 1 3 l0 ρψ0 (T )eλ0 (z3 −T ) +p(t)=e1110tR+l(2) (1 − ρ)(eλ2 (z3 −T ) ψ (0) (T ) + eλ2 z3 B2 T e(−δ−λ2 )z4 ·02z3α2 −1iα1α1(1)(1)(1−ρ)Akll2 (1−ρ)A1 k1,01 1,02−λz−λαz24114k−e+edz)dz2,043λ2 −λ1 α1λ2 −λ1 α1(0)p2 (t) = eλ2 t e−λ2 T ψ2 (T )+α2 −1α1α1(1)(1)R T (−δ−λ )zl2 (1−ρ)A1 k1,0−λ2 z1−λ1 α1 z1 l2 (1−ρ)A1 k1,02 1k2,0 − λ2 −λ1 α1+edze+B2 t e1λ2 −λ1 α1(3.9.2)3) Рассмотрим третий вариант поведения функции Q(p0 (t), p1 (t), p2 (t)), в котором эта функция удовлетворяет условиям Q(p0 (t), p1 (t), p2 (t)) > 0 при 0 ≤ t < τ иQ(p0 (t), p1 (t), p2 (t)) < 0 при τ < t ≤ T .
В данном варианте соответствующая функция управления u1 (t) имеет единственную точку переключения t = τ и определяетсяформулой (3.5.18)u1 (t) =1,0 ≤ t < τ,0,τ ≤ t ≤ T.Для этого варианта была записана система дифференциальных уравненийотносительно основных параметров (3.3.14) для 0 ≤ t < τ и для τ < t ≤ T , в дальнейшем было найдено решение этой системы (3.7.35). Подставляя данное решение(3.7.35) в соотношения (3.5.28) и (3.5.29), получаем явные представления для сопряженных параметров при указанном варианте функции управления(0)p0 (t) = p0,τ eλ0 (t−τ ) ,R(0)p1 (t)A1 α1 tτe−λ1 (1−α1 )z2= p1,τ e(0)λt2p2,τ e−λ2 τ −p2 (t) = eB2 kα2 −1δ−11−αAk1,0 1 − λ 11A+ λ11dz2 +λ1 (t−τ )−δτ −λ2 α2−δt−λ2 α2e−e101(3.9.3),, t ∈ [0, τ ](1)(0)p0 (t) = ψ0 (T )eλ0 (t−T ) ,hR T α1 −1 −λ (z +(α −1)(z −τ ))(1)(1)λ1 t3e 1 3 1·ψ0 (T )e−λ1 T + A1 α1 t k1,τp(t)=e1h(1)(0)(2)(0) (l0 ρψ0 (T )eλ0 (z3 −T ) + l0 (1 − ρ)(eλ2 (z3 −T ) ψ2 (T ) + eλ2 z3 B2 ·α2 −1iα1 λ τ(1)R T (−δ−λ α )ze 1l2 (1−ρ)A1 k1,τλτ(λ−λα)τ(λ−λα)z22 2 421 121 1 4k2,τ e +e−edz4 ) dz3eλ0 −λ1 α1z3 (0)RT(1)p2 (t) = eλ2 t ψ2 (T )e−λ2 T + B2 t e−δz1 −λ2 α2 ·α2 −1α1 λ τ(1)e 1l2 (1−ρ)A1 k1,τλ2 τ(λ2 −λ1 α1 )τ(λ2 −λ1 α1 )z1dz1 , t ∈ [τ, T ]−ee k2,τ e +λ0 −λ1 α1(3.9.4)где значения k0,τ , k1,τ , k2,τ ; p0,τ , p1,τ , p2,τ заданы формулами (3.7.28) и (3.5.23) соответственно.4) Теперь выразим в явном виде сопряженные переменные для варианта,когда функция Q(p0 (t), p2 (t), p2 (t)) удовлетворяет условиям Q(p0 (t), p2 (t), p2 (t)) < 0при 0 ≤ t < τ , и Q(p0 (t), p2 (t), p2 (t)) > 0 при τ < t ≤ T .
Как и в предыдущемслучае, были записаны системы уравнений дифференциальной связи (3.3.14) дляслучая 0 ≤ t < τ и (3.5.30) для случая τ < t ≤ T . Подставив формулы (3.7.44)в соотношения (3.5.33) и (3.5.34), получаем явные представления для сопряженных102параметров:(0)p0 (t) = p0,τ eλ0 (t−τ ) ,hR(1)(0)α1 −1 τ −λ1 z3 α1λ1 t−λ1 τep0,τ l0 ρeλ0 (z3 −τ ) +p(t)=epe+Aαk1,τ111,01t+l(2) (1 − ρ)(p eλ2 (z3 −τ ) + eλ2 z3 B R τ e(−δ−λ2 )z4 ·2 z32,τ0hiαα1 iα2 −1(1)(1)1 −λ zl2 (1−ρ)A1 k1,0−λ1 α1 z4 l2 (1−ρ)A1 k1,02 4·ek−+edz)dz2,043 ,λ2 −λ1 α1λ2 −λ1 α1α1(1)R τ (−δ−λ )z h −λ zl2 (1−ρ)A1 k1,0(0)λ2 t−λ2 τ2 12 1+p2 (t) = e p2,τ e+ B2 t eek2,0 − λ2 −λ1 α1α1 iα2 −1(1)+e−λ1 α1 z1 l2 (1−ρ)A1 k1,0dz1 ,λ2 −λ1 α10 ≤ t < τ,(1)(0)p0 (t) = ψ0 (T )eλ0 (t−T ) ,hRT(1)(0)A 1 α1t1−αe−λ1 (1−α1 )(t−τ ) k1,τ 1 +i−1A1λ(1−α)(t−τ)11[1−e]dz2 +λ1 (t−T )λ1,p1 (t) = ψ1 (T )ehip(1) (t) = eλ2 t ψ (0) (T )e−λ2 T + B k α2 −1 eλ1 τ (α2 −1)T (−δ−λ2 −λ1 (α2 −1))t(−δ−λ2 −λ1 (α2 −1))·e−e,2 2,τ22−δ−λ2 −λ1 (α2 −1)τ < t ≤ T.Значения k0,τ , k1,τ , k2,τ , а так же p0,τ , p1,τ , p2,τ , заданы явно формулами (3.7.39) и(3.5.31).Перейдем к завершающему этапу исследования задачи оптимального управления.
Отметим еще раз, что структура оптимального управления определяется взависимости от поведения функции Q(p0 , p1 , p2 ), зависящей в свою очередь, от сопряженных переменных p0 (t), p1 (t), p2 (t). В следующем разделе будет предложенметод определения функции управления i1∗ (t) и соответствующих ей функций состояний системы (траекторий) k0∗ (t), k1∗ (t), k2∗ (t), удовлетворяющих необходимымусловиям экстремума в форме принципа максимума.3.10Качественный анализ поведения состояний системы длявариантов управления без переключения и с одним переключениемДанный раздел работы имеет иллюстративный характер. В нем рассматривается качественное поведение решений уравнений дифференциальной связи при различных103видах управлений, соответствующих принципу максимума.Отметим, что выше были получены явные аналитические решения уравненийдифференциальной связи для указанных видов функции управления. Таким образом, при заданных исходных параметрах модели можно вычислить значения функций состояний системы k0 (t), k1 (t), k2 (t) при всех значениях t, 0 ≤ t ≤ T и нарисоватьих графики.
Однако качественный анализ решений уравнений дифференциальнойсвязи также является полезным, поскольку позволяет описать общие закономерности и особенности такого поведения при различных соотношениях между исходнымипараметрами математической модели.Рассмотрим последовательно системы уравнений дифференциальной связи(3.3.14) для четырех видов функций управления: двух вариантов без переключенияи двух вариантов с одним переключением, производящихся в некоторый момент времени τ , 0 ≤ τ ≤ T .1. Предположим сначала, что функция Q(t) удовлетворяет условию: Q(t) > 0,0 ≤ t ≤ T .
Тогда оптимальным управлением является u1∗ (t) = 1, 0 ≤ t ≤ T , функцияуправления не имеет переключений. При таком управлении система дифференциальных уравнений относительно параметров k0 (t), k1 (t), k2 (t), то есть дифференциальная связь, принимает вид (3.7.5). Исследуем поведение решения этой системы приразличных начальных условиях k0 (0) = k0,0 , k1 (0) = k1,0 , k2 (0) = k2,0 .При заданном управлении функции k0 (t), k2 (t) являются экспоненциальноубывающими. Рассмотрим поведение решения уравнения относительно функции k1 (t).(0)Обозначим через k1- стационарное решение данного дифференциального уравне-ния.
Тогда эта величина должна удовлетворять следующему алгебраическому уравнениюλ1 k1 = A1 k1α1(3.10.1)Необходимо определить при каких значениях параметров уравнение (3.10.1)и остальные уравнения системы имеют единственное решение.Введем вспомогательные функции от аргумента k1 ≥ 0.g1 (k1 ) = A1 k1α1 , g2 (k1 ) = λ1 k1Вычислим производные функции g1 (k1 ). При заданных значениях параметров модели A1 > 0, 0 < α1 < 1 имеемġ1 (k1 ) = A1 α1 k α1 −1 > 0 при k1 > 0;104g̈1 (k1 ) = A1 α1 (α1 − 1)k α1 −2 < 0 при k1 > 0.Из последних неравенств следует, что g1 (k1 ) - возрастающая, выпуклая вверхфункция. Заметим также, что функция ġ1 (k1 ) обладает следующим свойствомġ1 (+0) = ∞; ġ1 (+0) > λ1 .Рис.
7: Иллюстрация к решению уравнения (3.10.2).Исходя из установленных свойств функций g1 (k1 ), g2 (k1 ) можно сделать вывод, что уравнение (3.10.1) имеет единственное решение при любых заданных значениях параметров A1 > 0, λ1 > 0, 0 < α1 < 1. Поведение функций g1 (k1 ), g2 (k1 )показано на рисунке 7.Решение уравнения (3.10.1) выражается формулой1 1−α1A1k1 =λ1(3.10.2)В силу сделанных выше замечаний относительно поведения функций k0 (t), k2 (t)можно считать, что стационарные решения соответствующих дифференциальныхуравнений представляют собой функции, тождественно равные нулю.
Таким образомединственное стационарное решение системы дифференциальных уравнений (3.7.5)имеет вид.(0)k0 = 0,1 1−α1(0)A1k1 = λ1,k2(0) = 0.105(3.10.3)Теперь проведем качественное исследование поведения функций k0 (t), k1 (t), k2 (t), удовлетворяющих системе дифференциальных уравнений (3.7.5). Отметим следующиесвойства функции k1 (t).1. Если для некоторого множества значений временного параметра t выполняется неравенствоk̇1 (t) = −λ1 k1 (t) + A1 k1α1 (t) > 0, то k1 (t) возрастает по t.Если же для соответствующего множества значений параметра t выполняется неравенствоk̇1 (t) = −λ1 k1 (t) + A1 k1α1 (t) < 0, то k1 (t) убывает по t.Рассмотрим вспомогательную величину ∆k1 , зависящую от аргумента k1∆k1 = g1 (k1 ) − g2 (k1 ) = −λ1 k1 + A1 k1α1 ,Заметим, что знак величины ∆k1 как функции от временного параметра t совпадаетсо знаком производной k̇1 (t).
В то же время,∆k1 > 0 ⇔ A1 k1α1 > λ1 k1 ,∆k1 < 0 ⇔ A1 k1α1 < λ1 k1 .Поскольку λ1 > 0, k1 > 0, имеют место логические соотношения:A1⇔ k1 <<λ1∆k1 > 0 ⇔k11−α1A1>⇔ k1 >λ1∆k1 < 0 ⇔k11−α1A1λ1A1λ11 1−α1 1−α11(0)= k1(0)= k1Таким образом, можно сделать следующие выводы.Если для некоторого множества значений временного параметра t выполняет(0)ся неравенство k1 = k1 (t) < k1 , то ∆k1 > 0 и функция k1 (t) является возрастающейпо t.Если для соответствующего множества значений временного параметра t вы(0)полняется неравенство k1 = k1 (t) > k1 , то ∆k1 < 0, и функция k1 (t) являетсяубывающей по tПри этом, как следует из явного представления для функции k1 (t):lim k1 (t) =t→∞(0)k1=106A1λ11 1−α1.Рис.
8: Качественное поведение функций фондовооруженостей первого сектора назаданном интервале времени при различных начальных значениях.На основании сделанных выводов можно изобразить характер решений дифференциального уравнения относительно k1 (t) из системы (3.7.5) в зависимости отначальных значений k1,0 , то есть фазовые траектории этого уравненияКачественное поведение функций k0 (t) и k2 (t) при данном управлении однотипно и представлено на рисунке 9.Рис.