Диссертация (Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)), страница 3
Описание файла
Файл "Диссертация" внутри архива находится в папке "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)". PDF-файл из архива "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
x̂ = t ∈ absmax;ZSmax = B(x̂(·)) =42(x̂˙ + x̂)dt =Z0044t2 (1 + t)dt = t += 4 + 8 = 12.2 0То, что x̂ = t ∈ absmax можно было бы получить и без непосредственной проверки изусловия самой задачи. Разобьем исходный функционал на два интеграла. МаксимумR4 2R4ẋdtпри|ẋ|≤1достигаетсяна|ẋ|=1,амаксимумxdt при |ẋ| ≤ 1, x(0) = 0,00достигается при наибольшем возрастании функции x, т.е. при ẋ = 1(⇔ x̂ = t).Ответ:−t,0 ≤ t ≤ 2, t2 − 2t + 1,4∈ absmin,2Smin = −4 ;32≤t≤412t ∈ absmax,Smax = 12.1.2Численные методы решения задач оптимального управленияВ теории оптимального управления существует специальное направление, связанноес использованием численных методов.
Обзор имеющихся в этой области результатовтребует отдельного изложения и не входит в рамки данной работы. Систематическоеи достаточно полное изложение результатов исследований в этом направлении приведено в монографиях [30], [34]. Приведем здесь результаты только данной работы[11], дающее представление об уровне современных исследований в данной области.Указанная работа посвящена поиску оптимальных управлений и траекторий в модели управления региональной экономикой. Теоретическую основу решения задачиуправления составляет принцип максимума.Рассмотрим множество функций потребления региональной макроэкономикиw(t), удовлетворяющих неравенствуπ1 B(x(t)) ≤ w(t) ≤ π2 B(x(t))∀t ∈ [0, T ].(1.2.1)Где1B(x(t)) = b(1 − e−x ) + (1 − b)x(1 − e− x )(1.2.2)µK(t)есть производственная B-функция, x(t) = B g(t)N- фазовая переменная, 0 < b < 1,(t)B > 0 - постоянные В-функции, 0 < π1 < π2 - постоянные, 0 < T < ∞ - конечныйгоризонт планирования.Введем функцию управленияu(t) = w(t)/B(x(t)),(1.2.3)где функция B(x) строго вогнутая на полупрямой [0; ∞), имеет асимптотическоеповедение B(x) → 1, x → ∞.Начальное и конечное состояния фазовой переменной x(t) удовлетворяет неравенству 0 < x1 < x2 < ∞.
Для любого t ∈ [0, T ] имеем B(x(t)) > 0. Обозначим черезR¯u множество значений u функции управления u(t) при 0 ≤ t ≤ T ; R¯u - множество вещественных чисел отрезка [π1 , π2 ]. Учитывая (1.2.1), (1.2.3), введем множествофункций допустимых управленийŪ = {u(t) ∈ C[0, T ] : R¯u = R̄}.(1.2.4)При использовании управления u(t) уравнение для фазовой переменной x(t)имеет видdx= a0 B(x) − λx − pB(x)u,dt13(1.2.5)где x(t) ∈ C 1 [0, T ]; a0 , λ, p - положительные постоянные.Математическая постановка задачи оптимального управления имеет видZ TB α (x(t))uα (t)dt,(1.2.6)maxu(t)∈Ū0dx= a0 B(x) − λx − pB(x)u,dtx(0) = x1 ,x(T ) = x2 .Заметим, что момент времени T заранее не задан.Обозначим через ψ(t) сопряженную переменную к фазовой переменной x(t).Функция Гамильтона задачи (1.2.6) имеет видH(x, ψ, u) = B α (x)uα + ψ[a0 B(x) − λx − pB(x)u],(1.2.7)а гамильтонова система уравнений - видdx= a0 B(x) − λx − pB(x)u,dtdψ= −ψ[a0 B 0 (x) − λ] + [ψpu − αB α−1 (x)uα ]B 0 (x),dtx(0) = x1 ,(1.2.8)x(T ) = x2 .где ψ(t) ∈ C 1 [0, T ].Решение задачи (1.2.6) получим на основе принципа максимума Понтрягина,основным содержанием которого является следующий факт.
Если u∗ (t) - оптимальное управление задачи (1.2.6), а x∗ (t), ψ ∗ (t) - соответствующие ему оптимальныетраектории системы (1.2.8), то функция Гамильтона (7) удовлетворяет равенствуH(x∗ (t), ψ ∗ (t), u∗ (t)) = sup H(x∗ (t), ψ ∗ (t), u).(1.2.9)u∈R̄Соотношение (1.2.9) представляет собой условие максимума.Исследуем функцию Гамильтона (1.2.7). Рассмотрим на положительном ор2танте R+(ψ, x) плоскости сопряженной и фазовой переменных областьΩ̄(ψ, x) = {ψ, x : ψmin ≤ ψ ≤ ψmax , xmin ≤ x ≤ xmax }.Здесь отрезок [xmin , xmax ] содержит все возможные реальные начальные и конечныесостояния x1 , x2 рассматриваемой задачи, а отрезок [ψmin , ψmax ] - все значения переменной ψ(t) краевой задачи (1.2.8) при допустимых управлениях u(t) ∈ Ū .
Отрезок[xmin , xmax ] содержит все значения фазовой переменной x(t), определяемые краевойзадачей (8) при u(t) ∈ Ū .14Рис. 1: Область Ω̄(ψ, x).ψ=α 111−α∗1−αpuB (x)(1.2.10)Рассмотрим функцииψ1 (x) =c2,1−αB (x)ci =ψ2 (x) =α,p(πi )1−αc1,1−αB (x)(1.2.11)i = 1, 2,на отрезке [xmin , xmax ]. На рис.1 показана область Ω̄(ψ, x) и расположенные на нейграфики функции ψ1 (x), ψ2 (x).Из условия максимума (1.2.9) и структура рассматриваемых областей ψ, ψ1 , ψ2следует, что максимум функции Гамильтона H(x, ψ, u) имеет место при любых фиксированных (ψ, x) ∈ Ω̄ досигается на управленияхπ2 , (ψ, x) ∈ ψ1 ,1∗1u =1−α ,πψ(ψ, x) ∈ ψ,B(x)π , (ψ, x) ∈ ψ .12(1.2.12)Обозначим через u∗ (t), x∗ (t), ψ ∗ (t) траекторию оптимального управления задачи (1.2.6)и соответствующие ему оптимальные траектории фазовой и сопряженной переменной.
Траектории x∗ (t), ψ ∗ (t) определяются краевой задачейdx∗= a0 B(x∗ (t)) − λx∗ (t) − pB(x∗ (t))u∗ (t),dtdψ ∗= −ψ ∗ [a0 B 0 (x∗ (t)) − λ] + [pψ ∗ (t)u∗ (t) − αB α−1 (x∗ (t))u∗ α (t)]B 0 (x∗ (t)),dt15(1.2.13)x∗ (0) = x1 ,x∗ (T ) = x2 .Соотношения (1.2.13) представляют собой систему, состоящую из необходимых условий и ограничений исходной задачи.Из соотношения (1.2.12) для оптимальных траекторий u∗ (t), x∗ (t), ψ ∗ (t) следует, чтоu∗ (t) =π2 ,ψ ∗ (t) ≤ ψ1 (x∗ (t)),1πψ ∗ 1−α (t) , ψ1 (x∗ (t)) ≤ ψ ∗ (t) ≤ ψ2 (x∗ (t)),B(x∗ (t))π , ψ ∗ (t) ≥ ψ (x∗ (t)).12(1.2.14)Таким образом, на основании принципа максимума Понтрягина (1.2.9) авторами работы [11] доказана следующая теорема.Теорема.
Пусть u∗ (t) ∈ Ū - оптимальное управление задачи (1.2.6), а x∗ (t),ψ ∗ (t) - соответствующие ему решения гамильтоновой системы (1.2.13). Тогда междуоптимальным управлением u∗ (t) и соответствующими ему оптимальными траекториями фазовой и сопряженных переменных x∗ (t), ψ ∗ (t) имеет место зависимость(1.2.14).В оставшейся части статьи предложен численный алгоритм решения краевойзадачи (1.2.13) с учетом структуры оптимальных управлений (1.2.14). Для подтверждения работоспособности алгоритма приведены результаты численных расчетовоптимального управления и соответствующих ему оптимальных траекторий.Заметим дополнительно, что возможности использования методов оптимизации и оптимального управления для решения задачи управления сложной нестационарной экономической системой (на примере экономики Российской Федерации впереходный период) были реализованы в монографии В.Н.Лившица [28].1.3Аналитическое исследование задачи оптимального управления в односекторной экономической моделиПоскольку метод исследования задачи оптимального управления реализован в данной работе на примере задачи управления в динамической экономической модели,приведем здесь общую схему исследования классической односекторной экономической модели.
Задача оптимального управления в этой модели была поставлена ирешена в работе [43]. Решение этой классической задачи математической экономики16в различной форме излагалась во многих изданиях ([46],[50],[51]). В данной работебудем исследовать в основном монографию С.А.Ашманова [6]. Отметим также, чтоцелый ряд специальных проблем, связанных с этой классической задачей оптимального управления, исследовался в работах Ю.И.Параева ([32],[33]).Будем использовать стандартные обозначения для основных характеристикв исходной динамической модели:K(t) - объем основных производственных фондов (капитал);C(t) - объем фонда потребления;L(t) - объем трудовых ресурсов (рабочая сила);F (K, L) - производственная функция (объем произведенного продукта);Обозначим такжеK(t)- удельный объем производственных фондов (удельный капитал);L(t)c(t) = C(t)- удельное потребление;L(t)f (k) = F (K,L)= F (K, 1) - удельное производство на единицу рабочей силыLLk(t) =(производительность труда).Будем обозначать через s(t) долю произведенного продукта направленнуюна инвестирование и считать эту переменную величину функцией управления в рассматриваемой задаче.Постановка классической задачи оптимального управления в односекторнойдинамической модели имеет видZ T(1 − s(t))f (k(t))e−δt dt(1.3.1)k̇(t) = s(t)f (k(t)) − µk(t),(1.3.2)k(0) = k0 > 0, k(T ) ≥ k T > 0,(1.3.3)0 ≤ s(t) ≤ 1.(1.3.4)0при ограниченияхРешение этой задачи проводится на основе принципа максимума Понтрягина.
Обозначим через ϕ(t) сопряженную переменную в поставленной задаче управления.Гамильтониан этой задачи имеет видH(ϕ, k, t, s) = (1 − s)e−δt f (k) + ϕ(sf (k) − µk).Если уравнение s(t) оптимально, то согласно принципу максимума сопряженная переменная ϕ(t) удовлетворяет дифференциальному уравнениюϕ̇ = −dH= −(1 − s)e−δt f 0 (k) − ϕ(sf 0 (k) − µk),dk17(1.3.5)Соотношение (1.3.5) называется сопряженным уравнением.
Кроме него, в систему необходимых условий входит соотношениеϕ(T )(k(T ) − k T ) = 0,(1.3.6)которое представляет собой условие дополняющей нежесткости, соответствующееограничению в форме неравенства для функции k(t) в точке t = T (см. соотношение(1.3.3)).Условие максимума гамильтониана H по s совместно с дифференциальнымуравнением (1.3.5) и соотношением (1.3.6) представляет собой систему необходимыхусловий экстремума в рассматриваемой задаче (1.3.1)-(1.3.4).Введем новую переменную q = ϕ̇e−δt .
Из условия максимума гамильтонианаH следует, что структура оптимального управления в рассматриваемой задаче имеетследующий вид1если q > 1,s(t) = 0,если q < 1,ŝ(t), если q = 1,(1.3.7)где ŝ(t) - некоторая функция, 0 ≤ ŝ(t) ≤ 1, которая определяет так называемое особоеуправление. Уравнение (1.3.5) при переходе к новой переменной q принимает видq̇(t) = (δ + µ)q − [(1 − s) + sq]f 0 (k).(1.3.8)Таким образом, из принципа максимума следует, что оптимальное управлениев исходной задаче (1.3.1)-(1.3.4) имеет вид (1.3.7) и при этом выполняются следующиесоотношения, которые образуются из необходимых условий и ограничений исходнойзадачиk̇(t) = sf (k) − µk,q̇(t) = (δ + µ)q − (1 − s + sq)f 0 (k)k(0) = k0 ,(1.3.9)k(T ) ≥ k T ,q(t)[k(T ) − k T ] = 0Если решение исходной задачи существует, то из принципа максимума следует, чтосистема соотношений (1.3.9) имеет решение.18Дальнейшее исследование задачи (1.3.1)-(1.3.4) сводится к исследованию поведения решений системы (1.3.9).
Можно доказать что при определенных дополнительных предположениях оптимальное управление имеет конкретную аналитическую форму.Более подробное изложение нахождения оптимального управления s(t) и соответствующих функций состояний k(t) приводится в работах [6],[33].19Глава 2. Разработка алгоритма численного решения задачи оптимального управления2.1Классическая задача оптимального управления с фиксированным интервалом времени и закрепленным левымконцом траекторииБудем рассматривать так называемую классическую задачу оптимального управления, в которой интервал времени является фиксированным, а граничные условияимеют характер закрепленного левого и свободного правого конца. Такая постановка задачи включает в себя многие конкретные задачи управления в экономическихи технических системах.Постановка классической задачи оптимального управления имеет видZt1f (t, x(t), u(t))dt + l(x(t1 )) → min;B(x(·), u(·)) =t0ẋ − ϕ(t, x(t), u(t)) = 0u(t) ∈ U ∀t ∈ [t0 , t1 ],∀t ∈ T,(2.1.1)x(t0 ) = x0 ,где функция состояния x(·) ∈ P C 1 ([t0 , t1 ], Rn ) - множество кусочно- непрерывнодифференцируемых вектор-функций, заданных на [t0 , t1 ] и принимающих значения в Rn ; управление u(·) ∈ P C([t0 , t1 ], Rr ) - множество кусочно-непрерывныхвектор-функций, заданных на [t0 , t1 ] и принимающих значения в заданном подмножестве U ⊂ Rr (множество допустимых управлений), T ⊂ [t0 , t1 ] множество точекнепрерывности управления u(·).Приведем формулировку основного утверждения о необходимых условияхэкстремума в поставленной задаче оптимального управления.