Диссертация (Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)), страница 2
Описание файла
Файл "Диссертация" внутри архива находится в папке "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)". PDF-файл из архива "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 2 страницы из PDF
Построенный алгоритм реализован в наборе программ. Созданный программный продукт позволяет по заданным исходным параметрам модели численно проанализировать достаточно широкий класс теоретически возможныхфункций управления и определить управляемые процессы, удовлетворяющие необходимым условиям и ограничениям.Анализ задачи оптимального управления в трехсекторной динамической экономической модели позволяет продемонстрировать особенности и возможности разработанного метода исследования общей классической задачи оптимального управления. Этот метод можно усугублять и развивать, однако в настоящем виде он позволяет получать существенные результаты для решения соответствующих конкретныхзадач в различных областях приложений.Отметим, в главах 3 и 4 используются результаты и тексты работ, опубликованных соискателем [35],[36],[37].В диссертационной работе принята следующая система нумерации: формулынумеруются тремя цифрами.
Первая цифра обозначает номер главы, вторая - номерраздела, третья - номер формулы или утверждения.6Глава 1. О некоторых аналитических и численныхметодах исследования задач оптимального управления1.1Общая постановка задачи оптимального управления и ееисследование на основе принципа максимумаВ пятидесятых годах потребности прикладных дисциплин (техники, экономики идр.) стимулировали постановку и рассмотрение нового класса задач, получившихназвание задач оптимального управления.
Необходимое условие экстремума для задач этого класса -Принцип максимума, - сформулированное Л.С. Понтрягиным в1956 г, было доказано и развито впоследствии им, его учениками и сотрудниками.Задача оптимального управления будет рассматриваться в стандартной форме как экстремальная задача на максимум. Необходимые условия оптимальностиназываются принципом максимума Понтрягина. В данной работе они будут сформулированы в лагранжевой форме.Приведем формулировку принципа максимума для весьма общей постановкизадачи оптимального управления, следуя [2],[3],[13].В отличии от задачи Лагранжа в задаче оптимального управления вводитсяуправление и появляется дополнительное ограничение типа включения на управление: u ∈ U .
Множество U определяет возможности человека влиять на происходящийпроцесс.Принцип максимума Понтрягина. Постановка задачи.Задачей оптимального управления (в понтрягинской форме) будем называтьследующую задачуB0 (ξ) −→ min;Bi (ξ) = 0,Bi (ξ) ≤ 0, i = 1, ..., m0 ,i = m0 + 1, ..., m,ẋ(t) − ϕ(t, x(t), u(t)) = 0u(t) ∈ U∀t ∈ ∆∀t ∈ T,(1.1.1)(1.1.2)(1.1.3)где ξ = (x(·), u(·), t0 , t1 ), x ∈ P C 1 (∆, Rn ), u ∈ P C(∆, Rr ), t0 , t1 ∈ ∆, t0 < t1 , ∆ заданный конечный отрезок, U ⊂ Rr - произвольное множество, T ⊂ ∆ - множество7точек непрерывности управления u,Z t1fi (t, x(t), u(t))dt + li (t0 , x(t0 ), t1 , x(t1 )),Bi (ξ) =i = 0, 1, ..., m.t0Вектор-функция x = (x1 , ..., xn ) называется фазовой переменной, вектор функция u = (u1 , ..., ur ) называется управлением. Ограничение (1.1.2), являющееся дифференциальным уравнением, называется дифференциальным ограничением или дифференциальной связью.
Оно должно выполняться во всех точках непрерывностиуправления u. В отличии от задачи Лагранжа имеется ограничение (1.1.3) типа включения, которое должно выполняться во всех точках t ∈ ∆, а фазовая переменнаяx = (x1 , ..., xn ) может иметь меньшую гладкость. Частным случаем задачи оптимального управления (1.1.1) является задача, в которой один из концов или дажеоба закреплены.Элемент ξ, для которого выполнены указанные условия и ограничения задачи, называется допустимым управляемым процессом.Допустимый управляемый процесс ξˆ = (x̂(·), û(·), tˆ0 , tˆ1 ) называется (локальˆ для любого допуно) оптимальным, если существует δ > 0 такое, что B0 (ξ) ≥ B0 (ξ)стимого управляемого процесса ξ = (x(·), u(·), t0 , t1 ), для которого ||x(·) − x̂(·)||C(∆) <δ, |t0 − tˆ0 | < δ, |t1 − tˆ1 | < δ.Формулировка теоремы.Теорема.
Пусть ξˆ = (x̂(·), û(·), tˆ0 , tˆ1 ) - оптимальный процесс (в сильном смысле) процесс в задаче оптимального управления (1.1.1); функции f1 , i = 0, 1, ..., m, φи их частные производные по x непрерывны в некоторой окрестности множества{(t̂0 , x̂(t̂0 ), tˆ1 , x̂(t̂1 )} (условие гладкости).Тогда найдутся множители Лагранжа (λ, p) ∈ Rm+1 × P C 1 (∆, Rn ), λ 6= 0,такие, что для функции ЛагранжаZ t1Λ(x(·), u(·), t0 , t1 ) =(f (t, x, u) + p(t)(ẋ − ϕ(t, x, u)))dt + l(t0 , x(t0 ), t1 , x(t1 )),t0гдеf (t, x, u) =mXλi fi (t, x, u),l=i=0mXλi li (t0 , x(t0 ), t1 , x(t1 ))i=0– терминант, выполнены условия:а) стационарность по x - уравнение Эйлера для лагранжиана L(t, x, ẋ, u) =f (t, x, u) + p(ẋ − ϕ(t, x, u))−dL̂ẋ (t) + L̂x (t) = 0dt∀t ∈ T ⇔ −ṗ(t) + fˆx (t) − p(t)ϕ̂x (t) = 0;8b) трансверсальность по xL̂ẋ (t̂0 ) = ˆlx(t0 ) ⇔ p(t̂0 ) = ˆlx(t0 ) ,L̂ẋ (t̂1 ) = −ˆlx(t1 ) ⇔ p(t̂1 ) = −ˆlx(t1 ) ;c) оптимальность по u˙min L(t, x̂(t), x̂(t),û(t)) ⇔u∈U⇔ min{f (t, x̂(t), u) − p(t)ϕ(t, x̂(t), u)} = fˆ(t) − p(t)ϕ̂(t)u∈U∀t ∈ T ;d) стационарность по подвижным концам (выписывается только для подвижных концов отрезка интегрирования)˙ t̂0 ) = 0,Λ̂t0 = 0 ⇔ −fˆ(t̂0 ) + ˆlt0 + ˆlx(t0 ) x̂(˙ t̂1 ) = 0;Λ̂t1 = 0 ⇔ fˆ(t̂1 ) + ˆlt1 + ˆlx(t1 ) x̂(e) дополняющая нежесткостьˆ = 0,λi Bi (ξ)i = 1, ..., m0 ;f) неотрицательностьλi ≥ 0, i = 1, ..., m0 .Утверждение теоремы находится в полном соответствии с принципом Лагранжа.
Функция Лагранжа Λ = Λ(x(·), u(·), t0 , t1 ) является функцией трех аргументов:фазовой переменной x(·), управления u(·), концов отрезка интегрирования t0 , t1 . Согласно общему принципу Лагранжа, надо рассмотреть задачи о минимуме функцииЛагранжа, в которых фиксированы все аргументы, кроме одного, и выписать необходимые условия минимума функции Лагранжа:Λ(x(·), û(·), t̂0 , t̂1 ) → min;(1.1.4)Λ(x̂(·), u(·), t̂0 , t̂1 ) → min;(1.1.5)Λ(x̂(·), û(·), t0 , t1 ) → min .(1.1.6)Задача (1.1.4) является задачей Больца, необходимые условия экстремума вкоторой - уравнение Эйлера и условия трансверсальности.
Задача (1.1.5) являетсяэлементарной задачей оптимального управления. Минимум интеграла достигается,если подынтегральная функция достигает своего минимума по выбору возможных9управлений - это и есть условие оптимальности по управлению. Задача (1.1.6) является задачей нахождения минимума функции двух переменных, необходимые условияв которой - теорема Ферма - равенство нулю в точке минимума частных производныхпо t0 и t1 .Проиллюстрируем применение принципа максимума на примере конкретнойзадачи оптимального управления [13].Пример.4Z(ẋ2 + x)dt → extr;B(x(·)) =|ẋ| ≤ 1,x(0) = 0.0Приведем задачу к виду задач оптимального управления, введя управлениеu:Z4(u2 + x)dt → extr;ẋ = u,u ∈ [−1; 1],x(0) = 0.0Функция Лагранжа:Z 4Λ=(λ0 (u2 + x) + p(ẋ − u))dt + λ1 x(0).0Необходимые условия:a) уравнение Эйлера для Лагранжиана L = λ0 (u2 + x) + p(ẋ − u)−dLẋ + Lx = 0 ⇔ −ṗ + λ0 = 0;dtb) трансверсальность по x для терминанта l = λ1 x(0)Lẋ (4) = −lx(4) ⇔ p(0) = λ1 ,Lẋ (0) = lx(0) ,p(4) = 0;c) оптимальность по umin {λ0 u2 − pu} = λ0 û2 − pû;u∈[−1;1]d) неотрицательностьλ0 ≥ 0 в задаче на минимум,λ0 ≤ 0 в задаче на максимум.Если λ0 = 0, то из a) ṗ = 0 и из b) p = λ1 = 0 – все множители Лагранжаоказались нулями.В задаче на минимум положим λ0 = 1.
Тогда из a) ṗ = 1 и из b) p = t − 4. Изусловия c) следует, чтоû =sign p,p,2| p2 |≥ 1,⇔ x̂˙ =−1, t − 2,2| p2 | ≤ 1,100 ≤ t < 2,2 ≤ t ≤ 4.Интегрируя, получаем−t + C1 , 0 ≤ t < 2,x̂ = t2 − 2t + C , 2 ≤ t ≤ 4.24Из начального условия x(0) = 0 выводим, что C1 = 0, а из условия непрерывности в точке t = 2 имеем −2 = 1 − 4 + C2 ⇔ C2 = 1. Таким образом,x̂ =−t,0 ≤ t < 2, t2 − 2t + 1,42 ≤ t ≤ 4.Докажем с помощью непосредственной проверки, что функция x̂ доставляетабсолютный минимум в задаче.
Возьмем функцию h ∈ P C 1 ([0, 4]) такую, чтобы x̂+hбыла допустимой в задаче. Для этого надо взять функцию h, для которой |x̂˙ + ḣ| ≤ 1,h(0) = 0. ИмеемZB(x̂ + h) − B(x̂) =4((x̂˙ + ḣ)2 + x̂ + h)dt −04Zx̂˙ ḣdt +=20Z4Z2(x̂˙ + x̂)dt =044ZZ2ḣ dt ≥ 2hdt +004˙ +x̂dh0Z4hdt.0˙Интегрируя по частям в первом интеграле с учетом условий h(0) = 0, x̂(4)=0, получим4 Z 4Z 4˙¨B(x̂ + h) − B(x̂) ≥ 2x̂h +(−2x̂ + 1)hdt =(−2x̂¨ + 1)hdt000Подставляя в последний интеграл найденную функцию x̂ и разбивая отрезокинтегрирования на два, имеемZ 2Z 4Z¨¨B(x̂ + h) − B(x̂) ≥(−2x̂ + 1)hdt +(−2x̂ + 1)hdt =022hdt ≥ 0,0h(t) ≥ 0 при t ∈ [0; 2], так как h(0) = 0, и ḣ ≥ 0 при t ∈ [0; 2] (функция hвозрастает на отрезке t ∈ [0; 2] и, следовательно, неотрицательна). Итак, x̂ ∈ absmin.4242 t2− 2 + − 2t + 1 dt =240022 Z 4 2 t34t2 t22= t−+− 4t + 5 dt = 2 − 2 +− 2t + 5t = −4 .2 026322ZSmin = B(x̂) =2(x̂˙ + x̂)dt =ZZ(1 − t)dt +11 tВ задаче на максимум положим λ0 = −1.
Тогда из a) ṗ = −1 и из b) p = 4 − t.Из условия c)min {−u2 − pu} = −û2 − pûu∈[−1;1]следует, чтоû = x̂˙ = sign p = sign(4 − t) = 1,0 ≤ t < 4.Интегрируя, получаем x̂ = t + C. Из начального условия x(0) = 0 вытекает,что C = 0. Таким образом, x̂ = t.Докажем с помощью непосредственной проверки, что функция x̂ доставляетабсолютный максимум в задаче.
Возьмем функцию h ∈ P C 1 ([0, 4]) такую, чтобы x̂+hбыла допустимой в задаче. Для этого надо взять функцию h, для которой|x̂˙ + ḣ| ≤ 1(⇔ |1 + ḣ| ≤ 1 ⇔ −2 ≤ ḣ ≤ 0),h(0) = 0.Как при проверке экстремали на минимум имеемZ 4Z 4Z 4Z 4Z2˙B(x̂ + h) − B(x̂) = 2x̂ḣdt +ḣ dt +hdt =(2 + ḣ)ḣdt +00004hdt.0Оба интеграла неположительны, поскольку в первом интеграле ḣ ≤ 0, а 2 +ḣ ≥ 0, а во втором интеграле h ≤ 0, так как h(0) = 0 и ḣ ≤ 0 (т.е. функция hубывает). Следовательно,B(x̂ + h) − B(x̂) ≤ 0,т.е.