Диссертация (Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)), страница 4
Описание файла
Файл "Диссертация" внутри архива находится в папке "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)". PDF-файл из архива "Разработка численно-аналитического метода и алгоритма решения задачи оптимального управления (на примере трехсекторной инвестиционной экономической модели)", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 4 страницы из PDF
Данное утверждениеназывается принципом максимума Понтрягина [7].Введем вспомогательную функцию, называемую функцией ПонтрягинаH(t, x, u, p, λ0 ) = (p, ϕ(t, x, u)) − λ0 f (t, x, u).Сформулируем основное утверждение о необходимых условиях экстремума в задаче(2.1.1), следуя [13].Теорема.
Пусть (x∗ (·), u∗ (·)) - оптимальный управляемый процесс в задачеоптимального управления (1) ((x∗ , u∗ ) ∈ strlocminP ), функции f , ϕ непрерывны в20некоторой окрестности множества Γx∗ × U , где Γx∗ = {(t, x∗ (t))|t ∈ [t0 , t1 ]}, частныепроизводные (по Фреше) fx , ϕx определены на этом множестве и непрерывны в точках множества Γx∗ ,u∗ = {(t, x∗ (t), u∗ (t))|t ∈ [t0 , t1 ]}, а функция l дифференцируема(по Фреше) в точке x∗ (t1 ), (l ∈ D(x∗ (t1 ))).Тогда выполняются следующие условияmax H(t, x∗ (t), u, p(t), λ0 ) = H(t, x∗ (t), u∗ (t), p(t), λ0 ), t ∈ Tu∈U(2.1.2)или в другой форме(p(t), ϕ(t, x∗ (t), u∗ (t))−f (t, x∗ (t), u∗ (t)) ≥ (p(t), ϕ(t, x∗ (t), u)−f (t, x∗ (t), u),t ∈ T, ∀u ∈ U(2.1.3)причем множитель Лагранжа λ0 можно принять равным 1.
Функция p(t), котораяназывается сопряженной переменной, является единственным решением задачи Коши, состоящей из дифференциального уравненияṗ(t) = −ϕ∗x (t, x∗ (t), u∗ (t))p + fx (t, x∗ (t), u∗ (t))(2.1.4)и граничного условияp(t1 ) = −l0 (x∗ (t1 )).(2.1.5)Замечания к теореме.Условие оптимальности, принимающее формы (2.1.2) или (2.1.3), называется условием максимума, от него и происходит название данного фундаментальногоутверждения о необходимых условиях экстремума.
Соотношение (2.1.4), которое аналитически представляет собой систему дифференциальных уравнений относительновектор-функции p(t), называется сопряженным уравнением. Граничные условия кэтому уравнению называются условием трансверсальности. В данной задаче условиетрансверсальности является содержательным только в точке t = t1 , соответствующее условие в точке t = t0 не информативно и не включается в систему необходимыхусловий экстремума.Условие максимума функции Понтрягина (2.1.2) имеет ключевую роль в системе необходимых условий экстремума. При решении задачи оно дает возможностьопределить общую структуру оптимального управления.
В наиболее распространенном, стандартном варианте функция Понтрягина линейно зависит от управленияu ∈ U . Обозначим через Q(t) коэффициент при u ∈ U в формуле для функции Понтрягина. При этом функция Q(t) явно зависит от сопряженной переменной p(t). Еслипредположить, что множество допустимых управлений представляет собой интервал21U = [u0 , u1 ] ⊂ R, то из условия максимума следует, что оптимальное управление u∗ (t)имеет следующую структуруu1 ,если Q(t) > 0,u∗ (t) = u(0) (t), если Q(t) = 0,u ,если Q(t) < 0.0(2.1.6)Функция u(0) (t), фигурирующая в соотношении (2.1.6), называется особым управлением.
Это управление возникает, когда функция Q(t) принимает нулевое значение;в этом случае функция Понтрягина явно не зависит от управления u ∈ U . Особоеуправление не определяется из условий максимума, и для его нахождения используются специальные методы.В дальнейшем будем называть функцию Q(t) функцией, определяющей управление.
Из соотношения (2.1.6) следует, что поведение этой функции в основном определяет вид оптимального управления.2.2Общее описание численного алгоритмаОсновная проблема использования необходимых условий экстремума в форме принципа максимума заключается в том, что необходимо исследовать сложную систему соотношений, состоящую из нескольких систем дифференциальных уравненийи граничных условий, которые связаны между собой. В частности, сопряженная система дифференциальных уравнений может зависеть от управлений u(t) и состоянийx(t), а дифференциальная связь, определяющая изменение состояний x(t), зависитот управлений u(t).
Аналитически решить такую систему можно только в специальных случаях (см. примеры решения задачи оптимального управления в разделе1.1, а также решение задачи оптимального управления односекторной динамическойэкономической системой в разделе 1.3). Таким образом, возникает необходимостьразработки методов численного исследования системы, состоящей из необходимыхусловий экстремума и ограничений исходной задачи. В настоящей работе предлагается один из таких методов.В настоящем исследовании было принято предположение о том, что функцияуправления может иметь только конечное число скачков (переключений управления)на конечном интервале времени. Такое предположение является вполне оправданнымс точки зрения его прикладного содержания. Отсюда следует, что функция переклю22чения Q(t), определяющая структуру функции управления, только конечное числораз меняет знак на заданном конечном интервале времени t ∈ [0, T ]. Таким образом, структура функций оптимального управления, определяемая в соответствии спринципом максимума, допускает лишь конечно число вариантов.
Рассматривая этиварианты последовательно, можно численно определить тот из них, в котором исходное предположение о структуре управления соответствует определяемому видуфункции Q(t).Нахождение такого варианта функции управления,для которого функция переключений Q(t), вычисляемая по данному варианту, имеет характер, определяемый условием максимума, не означает немедленного завершения описываемой процедуры.
Из общей теории экстремальных задач известно, что могут существоватьнесколько допустимых экстремалей, удовлетворяющих необходимым условиям экстремума и ограничениям исходной задачи. Таким образом, процедура поиска должнапродолжаться с использованием целенаправленного перебора возможных вариантовповедения функции управления. Указанный перебор должен осуществляться при помощи изменения положения точек переключения и числа этих точек. Например, прианализе вариантов с одной точкой переключения τ необходимо рассмотреть конечноечисло значений, которые может принимать величина τ на заданном интервале [0, T ],выбрав определенный шаг разбиения.Изложим общую схему этого метода для классической задачи оптимальногоуправления.
В дальнейшем он будет подробно описан и реализован для задачи оптимального управления в экономической модели. Иллюстрацией к алгоритму нахождения допустимых экстремалей в исходной задаче оптимального управления можетслужить теоретическая схема, изображенная на рисунке 2.Предположим, что оптимальное управление имеет кусочно-постоянную структуру, и функции управления принимают только два возможных значения, которыебудут обозначаться через u0 , u1 ∈ U . В стандартных одномерных задачах роли параметров u0 , u1 обычно играют минимальное и максимальное значение множестваU.Обозначим через t0 = τ0 < τ1 < τ2 < ... < τn−1 < τn < τn+1 = t1 точки, вкоторых функция u(t) изменяет свои значения.
Такие точки называются точкамипереключения управления. Зафиксируем некоторое разбиение временного интервала [t0 ; t1 ] на достаточно малые отрезки длины ∆ и будем предполагать, что точкипереключения управления принимают значения на множестве точек, образующих23Рис. 2: Теоретическая схема реализации алгоритма.заданное разбиение. Пусть N - общее число точек, входящих в разбиение отрезка(N )[t0 ; t1 ]. Обозначим через Snмножество функций возможных управлений, обладаю-щих свойствами:1. Данные функции принимают только два возможных значений: u0 или u1 .2.
Данные функции являются кусочно-постоянными и меняют свое значениев точках переключения. В этих точках функции управления обладают свойствомнепрерывности справа.3. Количество точек переключения равно n и они образуют подмножествоточек заданного разбиения, отрезка времени [t0 ; t1 ].(N )Заметим, что при n = 0 множество S0состоит из двух функций, принима-ющих одно значение на всем отрезке [t0 ; t1 ].u(t) = u0 ,t ∈ [t0 ; t1 ];u(t) = u1 ,t ∈ [t0 ; t1 ].(N )При n = 1 множество S1состоит из функций, имеющих одну точку пере-ключения, совпадающую с одной из точек заданного разбиения [t0 ; t1 ].(N )Наконец, при n = N множество Snсостоит из функций, имеющих N точекпереключения, которые являются точками заданного разбиения.(N )В дальнейшем будем рассматривать множество функций Ŝn=nS(N )Sk , n ≤k=0N как класс предполагаемых функций управления. Этот класс состоит из функции,принимающих два возможных значения и имеющих не более n точек переключения.(N )Теорема 1.
Число элементов множества Ŝn24определяется следующей фор-мулойN̂n = 2nXCNk .k=0Доказательство. Определим число элементов в каждом из множеств, вхо(N )(N )дящих во множество Ŝn . Множество S0множество(N )Skсостоит из двух элементов. Рассмотримс фиксированным номером k. Число возможных вариантов точекпереключения для функций из данного множества совпадает с числом возможныхвариантов выбора k различных элементов из N без возвращения и без учета порядка элементов.
Указанное число вариантов переключения равно числу сочетанийCNk =N!.k!(N −k)!Каждому фиксированному набору точек переключения соответствуетдва варианта возможного вида функции управления, которые отличаются значением функции на интервале от t = 0 до первой точки переключения. таким образом,(N )множество Sk(N )содержит 2CNk элементов.
Поскольку множества Skне пересекают-ся при различных k, число элементов в объединении множеств равно сумме числаэлементов в каждом множестве. Отсюда следует, чтоN̂n = 2 + 2CN1 + 2CN2 + ... + 2CNn = 2nXCNk .k=0Теорема 1 доказана.Идея метода численного исследования задачи управления, предполагаемогов настоящей работе, заключается в том, что для каждой функции управления, принадлежащей классуŜn(N )=n[(N )Sk ,n ≤ N,k=0можно решить соответствующие системы дифференциальных уравнений относительно p(t) и x(t).
Тогда для заданной функции управления определяется функция Q(t),которая зависит, вообще говоря, от сопряженных переменных p(t) и состояний x(t).Далее можно численно сравнить вид найденной функции Q(t) и структуру исходнойфункции переключений Q(t), при которой управление u(t) имеет предполагаемуюструктуру.