Диссертация (Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению), страница 5
Описание файла
Файл "Диссертация" внутри архива находится в папке "Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению". PDF-файл из архива "Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 5 страницы из PDF
В данном случае, когда предполагается существование плотности распределениявероятности, это обобщённое уравнение принимает вид интегрального тождестваRη(x) ∂p(t,x)∂t dx =nR"nnR PP∂η=(x)f(t,x,u(t))+i∂xiRni=1i,j=1(1.4)#∂2η∂xi ∂xj (x)aij (t, x, u(t))p(t, x)dx,которое должно выполняться для любых финитных дважды непрерывнодифференцируемых функций x → η(x) : Rn → R1 . Однако не толькофинитные функции могут удовлетворять тождеству (1.4). Более широкий∗класс таких функций обозначается в [1] через W .Через D обозначим множество допустимых процессов управленияz = (p∗ (·), u(·)), удовлетворяющих условию: при заданном управлении u(·)функция t → p∗ (t) = p(t, ·) : T → Cp2 (Rn ) абсолютно непрерывна и такова, что плотность p является решением уравнения (1.2) с начальнымусловием (1.3).Для процесса z ∈ D определим функционал качества управленияz → J(z) =Rt1 R cR=f (t, x, u(t))p(t, x)dxdt + F c (x)p(t1 , x)dx : D → R1 ,t0 R n(1.5)Rnгде (t, x, u) → f c (t, x, u) : T × Rn × Rm → R1 , x → F c (x) : Rn → R1 –заданные измеримые функции.29Цель управления состоит в минимизации функционала (1.5) на множестве D.1.2.Достаточные условия оптимальностиВ работе [1] для построения достаточных условий вводится классΦ вектор-функций Ляпунова–Лагранжа ϕ = (ϕ0 , ϕ1 , .
. . , ϕn ), первые компоненты ϕ0 которых играют роль множителей Лагранжа, соответствующихуравнению (1.4), а компоненты ϕα , α = 1, n, используются для учёта неполноты информации о состоянии в задачах синтеза оптимальной стратегииуправления с информационными ограничениями [1, 2, 4, 5].В диссертации рассматривается функция программного управленияt → u(t), поэтому потребуется использование только первой компонентыϕ0 ∈ Φ0 функции Ляпунова–Лагранжа.
Функции из множества Φ0 должныудовлетворять условиям A.1 – A.2:A.1) функция (t, q) → ϕ0 (t, q) : T × C̃p2 → R1 локально липшицевана T × C̃p2 и дифференцируема по Фреше по совокупности аргументов (t, q)всюду на (T \ T0 ) × C̃p2 , где C̃p2 – некоторая окрестность множества Cp2 (Rn )в пространстве C 2 (Rn );A.2) частная производная ∂ϕ0 /∂q функции ϕ0 при всех t ∈ T \ T0и q ∈ C̃p2 представима в виде∂ϕ0[q] =∂qZξ(t, x, q(·))q(x)dx,(1.6)Rnгде функция (t, x, q) → ξ(t, x, q) : T × Rn × C̃p2 → R1 такова, что длялюбых фиксированных t ∈ T \ T0 и q ∈ C̃p2 функция ξ(t, ·, q) : Rn → R1∗принадлежит классу W .30О п р е д е л е н и е 1. Процесс z ∈ D называется оптимальным,если J(z) ≤ J(z) для любого процесса z ∈ D.Построим следующие конструкции:K(t, x, u, q) =+nPi,j=1nPi=1fi (t, x, u) ∂x∂ i ξ(t, x, q)+2aij (t, x, u) ∂x∂i ∂xj ξ(t, x, q)(1.7)c+ f (t, x, u),H(t, x, u, q) = K(t, x, u, q)q(x),Z∂ 0B(t, v, q) = ϕ (t, q) + H(t, x, v, q)dx,∂tRnZG(q) = F c (x) q(x) dx − ϕ0 (t1 , q).(1.8)(1.9)(1.10)RnЗдесь ξ – производная Фреше функции ϕ0 , задаваемая равенством (1.6).Центральную роль при доказательстве теорем, устанавливающих оптимальность процесса, играет функционал Лагранжа–Кротова [1]L(z) = ϕ0 (t0 , p∗ (t0 )) + G(p∗ (t1 )) +Zt1B(t, u(t), p∗ (t))dt,(1.11)t0используемый далее в диссертационной работе для формулировки необходимых условий оптимальности и обоснования предлагаемых алгоритмовпоиска оптимального управления.Приведём ряд утверждений из [1], касающихся функционала L.Л е м м а 1.
Для всех z ∈ D определён функционал (1.11) и справедливо равенствоJ(z) = L(z).(1.12)Т е о р е м а 1. Пусть задан процесс z = (p∗ (·), u(·)) ∈ D, функцииϕ0 ∈ Φ0 , µ(·) ∈ L1 (T ), число β ∈ R1 и выполнены условия:311. B(t, v, q) ≥ µ(t),2. G(q) ≥ β,(t, v, q) ∈ (T \ T0 ) × U × C̃p2 ;q ∈ C̃p2 .Тогдаа) J(z) ≥ λ для всех z ∈ D, гдеZt1λ=µ(t)dt + β + ϕ0 (t0 , p0 (·)).t0б) Если справедливо равенствоJ(z) = λ,то процесс является оптимальным.1.3.Функционал Лагранжа–КротоваКак отмечается в [1, 2], в общем случае отыскание процесса и функ-ции Ляпунова–Лагранжа (даже первой её компоненты), удовлетворяющихтеореме 1, представляет достаточно сложную задачу.В методе Лагранжа [2] предлагается раскладывать функцииЛяпунова–Лагранжа в ряды по аргументу q и искать линейный член ряда. Одновременно с выбором этого линейного члена, процесс управленияподбирается так, чтобы добиться локального выполнения условий оптимальности.
Такой процесс в [2] предлагается называть экстремалью.В данной работе мы не будем нацеливаться на отыскание экстремальных процессов управления. Вместо этого здесь предлагается сформулировать необходимые условия оптимальности, непосредственно работаяс функционалом Лагранжа–Кротова. Тем не менее, нам потребуется для32этого использовать некоторые построения из [2, 4, 5], связанные с поискомэкстремалей.Следуя [2, 5], функцию ϕ0 ∈ Φ0 будем искать в формеZ0ϕ (t, q) = ψ 0 (t, x) q(x)dx.(1.13)RnЗдесь (t, x) → ψ 0 (t, x) : T × Rn → R1 – заданная функция. При этомсчитается, что эта функция такова, что ϕ0 (·) вида (1.13) удовлетворяетусловиям А.1–А.2 (в частности, ψ 0 (t, ·) при фиксированном t ∈ T \T0 есть∗функция из W ).В этом случае конструкции (1.7)-(1.8) конкретизируются в формеnPh(t, x, u) =+nPi,j=1i=1fi (t, x, u) ∂x∂ i ψ 0 (t, x)+2aij (t, x, u) ∂x∂i ∂xj ψ 0 (t, x)(1.14)c+ f (t, x, u),а функционал Лагранжа–Кротова для заданного процесса z=(p∗ (·), u(·)) ∈ D принимает видL(z) =Rψ 0 (t0 , x)p0 (x)dx+RnR c+F (x) − ψ 0 (t1 , x) p(t1 , x)dx+(1.15)Rn+Rt1 R ∂t0 Rn0ψ(t,x)+h(t,x,u(t))p(t, x)dxdt.∂tВ заключение отметим следующий естественный результат [5, лемма 1], непосредственно вытекающий из формулы (1.15) и леммы 1.Л е м м а 2.
Если процесс z = (p∗ (·), u(·)) ∈ D и функция ψ 0 удовлетворяют условиям∂ 0ψ (t, x) + h(t, x, u(t)) = 0, (t, x) ∈ (T \ T0 ) × Rn ,∂t(1.16)ψ 0 (t1 , x) = F c (x), x ∈ Rn ,(1.17)33то справедливо равенствоZJ(z) =ψ 0 (t0 , x)p0 (x)dx.(1.18)Rn1.4.РезультатыЗаписана постановка задачи оптимального программного управлениястохастическими системами диффузионного типа, определён ряд ключевых понятий и соотношений, а также сформулирована основная идея, используемая для синтеза оптимального управления. Отдельно выделим следующие результаты:1) сформулированы основные понятия, необходимые для описанияи анализа динамических стохастических управляемых систем;2) введены понятия вектор-функций Ляпунова–Лагранжа и функционала Лагранжа–Кротова, на основе которых получены основные результаты данной работы;3) определены понятия допустимого и оптимального процессов управления, сформулированы достаточные условия оптимальности общего вида;4) сформулированы утверждения, устанавливающие наиболее явныйвид функционала Лагранжа–Кротова и являющиеся фундаментом для построения новых теоретических результатов.342.
Оптимизация квазилинейных системс нелинейными по управлению коэффициентамиВо второй главе формулируются результаты диссертационной работы, связанные с построением оптимального программного управленияквазилинейными стохастическими системами, коэффициенты которых могут быть в общем случае нелинейными функциями управления.В § 2.1 формулируется постановка задачи оптимального управленияквазилинейными системами, нелинейными по управлению. Устанавливаются основные обозначения, используемые далее в работе, и проводятсясвязи с общей постановкой задачи главы 1.В разделе 2.2 определяется вид функций Ляпунова–Лагранжаи функционала Лагранжа–Кротова, позволяющий в условиях данной задачи получить конструктивные соотношения для поиска оптимальногоуправления.
Соответствующим образом уточняется лемма 2.Раздел 2.3 содержит ключевые результаты диссертации, устанавливающие возможность улучшения процессов управления (теоремы ??-2).На их основе в разделе 2.4 формулируются и доказываются необходимыеусловия оптимальности (теорема 3).Наконец, § 2.5 и § 2.6 посвящены построению численного метода поиска оптимального программного управления и решению конкретного модельного примера.
В рамках этого примера необходимые условия опти-35мальности разрешаются аналитически, а на основе разработанного методастроится численное приближение, и проводится их сравнение.2.1.Постановка задачи оптимального управления квазилинейными динамическими стохастическими системами, нелинейными по управлениюПроцесс управления описывается системой уравнений Итоdx(t) = [A(t, u(t))x(t) + B(t, u(t))] dt+ν P+G(l) (t, u(t))x(t) + C (l) (t, u(t)) dwl (t),(2.1)l=1x(t0 ) = x0 ,где t ∈ T = [t0 ; t1 ] – время; x ∈ Rn – вектор состояния системы; w(·) –ν-мерный стандартный винеровский процесс; u ∈ Rm – вектор управления; t → u(t) : T → Rm – ограниченная борелевская функция на T .Здесь (t, u) → A(t, u) : T × Rm → Rn×n , (t, u) → B(t, u) : T × Rm →Rn , (t, u) → G(l) (t, u) : T × Rm → Rn×n , (t, u) → C (l) (t, u) : T × Rm →Rn , l = 1, ν, – непрерывные по t и дважды непрерывно дифференцируемыепо u функции на T × Rm (см.
далее замечание 1). Случайный вектор x0имеет плотность распределения x → p0 (x) : Rn → R1 с математическиможиданием m0 ∈ Rn и ковариационной матрицей K0 ∈ Rn×n . Функция p0принадлежит множеству Cp2 (Rn ) и считается заданной.В обозначениях главы 1 имеемf (t, x, u) = A(t, u)x + B(t, u),gl (t, x, u) = G(l) (t, u)x + C (l) (t, u),где столбцы gl (·) составляют матрицу g(·) размеров n × ν.36Для рассматриваемого здесь случайного процесса x плотность распределения вероятности (t, x) → p(t, x) : T × Rn → R1 существует, имеетконечные первый и второй моменты и удовлетворяет уравнению ФПК (1.2)с начальным условием (1.3) [6, 64].Аналогично разделу 1.1 введём в рассмотрение множество D допустимых процессов управления z = (p∗ (·), u(·)) и определим на нём функционалкачества управленияz → J(z) ==Rt1 R 1t0 R nTTxD(t,u(t))x+S(t,u(t))x+E(t,u(t))p(t, x)dxdt+2+RRn1 T2 x Qxp(t1 , x)dx(2.2): D → R1 ,где Q ∈ Rn×n , а (t, u) → D(t, u) : T × Rm → Rn×n , (t, u) → S(t, u) :T × Rm → Rn , (t, u) → E(t, u) : T × Rm → R1 – непрерывные по t идважды непрерывно дифференцируемые по u функции на T × Rm , и прикаждом (t, u) ∈ T × Rm выполнены условия D(t, u) ≥ 0, Q ≥ 0.
Здесьи далее матрицы квадратичных форм считаются симметрическими. Цельуправления состоит в минимизации функционала (2.2) на множестве D.В обозначениях главы 11f c (t, x, u) = xT D(t, u)x + S T (t, u)x + E(t, u),21F c (x) = xT Qx.2З а м е ч а н и е 1. Условия на функции A, B, G(l) , C (l) , D, S, E могут быть ослаблены. Для доказательства справедливости излагаемыхниже результатов, достаточно потребовать, чтобы эти функции вместесо своими первыми частными производными ∂A/∂u, ∂B/∂u, ∂G(l) /∂u,∂C (l) /∂u, ∂D/∂u, ∂S/∂u, ∂E/∂u, были ограниченными и липшицевыми по37переменной u борелевскими функциями на любом компактном подмножестве из T × Rm .З а м е ч а н и е 2. Условия ограниченности и измеримости по Борелю, накладываемые на указанные в разделе функции, требуются для ихинтегрируемости на интервале T .2.2.Функционал Лагранжа–КротоваВ данном разделе мы окончательно сформируем нужный нам видфункции Ляпунова–Лагранжа и конкретизируем результаты раздела 1.3,касающиеся функционала Лагранжа–Кротова (лемма 2), для рассматриваемой здесь задачи.