Диссертация (Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии), страница 10
Описание файла
Файл "Диссертация" внутри архива находится в папке "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии". PDF-файл из архива "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 10 страницы из PDF
Эта вспомогательнаяквазилинейная система имеет вид = T0 () +∑︁T () + (),(3.22)=1где ∈ , ∈ , () - матрица размеров ×. При 0 (·) ∈ 0 , ∈ Λ предельнаяматрица ковариаций ∞ для этой системы удовлетворяет уравнению∞T0∞+ 0 +∑︁∞TT + = 0.(3.23)=1Если выбрать матрицу из условияT = (),учитывая, что () ≥ 0, то при = ∞ уравнение (3.23) совпадает с уравнением (3.19). Так как, как было установлено, решение урвнения (3.19) существует иединственно, матрица есть предельная ковариационная матрица системы (3.22) ипоэтому неотрицательна.Следует заметить, что уравнения (3.19) и (3.18) в общем случае могут не иметьрешения.Из теоремы 3.1 и лемм 3.2, 3.3 очевидно вытекает следующий результат.54Если ∈ Λ , то векторный параметр является стабилизирующими стабильное значение критерия ¯ определяется выражениемТеорема 3.2.¯ () =0T 1 ∑︁1+T + ,2 =12(3.24)где вектор и матрица находятся из уравнений (3.18), (3.19).В связи с результатом теоремы 3.2 всюду далее будем считать, что векторныйпараметр выбирается из множества Λ .3.3Оптимизация облика квазилинейной стохастической системы.
Необходимые условия оптимальностиВ связи с результатом теоремы 3.2 возникает естественная идея: среди стабилизирующих векторных параметров ∈ Λ найти вектор, обеспечивающий минимальноезначение критерия (3.2). Для стабилизирующего вектора ∈ Λ значение критерия (3.2) может быть подсчитано по формуле (3.24). Однако, эта формула не удобнадля получения условий оптимальности, так как для каждого значения необходимо решать уравнения (3.18), (3.19). Целесообразно воспользоваться идеями методафункций типа Кротова, применявшимися в работах [45, 46, 54] для линейных стохастических систем.
Прежде всего заметим, что в силу теоремы 3.1 в случае, когда ∈ Λ , критерий (3.2) не зависит от начального распределения состояния 0 (·) ∈ 0и реализовавшегося процесса (, ·). В результате критерий (3.2) является функциейконечного числа переменных – компонент вектора ∈ Λ( * (·), ) = (),Задача оптимизации облика системы. ∈ Λ .Найти значение векторного параметра¯ ∈ Λ , удовлетворяющее условию¯ = min (). ()∈Λ(3.25)Матрицы , , = 0, , , , , задающие систему (3.1)и критерий (3.2), входящие в выражения (3.16)-(3.24), дифференцируемы по элементам вектора ∈ Λ , = 1, всюду на Λ .Предположение 3.1.55Теорема 3.3.Для любых значений ∈ Λ , 0 (·) ∈ 0 справедливо равенство1(3.26) () = ¯ + [ΨΓ∞ ] + Θ∞2независимо от выбора постоянных матриц , , задающих функцию (3.10).
Здесь∞ , Γ∞ , Ψ, Θ, ¯ определяются равенствами (3.6), (3.7), (3.16), (3.17), (3.24).Кроме того, если выполнено предположение 3.1, функция () дифференцируемапри всех ∈ Λ .Доказательство. Следуя [46], для заданной начальной меры 0 (·) ∈ 0 через () =¯ , ∈ [0, +∞) обозначим произвольный процесс, соответствующий вектору( (, ·), )¯ . Рассмотрим сужение этого процесса () = ( (, ·), )¯ на интервал [0, 1 ], 1 <+∞. Тогда критерий∫︁1 ∫︁¯ (, ) (, )(3.27) ( (·)) =0 может быть точно вычислен по аналогичной выражению (1.13) формуле∫︁∫︁0 ( (·)) = ( (·)) = − () (1 , ) + 0 ()0 () + 1 ¯ +∫︁1⎛⎞∫︁⎝−¯++0¯ (, )⎠ , (3.28)ℎ(, )¯ , ¯ определяются равенствами (3.10), (3.15), (3.24).
Здесь ( (·)) –где 0 (), ℎ(, )функционал Лагранжа [44, 45, 54] для задачи на минимум критерия (3.27) на множестве процессов, получающемся из множества процессов исходной задачи сужениемна интервал [0, 1 ]. Функция 0 () играет роль множителя Лагранжа. Важно то, чторавентсво (3.28) справедливо для любой функции вида (3.10) (при любых и ).Равенство (3.28) в [46,54] использовалось для исследования линейной стохастической системы, однако оно справедливо и для рассматриваемой здесь квазилинейнойсистемы, так как линейность системы и конкретный вид функции 0 () использовались в [46, 54] лишь в дальнейших преобразованиях равенства (3.28).Если матрицы 0 , асимптотически устойчивы и 0 (·) ∈ 0 , то согласно теореме 3.1 критерий (3.2) однозначно определен, конечен и может быть записан в виде1 ( (·)).1 →+∞ 1( (·)) = lim(3.29)Учитывая (3.28), (3.29), получим⎡⎤∫︁∫︁1⎣( (·)) = ¯ + lim− 0 () (1 , ) + 0 ()0 ()⎦ +1 →+∞ 1⎛⎞1∫︁∫︁1¯ (, )⎠ .
(3.30)⎝−¯+ lim + ℎ(, )1 →+∞ 1056В силу леммы 3.2 справедливо утверждение 1 теоремы 3.1, из которого следует,что второе слагаемое в правой части (3.30) равно нулю. И тогда с учетом (3.15), (3.24)получим1( (·)) = ¯ + lim1 →+∞ 1∫︁1 ∫︁1( T Ψ + Θ) (, ).20 Так как ∈ Λ и 0 (·) ∈ 0 , то функции () и Γ() имеют предельные значения ∞и Γ∞ при → ∞, и тогда1( (·)) = ¯ + lim1 →+∞ 1∫︁11[ ΨΓ() + Θ()] =201= ¯ + lim1 →+∞ 1∫︁111[ ΨΓ∞ + Θ∞ ] = ¯ + [ΨΓ∞ ] + Θ∞ ,220или, окончательно1( (·)) = ¯ + [ΨΓ∞ ] + Θ∞ ,2∞∞где , Γ – предельные первый и второй центральный моменты меры (, ·). Уравнения (3.6), (3.7) для величин ∞ , Γ∞ в силу Леммы 3.3 имеют решения.Матрицы , , входящие в равенство (3.26), играют роль множителей Лагранжа, а функция () – функция Лагранжа, совпадающая с исходным критерием( * (·), ) при любых и в силу того, что выполнены ограничения (3.6), (3.7),подменяющие исходное ограничение (3.1).
Применительно к линейным стохастическим системам такой способ использования метода Лагранжа подробно описан в [54].Для квазилинейных систем, как видно из доказательства теоремы 3.3, он также применим.Учитывая результат теоремы 3.3 и предположение 3.1 нетрудно видеть, что необ-¯ в задаче (3.25) очевидно будет иметьходимое условие оптимальности вектора = вид⃒ () ⃒⃒= 0, ⃒=¯где ()/ – градиент функции ().
Задача состоит в том, чтобы конструктивнозаписать выражение для ()/.В результате использования функции Лагранжа (3.26) вместо исходного критерия (3.2) мы имеем достаточно богатое многопараметрическое представление оптимизируемого функционала, позволяющее упростить вычисление градиента. Более57того, в представленном ниже градиентном методе это представление изменяется отшага к шагу, так как на каждом шаге используются свои матрица и вектор .Пусть выполнено предположение 3.1, тогда в силу теоремы 3.3 функция ()дифференцируема на Λ и -й элемент ( = 1, ) ее градиента с учетом (3.26) запишется в виде ()¯1 Ψ ∞Γ∞Θ ∞∞=+ [Γ +Ψ]+ +Θ.
2 (3.31)Здесь производная от матрицы по параметру , = 1, понимается как матрица производных от компонент исходной матрицы. Теперь воспользуемся тем, чтофункция () зависит от произвольных постоянных матриц и (множителейЛагранжа). Выберем и так, чтобы упростить выражение градиента (3.31). А¯ , удовлетворяюименно, будем предполагать, что для оптимального значения = щего условию (3.25) выполняются условия (3.18), (3.19), что означает равенство нулю¯ . Решения ураввеличин Ψ и Θ, определенных равенствами (3.16), (3.17), при = нений (3.18), (3.19) в силу леммы 3.3 существуют. И тогда выражение для компонент¯ примет более простой видградиента ()/ в точке = ⃒¯1 Ψ ∞Θ ∞ () ⃒⃒=+ [Γ ]+⃒ =¯ 2 (3.32)¯ ). Сравнивая (3.31) и (3.32)(слагаемые в правой части вычисляются в точке = ¯ можнонетрудно видеть, что формально при вычислении градиента в точке = считать, что Γ∞ и ∞ постоянны (не зависят от ).С учетом (3.16), (3.17) аналитическая формула для компонент градиента¯ имеет вид ()/ в точке = ⃒∑︁1 () ⃒⃒T0 ∑︁T ∞0=[(+++T+)Γ ]+⃒ =¯ 2=0=0∑︁0 ∑︁T 0T ∞+ (+ +T ++) +=0=00T1 ∑︁T1 ∑︁ 1 ++ +T +.
(3.33)2 =0 2 =02 ¯ , а матрицы и удовлеСлагаемые в правой части (3.33) вычисляются при = ¯ ). В результате приходим к следующейтворяют условиям (3.18), (3.19) (при = теореме.58¯ ∈ Λ оптимальный векторный параметр (удовлетворяетЕсли условию (3.25)) и выполнено предположение А, то функция () дифференцируема¯ и выполнено необходимое условие оптимальностив точке = ⃒ () ⃒⃒= 0,(3.34) ⃒=¯Теорема 3.4.¯ задаются равенством (3.33),где компоненты градиента ()/ в точке = = 0, , а матрицы ∞ , Γ∞ , , находятся из уравнений (3.6), (3.7), (3.18),(3.19), единственные решения которых существуют.3.4Управляемая по выходу системаЧастным случаем поставленной задачи (3.25) является задача оптимизацииуправляемой системы, описываемой уравнением Ито1 = (0 + 0 + 0) +∑︁1( + + ) ,(3.35)=1а управление задается равенствами = − + ,(3.36) = .(3.37)Здесь ∈ – состояние системы; ∈ – вектор управления; ∈ – стан1дартный винеровский процесс; ∈ – выход системы; , , ( = 0, ), , – матрицы соответствующих размеров, не зависящие от вектора .
Роль векторапараметров играют элементы матрицы и компоненты вектора ∈ = {, }.Функцию вида (3.36) будем называть стратегией управления или регулятором. Вуравнении (3.35) и далее, как это принято в теории дифференциальных уравнений,аргумент в записи функций, входящих в уравнение Ито, будем опускать.Критерий оптимальности задачи (3.35)-(3.37) имеет вид аналогичный (3.2), приэтом функция (, ) = T + 2T + T ≥ 0,где , , – матрицы соответствующих размеров, причем , > 0 симметрические.59Если подставить (3.36), (3.37) в (3.35), получим систему вида (3.1), где(3.38) = − ,1 = + , = 0, .(3.39)Тогда задача поиска оптимальной стратегии управления вида (3.36) сводится кпоставленной выше задаче оптимизации критерия (3.2) по параметру . При этомматрицы , и в критерии (3.2) будут иметь вид = − − T T T + T T , = T T − T ,(3.40) = T .(3.41)Для управляемой по выходу системы (3.35)-(3.37) оптимизируемыми параметрами, играющими роль вектора , являются элементы матрицы и вектора .
Для неетакже справедлива теорема 4, где матричные градиенты критерия по этим параметрам имеют вид(︂)︂ ⃒⃒⃒⃒⃒Π1 = − 0 −∑︁(3.42)= −∞T Π1 − Π2 ,(3.43)¯=,=¯)︂ ⃒⃒(︂⃒⃒⃒где= [Γ∞ Π1 + ∞ Π2 ],¯=,=¯T ∑︁T− + ( + ),T ¯T=1TΠ2 = − 0 −(3.44)=1∑︁1T =1T− ¯ (∑︁T + ),(3.45)=1/ = {/ } – матричный градиент критерия оптимальности задачи (3.35)(3.37) по компонентам матрицы = { }, = 1, , = 1, , а / =(/1 , . . .