Автореферат (Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии), страница 3
Описание файла
Файл "Автореферат" внутри архива находится в папке "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии". PDF-файл из архива "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
Если матрица ¯ = − , ∈ ℒ асимптотически устойчиваи |Γ∞ | ≠ 0, то условия Хрусталева М.М. (2.3)-(2.9) эквивалентны условию (2.11)и являются необходимыми условиями оптимальности линейного регулятора ¯() =¯ .−Введено новое понятие вполне возмущаемости системы , аналогичноесвойству вполне управляемости Калмана, которое позволило исследовать вопросединственности оптимального регулятора.¯ ,¯∈Определение 2.1. Замкнутую систему (2.1) с управлением ¯() = −¯ , назовемℒ, обеспечивающим асимптотическую устойчивость матрицы ¯ = − вполне возмущаемой, если предельная ковариационная матрица Γ∞ не вырождена.Доказана следующая теорема.Теорема 2.4. Для того, чтобы замкнутая система (2.1) с управлением ¯() =¯ ,¯ ∈ ℒ, обеспечивающим асимптотическую устойчивость матрицы ¯ = −−¯ , была вполне возмущаемой, необходимо и достаточно выполнение условия(, ¯ , 2¯ , ..., −1¯ ) = .Полученные условия (2.11) являются более общими, так как охватывают случай вырожденной предельной матрицы ковариаций Γ∞ .В общем случае (Γ∞ )−1 может не существовать.
Мера (, ·) при всех ∈[0 , ∞) гауссова и имеет плотность (, ), предельная же мера ¯ (·) = lim→∞ (, ·)может не иметь плотности. В этом случае Γ∞ может оказаться вырожденной, т.е.¯ имеется меньше уравнений,|Γ∞ | = 0. Если Γ∞ вырожденная, то для определения чем искомых коэффициентов регулятора. И может оказаться, что часть компонент¯ может быть задана произвольно с учетом лишь требования асимптотичематрицы ской устойчивости матрицы ¯ . Вырожденность Γ∞ означает детерминированностьпредельных значений некоторого количества компонент вектора состояния или ихлинейных комбинаций.Показано, что если замкнутая система (2.1) является вполне возмущаемой, то¯ , задающее оптимальный лиуравнение (2.11) имеет единственное решение = нейный регулятор.
Исследован случай не единственности решения задачи в случае,когда система (2.1) не является вполне возмущаемой, и получено условие, при котором оптимальная стратегия управления будет не единственной. Приводится примерсистемы, не являющейся вполне возмущаемой.На основе полученных необходимых условий оптимальности (теорема 2.2) разработан градиентный численный метод синтеза оптимального регулятора. Егоработа продемонстрирована на модельном примере при различных составах доступных измерению компонент объекта управления.
Также рассмотрена прикладная задача стабилизации орбиты искусственного спутника Земли (ИСЗ) c гибкой штангой.В третьей главерассматривается задача стабилизации и оптимизации ква-—10—зилинейных стохастических систем при неполной информации о состоянии.Пусть поведение модели объекта описывается квазилинейным уравнением Ито() = (0 ()() + 0 ()) +∑︁( ()() + ()) ().(3.12)=1Здесь () = (1 (), ..., ())T ∈ – случайное состояние системы; () =(1 (), ..., ())T ∈ – стандартный винеровский процесс; ∈ [0, +∞) – время; , ( = 0, ) – матрицы размеров × и векторы-столбцы длины соответственно.Постоянные во времени матрицы , зависят от векторного параметра ∈ Λ ⊂ .
В качестве этого векторного параметра могут выступать параметрыалгоритма управления, конструктивные параметры объекта (например, жесткостьшасси самолета, размеры крыла), а также параметры среды, в которой функционирует объект. Поэтому будем говорить, что этот векторный параметр определяетоблик системы и подлежит оптимизации.Уравнение (3.12) порождает вероятностную меру * () = (, ·), задающуюраспределение случайного состояния системы (3.12) в момент времени ∈ [0, +∞).Начальная мера 0 (·) = (0, ·) состояния 0 = (0) считается заданной и выбираетсяиз множества 0 , задаваемого условиями:1. борелевская мера 0 (·) абсолютно непрерывна относительно меры Лебега в (имеет плотность);2. существуют конечные вектор математического ожидания и матрица ковариаций.В работе Параева Ю.И.
показано, что в этом случае текущая мера (, ·)процесса также обладает свойствами 1, 2.Определение 3.1. Обозначим через Λ ⊂ Λ совокупность векторов ∈ Λ,для которых асимптотически устойчивы первый () и второй центральный Γ()моменты.
Уравнения для их предельных значений имеют вид0 ∞ + 0 = 0,∞0 Γ + Γ∞T0+∑︁=1∞ ΓT+∑︁( ∞ + )( ∞ + )T = 0.(3.13)(3.14)=1Решения уравнений (3.13) и (3.14) существуют, и эти решения единственны, если ∈ Λ . Кроме того, матрица Γ∞ неотрицательна (в смысле соответствующей квадратичной формы).Задача состоит в оптимизации облика системы (3.12), исходя из условий минимума критерия оптимальности11lim( * (·), ) =2 →+∞ ∫︁ ∫︁ (, ) (, ),0 (3.15) (, ) = T () + 2() + (),где T – неотрицательная квадратичная форма при любых ∈ Λ; – матрица размеров × ; ∈ – вектор-строка длины ; ∈ 1 – скаляр. Как и в—11—первой главе внутренний интергал в (3.15) представляет собой математическое ожидание «мгновенных потерь».
Здесь и далее для краткости записи матриц системы икритерия аргумент будем опускать.Определение 3.2. Допустимый вектор параметров ∈ Λ назовем стабилизирующим, если для любого начального распределения 0 (·) ∈ 0 состояния системы (3.12) и любого реализовавшегося в силу уравнения (3.12) процесса (, ·), функционал (3.15) определен и принимает одно и то же постоянное значение ( * (·), ) = ¯ (). Величину ¯ () в этом случае назовем стабильным значениемкритерия и будем говорить, что система (3.12) обладает свойством стабильности.Для исследования стабильности вводится в рассмотрение линейноквадратичная функция1 0 () = T + T ,2играющая роль множителя Лагранжа, отвечающего за связь в виде дифференциального уравнения (3.12).
Здесь , – постоянные матрицы размеров × , × 1соответственно.Теорема 3.2. Если ∈ Λ , то векторный параметр является стабилизирующим и стабильное значение критерия ¯ определяется выражением¯ () =0T 11 ∑︁T + ,+22(3.16)=1где вектор и матрица находятся из уравненийT 0 +∑︁T + 0T + = 0,(3.17)=1T0+ 0 +∑︁T + = 0,(3.18)=1которые имеют решения, и эти решения единственны. Кроме того, матрица неотрицательна.В связи с результатом теоремы 3.2 всюду далее будем считать, что векторныйпараметр выбирается из множества Λ .Из теоремы 3.2 следует, что в случае устойчивости по Параеву ( ∈ Λ ) системы (3.12) критерий (3.15) не зависит от начального распределения состояния0 (·) ∈ 0 и реализовавшегося процесса (, ·) и является функцией конечного числааргументов – компонент векторного параметра ∈ Λ( * (·), ) = (), ∈ Λ .Задача оптимизации облика системы.¯ ∈ Λ , удовлетворяющее условиюметра Найти значение векторного пара-¯ = min ().
()∈ΛДля этой задачи получены необходимые условия оптимальности .—12—¯ был оптимальным,Для того, чтобы векторный параметр необходимо выполнение условияТеорема 3.3.⃒ () ⃒⃒= 0, ⃒=¯(3.19)¯ задаются равенствомгде компоненты градиента ()/ в точке = [︃(︃)︃]︃⃒TT∑︁∑︁⃒ () ⃒10 0= T ++ ++Γ∞ +⃒ =¯ 2=0=0(︃)︃T∑︁∑︁ 0T0T + + +++∞ +=00T1++2=0∑︁=0 1 T1 ∑︁T ++,22 ( = 0, ).=0Здесь производная от матрицы по параметру , = 1, понимается как матрицапроизводных от компонент исходной матрицы.
Матрицы ∞ , Γ∞ , , находятся изуравнений (3.13), (3.14), (3.17), (3.18), единственные решения которых существуют.Оптимальное значение критерия вычисляется по формуле (3.16).Полученные необходимые условия были конкретизированы для управляемой по выходу системы , описываемой уравнением Ито вида = (0 + 0 +10)+∑︁1( + + ) ,(3.20)=1при управлении , задаваемом равенствами = − + , = .(3.21)Здесь ∈ – состояние системы; ∈ – вектор управления; ∈ – стан1дартный винеровский процесс; ∈ – выход системы; , , ( = 0, ), , – матрицы соответствующих размеров, не зависящие от вектора . Роль векторапараметров играют элементы матрицы и компоненты вектора ∈ .Критерий оптимальности задачи (3.20), (3.21) имеет вид аналогичный (3.15),при этом функция (, ) = T + 2T + T ≥ 0,где , , – матрицы соответствующих размеров, причем , > 0 симметрические.Для управляемой по выходу системы (3.20), (3.21) также справедлива теорема3.3, где матричные градиенты критерия по параметрам и имеют вид(︂)︂ ⃒⃒ ⃒⃒ ⃒= [Γ∞ Π1 + ∞ Π2 ],¯=,=¯(︂)︂ ⃒⃒ ⃒⃒⃒= −∞T Π1 − Π2 ,¯=,=¯—13—гдеΠ1 = − 0 −∑︁T ∑︁T + ),− + (T ¯T=1=1TΠ2 = − 0 −∑︁1T ∑︁T + ),− ¯ (T=1=1/ = {/ } – матричный градиент критерия оптимальности задачи (3.20), (3.21) по компонентам матрицы = { }, = 1, , = 1, , а/ = (/1 , .
. . , / )T .Необходимое условие (3.19) будет состоять из двух равенств[Γ∞ Π1 + ∞ Π2 ] = 0,∞T Π1 + Π2 = 0,(3.22)а оптимальное значение критерия вычисляется по формуле (3.16), где матрицы , определяются равенствами1 = + , = 0, , = T .(3.23)Представляет интерес частный случай системы (3.20) – симметрическаясистема .
Для симметрических управляемых по выходу систем доказано, что наряду с оптимальным регулятором вида (3.21) также оптимальным будет являтьсярегулятор = −, = ,(3.24)который будет реализовывать то же значение критерия, что и (3.21).Необходимые условия оптимальности регулятора (3.24) значительно упрощаются и состоят из одного матричного равенства, которое разрешимо относительно, если матрица ковариаций не вырождена (|Γ∞ | ̸= 0) и матрица имеет полныйранг .Для систем с ПИД-регулятором указан метод сведения к системе общеговида (3.12), для которой могут быть записаны уравнения для первого (3.13) и второгоцентрального (3.14) моментов, исследована устойчивость системы и синтезированоптимальный регулятор, что продемонстрировано на модельном примере.В случае полной информации о состоянии системы (3.20), так что стратегияуправления → () : → (3.25)может зависеть от всех компонент вектора состояния , получены не только необходимые, но и достаточные условия оптимальности линейного регулятора = − + .(3.26)При этом регулятор оказывается оптимальным не только среди линейных, но и срединелинейных из достаточно широкого класса.