Диссертация (Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению), страница 9
Описание файла
Файл "Диссертация" внутри архива находится в папке "Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению". PDF-файл из архива "Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 9 страницы из PDF
Для того чтобы процесс z = (p∗ (·), u∗ (·)) ∈ D, стра-тегия управления u(t, x) которого есть линейный регулятор (3.3), был оптимален, необходимо существование функций m, K, γ, λ, M и H, удовлетворяющих совместно с коэффициентами регулятора P, L перечисленнымниже условиям.1.
Функции m, K являются решением системы уравненийdm(t) = Ã(t)m(t) − B(t)L(t),dt(3.8)dK (t) = Ã(t)K(t) + K(t)ÃT (t)+dtν PTG̃(l) (t)K(t)G̃(l) (t)++l=1hihiT + C̃ (l) (t) + G̃(l) (t)m(t) C̃ (l) (t) + G̃(l) (t)m(t),(3.9)где Ã = A − BP , G̃(l) = G(l) − F (l) P , C̃ (l) = C (l) − F (l) L, с начальнымиусловиямиm(t0 ) = m0 ,K(t0 ) = K0 .(3.10)2. Функции γ, λ, M являются решением системы уравненийdγ(t) = λT (t)B(t)L(t) − 21 LT (t)E(t)L(t)−dtνPT1−2C̃ (l) (t)M (t)C̃ (l) (t),(3.11)dλ (t) = −ÃT (t)λ(t) + S T (t)L(t) + P T (t)E(t)L(t)+dtνPT+M (t)B(t)L(t) − G̃(l) (t)M (t)C̃ (l) (t),(3.12)l=1l=167dM (t) = −M (t)Ã(t) − ÃT (t)M (t) − D(t) + S T (t)P (t)+dtνPT+P T (t)S(t) − P T (t)E(t)P (t) − G̃(l) (t)M (t)G̃(l) (t),(3.13)l=1с условиями, заданными при t = t1 ,γ(t1 ) = 0,λ(t1 ) = 0,M (t1 ) = Q.(3.14)3. Функции P и L удовлетворяют соотношениямP (t) = (E(t) + Θ(t))−1 B T (t)M (t) + Π(t) + S(t) − H(t)K −1 (t) ,(3.15)L(t) = (E(t) + Θ(t))−1 B T (t)λ(t) + Λ(t) + H(t)K −1 (t)m(t) ,(3.16)где ненулевые элементы матрицы H(t) = ℵH ∗ (t), t ∈ T , являются решением уравненияnℵ (E(t) + Θ(t))−1 B T (t)M (t) + Π(t)+(3.17)∗−1+S(t) − (ℵH (t))K (t) = 0.Символом ℵ в уравнении (3.17) обозначен линейный оператор структуры управления [2], который определён на множестве матриц размеров(m × n) и действует на матрицу H ∗ (t) так, что если компонента ui векторастратегии управления зависит от компоненты xj вектора состояния, то соответствующий элемент Hij (t) матрицы H(t) = ℵH ∗ (t) будет равен нулю,в противном случае Hij (t) = Hij∗ (t).Д о к а з а т е л ь с т в о.Соотношения (3.8)-(3.14) непосредствен-ным образом вытекают из подстановки выражений (3.6) в формулы (2.9)(2.11) и (2.4)-(2.7).
При этом из теоремы 3 следует, что для оптимальностилинейного регулятора (3.3) необходимо выполнение равенства ∂I/∂ ũr = 0при почти всех t. Приравнивая к нулю правую часть (3.7) для значений68r = p − m + 1, p, нетрудно получить(E(t) + Θ(t)) L(t) − B T (t)λ(t) − Λ(t) ++ (E(t) + Θ(t)) P (t) − B T (t)M (t) − Π(t) − S(t) m(t) = 0.(3.18)Отсюда следует, что для каждого r = 1, p − m, в свою очередь имеемtr Pr0T (t) [(E(t) + Θ(t)) P (t)−(3.19)−B (t)M (t) − Π(t) − S(t) K(t) = 0.TВсякому r = 1, p − m поставим в соответствие пару индексов ir , jrтак, что Pir jr (t) = ûr (t).
Тогда каждая матрица Pr0 , r = 1, p − m, будетотличаться от нулевой матрицы элементом ir -ой строки и jr -го столбца,равным единице. Следовательно, из (3.19) заключаем, что элемент матрицы (E(t) + Θ(t)) P (t) − B T (t)M (t) − Π(t) − S(t) K(t) с индексами ir , jrбудет равен нулю. Это означает, что соотношение (3.19) может быть переписано при помощи оператора структуры управления ℵ в виде(E(t) + Θ(t)) P (t) − B T (t)M (t) − Π(t) − S(t) K(t) = −ℵH ∗ (t),где H ∗ (t) – некоторая матрица размеров (m × n).Функция M удовлетворяет уравнению (3.13) и условию M (t1 ) = Q.Учитывая исходные предположения относительно матриц D и Q, легко показать, что этого достаточно для неотрицательной определённостиM (t), t ∈ T .
Ввиду положительной определённости E(t) заключаем, чтов этом случае матрица (E(t) + Θ(t)) обратима. При этом K0 здесь такжесчитается невырожденной, а значит и матрица K(t) будет обратимой привсех t, т.е. последняя формула может быть переписана в видеP (t) = (E(t) + Θ(t))−1 B T (t)M (t) + Π(t)+∗−1+S(t) − (ℵH (t))K (t) .(3.20)69Вводя обозначение H = ℵH ∗ , и подставляя (3.20) в (3.18), получим формулы вычисления компонент оптимального линейного регулятора (3.15)-(3.16).Остаётся заметить, что матрица P (t) удовлетворяет условиюℵP (t) = 0, т.к. при учёте информационных ограничений соответствующиеэлементы P (t) принимаются тождественно равными нулю.
Тогда, применяя оператор ℵ к правой части (3.20), получим систему уравнений (3.17). 3.4.Численный метод синтеза оптимальной стратегии управленияЧисленный метод поиска оптимальной стратегии управления с ин-формационными ограничениями в задаче (3.1)-(3.2) незначительно отличается от численного метода, сформулированного в разделе 2.5, ввиду того,что настоящий метод формулируется не на основе теорем 2 и 3, а на основетеорем 2 и 4.Алгоритм поиска оптимальной стратегии управления.Ш а г 1.
Произвольным образом или из дополнительных соображений задать θ – шаг градиентного метода, ε1 , ε2 – требуемые максимальные погрешности приближения, u(0) (t, x) = −(P (0) (t)x + L(0) (t)) – начальную точку приближения, учесть информационные ограничения в задачетождественным занулением нужных компонент матрицы P (0) (t), составитьиз оставшихся элементов матрицы P (0) (t) и вектора L(0) (t) вектор û(0) (t),и положить номер итерации k = 0, количество успешных итераций i = 0.Ш а г 2. Решить (численно) задачи Коши сперва в прямом, а затем и в обратном времени для системы уравнений (3.8), (3.9), (3.11)-70(3.13) с условиями (3.10), (3.14), используя матрицы регулятора P = P (k)и L = L(k) .Ш а г 3.
Вычислить значение критерия J (k) по формуле (2.8). Если k = 0, перейти к шагу 5. В противном случае проверить выполнениеусловия J (k) < J (k−1) : если условие выполнено, увеличить i на единицуи перейти к шагу 4, иначе положить i = 0, P (k) = P (k−1) , L(k) = L(k−1) ,û(k) = û(k−1) , уменьшить θ вдвое, уменьшить k на единицу и перейти к шагу 6.Ш а г 4. Если i = 2, увеличить θ вдвое, положить i = 0.Ш а г 5. Для всех r = 1, p вычислить ∂I/∂ur по формуле (3.7).Ш а г 6. Вычислить величину ||∇I|| по формуле (2.19) и проверитьвыполнение условий ||∇I|| < ε1 , θ < ε2 : если любое из условий выполнено, искомое значение u(t, x) положить равным u(k) (t, x) = −(P (k) (t)x +L(k) (t)) и закончить расчет, иначе вычислить û(k+1) (t) по формуле (2.14),с учётом информационных ограничений составить из полученных элементов коэффициенты P (k+1) (t), L(k+1) (t) и перейти к шагу 7.Ш а г 7.
Увеличить k на единицу и перейти к шагу 2.Разработанный здесь численный метод применяется при решении задачи оптимальной стабилизации спутника с упругой штангой в разделе 5.2.3.5.РезультатыЗадача оптимизации стратегии управления квазилинейной динами-ческой стохастической системой с информационными ограничениями сформулирована в виде частного случая задачи оптимизации программногоуправления квазилинейной стохастической системой, нелинейной по управ-71лению. Это позволило получить следующие результаты:1) сформулированы необходимые условия оптимальности стратегииуправления с информационными ограничениями;2) разработан численный метод поиска оптимальной стратегии управления.Результаты главы опубликованы в работах [69, 77].724.
Субоптимальное управление квазилинейнымисистемамиЧетвёртая глава диссертационной работы посвящена построениюоптимального управления в заранее суженном классе функций достаточнопростой структуры (субоптимального управления) для задач, рассматриваемых в главах 2 и 3.В § 4.1 формулируется понятие субоптимального управления и определяется его структура.Разделы 4.2 и 4.3 содержат необходимые условия субоптимальностии численные методы поиска субоптимального управления в задачах глав 2и 3 соответственно.4.1.Формулировка понятия субоптимального управленияВ общем случае компоненты вектора оптимального управления u(t),удовлетворяющие необходимым условиям оптимальности теоремы 3(в частности матрицы P (t), L(t), определяемые соотношениями (3.15),(3.16) теоремы 4 для стратегии управления u(t, x) вида (3.3)) могут бытьдостаточно произвольными нелинейными функциями времени t. При разработке приближённо-аналитических методов синтеза оптимальных стратегий управления с информационными ограничениями в [68] было предложено аппроксимировать функции в правых частях (3.15), (3.16) рядами73по выбранной системе базисных функций, ортонормированных на заданном отрезке времени.
В результате P (t) и L(t) приобретали несколько более простой вид, соответствующий количеству использованных базисныхфункций.В данной главе предлагается искать управление u(t) (например, компоненты матриц P (t), L(t)) в виде полиномиальных по времени функций.Очевидно, что полученное за счет этого управление уже не будет в общемслучае оптимальным по критерию (2.2) среди всех допустимых функций,но применение такого управления на практике может быть значительновыгоднее в силу его простоты.Для определения структуры управления введём набор параметровs = (s1 , ..., sN ) и обозначим через ũi (t, s), i=1, m, полиномыот t с коэффициентами sj .
Здесь N определяется значением m и заранеевыбранным порядком полиномов. Коэффициенты sj , j = 1, N , требуетсяподобрать так, чтобы минимизировать критерий качества управления J.Таким образом, получена задача безусловной минимизации критериˆальной функции J(z(s)) = J(s),зависящей неявно от s = (s1 , ..., sN ), т.е.необходимо найти значение s такое, чтоˆ = min J(s).ˆJ(s)N(4.1)s∈RО п р е д е л е н и е 3. Управление u(t) = ũ(t, s), где вектор s удовлетворяет условию (4.1), будем называть субоптимальным.З а м е ч а н и е 3. Так как при поиске субоптимального управления ставится задача минимизации функции N действительных переменных(в отличие от задач минимизации функционала, рассматриваемых в гла-74вах 1-3), предлагаемые в данной главе алгоритмы имеют значительно большее сходство по построению и структуре с классическими градиентнымипроцедурами [80].4.2.Субоптимальное управление квазилинейными системами,нелинейными по управлениюВ данном разделе мы будем рассматривать задачу (2.1)-(2.2) и в со-ответствии с определением 3 строить для неё субоптимальное управлениевида u(t) = ũ(t, s).Т е о р е м а 5.