Диссертация (Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению), страница 11
Описание файла
Файл "Диссертация" внутри архива находится в папке "Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению". PDF-файл из архива "Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 11 страницы из PDF
Разработанное программное обеспечениесостоит из 4-х обособленных программных модулей, каждый из которыхвключает в себя 3 основных блока (блок ввода исходных данных, блокпоиска управления, блок моделирования процесса управления и выводарезультатов). При этом блоки в каждом из модулей имеют свои отличительные особенности в зависимости от решаемой задачи.• Модуль поиска оптимального программного управления квазилинейной стохастической системой, нелинейной по управлению – реализуеталгоритм численного поиска из раздела 2.5, в качестве исходных данных вводятся матрицы системы (2.1) и критерия (2.2), которые могутнелинейно зависеть от времени t и компонент вектора управленияui , i = 1, m, результатом вычислений является численное приближение функции u(t), удовлетворяющей необходимым условиям оптимальности теоремы 3.• Модуль синтеза оптимальной стратегии управления квазилинейнойстохастической системой с информационными ограничениями – реализует алгоритм численного поиска из раздела 3.4, в качестве исходных данных вводятся матрицы системы (3.1) и критерия (3.2), которые могут нелинейно зависеть от времени t, результатом вычисленийявляется численное приближение коэффициентов P (t), L(t) линейного регулятора, удовлетворяющего необходимым условиям оптималь-83ности теоремы 4.• Модуль поиска субоптимального программного управления квазилинейной стохастической системой, нелинейной по управлению – реализует алгоритм численного поиска из раздела 4.2, в качестве исходныхданных вводятся матрицы системы (2.1) и критерия (2.2), которыемогут нелинейно зависеть от времени t и компонент вектора управления ui , i = 1, m, результатом вычислений является численное приближение функции u(t), имеющей вид полинома от t заданной степени и удовлетворяющей необходимым условиям субоптимальноститеоремы 5.• Модуль синтеза субоптимальной стратегии управления квазилинейной стохастической системой с информационными ограничениями –реализует алгоритм численного поиска из раздела 4.3, в качестве исходных данных вводятся матрицы системы (3.1) и критерия (3.2), которые могут нелинейно зависеть от времени t, результатом вычислений является численное приближение коэффициентов P (t), L(t) (имеющих вид полиномов от t заданной степени) линейного регулятора,удовлетворяющего необходимым условиям оптимальности теоремы 6.Описание логической структуры.
Логическая структура является общей для всех программных модулей комплекса с учётом изложенных вышеотличий. Такая общность основывается на том, что все алгоритмы, описанные в диссертации, построены по одному и тому же принципу.На рисунке 9 приведена блок-схема работы программных модулей.84Интервал времени и размерности векторовБлок вводаисходныхданныхМатричные функцииНачальные данные для работы алгоритма:- шаг градиентного метода;- требуемые максимальные погрешности;- начальная точка приближения.Требуемые дополнительные данные:- информационные ограничения;- порядок полиномов(для поиска субоптимального управления).Блок поискауправленияВыполнение расчётов (реализация алгоритма)Моделирование процесса управленияГрафическое представлениерезультатовСохранение результатовБлок моделированияпроцесса управленияи вывода результатовРисунок 9.
Блок-схемаВо всех вычислениях интервал времени проходится с шагом h, заданном в блоке поиска управления перед выполнением расчётов. Интегрирование дифференциальных уравнений осуществляется с помощью отдельносоставленной программной реализации метода Рунге-Кутты 4-го порядка точности. При вычислении определённых интегралов в формулах (4.3)и (4.6) используется метод трапеций. Моделирование процесса управлениясистемой осуществляется методом Эйлера.855.2.Задача оптимального управления двухзвенным манипуляторомРассмотрим следующую задачу [81].
На горизонтальной плоскости на-ходится двухзвенный механический манипулятор, каждое звено которогопредставляет собой абсолютно жесткий стержень длиной li , i = 1, 2 (см. рисунок 10).l2O2l1O1C1φ1φ2C2u2u1xРисунок 10. Механический манипуляторПервое звено соединено с неподвижным основанием манипуляторавращательной парой O1 , а со вторым звеном – вращательной парой O2 .Масса схвата манипулятора – m, центр масс i-го звена находится в середине стержня – точке Ci , его масса – mi , момент инерции i-го звенаотносительно своего центра масс – Ii , i = 1, 2. В соединительных парах могут развиваться управляющие вращательные моменты: соответственно u1и u2 . Известно положение ϕ1 = ϕ∗1 , ϕ2 = ϕ∗2 , в котором требуется стабилизировать манипулятор.Линеаризованные уравнения движения манипулятора в окрестности86ϕ∗1 , ϕ∗2 имеют видẋ = Ax + Bu,где x = (x1 , x2 , x3 , x4 )T , x1 = ϕ1 − ϕ∗1 , x2 = ϕ2 − ϕ∗2 , x3 = ϕ̇1 , x4 = ϕ̇2 , u =(u1 , u2 )T ,0 00 0A=0 00 00 0 0 0 0 11, B =,2ab−c0 0 b −c −c a0 01 0a = 1/4 l12 (m1 + 4m2 + 4m) + 4I1 ,b = 1/4 l22 (m2 + 4m) + 4I2 , c = 1/2(2m + m2 )l1 l2 cos(ϕ∗1 − ϕ∗2 ).Предполагается, что на движение манипулятора и процесс управления оказывает влияние вектор случайных воздействий, имеющий две компоненты.
Будем также считать, что управление осуществляется в условиях информационных ограничений, отражающих невозможность полученияполной информации о состоянии. Выбраны следующие характеристики манипулятора: m1 = m2 = m = 30 кг; l1 = l2 = 1 м; I1 = I2 = 5/2 кг·м2 ;ϕ∗1 = ϕ∗2 .Цель управления состоит в переводе манипулятора из случайногоначального состояния, определяемого математическим ожиданием m0 =(0, 0, 0, 0)T и матрицей ковариаций K0 = diag(0.2, 0.2, 0.2, 0.2) вектора x0 ,в состояние, наиболее близкое к точке x∗ = (0, 0, 0, 0)T . При этом требуетсяминимизировать затраты на управление.
Цель должна быть достигнута завремя T = 5 c.87Таким образом, задача принимает видdx(t) = (Ax(t) + Bu(t, x)) dt + g(u(t, x))dw(t),Z5 Z J=Z 1 T1 Tu Eu p(t, x)dxdt +x Q x p(5, x)dx → min,220 R4R40 00 0A=0 00 0x(0) = x0 ,0.5 0.1g(u) = 0.25u10.15u11 00 0000 11 , B =,1550 0 8 −9 0 0−9 140.115 0 0 150.5 10,E = ,Q = 0.15u2 0 1 0 00.25u20 0000 0 .10 0 0 10Полученная задача представляет собой задачу оптимизации обыкновенной квазилинейной стохастической системы при неполной информациио состоянии, изучаемой в главе 3 и разделе 4.3.
Для синтеза стратегииуправления простого вида воспользуемся постоянными по времени матрицами P (t) ≡ P̃ , L(t) ≡ L̃ и предложенным в разделе 4.3 алгоритмом поискасубоптимальной стратегии управления с информационными ограничениями вида u(t, x) = −(P̃ x + L̃). Результаты вычислений представлены в таблице 5. Запись вида u2 (t, x2 , x3 ) определяет информационные ограниченияна компоненту вектора управления u2 и означает, что u2 зависит от x2 , x3 ,но не зависит от x1 , x4 .Таблица 5. Результаты решения задачи (субоптимальный линейныйрегулятор с постоянными по времени коэффициентами)88Номерварианта12345ПустьИнформационныеограниченияu1 (t); u2 (t)u1 (t); u2 (t, x2 , x3 )u1 (t, x1 , x2 , x4 ); u2 (t)u1 (t, x2 , x4 );u2 (t, x1 , x2 , x4 )u1 (t, x1 , x2 , x3 , x4 );u2 (t, x1 , x2 , x3 , x4 )теперьточноизвестноJ87.1177.5979.8863.81||∇I||0.0250.140.2950.768Количествоитераций715205753.970.9969начальноесостояниеx0=(0.6, −0.3, −0.095, 0.04)T , тогда, применяя найденные для разных случаевинформированности субоптимальные стратегии управления, получимследующие результаты моделирования процесса управления (см.
рис.11-16).Рисунок 11. Графики ϕ1 (t)89Рисунок 12. Графики ϕ2 (t)Рисунок 13. Графики ϕ̇1 (t)90Рисунок 14. Графики ϕ̇2 (t)Рисунок 15. Графики u1 (t, x(t))91Рисунок 16. Графики u2 (t, x(t))На манипулятор действуют небольшие случайные возмущения,управление реализуется со случайными ошибками. На графиках видно, чтос помощью достаточно малых вращательных моментов можно получитьнезначительные отклонения звеньев манипулятора от требуемого положения в конечный момент времени. Это вполне соответствует целям управления.Для определения точности приближения синтезированных субоптимальных стратегий управления к оптимальным сравним полученные результаты с результатами, найденными при использовании численного метода раздела 3.4, построив относительную погрешность их приближения всмысле функционала J (см.
таблицу 6).Таблица 6. Сравнение оптимальных и субоптимальных стратегий92№12345Информационныеограниченияu1 (t); u2 (t)u1 (t); u2 (t, x2 , x3 )u1 (t, x1 , x2 , x4 ); u2 (t)u1 (t, x2 , x4 );u2 (t, x1 , x2 , x4 )u1 (t, x1 , x2 , x3 , x4 );u2 (t, x1 , x2 , x3 , x4 )ПроведёмцессатакжеуправленияJопт86.1476.5978.3962.66Jсубопт87.1177.5979.8863.81Относительнаяпогрешность, %1.11.31.91.852.9853.971.9сравнениеприизвестномрезультатовначальноммоделированиясостоянииx0про=(0.6, −0.3, −0.095, 0.04)T для одного из вариантов информационныхограничений (вариант №3: u1 = u1 (t, x1 , x2 , x4 ); u2 = u2 (t)) (см. рис.17-22).Рисунок 17.
Графики ϕ1 (t)93Рисунок 18. Графики ϕ2 (t)Рисунок 19. Графики ϕ̇1 (t)94Рисунок 20. Графики ϕ̇2 (t)Рисунок 21. Графики u1 (t)95Рисунок 22. Графики u2 (t)Как видно из графиков, несмотря на существенное упрощение субоптимальных стратегий управления в сравнении с оптимальными, в некоторых случаях удаётся получить качественно неплохие результаты уже прииспользовании постоянных по времени функций (полиномов нулевой степени).