В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем, страница 28
Описание файла
PDF-файл из архива "В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем", который расположен в категории "". Всё это находится в предмете "механика управляемых систем" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 28 страницы из PDF
Зная y i (tk ), можно вычислить ∂y∂ϕi (t ) и получить краеkвые условия для сопряженной системы.Теперь можно независимо проинтегрировать сопряженную систему (28.8) справа-налево, вычисляя правые части в (28.8) Hy (y i (t)) какфункции времени.2) Промежуточное управление находится из решения задачи ПМПũi (t) = max H(ψ i (t), y i (t), u).u(t)∈U3) Следующее приближение вычисляется по формулеui+1 = ui + αi (ũi − ui ),где αi подбирается из условия, чтобы J(ui+1 ) < J(ui ).Как видим схема данного метода полностью совпадает со схемойусловного градиента. Сходимость этого метода в общем случае не доказана.Известны различные модификации, для которых при некоторыхограничениях доказана сходимость в пространстве состояний.2.
Алгоритм проектирования точки на множестводостижимостиРассмотрим линейную систему (28.1) и следующий функционалJ(u) = ϕ0 (x(tk )) = x(tk ) − xc 2 →min ,u(·)≤μгде xc — фиксированная точка, не принадлежащая множеству достижимости, построенному в момент времени tk : xc ∈ Ωu (tk ).Мы хотим найти минимальное расстояние между xc и точкамимножества достижимости.Метод условного градиента в этой задаче строится аналогично предыдущему примеру, но решение сопряженной системы (28.2)ищется c другим краевым условием:ψ(tk ) = −2(x0 (tk , u) − xc ).(28.10)203Сходимость метода условного градиента существенно зависит оттого, насколько далеко точка xc находится от границы множества достижимости.
Если точка близка к границе, то необходимо использовать методику подбора коэффициента αi на каждом шаге алгоритма.3. Максиминное тестирование качества стабилизацииРазработка сложных систем управления всегда включает в себяэтап испытания и тестирования созданных алгоритмов управления динамической системой. Как правило, такая проверка проводится путеммоделирования условий работы алгоритма самим коллективом разработчиков алгоритмов. При этом существенно, что сам алгоритм управления известен системе, с помощью которой проводится тестирование.
Другая ситуация, когда необходимо провести приемку и выборлучшего алгоритма из нескольких, причем созданных разными разработчиками. В этом случае, как правило, сам алгоритм неизвестен ипредставляет «черный ящик», в котором известны только вход и выход.Аналогичная проблема возникает, когда надо проверить работучеловека-оператора или пилота, так так в этих случаях структура алгоритма управления тоже неизвестна.Для того, чтобы объективно получить оценку качества управления, а также провести тренировки пилотов-операторов с целью улучшения показателя качества, необходимо создать проверочный стенд.Сам стенд может иметь различный уровень сложности — быть чистокомпьютерным, либо и компьютерным, и динамическим, быть полунатурным, т.е. включать отдельные элементы системы управления внатуральном виде (это может быть сам человек-оператор, либо микроконтроллер с зашитыми алгоритмами управления).Все стенды должны содержать модель динамики управляемогообъекта и, кроме того, если стенд динамический, нужно так организовать движение стенда, чтобы имитировать условия реального движения для измерителей и сенсорных систем пилота.
Таким образом,очень важно создать на стенде соответствующую реальным условиям визуальную обстановку. Имея в распоряжении такой стенд, можнопроверять либо качество работы алгоритмов управления, либо навыкипилота по управлению динамическим объектом.Часто требуется проверить качество алгоритмов управления вэкстремальных условиях их функционирования. Это характерно, на204uАлгоритмыуправленияx̃СенсорыСредаИсполн. Движущийся xмеханизмы(Имитаторыобъектдвижения)vvxx̃uАлгоритмы тестированияРис. 28.3. Структурная схема тестирующего стендапример, при разработке космических систем, где цена ошибки непомерно высока. Для этого надо моделировать динамику управляемогообъекта при наихудшем поведении возмущений (параметров, мешающих управлению), действующих на управляемый объект. Следовательно, в процессе проверки алгоритма либо тренировки надо решатьзадачу поиска этих наихудших возмущений.Структурная схема такого тестирующего стенда представлена нарис.
28.3.Рассмотрим более подробно функционирование системы тестирования на примере решения задачи об оценке точности алгоритмов стабилизации программного движения.Если система стабилизации сконструирована достаточно хорошо,то реальное движение будет осуществляться в окрестности программного движения и можно рассматривать линейную систему уравненийв отклонениях при наличии внешних возмущений vẋ = Ax + Bu + Cv,x(0) = x0 ∈ X 0 ,(28.11)где u(·) ∈ U, v(·) ∈ V — ресурсы управления и возмущения, а X 0 —область начальных возмущений.Поставим задачу: оценить точность стабилизации для некоторогоуправления ũ = ũ(x, t) в заданный момент времени tk в смысле следующего функционала⎛s5634где Es = ⎝ 10...0J(u, v) = x(tk ) Es x(tk ),⎞0...
⎠,1 0 ............ ... 0т.е. по отклонениям в момент tk первых sкоординат.Следующие две задачи составляют дифференциальную антагонистическую игру между управлением и возмущением:205а) управление стремится минимизировать критерий качестваJ(u, v) → min;u∈Uб) возмущение же стремится его максимизировать J(u, v) →max.v∈VЗадача системы тестирования — сформировать те наихудшие возмущения, при которых будет происходить тестирование алгоритмауправления на стенде.Предположим, что указанную дифференциальную игру будем решать в классе программных стратегий, т.е. u(t) ∈ U и v(t) ∈ V —функции времени.Сделаем замену x = y − z, тогда систему (28.11) можно представить в виде двух подсистемẏ = Ay + Cv,y(0) = y0 ∈ X 0 ,(28.12)ż = Az − Bu,z(0) = 0.(28.13)Критерий качества (функционал) представим как квадрат расстояния фазовых векторов этих подсистем в конечный момент tk :J(u, v) = (y − z) Es (y − z) = 2 (y, z).Для простоты считаем, что s = n.Множества точек z(tk ) ∈ Ωu и y(tk ) ∈ Ωv при всевозможном допустимом поведении управлений u(t) ∈ U и возмущений v(t) ∈ V составляют множества достижимости систем (28.13) и (28.12), соответственно.
Ограничения на управление и возмущение таковы, что множества достижимости Ωu , Ωv — ограниченные выпуклые замкнутыемножества.¾ ¾ªÚ¼¼ªÙ0½ ½Рис. 28.4. Седловая точка геометрической игры206Таким образом, дифференциальная игра между управлением u ивозмущением v свелась к геометрической игре на множествах достижимости между z(tk ) и y(tk ):а) минимакс:max (y, z) → min ;y∈Ωvб)максимин:z∈Ωumin (y, z) → max .z∈Ωuy∈ΩvПокажем, что всегда выполнено неравенствоmax min (y, z) ≤ min max (y, z)y∈Ωv z∈Ωuz∈Ωu y∈ΩvДействительно, зафиксируем y = y .
Тогда ∀z ∈ Ωu (y , z) ≤max (y, z), откудаy∈Ωvmin (y , z) ≤ min max (y, z) = 0z∈Ωuz∈Ωu y∈Ωvпоскольку это неравенство выполнено при любом y , то0 = max min (y, z) ≤ 0y∈Ωv z∈ΩuСедловая точка геометрической игры существует, если 0 = 0 =(y , z 0 ). Величина 0 называется ценой игры.Оптимальная стратегия тестирования существует, если существует седловая точка дифференциальной игры.В этом случае методика максиминного тестирования проводится втри этапа по следующей схеме:1) находим решение задачи на максимин и, соответсвенно, цену игры 0 = (y 0 , z 0 );2) моделируем на стенде подсистему (28.13) с тестируемым алгоритмом управления ũ (проводим тренировки пилота) и вычисляем точку z̃(tk ).Тогда 0 ≤ (y 0 , z̃) = ˜ и, следовательно, ˜ = (y 0 , z̃) ≥ 0 ;3) вычисляем оценку результатов тестирования по десятибальнойшкале 10 · ˜0 .При этом существование седловой точки соответствует возможности для пилота (автоматического алгоритма) получить «отличную»оценку.
Таким образом, максиминное тестирование в этом случае даетобъективную оценку качества управления.Как видим, существенное место при формировании тестовых возмущений занимает выяснение условий существования седловой точкив геометрической игре на множествах достижимости. Известно много различных критериев существования седловой точки в геометрической игре.
Например, если пара (z 0 , y 0 ) составляет седловую точку,0207то, как показано на рис. 28.4, в этих точках существуют опорные гиперплоскости к множествам достижимости Ωu и Ωv , которые параллельны между собой и перпендикулярны отрезку [z 0 , y 0 ].Заметим еще, что только единственная точка z 0 множества достижимости подсистемы по управлению Ωu может составлять седловуюточку игры (z 0 , y 0 ), тогда как решений по возмущению y 0 может бытьбесконечно много.Существуют численные итерационные алгоритмы поиска седловойточки геометрической игры, которые представляют собой комбинацию алгоритма решения задачи Булгакова, рассмотренной в п.1 и задачи проектирования точки на множество, рассмотренной в п.2.Если седловой точки не существует, то можно перейти к так называемому смешанному расширению игры.Процедура перехода к смешанному расширению дана в дополнении к лекции 28.208Дополнения к лекциямВ Дополнения к лекциям вошли только те материалы, которые непосредственно примыкают к материалам лекций — либо их развивают, либо дополняют.
В лекции они не вошли из-за недостатка времени, отводимого на чтениекурса.Дополнение к лекциям 5–7. Декомпозиция алгоритмов управления и оценивания по компонентамсоответственно вектора управления и вектора наблюденияРассмотрим задачу построения алгоритмов управления для систем снесколькими управляющими входами (величина u — вектор). Для простоты, но не нарушая общности, будем считать, что вектор u двумерный: u ==(u1 u2 ). Тогда уравнения управляемой системы можно представить в видеẋ = Ax + u1 b1 + u2 b2 ,B = (b1 b2 ).(D5.1)Введем две последовательностиg 1 = b1 , g 2 = Ag 1 , . . . , g j+1 = Ag j , .