В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем, страница 32
Описание файла
PDF-файл из архива "В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем", который расположен в категории "". Всё это находится в предмете "механика управляемых систем" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 32 страницы из PDF
Параметрический резонанс1C4 = 0, C3 = √ > 0.lИз вида решений следует, что выражение ψ2 (t)y1 (t) меняет знак в моментπ.времени τ − t0k = − 2√lНа отрезке времени [t0 , τ ] решение системы продолжается с управлениемu0 (t) = m.Из краевого условия y1 (t0 ) = 1 и гладкости y1 в точке τ следуетπt0 − τ = − √2 mππt0k − t0 = √ + √ ,2 m2 l> 1 — возрастание амплитуды на одном полуколебании.аα= mlЕсли продолжить решение на следующих полуколебаниях системы аналогичным образом, то получим неограниченное возрастание возрастание амплитуды колебаний (см. рис.
D24.2). В силу полученного решения верно соотношение sign ψ2 = sign y2 и можно осуществить синтез оптимального управленияlпри y1 y2 > 00u (y1 , y2 ) =m при y1 y2 < 0.Проверим условия регулярного синтеза Болтянского (см. рис. D24.3).Мн-во N = {0} — начало координат.Область G = R2 \ {0}.Терминальное множество M = {y2 = 0} — ось абсцисс.Множество нульмерных клеток P0 = ∅ — пусто.Множество одномерных клеток P1 = {y1 = 0} линия переключения, осьординат.Множество двумерных клеток P2 — набор координатных четвертей.228ẏP1u0 ≡ mu0 ≡ lP21P24P22 1P23u0 ≡ lMα2yu0 ≡ mРис. D24.3.
Регулярый синтезТаким образом, в данной задаче выполнены условия регулярного синтезаи, следовательно, построено глобально-оптимальное решение.Дополнение 2 к лекции 24. О достаточности принципа максимума в общем случае.На лекции 24 было рассказано о достаточности принципа максимумаПонтрягина (ПМП) для линейной задачи быстродействия. В предыдущемприложении приведен результат В.Г. Болтянского о достаточности ПМП вформе синтеза, когда управление имеет конечное число переключений.В 2003 году А.В. Арутюновым [13] была доказана теорема о ПМП какнеобходимом и достаточном условии минимума. Сформулируем эту теоремудля задачи, когда математическая модель управляемой системы имеет видt ∈ [t0 , tk ], где y ∗ , tk — заданы,ẏ = f (y, u), y(t0 ) = y ∗ ,u(·) ∈ U = {u(·) ∈ L∞ ([t0 , tk ], Rs )u(t) ∈ Ω ⊂ Rs },(D24.2)где Ω — ограниченное, замкнутое выпуклое и регулярное множество [13], аy(tk ) ∈ M = {ϕi = 0,i = 1, .
. . , m < n}.Критерий качестваtkf0 (y, u, t)dt + ϕ0 (y(tk )) → min .J(u) =t0u(·)∈UВсе функции являются гладкими по y, u и измеримыми по t.Определение 23. Допустимый процесс {y 0 (·), u0 (·)} является понтрягинским локальным минимумом, если существует δ > 0 такое, чтодля любого допустимого управления u(·) ∈ U, для которого u0 (·) −u(·)L1 < δ и |y 0 (tk ) − y(tk )| < δ выполняется неравенство J(u(·)) ≥J(u0 (·)).229Из определения следует, что в рассматриваемом нами случае управляемый процесс, являющийся сильным локальным минимумом (см. лекцию 23),является одновременно и понтрягинским локальным минимумом.Функция Понтрягина имеет вид H(ψ, y, u) = ψ f (y, u) − λ0 f0 (y, u, t), алагранжиан — L = ψ ẏ − H.Теорема 37.
Для того, чтобы допустимый управляемый процесс{y 0 (·), u0 (·)} являлся понтрягинским локальным минимумом, необходимо и достаточно существование ненулевого вектора (λ0 , λ1 , . . . , λm )при λ0 ≥ 0, ε ≥ 0 и абсолютно непрерывной вектор-функции(ψ1 (t), . . . , ψn (t)) таких, что выполнены следующие условия:1.функция ψ(t) является решением уравнения Эйлера∂L0d ∂L0+=0dt ∂ ẏ∂yилиψ̇ = −2.f (y 0 (t), u0 (t))∂yψ + λ0;условие трансверсальности при t = tkψ (tk ) = −mj=03.f0 (y 0 (t), u0 (t), t)∂yλj∂ϕj (y 0 (tk ));∂yусиленное условие максимума по управлениюH(ψ(t), y 0 (t), u0 (t)) ≥ H(ψ(t), y 0 (t), u(t)) + ε|u0 (t) − u|2при всех u ∈ Ω и почти всюду по t ∈ [t0 , tk ], гдеε = 0 при рассмотрении необходимости;ε > 0 при рассмотрении достаточности.Дополнение к лекции 28. О смешанных стратегияхреализации игрыВ том случае, когда седловой точки в игровой задаче методики тестирования не существует, можно перейти к так называемому смешанному расширению игры.Процедуру перехода к смешанному расширению объясним в случае, когдарассматривается игра на конечном множестве стратегий управления и возмущения.Обозначим ui = ui (t) ∈ U, i = 1, 2, .
. . , n, а vj = vj (t) ∈ V ,j = 1, 2, . . . , m — конечный набор стратегий по управлению и возмущениюв задаче стабилизации.230Перебирая все стратегии, можно составить матрицу⎛J(u1 , v1 ) J(u2 , v1 ) . . . J(un , v1 )⎜ J(u1 , v2 ) J(u2 , v2 ) . . . J(un , v2 )R=⎜⎝............J(u1 , vm ) J(u2 , vm ) . . . J(un , vm )⎞⎟⎟⎠которая называется матрицей игры.
Обозначим Rij = J(ui , vj ) и вычислим0 = maxj mini Rij и 0 = mini maxj Rij . Если 0 = 0 , то игра имеет седловую точку в чистых стратегиях ui и vj .Пример 1. Игра против природы.Пусть природа имеет два состояния: дождь и сухо. При прогулке в сухуюпогоду без плаща турист получает удовольствие в 10 баллов, а в плаще — 8баллов. Прогулка под дождем в плаще приносит 7 баллов, а без плаща — 1балл. Отказ от прогулки приносит 0 баллов. Таким образом у туриста 3 стратегии: 1) выйти без плаща; 2) выйти в плаще; 3) отказаться от прогулки.Матрица игры выглядит следующим образом1 7 0R=.10 8 0В этой игре есть седловая точка: mini maxj Rij = maxj mini Rij = 7, соответствующая стратегии природы — «дождь» и стратегии туриста — «прогулка в плаще». И туристу и природе в этой игре невыгодно отклоняться отих оптимальных стратегий, при которых они получают гарантированный выигрыш в 7 баллов.Пример 2.
Приведем пример матричной игры, где не существует седловой точки:Пусть стратегии управления ui = i, i = 1, 2, 3, 4, стратегии возмущенияvj = j, j = 1, 2, 3, 4, а функционал представляет расстояние между точкамиi, j,то есть Rij = J(ui , vj ) = |i − j|. Тогда матрица игры⎛⎞0 1 2 3⎜1 0 1 2⎟⎟R=⎜⎝2 1 0 1⎠3 2 1 0В этой игре 0 = mini maxj Rij = 2 > 0, а 0 = maxj mini Rij = 0, то естьседловой точки не существует и следовательно не существует чистой максиминной оптимальной стратегии возмущений, (также и управлений) дающейгарантированный результат.В случае, когда не существует седловой точки игры в чистых стратегиях,можно перейти к смешанному расширению игры, когда стратегиивыбираютсяслучайным образом.
Рассмотримξ = (ξ1 , . . . , ξn ), где ni=1 ξi = 1,векторыη=1,η≥0,которыеимеютсмыслξi ≥ 0 и η = (η1 , . . . , ηm ),где mjjj=1231вероятности выбора стратегии ui и vj соответственно. В качестве критерияигры теперь рассмотрим математическое ожидание исходного функционалаK(ξ, η) = M [J(u, v)] =mn Rij ξi ηj .i=1 j=1Можно записать K(ξ, η) = (η R)ξ = η (Rξ). Стратегии ξ, η в расширенойигре называются смешанными.В матричной игре можно считать Rij > 0, поскольку если добавить положительную константу ко всем элементам матрицы R, то игра не меняется.Теорема 38. Всякая матричная игра имеет седловую точку в смешанных стратегиях.Доказательство.С каждой расширенной игрой можно связать пару задач линейного программирования следующим образом.Рассмотрим вектор p = (1, 1, . .
. , 1) состоящий из n единиц и вектор w =(1, 1, . . . , 1) состоящий из m единиц.Составим задачу линейного программированияmin η wηη R ≥ p ,η≥0(D28.3)и двойственную к нейmax ξ pξRξ ≤ w,ξ ≥ 0.(D28.4)Поскольку Rij > 0 то в первой задаче существует допустимое решение,если выбрать элементы вектора η достаточно большими.Во второй игре решение ξ = 0 тоже является допустимым. В теории линейного программирования доказывается, что в этом случае существует решение первой и второй задачи и они совпадают по функционалу. Обозначимэто решениеη w = ξ p = r0 > 0.Произведем замену η ∗ = rη0 ≥ 0 и ξ ∗ = rξ0 ≥ 0.
∗Тогда выполнены условия ηj∗ = 1 иξi = 1 и η ∗ , ξ ∗ являются решением смешанной задачи.Поскольку w ≥ Rξ а η R ≥ p , тоr0 = η w ≥ η (Rξ) = (η R)ξ ≥ p ξ = r0 ,откуда следует η Rξ = r0 .232Вычислим функционал смешанной задачиK(ξ ∗ , η ∗ ) = η ∗ Rξ ∗ =(η Rξ)1= .r02r0Пусть теперь ξ и η — произвольные смешанные стратегии управления ивозмущения. Тогда выполненоK(ξ , η ∗ ) = η ∗ Rξ =1 11η Rξ ≥ p ξ == K(ξ ∗ , η ∗ )r0r0r0и111≤ η w == K(ξ ∗ , η ∗ ),r0r0r0откуда следует существование седловой точки в смешанных стратегиях.Замечание 19. Заметим, что в отличие от случая существования седловой точки в чистых стратегиях процедура тестирования усложняется, поскольку этап 2 надо проводить многократно, моделируя случайный выбор стратегии возмущений в соответствии с вероятностями, заданными вектором η ∗ .Усложняется и третий этап процедуры, поскольку для полученияобъективной оценки качества управления надо вычислить статистические показатели (доверительные интервалы) оценки тестирования.Переход к смешанному расширению игры возможен и в случае, когда обаигрока имеют бесконечное множество стратегий.
Однако, в отличие от конечномерного случая, здесь седловая точка в смешанных стратегиях может несуществовать. Даже сам средний выигрыш зависит от выбора вероятностныхмер, связанных с множествами стратегий U и V .Если множества стратегий U и V представляют собой метрические компакты, а функция выигрыша J(u, v) непрерывна по совокупности переменных, то седловая точка ( цена игры ) для смешанного расширения игры существуют [31].Более того, если цена игры выпукла по u для каждого v/inV и множество стратегий U выпукло (заметим, что эти свойства выполняются для рассматриваемой в задаче тестирования дифференциальной игры, которая можетбыть редуцирована к геометрической игре, где функция выигрыша представляет расстояние между точками множеств достижимости подсистем по управлению и по возмущению), то выполнены следующие замечательные свойстваструктуры оптимального решения:а) существует цена игры K0 , равнаяK(ξ ∗ , η ) = η Rξ ∗ = η RξK0 = min max J(u, v).u∈U v∈Vб) оптимальное решение первого игрока u существует в чистых стратегиях;233в) спектр оптимальной смешанной стратегии второго игрока v конечени состоит не более, чем из n + 1 точки множества V .Пример 3.
Тестирование точности сближения космического модуляс орбитальной станцией.Станция движется с постоянной скоростью по круговой орбите. Относительно нее в плоскости орбиты движется модуль, снабженный продольными(маршевыми) и боковыми реактивными двигателями.
Программное движениемодуля в задаче сближения реализуется с помощью маршевых двигателей исостоит из участка разгона, участка свободного движения с постоянной скоростью и участка торможения. Линеаризованные уравнения в отклонениях отпрограммного движения имеют вид:⎧ẋ1⎪⎪⎪⎪⎪⎪ẋ2⎪⎪⎪⎨ ẋ3⎪ẋ4⎪⎪⎪⎪⎪ẋ5⎪⎪⎪⎩ẋ6= x2 ,= vr (t),= x4 ,= −x5 up (t),(D28.5)= x6 ,= Mr (t)/Bz .Здесь x = (x1 , x3 ) — отклонение от программной траектории в плоскостидвижения космического модуля, x5 — отклонение по углу от программногодвижения, up (t) — программное управление маршевыми двигателями (заданные функции времени), u(·) ∈ U = {u(·) ∈ L∞ [t0 , t1 ] |u(t)| ≤ f, f = const }— стабилизирующее боковое управления, vr (t) — ошибка тяги маршевыхдвигателей, Mr (t) — возмущающий момент, связанный с разнотяговостьюмаршевых двигателей, Bz — момент инерции модуля. Предположим, что начальные условия x(t0 ) = x0 фиксированы.С помощью боковых двигателей космонавт пытается уменьшить отклонение от станции в момент причаливания — критерий качества управленияимеет вид J = x21 (tk ) + x23 (tk ).