В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем, страница 31
Описание файла
PDF-файл из архива "В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем", который расположен в категории "". Всё это находится в предмете "механика управляемых систем" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 31 страницы из PDF
Решение переопределеннойсистемы (D14.1) в соответствии с этим методом ищем как решение, минимизирующее функционал J(x):J(x) = Hx − z2 = (Hx − z)T (Hx − z).(D14.2)Известно, что любая матрица H(m × n) ранга k представима в виде сингулярного разложенияH = U SV T .Здесь U (m × m), V (n × n) – ортогональные матрицы,Sk 0, Sk = diag(s1 , s2 , .
. . , sk ),S =0 0s1 ≥ s2 ≥ . . . ≥ sk > 0.(D14.3)Величины sj (j = 1, . . . , k) называются сингулярными числами и определяются следующим образом:sj = λj ,где λj — корни характеристического уравнения матрицы H H. Очевидно,если H максимального ранга, то λj > 0. Далее будем предполагать, что этоусловие выполнено и матрица S такова:SnS=.0Сделаем невырожденные (ортогональные) замены (y — новый вектор состояния, g — новый вектор измерения):y = V T x,g = UT zи представим вектор g в видеgI, где gI (n × 1),g=gIIgII (m − n) × 1.Вследствие ортогональности использованных преобразований очевидно, чтоmin Hx − z2 = min Sy − g2 .xy221Согласно (D14.3)Sy − g2 = Sn y − gI 2 + gII 2 ,Sn y = gII .Оценка y имеет вид:ỹ = SI−1 gI ,(D14.4)или, в скалярной форме,ỹj =gj,sj(D14.5)j = 1, 2, .
. . , n.Найдем ошибку оценки. Имеемg = Sn y + r ,r = U T r,M [r r T ] = σ 2 E.Из (D14.5) следует:Δyj = yj − ỹj = −rj,sjM [Δy 2 ] =σ2.s2jОшибка оценки величины y, порожденная погрешностью информации о векторе g, усиливается с коэффициентом усиления 1/sj и, стало быть, число сингулярности может служить количественной мерой оцениваемости.Если сингулярное число мало, то часто оказывается целесообразным вкачестве оценки соответствующей переменной принять нуль и тем самымпонизить порядок оцениваемого вектора. Понижение порядка оцениваемоговектора называется редукцией.Приведем без доказательства две важные для приложений теоремы, вопервых, показывающие, что сингулярные числа устойчивы к возмущениямматрицы H т.е.
малые изменения элементов матрицы H приводят к малымизменениям чисел sj , и, во-вторых, обосновывающие процедуру редукции.Теорема 34. Пусть A, B, Γ — матрицы размерности (m × n) и m ≥ n,Γ = A−B. Обозначим сингулярные числа этих матриц, упорядоченныепо невозрастанию, соответственно через αj , βj , γj . Тогда|βj − αj | ≥ γj .Теорема 35. Пусть A — матрица размерности (m × n) и B — матрица размерности (m × (n − 1)), полученная из A вычеркиванием n-гостолбца.
Если занумеровать сингулярные числа матрицы B в порядкеневозрастания, то они будут разделять сингулярные числа αj матрицы A следующим образом:α1 ≥ β1 ≥ α2 ≥ β2 ≥ . . . ≥ αn−1 ≥ βn−1 ≥ αn ≥ 0.2222. Стохастическая мера оцениваемости.Пусть x = (x1 , x2 , . . . , xn ) — случайный вектор с априорным математическим ожиданием μx и ковариацией Px , {Z} — совокупность измерений,коррелированных с x, x̃ — оценка вектора x, доставляемая алгоритмом L:x̃ = L[{Z}].Стохастическая мера оцениваемости μα скалярной величины α = cT x,c = (c1 , c2 , . .
. , cn )T определяется соотношениемσα − σΔασΔαcT PΔx c,0 ≤ μα ≤ 1, (D14.6)μα ==1−=1−σασαcT Px cгде PΔx – ковариация ошибки оценки Δx = x − x̃.Мера оцениваемости характеризует относительное изменение среднеквадратичного отклонения σΔα ошибки оценки Δα переменной α при ее оценивании посредством алгоритма L.Для приложений важна задача выделения переменных с малыми мерами(если они существуют), которая ставится как задача отыскания стационарных(экстремальных) значений мер в зависимости от направления, определяемоговектором c:∂μα= 0.(D14.7)∂cИз (D14.6) следует, что указанная задача эквивалентна хорошо известнойзадаче приведения одним преобразованием двух квадратичных форм к диагональному виду. Ее решение сводится к отысканию собственных чисел λj ,j = 1, 2, .
. . , n, и собственной матрицы Ψ = (Ψ1 , Ψ2 , . . . , Ψn ) регулярногопучка квадратичных форм PΔx − λPx .Имеют место соотношения|PΔx − λPx |Ψ Px Ψ==0,E,PΔx ΨjΨ PΔx Ψ==λj Px Ψj ,(D14.8)diag (λ1 , . . . , λn ).TTПреобразование y = Ψæ квадратичные формы C Px C и C PΔx C приводитсоответственно к виду æ2j и λj æ2j .Стационарные значения мер определяются соотношениями(D14.9)μj = 1 − λj .Рассмотрим определение мер оцениваемости в задаче оптимальной калмановской фильтрации.Непрерывный фильтр Калмана. Матрицы Px и PΔx находятся из уравненийṖx=APx + Px A + Q,ṖΔx=APΔx + PΔx A + Q − PΔx H T R−1 HPΔx ,223Px (t0 )=PΔx (t0 ).Дискретный фильтр Калмана. Матрицы Px и PΔx находятся из уравненийPx (j + 1)+(j)PΔxK(j)−(j + 1)PΔx====Φ(j)Px (j)ΦT (j) + Q(j),−[E − K(j)H(j)]PΔx(j),(D14.10)−T−PΔx (j)H (j)[H(j)PΔx(j)H T (j) + R(j)]−1 ,+Φ(j)PΔx (j)ΦT (j) + Q(j).+Для вычисления меры в момент j следует положить PΔx (j) = PΔx(j).Знание стохастических мер позволяет понять, насколько велик вклад измерений в оценку тех или иных комбинаций вектора x.
В частности, для линейных комбинаций cT x с малыми мерами может оказаться целесообразнойзамена их оценок на априорные значения, т.е. сведение задачи оценивания кменьшей размерности.Стохастическая мера оцениваемости показывает, в какой степени измерения z позволяют улучшить знание компонент вектора состояния x(t), и является инструментом для выделения комбинаций переменных с малыми мерамии для возможной последующей редукции задачи.
Но между мерой оцениваемости какой-либо переменной и ее наблюдаемостью нет прямой зависимости.Из условия «мера равна 1» не следует, вообще говоря, что соответствующаяпеременная наблюдаема.Пример 14.1.ẋ1z==x1 ,x1 + r,ẋ2 = x1 − x2 ,M [r(t)r(s)] = δ(t − s).Здесь σx1 (t) и σx2 (t) → ∞ при t → ∞, а σΔx1 (t), σΔx2 (t) ограничены. Отсюда, в частности, следует, что мера μx2 (t) очевидно ненаблюдаемойпеременной x2 стремится к 1 при t → ∞.Замечание.
При Q = 0 и R = E уравнение для матрицы, обратной к ковари−1= N ∗ , в алгоритме калмановской фильтрации то же, что и дляационной, PΔxграмиана наблюдаемости N :Ṅ ∗ = −AT N ∗ − N ∗ A + H T H.Отличие в начальных условияхN (t0 ) = 0,N ∗ (t0 ) = PΔx (t0 )−1 .Как уже говорилось выше, априорная информация о начальном состояниивектора x может интерпретироваться как дополнительное разовое измерение.В этом случае характеристические числа матрицы N ∗ (t) более полно отражают возможность определения x(t), чем соответствующие характеристическиечисла матрицы N (t).224Дополнение к лекции 24. Регулярный синтез поБолтянскомуРассмотрим задачу оптимального управления⎧∗t ∈ [t0 , tk ],⎪⎨ ẏ = f (y, u), y(t0 ) = y ,u(·) ∈ U = {u(·) ∈ KC u(t) ∈ Ω ⊂ Rs },⎪⎩y(tk ) ∈ M ⊂ Rn ,(D24.1)где требуется минимизировать следующий функционал качества управленияtkf0 (y, u)dt → min .J(u) = ϕ0 (y(tk )) +t0u(·)∈UСчитаем, что решение задачи существует существует.
Тогда верна теорема одостаточных условиях оптимальностиТеорема 36. Управляемый процесс {y 0 (·), u0 (·), [t0 , t0k ]}, удовлетворяющий принципу максимума, является оптимальным, если выполняютсяшесть условий регулярного синтеза по В.Г. Болтянскому.Приведем формулировку условий регулярного синтеза для случая, когдаразмерность пространства состояний системы равна n = 2.Синтез оптимального управления осуществлен, если оптимальное управление построено как функция фазовых координат u0 = u0 (y).Условие 1.
Пусть G ⊂ R2 открытая область управляемости и справедливы утверждения:a) терминальное множество M — гладкое многообразие ( гладкая криваяили точка);б) множество N — особое множество, размерности s ≤ 1;в) множества P0 , P1 , P2 — кусочно-гладкие множества, замкнутые в G ине имеющие общих точек с M и N . Множество P0 представляет нульмерные клетки, множество P1 — кусочно-гладкие линии, одномерныеклетки, а множество P2 = G \ (M ∪ N ∪ P0 ∪ P1 ) — двумерные клетки;Условие 2. Все клетки разбиваются на два типа. Клетки P0 всегда являются клетками второго типа, а клетки P2 — клетками первого типа. КлеткиP1 могут быть как первого, так и второго типа.Условие 3. Через каждую точку клетки 1-го типа σ проходит единственная траектория, которая через конечное время покидает клетку, упираясь вклетку меньшей размерности, т.е.
существует управление u0 (y) гладкое и траектория ẏ 0 = f (y 0 , u0 (y 0 )), покидающая за конечное время эту клетку и попадающая в клетку π(σ) второго типа (под ненулевым углом, если σ двумерная).225Если σ — клетка 2-го типа, то для любой ее точки существует клетка 1-готипа Σ(σ) большей на 1 размерности, примыкающая к σ. Существует гладкоеуправление u(y) на σ ∪ Σ(σ) и траектория, начинающаяся в σ и проходящаячерез Σ(σ).Условие 4. Из условий 1–3 следует, что можно продолжать траекториюиз клетки в клетку, пройдя конечное число клеток и попадая на терминальноемногообразие M . Такая траектория называется отмеченной траекторией.Условие 5.
Отмеченные траектории удовлетворяет принципу максимума Понтрягина.Условие 6. Функционал J(u), вычисленный вдоль отмеченной траектории, непрерывно зависит от начальных условий.Используя условия теоремы В.Г. Болтянского можно осуществить синтезоптимального управления, доставляющего глобальный минимум функционалу качества.Пример.
Задача о параметрическом резонансе колебаний математического маятника.Рассмотрим малые колебания математического маятника, у которого точка подвеса может перемещаться вертикально с ускорением u (см.рис. D24.1 а). Требуется раскачать колебания маятника.Уравнения движения управляемой системы следующие:ÿ + uy = 0,0 < l ≤ u(t) ≤ mВсе решения системы колебательны (рис. D24.1 б), поэтому поставим задачу максимального увеличения амплитуды колебаний на полуколебании системы (рис. D24.1 в).
Пусть выполнены граничные условияy(t0 ) = 1,M = {ẏ(tk ) = 0} = {γ1 , 0},ẏ(t0 ) = 0,для управляемой системыγ1 > 0ẏ1 = y2 ,ẏ2 = −uy1 ,где функционал качества управления ϕ0 (y(tk )) = y1 (tk ) → minu(·)∈U < 0.Выпишем функцию Понтрягина H = ψ1 y + 2 + ψ2 (−uy1 ) и сопряженнуюсистемуψ̇1 = uψ2ψ̇2 = −ψ1 .Следовательно ψ̈2 = −uψ2 и рассматриваемая управляемая система является самосопряженной.Из ПМП следует, что оптимальное управление имеет видm при ψ2 y1 < 0u0 =lпри ψ2 y1 > 0226yutkt0ya)tб)ẏ1Myв)Рис. D24.1. Маятник с подвижной точкой подвесаУсловие трансверсальности следуетψ(t0k ) + λ0∂ϕ0⊥ M,∂yоткуда (ψ1 (t0k ) + λ0 )γ1 + ψ2 (t0k ) · 0 = 0 и следовательно ψ1 (t0k ) = −λ0 ≤ 0.Докажем, что управление u0 регулярно, т.е., ни на одном подинтервалеt ∈ [t̃1 , t̃2 ] не может быть выполнено ψ2 (t)y1 (t) ≡ 0.Допустим противное.
Условие y1 (t) ≡ 0 не может выполняться, иначе какy1 (t) так и y2 (t) ≡ 0 на всем интервале, что противоречит начальным условиям.Если ψ2 (t) ≡ 0, то и ψ1 (t) ≡ 0, откуда следует ψ1 (t̃2 ) = ψ2 (t̃2 ) = 0. Нотогда и на всем отрезке t ∈ [t̃2 , tk ] выполнено ψ(t) ≡ 0. Аналогично для левогоинтервала. Следовательно (λ0 , ψ) нулевая пара, что противоречит ПМП.Рассмотрим условие стационарности гамильтониана H(t) ≡ 0.В конечный момент времени y2 (t0k ) = 0, откуда ψ2 (t0k ) = 0. Если λ0 = 0,то ψ1 (t0k ) = 0 и опять получаем нулевую пару.Поэтому λ0 > 0 и после нормировки можно считать λ0 = 1 иψ̇2 (t0k ) = −ψ1 (t0k ) = 1.Отсюда следует, что в левой окрестности точки t0k выполнено неравенствоψ2 (t) < 0.
Но в этой окрестности y1 (t) < 0 ( поскольку y1 (t0k ) = α < 0).Значит в этой окрестности выполнено условие u0 (t) = l = const — оптимальное управление знак не меняет и можем проинтегрировать исходную√√y1 (t) = C1 sin l(t − t0k ) + C2 cos l(t − t0k ), ẏ1 (t0k ) = 0 =⇒C1 = 0,C2 = α < 0и сопряженную системы√√ψ2 (t) = C3 sin l(t − t0k ) + C4 cos l(t − t0k ),ψ2 (t0k ) = 0 =⇒227yuu0 (t)α2m1u0 (t)lt0τtk2tkt−αРис. D24.2.