Главная » Все файлы » Просмотр файлов из архивов » PDF-файлы » В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем

В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем, страница 4

Описание файла

PDF-файл из архива "В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем", который расположен в категории "лекции и семинары". Всё это находится в предмете "механика управляемых систем" из седьмого семестра, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .

Просмотр PDF-файла онлайн

Текст 4 страницы из PDF

Это означает, что18затухание переходных процессов в исходном уравнении относительноx происходит не медленнее, чем e−αt .Таким образом, для определения условий при которых системаимеет запас устойчивости α необходимо: в исходном характеристическом уравнении величину λ заменить на величину λ = μ − α. Выполнение условий Гурвица для полинома относительно μ обеспечивает всистеме запас устойчивости α.В качестве примера, иллюстрирующего конструктивность понятия запас устойчивости, рассмотрим задачу стабилизации летательного аппарата (самолета, крылатой ракеты) относительно программной траектории при условии, что информация о текущем боковом отклонении аппарата известна ( она доставляется навигационной системой). Пусть κ — известная величина бокового отклонения. В первомприближении уравнение, определяющее поведение величины κ, имеетвид:κ̈ + Rκ̇ = δ + q.(2.4)Здесь δ – управление, подлежащее выбору; q – внешнее возмущение(ветер); R – постоянный параметр, зависящий от аэродинамики аппарата.Обычно управление δ определяется соотношениемtδ = −k0 κ − k1 κ(τ )dτ.0Здесь k0 , k1 — коэффициенты обратной связи.

Добавление интегралав обратную связь позволяет избежать установившегося остаточногоотклонения при q = const = 0.Вывод уравнения, а также более подробная мотивировка управляющего сигнала здесь не приводятся. Дифференцируя (2.4) (при постоянном q), получаем...κ + Rκ̈ + k0 κ̇ + k1 κ = 0.При сохранении запаса устойчивости λ0 = R3 потребуем, чтобы корнихарактеристического уравнения были следующими:RRλ1 = − ,λ2,3 = − ± jω.33Характеристическое уравнение в этом случае примет вид 2RR R23222λ + Rλ ++ω λ++ ω = 0.33 3219Отсюда k0 =R23+ ω 2 , k1 =R R23 32k1 =+ ω 2 .

Исключая ω 2 , получимR2R3k0 −.3272При этом k0 ≥ R3 .При практическом построении алгоритма управления учитываетсяряд дополнительных обстоятельств, которые здесь не рассматриваются.Наблюдаемость и управляемость. Предварительные замечанияБудем считать, что программное движение y ∗ (t) и соответствующее этому движению управление w∗ задано.

Вопрос об определенииэтих величин будет рассмотрен во второй части нашего курса, а сейчас мы сосредоточим свое внимание на решении задачи управленияотносительно программного движения при помощи обратных связей.Считая, что приведенная выше линеаризация допустима (а такое имеет место в подавляющем большинстве случаев), мы приходим к следующей задаче. Пусть вектор x = y(t) − y ∗ (t) определяет рассогласование истинного движения с программным, а его поведение подчиняетсяуравнению:ẋ(t) = A(t)x(t) + B(t)u(t) + q(t),(2.5)где A и B известные матрицы, вообще говоря, зависящие от времени,величина u — управление, подлежащее выбору, а q — немоделируемое возмущение, т.е.

возмущение, не имеющее адекватных математических моделей, описываемых с помощью дополнительных переменных, включенных в вектор состояния управляемого объекта.Информацией для формирования управления служит величинаz(t) = H(t)x(t) + r(t),где H — известная матрица, r — немоделируемое возмущение (немоделируемая инструментальная погрешность измерителей).Задача состоит в определение алгоритма u = L(z), где оператор Lпредполагается линейным.Систему (2.5) будем называть стабилизируемой, если существуеттакой оператор L[z] (L[0] = 0), что при u = L[z] и равных нулю q и rтривиальное (нулевое) решение уравненияẋ(t) = A(t)x(t) + B(t)L[H(t)x(t)]асимптотически устойчиво.20(2.6)Как уже говорилось, одна из интерпретаций задачи стабилизациисостоит в декомпозиции на две подзадачи.

Первая из них — построение при помощи измерения z оценки x̃(t) = L1 [z], вторая — построение управления u(t) = L2 [x̃].Возможность решения каждой из этих подзадач тесно связана сдвумя характеристиками внутренних свойств системы — управляемостью и наблюдаемостью. К изучению результатов, связанных с указанными характеристиками, мы сейчас и приступаем. Заметим только, что соответствующая теория оказывается шире, чем просто ответна вопрос о стабилизируемости.Особое внимание будет уделено частному стационарному случаю(A, B и H — константы), для которого получены наиболее глубокие иконструктивные результаты.Прежде, чем излагать теорию, опирающуюся на понятия управляемости и наблюдаемости, рассмотрим два примера, поясняющих сутьобсуждаемых далее вопросов.Пример 2.1. Рассмотрим систему с управлением uẋ1 (t)ẋ2 (t)==λ1 x1 (t) + u(t),λ2 x2 (t) + u(t).Пусть величины x1 и x2 доступны измерению.

Тогда управление uможно организовать в виде линейной обратной связи u(t) = c1 x1 (t) +c2 x2 (t). Характеристическое уравнение системы будет иметь видλ2 − (λ1 + λ2 + c1 + c2 )λ + λ1 λ2 + c1 λ2 + c2 λ1 = 0.Пусть целью управления является построение системы с заданнымпереходным процессом, что эквивалентно заданию характеристического уравненияλ2 + aλ + b = 0.Эта цель достигается при c1 и c2 , удовлетворяющих системе уравненийc1 + c2λ2 c1 + λ1 c2= −a − λ1 − λ2 ,= b − λ1 λ2 .Решение однозначно при λ1 = λ2 . Если a > 0, b > 0, то системаасимптотически устойчива и, значит, стабилизируема.При λ1 = λ2 = λ0 сделаем замену переменных y1 = 12 (x1 + x2 ),y2 = 12 (x1 − x2 ).

Имеемẏ1 (t)=λ0 y1 (t) + u(t),21ẏ2 (t)=λ0 y2 (t).Из полученного следует, что в рассматриваемом случае можно управлять переходным процессом только частично.Заметим, что при λ0 < 0 система стабилизируема.Пример 2.2. Рассматривается система с измерением zẋ1 (t) =λ1 x1 (t),ẋ2 (t) =λ2 x2 (t).z(t) = x1 (t) + x2 (t),Имеем z(t) = x10 eλ1 t + x20 eλ2 t , где x10 = x1 (0), x20 = x2 (0).Измерение z дает возможность при λ1 = λ2 однозначно определитьвектор x(t).

Для этого достаточно использовать измерения в два момента времени, например при t = 0 и t = 1. Но если λ1 = λ2 = λ0 ,определяется только комбинация x1 (t) + x2 (t).22Лекция 3Понятия управляемости и наблюдаемости.Критерии управляемости инаблюдаемости1. Понятие управляемости и критерий управляемостиИтак, рассматривается системаẋ(t) = A(t)x(t) + B(t)u(t),(3.1)где A и B известные матричные функции времени, u — управление,подлежащее выбору.

Как правило, dim u < dim x.Определение 6. Система (3.1) называется вполне управляемойв момент времени t0 , если существует такое t > t0 и ограниченное управление u(τ ), где t0 τ t, которые переводит систему из состояния x(t0 ) = ξ в любое наперед заданное состояниеx(t) = ζ.Напомним, что решение уравнения (3.1) имеет вид:tx(t) = Φ(t, t0 )x(t0 ) + Φ(t, τ )B(τ )u(τ )dτ,t0где Φ(t, t0 ) — известная переходная матрица, удовлетворяющая уравнениюΦ̇(t, t0 ) = A(t)Φ(t, t0 ), Φ(t0 , t0 ) = E.(3.2)Введем вектор η = ζ − Φ(t, t0 )ξ, тогда перевод системы из состоянияξ в состояние ζ эквивалентен существованию конечного управленияu(τ ), удовлетворяющего соотношению:tΦ(t, τ )B(τ )u(τ )dτ = η.t0Отсюда можно дать следующее эквивалентное определениеуправляемости: cистема (3.1) вполне управляема в момент t0 ,если существует такой момент t и конечное управление u(τ ),23t0 τ t, которое переводит систему из нулевого состоянияx(t0 ) = 0 в любое наперед заданное состояние x(t) = η.В определении присутствует слово «вполне».

Оно введено для того, чтобы отличить качество системы от того факта, что в систему введено управление, т.е. система управляема.При общении специалистов такие тонкости не учитываются и слово «вполне» опускается, что никогда не приводит к недоразумению.Поскольку свойство управляемости целиком определяется свойством пары (A, B), то вместо того, чтобы сказать, что система (3.1)вполне управляема, говорят, что управляема пара (A, B).Критерий управляемости в общем случаеВведем матрицу:tW(t, t0 ) =Φ(t, τ )B(τ )B (τ )Φ (t, τ )dτ,t0которую будем называть грамианом управляемости. Очевидно, матрица W(t, t0 ) — симметрическая матрица и задает неотрицательноопределенную квадратичную форму λT Wλ 0 для ∀λ.Теорема 2 (Р.Калман, 1962). Для управляемости пары (A, B) вмомент t0 необходимо и достаточно, чтобы нашелся моментt > t0 такой, что det W(t, t0 ) = 0, т.е.

W(t, t0 ) > 0.Доказательство.Достаточность. Пусть det W(t, t0 ) = 0. Сформируем управлениеu(τ ) = B (τ )Φ (t, τ )W −1 η.Легко видеть, что это управление переводит систему из нулевого состояния x(t0 ) = 0 в состояние x(t) = η.Необходимость. Пусть система управляема, но det W(t, t0 ) = 0.Тогда найдется такой вектор η = 0, что η Wη = 0. Раскрывая последнее равенство, получимtη Φ(t, τ )B(τ )B (τ )Φ (t, τ )η dτ = 0,t0или ν (t) = η Φ(t, τ )B(τ ) ≡ 0 при любом τ ∈ [t0 , t].С другой стороны, в силу управляемости существует управлениеu, переводящее систему из нулевого состояния в состояние η в момент24времени t. Но тогдаη η=ηtΦ(t, τ )B(τ )u(τ ) dτ = 0,t0что противоречит первоначальному условию η = 0.Теорема 3.

Для управляемости пары (A, B) в момент t0 необходимо и достаточно, чтобы нашелся момент t такой, для которого уравнение относительно ηη Φ(t, τ )B(τ ) = 0,t0 ≤ τ ≤ tимело бы при всех τ единственное тривиальное решение.Рассмотрим стационарный случай, когда матрицы A и B не зависят от времени. Напомним, что в этом случае переходная матрицаΦ(t, t0 ) может быть записана в виде разложенияΦ(t, t0 ) = eA(t−t0 ) = E + A(t − t0 ) + A2(t − t0 )2+ ...2Перейдем к доказательству теоремы 3. Уравнениеη Φ(t, τ )B = 0будет иметь вид:(t − t0 )2(t − τ )n−1+ .

. . + An−1+η E + A(t − τ ) + A22(n − 1)!nn (t − τ )+ A+ . . . B = 0.(3.3)n!В силу того, что функции 1, (t − τ ), (t − τ )2 , . . . линейно независимы, уравнение (3.3) эквивалентно следующей бесконечной системеуравнений:η B = 0,η AB = 0,η A2 B = 0,...n−1η A(3.4)B = 0,nη A B = 0,...25Имеет место хорошо известная теорема Гамильтона-Кели, согласно которой матрица A удовлетворяет своему собственному характеристическому уравнению. Пусть характеристическое уравнение матрицы A таково:|λE − A| = λn + a1 λn−1 + .

. . + an = 0.ТогдаAn + a1 An−1 + . . . + an E = 0,т.е. матрица An является линейной комбинацией младших степенейматрицы A. Но легко видеть, что матрицы An+1 , An+2 и т.д. такжеявляются линейными комбинациями тех же степеней матрицы A.Отсюда следует, что бесконечная система алгебраических уравнений (3.4) равносильна конечной системе уравнений:η B = 0,η AB = 0,η A2 B = 0,...η An−1 B = 0.Для того, чтобы эта система имела единственное тривиальное решение относительно составляющих вектора η, необходимо и достаточно, чтобы ранг матрицы системы был равен размерности вектораη, т.е.

n.Теорема 4. Для того, чтобы стационарная пара (A, B) былауправляема, необходимо и достаточно, чтобы rank W = n, гдеW = (B, AB, A2 B, . . . , An−1 B).Матрица W называется матрицей управляемости.2. Понятие наблюдаемости и критерий наблюдаемостиРассматривается системаẋ(t) =A(t)x(t) + B(t)u(t),(3.5)z(τ ) =H(τ )x(τ ),τ ∈ [t0 , t].Определение 7. Система (3.5) называется вполне наблюдаемой в момент t, если существует момент t0 такой, что можно определить состояние системы x(t) из наблюдений выходнойфункции z(τ ) на отрезке t0 τ t (t0 < t).26Поскольку управление u в (3.5) — известная функция, то возможность определения x(t) при помощи z(τ ) та же, что и для системыẋ(t) = A(t)x(t),z(τ ) = H(τ )x(τ ),τ ∈ [t0 , t].(3.6)Размерность вектора z как правило меньше размерности x и знаниеz в некоторый фиксированный момент τ не дает достаточной информации для восстановления вектора состояния x(τ ).

Поэтому для решения задачи определения x(t) требуется учитывать имеющуюся внашем распоряжении информацию о векторе z(τ ) на всем интервалеt0 τ t.Замечание 1. По поводу слова «вполне» в определении наблюдаемости можно сказать то же, что говорилось по поводу определения управляемости. Далее это слово мы будем опускать.Поскольку наблюдаемость есть внутреннее свойство системы(3.6), полностью определяемой матрицами A и H, то далее будем также говорить о наблюдаемости пары (A, H).Сформулируем критерий наблюдаемости. Образуем симметрическую матрицуtΦ (τ, t)H (τ )H(τ )Φ(τ, t)dτ.N (t, t0 ) =t0Здесь Φ(t, t0 ) – переходная матрица системы. Матрицу N (t, t0 ) будемназывать грамианом наблюдаемости.Теорема 5 (Р.Калман, 1962).

Свежие статьи
Популярно сейчас