В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем (1158263), страница 5
Текст из файла (страница 5)
Для наблюдаемости пары (A, H) вмомент времени t необходимо и достаточно, чтобы нашелсямомент t0 < t такой, что det N (t, t0 ) = 0, т.е. N (t, t0 ) > 0.Доказательство. Выведем критерий наблюдаемости в общем(нестационарном) случае A = const , H = const . Доказательство теоремы можно провести аналогично доказательству теоремы 2 (смотрите лекцию 3). Но здесь мы пойдем по другому пути, используя возможность продемонстрировать метод наименьших квадратов, к которомумы будем обращаться в последующих лекциях.Рассмотрим уравнения (3.6). Зафиксируем некоторый момент t0 ,который будем рассматривать как начальный. Для определения x(t)имеем уравнениеz(τ )= H(τ )Φ(τ, t)x(t),(3.7)которое должно удовлетворяться для всякого τ из интервала [t0 , t].27Достаточность.
Попробуем построить конкретный алгоритм определения x(t) из уравнения на интервале [t0 , t]. Выберем в качествепробной некоторую величину x(t). Для произвольного момента τ ∈[t0 , t] это пробное x(t) не обязательно удовлетворяет уравнению (3.7)и имеется рассогласование (невязка)Δz(τ ) = z(τ ) − H(τ )Φ(τ, t)x(t).Естественно потребовать, чтобы пробное решение x(t) минимизировало в некотором смысле совокупность всех невязок на интервале[t0 , t]. Мерой невязки может служить следующий функционалtt2(3.8)J[x] = Δz(τ ) dτ = Δz (τ )Δz(τ ) dτ.t0t0Так как ограничения на x отсутствуют и функционал (3.8) являетсяквадратичным, то оптимальное решение x(t) выбирается из условия∂J= 0,(3.9)∂xкоторое приводит при det N = 0 к решениюt−1x(t) = N (t, t0 ) Φ (τ, t)H (τ )z(τ ) dτ.(3.10)t0Полученное нами решение является точным.
Это следует из прямойподстановки выражения (3.7) в выражение (3.10). Отсюда также следует, что наш функционал на решении (3.10) обращается в ноль: J =0.Необходимость. Предположим, что система наблюдаема, т.е. существует единственное решение уравнения (3.7)z(τ ) = H(τ )Φ(τ, t)x(t),τ ∈ [t0 , t].Пусть матрица N (t, t0 ) не является положительно определенной, т.е.для некоторого x = x(t)x N (t, t0 )x = 0(3.11)и этому x отвечает свое измерение z(τ ) в соответствии с соотношением (3.7). Из (3.11) следует⎤⎡ tt⎣Φ (τ, t)H (τ )H(τ )Φ(τ, t) dτ ⎦ x = z (τ )z(τ ) dτ = 0,xt028t0или z(τ ) ≡ 0 для всех τ ∈ [t0 , t]. Следовательно, для рассматриваемойсистемы существует решение x(t), которое невозможно отличить отнулевого, что противоречит условию о наблюдаемости.Замечание 2.
Вместо уравнения (3.7), определяющего x(t),можно рассматривать уравнение для определения x(t0 ) = x0z(τ ) = H(τ )Φ(τ, t0 )x(t0 ), t0 ≤ τ ≤ t.Эквивалентный грамиан наблюдаемости выглядит такtN (t, t0 ) = Φ (τ, t0 )H (τ )H(τ )Φ(τ, t0 ) dτ.(3.12)t0Рассмотрим теперь стационарный случай A = const , B = const .Критерий наблюдаемости для стационарной системы формулируетсяследующим образом.Теорема 6. Для наблюдаемости стационарной пары (A, H)необходимо и достаточно выполнения условия⎞⎛H⎜ HA ⎟⎟.rank N = n, N = ⎜⎠⎝...HAn−1Матрицу N назовем матрицей наблюдаемости.Последний критерий поясним рассуждениями, которые, посуществу, представляют вариант его вывода.Аналитическая функция z(t) однозначно определяется значениямиэтой функции и всех ее производных в некоторый момент t.
В силууравнения (3.6), получим в этот моментz(t) = Hx(t), ż(t) = HAx(t), . . . z (n−1) (t) = HAn−1 x(t). (3.13)Но все последующие производные z, в силу теоремы Гамильтона - Кэли, являются линейными комбинациями величины z и ее первых n − 1производных и поэтому не несут в себе новой информации о вектореx. Таким образом, возможность определения вектора x по измерениямz(τ ), τ ∈ [t0 , ∞] эквивалентна возможностям, содержащимся в системе (3.13).Но для того, чтобы система (3.13) имела однозначное решение x(t)необходимо и достаточно, чтобы rank N = n.Приведем некоторые полезные на практике факты, связанные спонятием управляемости и наблюдаемости.
В уравнениях (3.5) перейдем к новой переменнойξ = Cx,29где C — постоянная квадратная невырожденная матрица. Уравненияотносительно ξ имеют вид:ξ˙ = CAC −1 ξ + CBu,z = HC −1 ξ.ОбозначимAc = CAC −1 , Bc = CB, Hc = HC −1 .Имеет место следующее свойство: из управляемости пары (A, B) инаблюдаемости пары (A, H) следует управляемость пары (Ac , Bc ) инаблюдаемость пары (Ac , Hc ), и наоборот, то есть свойства управляемости и наблюдаемости инвариантны к невырожденному преобразованию вектора состояния. Доказательство здесь не приводится.Сформулируем еще одну методически важную теорему о сопряженности задач управления и наблюдения.Рассмотрим две линейные динамические системы, сопряженныедруг другу.Система I:ẋ = Ax + Bu,z = Hx.Система II:ξ̇ = −A ξ + H v,ς = B ξ.Теорема 7.
[О сопряженности понятий управляемости и наблюдаемости] Система II вполне управляема, если и только есливполне наблюдаема система I. Система II вполне наблюдаема,если и только если вполне управляема система I.Справедливость утверждения следует из сравнения соответствующих грамианов управляемости и наблюдаемости.Но понятие сопряженности существенно шире, чем содержаниетолько что сформулированной теоремы. Именно, все результаты, связанные с одной из характеристик, переносятся сопряженным образом на другую характеристику. Последующее изложение подтверждает сказанное.30Лекция 4Контрвариантные и ковариантныекоординаты, алгоритмы управления сзаданными свойствами переходныхпроцессовОбсудим теперь две задачи.Первая из них — пусть стационарная системаẋ = Ax + Bu,z = Hx,вполне управляема, т.е.
вполне управляема пара (A, B). Как строить алгоритм управления (или более узко — алгоритм стабилизации)?Один из таких алгоритмов, равно пригодный как для нестационарных,так и для стационарных систем, был рассмотрен при доказательстветеоремы (2.5). Будет показано, что по крайней мере в стационарномслучае более приемлем алгоритм в виде линейной обратной связи.Вторая задача — построение алгоритмов, доставляющих оценкувектора состояния, если пара (A, H) вполне наблюдаема.
Один из таких алгоритмов был рассмотрен при доказательстве теоремы (3.5). Ноболее удобным и выгодным со многих точек зрения оказывается динамический алгоритм оценивания. Он находит в настоящее время самоеширокое применение в разнообразных конкретных системах управления.Одно из эффективных средств решения поставленной задачи —выбор подходящего вектора состояния (вектора фазовых координат),связанного с первоначальным вектором невырожденным линейнымпреобразованием, т.е.
выбор подходящего базиса, в котором решениезадачи было бы очевидным.Пусть x̄, ȳ, z̄ — инвариантные обозначения векторов, не привязанные к какому-либо базису.Как известно, задаваясь базисом {ē1 , ..., ēn } в пространстве состояния, произвольный вектор x̄ можно определить двояким образом:во-первых, представить его в форме разложения по базисным векто31рамx̄ =njx+j ē ,(4.1)j=1и, во-вторых, задать n скалярных произведений jx−j = 1, ..., n .j = x̄ ē ,(4.2)x+jназываются контрвариантными координатами, величиВеличиныны x−—ковариантнымикоординатами. Соответственно, вводятсяjдва вектора-столбца+ − x− = (x−(4.3)x+ = (x+1 ...xn ) ,1 ...xn ) .Если базис ортонормированный, то x+ = x− .
Столбец x в уравнении (4.2) интерпретируется как столбец, составленный из координатвектора x в ортонормированном базисе {ēj }, при этом сами векторы ēj представляются в этом базисе как единичные столбцы ej =(0...1...0) .Введем новый базис {ḡ 1 , ..., ḡ n } и будем использовать представление векторов ḡ j в виде столбцов g j , составленных из координат векторов ḡ j в базисе {ēj }. Столбцы g j образуют матрицу G(4.4)G = (g 1 ...g n ).Обозначим через ξ + и ξ − столбцы, составленные из контрвариантныхи ковариантных координат вектора x̄ в базисе {ḡ 1 , ..., ḡ n }⎛ + ⎞ξ1⎜ ξ+ ⎟⎜ 2 ⎟x = ξ1+ g 1 + ξ2+ g 2 + .
. . ξn+ g n = (g 1 , g 2 , . . . , g n ) ⎜ . ⎟ = Gξ + .⎝ .. ⎠ξn+ξ1− = x g 1 = g 1 x,ξ2− = x g 2 = g 2 x,......ξn−Или= x g n = g n x.⎛g 1⎞⎜ 2 ⎟⎜g ⎟⎟⎜x = G x.ξ =⎜..⎟⎟⎜.⎠⎝−g n32Отсюда, кстати, следует ξ − = G Gξ + .Как будет показано далее, в стационарной задаче управления координаты при переходе к новому базису целесообразно понимать какконтрвариантные, что позволяет решить ее в той или иной постановке наиболее экономным и наглядным образом. Стационарной задаченаблюдения в той или иной постановке соответствуют ковариантныекоординаты. Такая двойственность в выборе координат вытекает изсопряженности друг другу задач управления и наблюдения.Далее напомним некоторые факты из линейной алгебры, которыебудут использованы в дальнейшем.Рассмотрим произвольный вектор-столбец f (n × 1) и произвольную квадратную матрицу A(n×n). Образуем последовательность векторов(4.5)g 1 = f, g 2 = Ag 1 , ..., g j+1 = Ag j , ...
.Пусть первый вектор последовательности {g j }, линейно зависимый отпредыдущих, есть g k+1g k+1 = α1 g 1 + ... + αk g k ,k ≤ n.(4.6)Тогда все последующие векторы последовательности {g j } также являются однозначными линейными комбинациями первых k векторов.Доказательство — по индукции.Отсюда следует, что подпространство, натянутое на векторы g j ,k-мерно и набор векторов {g 1 , ..., g k } служит базисом этого подпространства.Если k = n, то набор векторов {g 1 , ..., g n } служит базисом полногопространства(4.7)g n+1 = α1 g 1 + ... + αn g n .Запишем характеристическое уравнение матрицы A|λE − A| = λn + a1 λn−1 + ... + an−1 λ + an = 0.Как уже говорилось, справедлива теорема Гамильтона-Кэли, по которой любая матрица удовлетворяет собственному характеристическому уравнениюAn + a1 An−1 + ...