Диссертация (1149527), страница 7
Текст из файла (страница 7)
В то время как для линейных систем такаяробастность по отношению к дополнительным ошибкам устанавливается автоматически, то в55случае нелинейных систем установить ее довольно трудно, при этом построение соответствующего регулятора является сложной задачей [54].Управление маятником является классической и опорной задачей в теории управления. Задача стабилизации вертикального положения, ровно как и задача стабилизации уровня энергиимаятника, достаточно широко изучена и, соответственно, требует свежих подходов. В работах [32, 34, 60, 71, 72] и в литературе, указанной в данных работах, можно найти различныерезультаты, относящиеся к управлению маятником.
В целом, задача управления энергией в Гамильтоновых системах, по-видимому, была впервые рассмотрена в [39]. В работах [68, 69] былипредложены расширенные условия для управления инвариантами в приложении к задаче управления маятником.В данной главе рассматривается задача управления энергией маятника с помощью обратнойсвязи с квантованием. В качестве номинального алгоритма используется алгоритм скоростногоградиента (см.
Гл.1), асимптотически стабилизирующий произвольный уровень энергии в случае отсутствия квантования. В качестве кандидата в функции Ляпунова выбирается квадратичное отклонение между текущим и желаемым уровнем энергии (которая убывает для замкнутойсистемы без квантования). Показано, что в случае присутствия квантования даже с достаточномалым шагом, функция Ляпунова все равно уже не является всюду убывающей, однако периодыи величины возможного возрастания ограничены, а убывающее поведение является доминирующим.
Установлено, что если начальный уровень энергии достаточно отделен от уровня равновесий, то траектория за конечное время войдет в область, близкую к желаемому уровню энергии.Основной результат главы состоит в получении оценок как для границы ошибки квантизации,так и для границ области притяжения и области начальных данных.4.1Постановка задачиРассмотрим уравнение маятника1()¨ = − sin () + 2 (),(4.1)где – угол отклонения ( = 0 в нижнем положении), – управляющий вращающий момент, – гравитационная постоянная, и – масса и длина маятника соответственно.Предположим, что (, )˙ – полная энергия маятника, т.е.1(, )˙ = 2 ˙ 2 + (1 − cos ).256Рассмотрим задачу стабилизации уровня энергии системы (4.1).
Пусть = [, ]˙ , ∈ IR2 .Пусть ℎ (ℎ < 2) – некоторое положительное число. Рассмотрим множествоℎ = { : 0 < () 6 ℎ} .Пусть * (0 < * < ℎ) – целевой уровень энергии, а целевая функция выглядит следующимобразом:1(() − * )2 .2 () =(4.2)Требуется найти закон обратной связи = (),обеспечивающий достижение цели управленияlim ((, 0 )) = 0,→∞(4.3)где начальный уровень энергии (0 ) удовлетворяет следующему предположению:0 ∈ ℎ ,(4.4)т.е. 0 принадлежит уровню энергии между 0 и ℎ.Алгоритм управления основан на методе скоростного градиента (см.
Гл.1). Согласно методу скоростного градиента требуется вычислить функцию (, ) = ˙ (), которая являетсяскоростью изменения функции вдоль траекторий системы (4.1):(, ) = (() − * ) ,где = [0, 1] . Найдем -градиент функции (, ) и выпишем алгоритм скоростного градиентав конечной форме: = () = −= − (() − * ) ,(4.5)где > 0.Следующая теорема, характеризующая работоспособность алгоритма (4.5), может быть сформулирована непосредственно из Теоремы 3.1 и Замечания 3.1 в [26].Теорема 4.1.
Если между уровнями энергии (0 ) и * не содержится точек равновесия свободной системы (4.1), тогда для системы (4.1), (4.5) целевой уровень энергии * достигаетсяиз всех начальных условий при любом > 0.Выполнение условий из Теоремы 4.1 следует из (4.4).⋃︀Пусть множество = { : ∈ ℎ , ∈ N} является конечным подмножеством мно⋃︀жества ℎ , где ∈ IR2 .
Рассмотрим квантователь () : IR2 → , предложенный57{︀}︀в [54]. Предположим, что = ∈ IR2 : () = – области квантования (Рис.4.1) такие, что⋃︀ = ℎ . Следовательно, () = для всех ∈ , ∈ N. Когда не принадлежит объединению областей квантования, квантователь насыщается, т.е. () = , если ∈/ ℎ .Рисунок 4.1: Области квантованияПредположим, что для измерения вектора состояния доступны только квантованные сигналы ().
Тогда закон управления (4.5) не применим. Следовательно, вместо непрерывногоуправления (4.5) рассмотрим квантованный по состоянию закон (4.5): = (()) = − ((()) − * ) ().(4.6)Таким образом, требуется исследовать условия достижимости цели управления (4.3) с помощью квантованного по состоянию закона управления (4.6). Заметим, что предположение (4.4)существенно в случае использования алгоритма (4.5), однако может быть опущено в случаеиспользования модифицированной версии (4.5). В работе [72] показано, что глобальная аттрактивность верхней точки равновесия может быть достигнута с помощью модификации методаскоростного градиента на основе идеи теории систем переменной структуры.
Однако, такой модифицированный алгоритм не пригоден для случая квантованных измерений.Также отметим, что поскольку квантование осуществляется по состоянию, правая часть дифференциального уравнения (4.1), (4.6) является разрывной. Решения дифференциального уравнения (4.1), (4.6) понимаются в смысле решений по Филиппову [24].584.2Основной результатПусть () = () − = [1 (), 2 ()] – вектор ошибки квантования.
Предположим, что квантователь выбран таким образом, что|1 ()| 6 ∆1 ,Следовательно, |()| 6|2 ()| 6 ∆2для всех ∈ ℎ .(4.7)√︀∆21 + ∆22 = ∆ для всех ∈ ℎ .Закон (4.6) может быть переписан следующим образом: (()) = () + (),где(︂(︂ () = −)︂1 22 (2 () + )˙ + (1 − cos ( + 1 ())) − * 2 () +2)︂)︂ )︂(︂(︂12+ ˙ + 2 () 2 () +(cos − cos ( + 1 ())) ˙ .2Отметим, что для всех ∈ ℎ выполнено (1 − cos ( + 1 ())) = ( + 1 (), 0) 6 ℎ,(4.8)и|cos − cos ( + 1 ())|=⃒⃒⃒ 2 + 1 ()1 () ⃒⃒⃒2 ⃒sinsin22 ⃒6⃒⃒⃒ 1 () ⃒⃒⃒2 ⃒sin2 ⃒62 sin , (4.9)2где = min{, ∆1 }.√︂Из (4.7), (4.8), (4.9) и ˙ 62ℎполучаем2| ()| 6 ∆гдедля всех ∈ ℎ ,√√1 2 3 3 2ℎ 2∆ = ∆2 +∆2 + (4ℎ − * )∆2 + 2 2ℎ sin .222Для любых > > 0 рассмотрим множество−1[,]= { ∈ ℎ : 6 () 6 } ,а для любых > > 0 множество−1[,]= { ∈ ℎ : 6 () 6 } .Нетрудно видеть, что−1√√√√[,]= −1∪ −1.[* + 2, * + 2][* − 2, * − 2]59(4.10)Пусть ℎ* – некоторая положительная константа, удовлетворяющая условию ℎ* < min{* , ℎ−* }. Рассмотрим следующие функции скалярной переменной :1 () = * − ℎ* −2 () =√︃32 ∆2,2(︂0 ()1− 1−)︂2∆−2(︃)︃√ℎ* 6+1 ,где 0 () = min {2 − * − ℎ* , 1 ()} ,3 () =4ℎ2*√16 6 ∆3− −,2 () 2(︂)︂1 21 ()4 () = arccos 1 −2 () − ∆2 .12Основной результат заключается в следующей теореме.Теорема 4.2.
Пусть следующая система неравенств0 < < 2ℎ* ,1 () > 0,2 () > 0,(4.11)3 () > 0,4 () > 0разрешима относительно . Тогда для любого решения = ℎ1 системы (4.11) и любых началь−1ных условиях (0) ∈ [траектории замкнутой системы (4.1), (4.6) удовлетворяют* −κ2 ,* +κ2 ]−1−1() ∈ [для всех > 0, и существует > 0 такое, что () ∈ [для* −ℎ* ,* +ℎ* ]* −κ1 ,* +κ1 ]всех > , где√︃κ1 =√1 2 2 6 ∆3ℎ +,4 1ℎ1 2 (ℎ1 )√︃κ2 =√26 ∆3ℎ2* −.ℎ1 2 (ℎ1 )Следствие 4.1. Для любых κ̃1 , κ̃2 , удовлетворяющих κ̃1 < κ̃2 < ℎ* , существуют достаточно−1малые ∆1 , ∆2 такие, что для любых начальных условий (0) ∈ [траектории зам* −κ̃2 ,* +κ̃2 ]−1кнутой системы (4.1), (4.6) удовлетворяют () ∈ [для всех > 0, и существует* −ℎ* ,* +ℎ* ]−1 > 0 такое, что () ∈ [для всех > .* −κ̃1 ,* +κ̃1 ]Доказательство Следствия 4.1.
Пусть ℎ1 = 2κ̃1 . Если ∆1 → 0 и ∆2 → 0, то ∆ → 0. Следовательно, κ2 → ℎ* .Так как отрицательные члены в функциях 1 (ℎ1 ), 2 (ℎ1 ) и 4 (ℎ1 ) исчезают, а 3 (ℎ1 ) → 4(ℎ2* −κ̃12 ) > 0 при условии ∆ → 0 и κ2 → ℎ* , легко видеть, что = 2κ̃1 – решение системы (4.11).−1−1Наконец, из κ2 → ℎ* получаем [⊂ [.
В результате, заключение* −κ̃2 ,* +κ̃2 ]* −κ2 ,* +κ2 ]Следствия 4.1 прямо следует из Теоремы 4.2.60Доказательство Теоремы 4.2 основано на следующей вспомогательной лемме, доказательствокоторой аналогично доказательству Леммы 1 из [38].Лемма 4.1. Пусть существует константа > 0 такая, что ˙ () 6 при ∈ ℎ для почтивсех > 0, где ˙ () – производная по времени функции () вдоль траекторий замкнутойсистемы (4.1), (4.6). Пусть существуют положительные константы , 0 , 3(0 < 0 < 3 <∞) и непрерывные функции , : [−1→ IR+ ∖{0} такие, что для произвольной траетории0 ,3 ](·) системы (4.1), (4.6) верно следующее:если() ∈ [−1∖ Π ∀ ∈ [1 , 2 ] для некоторых 0 < 1 < 2 ,0 ,3 ]{︁}︁где Π = ∈ ℎ : ˙ () < −() для почти всех > 0 , тоa) 2 − 1 6 , иb) существует 3 > 2 такое, что ((3 )) − ((1 )) 6 −((1 )), и для всех ∈ (2 , 3 ) из() ∈ [−1следует, что () ∈ Π.0 ,3 ]1−1,Предположим, что < (3 − 0 ).
Обозначим 1 = 0 + , 2 = 3 − . Если (0) ∈ [0,2]2−1−1то () ∈ [0,для всех > 0, и существует > 0 такое, что () ∈ [0,для всех > .3]1]11 2ℎ1 , 3 = ℎ2* . Следовательно, из 0 < ℎ1 < 2ℎ*82следует, что 0 < 0 < 3 . Прямыми вычислениями получаемДоказательство Теоремы 4.2. Пусть 0 =˙ () = (() − * ) ˙ ( () − (() − * ) ).˙∙ Оценим ˙ .√︂(︂√︂)︂21Так как(() − * ) ˙ − ()= (() − * )2 ˙ 2 − (() − * ) ˙ () +2221 2 () > 0, имеет место оценка2 ˙ () 6 −(() − * )2 ˙ 2 + (() − * )2 ˙ 2 +211∆2+ 2 () 6 − (() − * )2 ˙ 2 + 2 () 6. (4.12)2222∆2.
Таким образом, ˙ 6 при ∈ ℎ для почти всех > 0.2∙ Пусть функция () = = . Докажем, что для произвольной траектории () верно,2˙ > − для почти всех ∈ [1 , 2 ], то существует > 0 такое,что если () ∈ [−1и0 ,3 ]2что 2 − 1 6 .Пусть =61]︂1Из того, что () ∈ [0 , 3 ], следует, что |() − * | ∈ ℎ1 , ℎ* .22∆Так как − (() − * )2 ˙ 2 + ∆2 > ˙ () > − , имеет место оценка224[︂(() − * )2 ˙ 2 6Следовательно,3∆2.2√∆ 6.||˙ 6ℎ1(4.13)⃒⃒⃒⃒ 11⃒||¨ = ⃒ sin − 2 ( () + ())⃒⃒ > |sin | − 2 | () + ()|.(4.14)Оценим ||.¨Так как0| () + ()| 6 | ()| + | ()| 6 |() − * | · ||˙ + ∆ 6(︃ √)︃√∆ 6ℎ* 6+ ∆ = ∆+1 ,6 ℎ*ℎ1ℎ1имеем)︃√ℎ* 6+1 .ℎ1[︂]︂1Теперь оценим | sin |.