Деменков Н.П. Вычислительные аспекты решения задач оптимального управления (2007) (1253737), страница 15
Текст из файла (страница 15)
[16].Рассмотрим объект второго порядка, описываемый уравнениемa 12 ⎤⎡a⎡0 0 ⎤x = ⎢ 11x+⎢⎥⎥ u.⎣ a21 a22 ⎦⎣0 b22 ⎦Запишем показатель качества в видеtJ=1k т( x Qx + u т Ru )dt ,2 t∫0где tk = ∞, Q и R – матрицы,⎡qQ = ⎢ 11⎣00 ⎤,q22 ⎥⎦⎡1 0 ⎤R= ⎢⎥.⎣0 1 ⎦Закон управления имеет видu2*(t) = –b22[k21x1*(t) + k22x2*(t)] + b22v1*(t).Здесь коэффициенты определяются из решения системы нелинейных дифференциальных уравнений первого порядка типа Риккати109S + SA + AтS – SBR–1BтS + Q = [0];K= R – 1 Bт S;v ∗ + (Aт – BR–1 Bт) v ∗ + Qx ж = 0,где x ж – желаемое поведение системы.Для замкнутой линейной стационарной системы передаточнаяфункция определяется какW(s) =1.T s + 2ζTs + 12 2(3.56)Согласно процедуре Эллерта выбор коэффициента демпфирования ζ обеспечивает требуемую степень устойчивости системыпри условии, что ни одна из переменных системы не превышаетзаданных пределов.Постоянная времени T выбирается в соответствии с требуемойполосой пропускания системы или ограничениями на u2(t).
Дляопределения постоянной времени T разрешим уравнения– v * 1 = q22x2ж + a22v2* + a12 v1* – b222k22v2*;– v * 2 = q11x1ж + a21v1* + a11 v1* – b112k21v2*относительно v1*(0). Подставим результат в уравнениеu2(t) = −1{[x1(t)/(a12T2) + [a11x1(t)/ a12 + x2(t)]2ζ/T +b22+ (a112/ a12 + a21)x1(t) + (a11 + a22)x2(t)} + b22v1(t).Это уравнение можно разрешить относительно постояннойвремени T при подстановке в него максимально допустимой величины u2(t), «наихудших» значений x1(t), x2(t) и v1(t).После определения ζ и T весовые коэффициенты q11 и q22 задаются уравнениями110q11 = (1/ a122 b222)[1/T4 + 6 a11ζ/T 3 + a112(12ζ + 2)/T 2 + 8a113ζ/T++(2a11a12a21a22 + 2 a112 a12a21 + a122 a212 + a114)];q22 = (1/b222)[(4ζ2 – 2)/T 2 – a112 – a222 – 2 a12a21].Далее после определения этих величин предположение о бесконечном времени tk отбрасывается (это является слабым местомрешения задачи) и рассчитывается оптимальная система для tk.Для выпуклости функционала качества весовые коэффициентыq11 и q22 должны быть неотрицательными.
В сущности, это требование служит проверкой непротиворечивости требований проектирования в предположении правомерности выбора квадратичногопоказателя качества с постоянными весовыми коэффициентами.Для объектов, описываемых уравнениями более высокого порядка, уравнение (3.56) принимает видW(s) =N ( s),T s + 2ζ n −1T s + ... + 2ζ1Ts + 1n nn −1 n −1(3.57)где N(s) = 1;N(s) = 2ς1Ts + 1;N(s) = 2ς2T 2s2 + 2ς1Ts + 1соответственно для систем первого, второго и третьего типа, т. е.систем соответственно с нулевой установившейся ошибкой приединичном ступенчатом входном сигнале, единичном линейно нарастающем входном сигнале и т.
д.Предложенная Эллертом процедура выбора весовых коэффициентов показателя качества применима и для объектов, описываемых уравнениями более высокого порядка, если ζi, (i == 1,2,...,n – 1) можно определить за небольшое число пробныхшагов. В литературе существуют табулированные численныезначения, называемые стандартными формами. Это напримерстандартные формы характеристического уравнения Уайтли(A.L. Whiteley, 1946 г.), которые могут быть использованы для нахождения ζi, с учетом требуемого значения ошибки и максимальной величины перерегулирования (табл.
3.8).111Таблица 3.8Тип системыСтандартные формыНулевая(a)позицион- (b)ная ошибка (c)(d)(e)Нулеваяскоростная (f)ошибка(g)(h)(i)Нулевая(j)ошибка по(k)ускорению(l)T 2/T 2s2 + 1,4Ts + 1T 3/ T 3s3 + 2T 2s2 + 2Ts + 1T 4/ T 4s4 + 2,6T 3s3 + 3,4T 2s2 + 2,6Ts + 1T 2/T 2s2 +2,5Ts + 1T 3/ T 3s3 + 5,1T 2s2 + 6,3Ts + 1T 4/ T 4s4 + 7,2T 3s3 + 1,6T 2s2 + 12Ts + 1T 5/ T 5s5 + 9T 4s4 + 29T 3s3 + 38T 2s2 + 18Ts + 1T 6/ T 6s6 + 11T 5s5 + 43T 4s4 + 83T 3s3 + 73T 2s2+ 25Ts + 1T 3/ T 3s3 + 6,7T 2s2 + 6,7Ts + 1T 4/ T 4s4 + 7,9T 3s3 + 15T 2s2 + 7,9Ts + 1T 5/ T 5s5 + 18T 4s4 + 69T 3s3 + 69T 2s2 + 18Ts + 1T 6/ T 6s6 + 36T 5s5 + 251T 4s4 + 485T 3s3 + 251T 2s2 + 36Ts + 1σmax,%5810101010101010202020Передаточной функцией типа (3.57) обладают многие реальныесистемы управления, поэтому для определения весовых коэффициентов, удовлетворяющих объективным требованиям проектирования, можно использовать стандартные формы Уайтли совместнос процедурой Эллерта.
Следует отметить, что выбор коэффициентов показателя качества не самоцель, так как именно он и определяет ς1, а следовательно, и параметры регулятора.112ГЛАВА 4. СПЕЦИФИЧЕСКИЕ ЗАДАЧИОПТИМАЛЬНОГО УПРАВЛЕНИЯК использованию необходимых условий оптимальности следует подходить с известной осторожностью. Существуют классы задач, при решении которых неправильное использование принципамаксимума или классического вариационного управления можетпривести к неверным результатам. Типичным примером являетсякласс особых задач оптимального управления.Встречаются и другие классы задач, применительно к которымдаже правильное использование принципа максимума недостаточно для нахождения решения. Типичный пример – вырожденныезадачи оптимального управления.Все численные методы решения двухточечных нелинейныхкраевых задач используют либо методы теории поля (или же динамическое программирование), либо итерационные процедуры.Методы теории поля применительно к двухточечным краевымзадачам могут быть представлены как процесс построения множества решений, удовлетворяющих заданным граничным условиямна одном конце при использовании незаданных граничных условий в качестве параметров.4.1.
Особые задачи оптимального управленияРассмотрим функцию Гамильтона для типичной задачи оптимального управленияH = p0 L + p т f = p0 L + H ′.(4.1)Предположим, что существует такая задача, что оптимальнаятраектория x ∗ (t ) и оптимальное управление u ∗ (t ) удовлетворяютвсем необходимым условиям для приведенной функции Гамильтона H ′ = p т f .113Тогда для того, чтобы гамильтониан (4.1) дал также оптимальное решение, должно быть выполнено условие р0 = 0.Оптимальная траектория x ∗ (t ) , вдоль которой р0 = 0, называется особой оптимальной траекторией.
Задачу управления, дающую особую оптимальную траекторию, будем называть особойзадачей оптимального управления.Возможным примером особых задач управления являются задачи, в которых решение не зависит от функции L. Этот класс задач плохо сформулирован, так как на решение не будет оказыватьвлияние показатель качества J. Однако из этого случая можно получить некоторые геометрические указания, которые могут бытьполезны при рассмотрении других вырожденных и особых задачуправления.Отметим, что переменные p0∗ будут тождественно равнятьсянулю, если достижимое множество Gk в конечной точке в n + 1мерном пространстве таково, что ось x0 перпендикулярна опорной плоскости Gk в этой конечной точке.
В подобном случае вектор p, который, как было показано ранее, перпендикулярен извне к достижимому множеству Gk, будет иметь составляющую p0,равную нулю.Для иллюстрации сказанного выше рассмотрим следующийпример.Пусть имеется система первого порядкаx = u.Желательно найти такую функцию управления u ∗ (t ) в интервале времени [0,1] с учетом 0 ≤ u (t ) ≤ 1 , которая переводит систему из состояния x(0) = 0 в состояние x(1) =1, максимизируя критерий качества1J = ∫ 1− u (t ) dt.0Так как J = − min(− J ), то приведенную выше задачу можнорешить также путем минимизации:1141∫−1− u (t ) dt.0Эта задача сформулирована недостаточно хорошо, так какимеется лишь одна функция управления, а именноu (t ) ≡1,которая может перевести x(t ) из 0 в 1 за отведенный интервалвремени, следовательно,u* (t ) =1.Теперь можно показать, что в данной задаче переменная p0должна равняться нулю, чтобы принцип максимума был удовлетворен.Гамильтониан для нашей задачи имеет видH = − p0 1− u (t ) + p1u (t ) .Таким образом, в соответствии с принципом максимумаH * ( p0 , p1 , x∗ , u ∗ , t ) ≥ H ( p0 , p1 , x∗ , u, t ) ,при u ∗ (t ) ≡1 это условие примет видp1 ≥ − p0 1− u (t ) + p1u (t ) .(4.2)Это условие должно быть удовлетворено для всех допустимых∂H= 0, то p1 = const .управлений u(t).
Так как p 1 = –∂xНапомним, что в соответствии с принципом максимума переменная p0 также является постоянной с неположительными значениями, а p0 и p1 не могут равняться нулю одновременно.Если p0 = 0, то уравнение (4.2) может быть выполнено при p1 > 0.Однако, если p0 < 0, то нельзя найти значение p1, которое удовле115творяло бы уравнению (4.2) длявсех допустимых u(t).
Таким образом, мы видим, что p0 = 0 представДостижимоеляет собой единственное решение имножествопотому является особым.Можно определить, что p0 = 0, пуР x1тем рассмотрения достижимого множества для данной задачи. При x0 == J можно убедиться, что достижиРис. 4.1 Достижимое множествомоемножество в зависимости от x0 ив особой задачеx1 принимает вид области на рис. 4.1.В точке x = x1 внешняя нормаль достижимого множествадолжна располагаться вдоль оси x1, следовательно, p0 = 0.Конечно, особые задачи управления не обязательно бывают такими наглядными, как в рассмотренном примере.x04.2. Вырожденные задачи оптимального управленияВ случае, когда существует, по крайней мере, один интервал вреn*мени, в течение которого соотношение u*j (t ) = −sign[∑ ϕi ( x ) pi* (t )] неi=1определяет оптимальное управление как функцию от x ∗ (t ) и p∗ (t ),говорят о задаче вырожденного оптимального управления.Вырожденными задачами оптимального управления называются такие, у которых необходимое условие оптимальностиH [ x ∗ (t ), p∗ (t ), u ∗ (t ), t ] ≤ H [ x ∗ (t ), p∗ (t ), u (t ), t ]не дает определенного соотношения между u ∗ (t ) , x ∗ (t ) , p∗ (t ) иt , т.
е. не дает информации относительно связи u ∗ (t ) с x ∗ (t ) иp∗ (t ) . Это не означает, что оптимальное управление не существует или не может быть определено, и происходит в том случае, еслиаргумент функции sign{...} ≡ 0 на конечном интервале времени.В общем случае решение вырожденных задач более сложно,чем решение нормальных задач оптимизации. Эти трудности возникают из-за того, что необходимое условие, состоящее в том, что116гамильтониан максимизируется (по отношению к управлению)вдоль оптимальной траектории, не позволяет получить достаточноопределенного выражения для оптимального управления.
При отсутствии такой информации мы должны пользоваться другиминеобходимыми условиями, пытаясь найти вполне определенноевыражение такого рода.К сожалению, в настоящее время общие результаты, относящиеся к существованию вырожденных решений задач оптимизации, весьма ограниченны. Необходимы дополнительные исследования природы, свойств и других характеристик вырожденныхрешений.
Вырожденные решения связаны со сложными вычислительными операциями.Несмотря на то, что в данном разделе эти положения будутрассмотрены достаточно поверхностно, продемонстрируем, какследует подходить к решению вырожденных задач.Чтобы избежать усложнения обозначений, будем рассматриватьинвариантные по времени задачи с единственной управляющей переменной. Для задач со многими составляющими управления u (t )основные понятия не изменятся. Кроме того, будем рассматриватьзадачи с закрепленным концом (задано конечное состояние объекта)как с заданным, так и с незаданным временем перехода.Сформулируем задачу, которая может иметь вырожденное решение.Дана инвариантная во времени системаxi = fi ( x , t ) + bi ( x , t )u (t ) где i = 1, 2,..., n ,(4.3)где u(t) – скалярная управляющая переменная, ограниченная повеличинеu (t ) ≤1 ∀ t.(4.4)Пусть заданы начальное состояние x (0) = x0 , конечное состояние x (tk ) = 0 и функционал качестваtkJ (u ) = ∫ [ f 0 ( x , t ) + b0 ( x , t )u (t )]dt ,(4.5)t0117где f 0 ( x , t ) и b0 ( x , t ) – скалярные функции состояния; время tkможет быть задано или не задано.