Диссертация (1145289), страница 42
Текст из файла (страница 42)
ВремяTϕ перехода в малую окрестность этого положения должно быть сделано минимальным за счет выбора коэффициентов ki , i = 1,4 регулятора (7.2.11).Для решения поставленной задачи, прежде всего, рассмотрим вопрос о265приближенном построении программного управления, обеспечивающего наиболее быстрый разворот объекта.Наряду с системой (7.2.9) введём в рассмотрение модель динамики объектав пределах линейной зоны привода рулейx[k + 1] = Ax[k ] + bδ[k ],(7.2.12)δ[k + 1] = Tu[k ] + δ[k ], y[k ] = cx[k ],которая хорошо представляет движение в режиме стабилизации или маневрирования с малыми углами ϕ z .
Будем далее предполагать, что матрица ( A − E) / Tимеет все вещественные собственные значения, расположенные в замкнутой левой полуплоскости.Пусть целью управления служит перевод системы (7.2.9) или (7.2.12) източки x 0 = x[0] = (0 0 0 ) в точку x ϕ = x[Tϕ ] = (0 0 ϕ z ) , т.е. поворот по углуTTϕ на заданную величину ϕ z , где Tϕ – заранее не фиксированный момент дис-кретного времени. Качество поворота будем оценивать его длительностью, т.е.значением функционала Tϕ = Tϕ (u ) , заданного на множестве управлений, определяемых ограничениями (7.2.10).Существо этой классической задачи теории оптимального быстродействиясостоит в поиске такого программного управления u = uc = {uc [k ]} , удовлетворяющего ограничениям (7.2.10), которое обеспечивает минимум функционалаTϕ = Tϕ (u ) .Методы точного решения этой задачи базируются на необходимых условиях экстремума в различных формах.
Однако их практическое применение затруднено, поскольку связано с достаточно сложной краевой задачей для систем обыкновенных дифференциальных уравнений.Если поиск оптимального управления осуществляется в исследовательскихусловиях, решение задачи, в принципе, может быть получено за разумное время.Однако если управление формируется в адаптивном режиме в темпе реальноговремени на борту, то известные методы практически не применимы в силу суще-266ственной ограниченности возможностей бортовых вычислителей.В отличие от линейного быстродействия, задача для нелинейной моделивообще не имеет аналитического решения.
Здесь возможны лишь численныеприближения с большим объёмом вычислений, которые совершенно нереальноосуществить на борту.Предлагаемый приближённый подход, исходная идея которого впервыебыла представлена в работе [49], заведомо ориентирован на бортовую реализацию. Эта идея базируется на известном представлении оптимального управления,как релейной функции времени, с количеством переключений, которое, в соответствии с теоремой Фельдбаума, в данном случае не превосходит трех.Оптимальное управление в виде функций u = uc = {uc [k ]} и δ = δ c = {δ c [k ]}качественно представлено соответствующими кривыми на рис.
7.2.1. В каждомконкретном случае его вид однозначно зависит от командного сигнала, однакоимеются общие закономерности, которые разумно использовать при синтезе.uu0uc0t1t2 t3t4kt2t4k-u0δδc0t1t3Рис. 7.2.1. Управляющий сигнал и отклонение рулейв квазиоптимальном процессе.Прежде всего, отметим, что в начале процесса руль поворачивается с максимальной скоростью u0 до момента времени t = t1 . Далее до момента t = t2 идет267торможение объекта обратным поворотом руля с максимальной скоростью.
Вмомент t = t 2 , когда скорость еще не погашена, управление снова переключаетсядля перемещения руля в нейтральное положение и для завершения сброса скорости. И на последнем участке от момента t = t3 до момента t = t4 руль окончательно приводится в нулевое положение и скорость сбрасывается до нуля.Рассмотрим вопрос о приближенном поиске моментов t1 ÷ t 4 переключенияуправления (рис. 7.2.1).
Заметим, что нижней оценкой для минимального времениповорота с очевидностью служит величина t0 , определяемая равенствомϕ0 [t0 ] = ϕ z , где функция ϕ = {ϕ0 [k ]} соответствует движению при условииu[k ] ≡ u0 , определяющему максимально быстрый выход руля на упор в нужномнаправлении и дальнейший разворот по курсу с максимальным значением отклонения руля δ[k ] ≡ δ 0 .Используя полученную оценку, можно выбрать момент k = t1 первого переключения управления в диапазоне t1 ∈ [t0 / 3, t0 ] . Легко видеть, что при слишкомраннем переключении на торможение (в момент k = t11 ) соответствующая функция ϕ = {ϕ1[k ]} не достигнет желаемого значения ϕ z . С другой стороны, прислишком позднем переключении (в момент времени t = t12 ) соответствующеедвижение ϕ = {ϕ 2 [k ]} превысит указанное значение.
Пример поведения этихфункций представлен на рис. 7.2.2 в виде соответствующих интерполяций в непрерывном времени.Учитывая приведенные соображения, легко построить итеративный процесс и найти такой момент переключения k = t1 , чтобы выполнилось условиеmax ϕ[k ] = ϕ z .k∈[ t 0 ,∞ )Нарис.7.2.2этомуусловиюудовлетворяетфункцияϕ* = {ϕ*[k ]} , для которой ϕ*[t * ] = ϕ z в момент k = t * .Полученное вспомогательное значение k = t * можно использовать для поиска момента переключения k = t 2 , который с очевидностью должен принадле-268жать отрезку [t ** , t * ] , где k = t ** – момент перехода рулей δc через ноль.
Заметим,что t ** < t * , поскольку причиной изменения знака скорости x2 может быть толькоизменение направления отклонения руля. Поиск момента переключения k = t 2 наотрезке [t ** , t * ] можно осуществлять любым способом, включая перебор с определенным шагом.φ,δφ0={φ0[k]}φ2={φ2[k]}φzφ*={φ*[k]}δc={δc[k]}φ1={φ1[k]}t*0t11t1t12 t0 t**t2kРис. 7.2.2. Динамика квазиоптимального программного процесса.Заметим, что для реализации предлагаемого подхода вполне достаточно ограничиться найденными значениями t1 и t 2 для формирования квазиоптимальнойобратной связи: моменты переключения k = t3 и k = t 4 , как будет показано ниже,определяются иным путем.Далее будем основываться на том факте, доказанном в работе [6], что реализация конкретного оптимального по времени программного управления рассматриваемого типа с известными моментами переключения для линейного объекта (7.2.12) может быть осуществлена с помощью стабилизирующей линейнойобратной связи (7.2.11).Согласно [6], существует обратная связь вида (7.2.11), обеспечивающая приусловии uc [k ] = u0 sign(u[k ]) устойчивость замкнутой системы и дающая для неёоптимальный по времени переходный процесс.
Но тогда коэффициенты такойобратной связи должны обеспечивать выполнение четырех равенств, соответст-269вующих указанным выше моментам переключения управления:uc [t1 ] = k1 xc1[t1 ] + k 2 xc 2 [t1 ] + k3 ( xc 3[t1 ] − ϕ z ) + k 4 δ c [t1 ] = 0,uc [t 2 ] = k1 xc1[t 2 ] + k 2 xc 2 [t 2 ] + k3 ( xc 3 [t 2 ] − ϕ z ) + k 4 δ c [t 2 ] = 0,uc [t3 ] = k1 xc1[t3 ] + k 2 xc 2 [t3 ] + k3 ( xc 3 [t3 ] − ϕ z ) + k 4 δ c [t3 ] = 0,(7.2.13)uc [t 4 ] = k1 xc1[t 4 ] + k 2 xc 2 [t 4 ] + k3 ( xc 3 [t 4 ] − ϕ z ) + k 4 δ c [t 4 ] = 0.Обратим внимание на то, что в приведенных равенствах все элементы кроме чиселk1 ÷ k 4известны, если сформировано программное управлениеuc = {uc [k ]} (найдены моменты t1 ÷ t 4 переключения) и построено соответствующее ему движение x c = {x c [k ]} и δ c = {δ c [k ]} объекта (7.2.9). Тогда равенства(7.2.13) могут трактоваться как неоднородная система алгебраических уравненийотносительно неизвестных коэффициентов k1 ÷ k 4 обратной связи (7.2.11), решение которой и завершает синтез этого закона управления.Однако очевидно, что полученный регулятор будет давать оптимальное побыстродействию движение только для принятой величины ϕ z командного сигнала.
Если изменить эту величину, но не пересчитать решение новой системы(7.2.13), то обратная связь (7.2.11) уже не даст оптимальный по времени процесс,но обеспечит близость к нему для близких значений командного сигнала. В этомсмысле синтезированная обратная связь будет квазиоптимальной (близкой к оптимальной).Дальнейшее развитие идеи квазиоптимизации можно обеспечить, переходяк упрощенному варианту поиска коэффициентов регулятора (7.2.11).
В частности, зафиксируем два из них, полагая k1 = k1* и k3 = k3* , и далее не будем менятьзначения k1* и k3* , выбранные из каких-либо практических соображений.Тогда в системе (7.2.13) два уравнения становятся лишними. Учитывая особую значимость моментов переключения t = t1 и t = t 2 , отбросим два последнихуравнения, соответствующих моментам переключения t = t3 и t = t4 , что приведетнас к системе270k 2 xc 2 [t1 ] + k 4 δ c [t1 ] = − k1* xc1[t1 ] − k3* ( xc3 [t1 ] − ϕ z ),k 2 xc 2 [t 2 ] + k 4 δ c [t 2 ] = − k1* xc1[t 2 ] − k3* ( xc 3[t 2 ] − ϕ z ).(7.2.14)Полученные равенства (7.2.14) дают линейную неоднородную систему, состоящую из двух уравнений с двумя неизвестными k2 и k4 , решение которой легко найти, зная моменты переключения k = t1 и k = t 2 :k 2* = k 2* (t1 , t 2 ) =∆ k1 *∆, k4 = k4* (t1 , t2 ) = k 2 ,∆k∆k(7.2.15)∆ k = xc 2 [t1 ]δ c [t 2 ] − xc 2 [t 2 ]δ c [t1 ] ,∆ k1 = β1δ c [t 2 ] − β 2 δ c [t1 ] , ∆ k 2 = xc 2 [t1 ]β 2 − xc 2 [t 2 ]β1 ,β1 = − k1* xc1[t1 ] − k3* ( xc3 [t1 ] − ϕ z ) , β 2 = − k1* xc1[t 2 ] − k3* ( xc 3[t 2 ] − ϕ z ) .После решения системы (7.2.14) можно сформировать квазиоптимальныйрегуляторu[k ] = k1* x1[k ] + k 2* (t1 , t2 ) x2 [k ] + k3* ( x3 [k ] − ϕ z ) + k4* (t1 , t 2 )δ[k ],(7.2.16)и записать уравнения замкнутой им системыx[k + 1] = Ax[k ] + bf δ (δ[k ]),δ[k + 1] = Tf u (u[k ]) + δ[k ], y[k ] = cx[k ],(7.2.17)u[k ] = k1* x1[k ] + k 2* (t1 , t2 ) x2 [k ] + k3* ( x3[k ] − ϕ z ) + k4* (t1 , t 2 )δ[k ]с учетом ограничений (7.2.10).По построению видно, что сформированная замкнутая система (7.2.17) неявляется оптимальной по быстродействию, однако достаточно близка к ней покачеству динамики.Переходный процесс в системе (7.2.17) качественно представлен на рис.7.2.3 в виде интерполяции графика функции ϕ = {ϕ[k ]} , представляющей изменения курса, и интерполяции графика δ = {δ[k ]} для изменения положения рулей.Здесь же представлены опорные функции ϕ0 = {ϕ 0 [k ]} и ϕ* = {ϕ*[k ]} , которыеслужат для определения исходного значения момента переключения k = t1* и диапазона [t ** , t * ] для момента k = t 2 .271φ,δφ0={φ0[k]}φ={φ[k]}φzφ*={φ*[k]}δ={δ[k]}t2t1 t1*0t*t0 t**TckРис.
7.2.3. Переходный процесс в замкнутой системе (7.2.17).Для того, чтобы приблизить систему (7.2.17) к оптимальной, введем в рассмотрение две характеристики качества процессов, обращая внимание на тотфакт, что их величины, как и значения коэффициентов k 2* и k4* , являются функциями от моментов переключения t = t1 и t = t 2 в квазиоптимальной программе.Первый показатель характеризует степень устойчивости замкнутой системы в линейном варианте (при снятии ограничений на величину и скорость перекладкируля):α = α(t1 , t 2 ) = 1 − max γ i , ∆ ( γ i ) = 0, i = 1, n3 ,i(7.2.18)где ∆ (z ) – характеристический полиномEz − A−b∆ ( z ) = det .**** − T [k1 k 2 (t1 , t 2 ) k3 ] z − Tk 4 (t1 , t 2 ) − 1Второй показатель характеризует меру отклонения процесса по курсу отжелаемой величины ϕ = ϕ z :TcJ ϕ = J ϕ (t1 , t 2 ) =∑[ϕ(k , t , t ) − ϕ ]21k =t2z,(7.2.19)*где принято значение Tc = 5t 0 момента окончания процесса. Заметим, что значение J ϕ характеризует площадь заштрихованной фигуры на рис.