Курс лекций по теме Управление в МИСО (1996) (1264200), страница 11
Текст из файла (страница 11)
Подход основан на сочетании задач фильтрации и управления.Его структурная схема:описание объекта QUx q = Ax q + Bujh(t)nXq+YПричемK(t,)SYОптимальноенаведениеjнОбъект Р( t , )K o ( t , )tK( t , ) = ( t , ) K 0 ( t , )dtx p (t) = K( t , )Y( )dt0tjн ( t ) = K 0 ( t , )Y( )dt0Здесь два объекта: Р - стремящийся к встрече;Q - уклоняющийся от нее.Страница 64Xp( t , )K o ( t , ) (t1)−XqS - оптимальный регуляторЗадача является позиционно-программной, т.к. Q |U| Um управляется программно, а P ,измеряя в шумах N координаты Q , выбирает ИПФ замкнутого САУ нормальными перегрузками.K 0 = K 0 (X q )Эта стратегия является позиционной, т.к.
К0 явно зависит от Xq (решениезадачи Бутона).Xq, p - координаты центра масс;(t,) - кинематическое звено, связывающее скорость с X P;jн- нормальное ускорение.t − 0 r ( t )Чаще всего Х - сферические координаты (углы ( t , ) = азимута, места, расстояние) (возможно совмещение поt− 0 3-м точкам).r ( t ) Задача:t22max min Tr M ( t 1 ) + jн ( t )d U Um K0t0 11 1 2 T r - сумма диагоналей элементов матрицы ошибок объекта Р. 2 1 2 2 Здесь мы имеем неопределенность типа активного партнера.Рассматривается схема является интегро-дифференциальной игрой.1-й этап задачи: решение задачи Солодовникова-Боткова (нестационарнаяфильтрация).2-й этап задачи: решение задачи оптимального управления.В рамках перечисленных подходов формируются задачи типа активногопартнера, задача сближения и уклонения, задача преследования.
Эти задачи легко перестраиваются на задачи в условиях неопределенности среды (в задачахсближения и уклонения среде придаются уклоняющие свойства).Рассмотримсинтезоптимальныхантагонистической квадратичной задаче:I=влинейно-1 Tx (T)Q 0 x(T) +2T+управлений1[ x T x + x T N 1 U + U T N 1T x + U T Q 1 U − x T N 2 V t 0 − V T N T2 x − V T Q 2 V]dt2 t0Задача:min max IСистема:x = Ax + B1U − B2 VUVСтраница 65Показатель является выпукло-вогнутым по U, V. Кроме того, он разделимпо U и V.
Также разделяется правая часть системы дифференциальных уравнений, следовательно, имеет место равновесие.Алгоритм определения равновесной пары (U0, V0) основывается на методе аналитического конструирования:H = f0 + T Ax + B1U − B2 VСтраница 66Уравнения Эйлера-Лагранжа принимают вид: H= N 1T x + Q 1 U + B1T = 0U = −Q1−1 B1T + N 1T xU1 HTV = −Q12 BT2 = − N T2 x − Q 2 U − B T2 = 02 + N2 xVT3 (T) = Q 0 x(T) H T = − V = −Q 0 x − N 1 U + N 2 V − A ( t ) = S( t ) x( t ) ( t ) = S x + S xВведем дополнительную переменную:Из (3) после преобразований получим:U 0 = − K1 ( t ) x( t )V0 = − K 2 ( t ) x( t ),где K1 = Q1−1 B1TS + N1TTK 2 = Q 2−1 BT2 S + N2S = −SA − A T S K 1T Q 1 K 1 − K T2 Q 2 K 2 − 0S(T) = Q 0В более сложных случаях существуют нелинейная модель и модульноеограничение, тогда имеет место максимум Понтрягина:x = f ( x, u, v)ui Ui = Ui : Ui Ui mv i Vj = Vj: Vj Vj mT(1)( 2)I = (T, x(T)) + f 0 ( x, u, v)dt (3)t0min max IU( 4)VУтверждение:Пусть в задаче (1) (4) существует равновесие управление (U0, V0).
Тогда, чтобы функции U0(t) и V0(t) доставляли min max (max min) функционалу(3), необходимо существование непрерывного вектора , удовлетворяющегоусловиюn +1nHH1 = i fi=−, где H = i f i = 0 f 0 + H 1 + n +1 1xi=0i =1При котором:1. Н достигает своего максимума по U и минимума по V, при этомmax min H = 0,UV 0 (T0 ) 02. Выполняется условие трансверсальностиI − Ht + xx 0 = f 0 ,Tt0T=0x n +1 = 1I = ( x n + 1 (T); x(T)) + x 0 (T)x 0 (T) = f0dtt0x ' = x 0 , x1 x n , x n + 1 - расширенный векторСтраница 67Замечания.1. Если равновесие отсутствует, но существует (минимаксимум) (максиминимум), то условие трансверсальности в общем случае принимает вид системыприU = U0, V = Vфикс;V = V0, U = Uфикс;2.
Для задачи на быстродействие x0 = x n+1 = t и условия 1, 2 достаточно сформулировать для Н и х.Для иллюстрации в рамках версии о неопределенности действий активного партнера рассмотрим алгоритм решения задачи преследования:Кинематика относительного движения объектовР-преследователя и Е-цели имеет вид:VEx 1 = r = − Vp cos( − Q p ) + Ve cos( − Q e ) = f1x1 − x 2 = r = Vp sin( − Q p ) − Ve cos( − Q e ) = f 2x 3 = p = U = f 3x 4 = e = V = f 4QErVPQPt = t0;r = r0 ;t = T;r(T) = ; Vp = Ve ; = 0; p = p0 ; e = e0 ;U, V jн = Рассмотрим аэродинамическое уравнение ( const ):TI = T − t0 = f0dt;f0 = 1t0В данной задач имеет место равновесие, т.к. функция I от U, V явно независит и система уравнений разделяется по U и V.
Поэтому ограничимся минимаксной задачей: max min I .VUn2( Vp sin( x 2 − x 3 ) −x1− H =xmax min H = max min i f i = max min[ − Vp cos( x 2 − x 3 ) + Ve cos( x 2 − x 4 ) +UVUVi =1U− Ve sin( x 2 − x 4 )) + 3 U + 4 V] 0VU = Usign 3 ;V = − Vsign 4 ;1 =−H Vp sin( x 2 − x 3 ) − Ve sin( x 2 − x 4 ) 2=x 1x 122 =−1H= − ( Vp sin( x 2 − x 3 ) − Ve sin( x 2 − x 4 )) 1 − ( Vp cos( x 2 − x 3 ) − Ve cos( x 2 − x 4 ))x 2x13 =−2H= Vp sin( x 2 − x 3 ) 1 + Vp cos( x 2 − x 4 )x 3x14 =−2H= − Ve sin( x 2 − x 4 ) 1 − Ve cos( x 2 − x 4 )x 4x1Страница 68U = U jmV = VjmИз условия трансверсальности при t = T имеем:T − HT + 1x i (T) = 0r (T) = x1 (T) = e = constH(T) = 1, i 0 + 0 x 2 + 0 x 3 + 0 x 4 T − HT = 0 H = 1 2 (T) = 3 (T) = 4 (T) = 0 ( )Тогда из основного уравнения при подставке в него () получим:1 (T) =1− Vp cos( x 2 − x 3 ) + Ve cos( x 2 − x 4 )Теперь для определения оптимальности управлений необходимо решитькраевую задачу одним из методов прогонки.
Есть система:Нужно найти, функции 3 и 4 , удовлетворяющие этой системе. Один изалгоритмов прогонки имеет вид: формируем в момент времени Т показатели 22 (T); 23 (T); ( x1 (T) − l) 2 ; 24 (T) меняя (t 0 ) градиентным методом минимизируем эти 4 показателя. Можно использовать алгоритм векторной оптимизации.В работах Понтрягина и его школы получены достаточные условия существования конечного времени преследования:min max T Uvи условия уклонения от встречи:max min T = VUВ более общем, чем в теореме, случае использования принципа максимизации приводит к исследованию системы:max H (U, Vфикс , t ) = 0 Umax H (U фикс , V, t ) = 0 VПринцип экстремального прицеливания КрасовскогоЭтот принцип как основной компонент использует области достижимости.
Сейчас разработан алгоритмический аппарат для линейных систем, а такжеразвиваются приемы исследования нелинейных систем. Этот прием используется в 3 видах задач: сближения, уклонения, преследования, со сложными показателями.Области достижимости - множество точек на фазовой плоскости, в которое ЛА может попасть из фиксированного начального условия за фиксированноевремя Т.Для линейной системы область можно задать с помощью уравнения состояния в форме Коши:Страница 69Tx(T) = (T, t 1 ) x( t 1 ) + (T, t ) U( t )dtt1GTUx = A( t ) x + U при каждой реализации u UЭто множества можно формировать повсему вектору состояния, а можно по некоторымкоординатам.X(t1)множество X(t)при любом UGTИ - область достижимости.Ф(t, ) - функция перехода (ТАУ).Основные компоненты принципа:1. область достижимости;2.
область прицеливания с точками экстремального прицеливания;3. экстремальное управление.Ограничимся далее рассуждениями в рамках задачи сближения-уклонения;Пусть:QG(V)G(V)- G(V)Y(t1)x = A u x + U u U (1)y = A v y + V v V (2)G (V) - область достижимости для игрока (2)G (U) - для игрока (1).X(t1)Принцип в данной задаче формирует еще G(U) =G(U) с некоторой окрестностью.
При этом принцип своими процедурами дает минимальное , нотакое, что G(U) G (U) следовательно G(U) и G(U) касаются. Здесь - экстремальный промах.Q (область касания) формирует область экстремального прицеливания,внутри которой находится 1 или несколько точек экстремального прицеливанияqQ. Важно, чтобы Q была односвязной, т.к. в противном случае возникает“нерегулярная ситуация”. В ней не имеет места равновесие. У Красовского показано, что если объекты U и V однотипны, а f (U),(V) выпуклы, замкнуты, ограничены, система (1), (2) - линейна, то существует регулярность (и равновесие) Q.Далее будем рассматривать регулярность и равновесие.Страница 70Для уклонения объекта 2 необходимо выбрать экстремальное управлениеV, которое обеспечивает попадание из y(t1) в т.
q, с другой стороны перехватчик1 формирует экстремальное управление U, которое из x(t1) в q1, наиболее близкую к q (что обеспечивает промах меньше чем ). Выбор экстремальных управлений похож на принцип максимума и полностью является минимаксимальнойзадачей для перехватчика (максиминимальной для убегающей цели).t 1 - текущий момент времени.Повторяя процедуру для t 2 = t 1 + t , t 3 ... и т.д. формируем управление вобратных связях (многократная коррекция программы управления).
Принципформирует оптимальный метод наведения.Если (1),(2) - нелинейны, то G ( u),( v) - не выпуклые, и принцип неприменим. Сейчас решение этой задачи разрабатывается.Пример:пусть каждая ЛА используется однотипное описание:x = v cos = f1y = v sin = f 2 = k − k cos = f12 x 1 = v cos x 3 = f1 x 2 = v sin x 3 = f 2 x = k u − k cos x = f1233 33a − угол атаки, U = ( : max )Можно описывать и через ( , , ) - пропорциональны углам поворота рулей.min max infНеобходимо обеспечить U и V :uгдеv,= ( x1 − y1 ) 2 + ( x 2 − y 2 ) 21x = ( x1 , x 2 , x 3 )Вектора состоянийx(T) m − y(T) m2 y = ( y1 , y 2 , y 3 )Такую систему можно записать для цели и для преследователя :min max infuv xE,x p2x E m − x P m T- показатель в задаче сближения-уклонения.Это случай равновесия (соприкосновение в 1 точке).