tul16 (Лекции по теории управления)
Описание файла
Файл "tul16" внутри архива находится в папке "Лекции по теории управления". PDF-файл из архива "Лекции по теории управления", который расположен в категории "". Всё это находится в предмете "теория автоматического управления (тау)" из 7 семестр, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "теория автоматического управления (тау)" в общих файлах.
Просмотр PDF-файла онлайн
Текст из PDF
Лекция 16.Часть III. ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ9. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ ДЕТЕРМИНИРОВАННЫХСИСТЕМ9.1. НАХОЖДЕНИЕ ОПТИМАЛЬНОГО ПРОГРАММНОГО УПРАВЛЕНИЯ9.1.1. Постановка задачиПусть поведение модели объекта управления описывается обыкновенным дифференциальным уравнениемx (t ) f (t , x (t ), u(t )) ,(1)где x – вектор состояния системы, x ( x1 , , x n )T R n ; u – вектор управления,u (u1 ,..., uq )T U R q , U – некоторое заданное множество допустимых значенийуправления; t – время, t T [t 0 , t1 ] – промежуток времени функционирования системы; f (t , x, u ) – непрерывная вместе со своими частными производными векторфункция, f (t, x, u) ( f1 (t, x, u),..., f n (t, x, u))T , f (t , x, u ) : T R n U R n ; R n – nмерное евклидово пространство.Момент начала процесса t 0 задан, а момент окончания процесса t1 определяетсяповерхностипервым моментом достижения точкой (t , x (t )) некоторой заданной R n 1 : { (t1 , x ) | i (t1 , x ) 0, i 1,..., l ; t1 (t 0 , ), x R n } ,(2)т.е.
в момент t1 должны выполняться условияi (t1 , x (t1 )) 0 ,i = 1, , l ,где 0 l n 1 , при l n 1 множество представлено точкой в пространстве R n 1 ,i (t1 , x )системавекторовфункции–непрерывнодифференцируемы; i (t1 , x ) (t , x ) i (t1 , x ) , i 1,..., l , линейно независима (t1 , x ) R n 1 .,, i 1, xxt11nНачальное условие x (t 0 ) x 0 задает начальное состояние системы.Предполагается, что при управлении используется информация толькоо времени, т.е. система управления в данном случае является разомкнутой по состоянию и рассматривается так называемое программное управление (рис.
1).1Множество допустимых управлений U 0 образуют кусочно-непрерывные функции u() со значениями в множестве U . В точках разрыва значение управления определяется как предел справа.Определим множество допустимых процессов D (t 0 , x 0 ) как множество троекd (t1 , x (), u()) , которые включают момент окончания процесса t1 , траекторию x () иуправление u() (где t T : x (t ) R n , u(t ) U , функции x () непрерывны и кусочнодифференцируемы, а u() U 0 кусочно-непрерывны), удовлетворяющие уравнению (1) сначальным условием x (t 0 ) x 0 почти всюду на множестве T и условию (2).x (t 0 ) x 0tdx f (t , x (t ), u(t ))dtu(t )x (t )Рис.
1На множестве D (t 0 , x 0 ) определим функционал качества управленияI (d ) t1f 0 (t , x (t ), u(t )) dt F (t1 , x (t1 )) ,(3)t0где f 0 (t , x, u ) , F (t1 , x ) – заданные непрерывно дифференцируемые функции.Требуется найти такую тройку d (t1 , x (), u ()) D (t 0 , x 0 ) , чтоI (d ) mind D (t0 , x0 )I (d ) .(4)Задача (4) с функционалом (3) называется задачей Больца; если в функционале (3)функция F (t1 , x ) 0 (отсутствует так называемый терминальный член) – задачей Лагранжа; если f 0 (t , x, u ) 0 (отсутствует интегральный член) – задачей Майера.Искомые функции x () и u () называются соответственно оптимальной траекторией и оптимальным управлением, а t1 – оптимальным моментом окончанияпроцесса.З а м е ч а н и е.
Если любое допустимое управление u() U 0 порождаетединственную тройку d D (t 0 , x 0 ) , то задача (4) может быть записана в эквивалентнойформе:I (t 0 , x 0 , u ()) min I (t 0 , x 0 , u()) .u () U 029.1.2. Принцип максимумаНеобходимым условием экстремума функционала в задаче (4) является принципмаксимума.Утверждение. Пусть на тройке d (t1 , x (), u ()) D (t 0 , x 0 ) достигаетсяминимумфункционала(3).Тогдасуществуеттакаявектор-функцияT(t ) (1 (t ),..., n (t )) , что:1) в каждой точке непрерывности управления u (t ) функция H (t , (t ), x (t ), u )достигает максимума по управлению, т.
е.max H (t , (t ), x * (t ), u) H (t , (t ), x * (t ), u * (t )) ,u Uгде H (t , , x, u ) n j f j (t, x, u) f 0 (t, x, u) ;j 12) выполняется условие трансверсальностиF (t1* ) H (t1* ) t1 n j (t1* ) x j0(5)j 1при любых t1 и x j , удовлетворяющих системеi (t1 , x (t1 )) 0 , i 1, , l ,i (t1 , x (t1 )) 0 ,i 1, , l ,где H (t1 ) H (t1 , (t1 ), x (t1 ), u (t1 )) , F (t1 ) F (t1 , x (t1 )) , а вариации определяютсяследующим образом:F (t1 ) F (t1 , x (t1 )) i (t1 , x (t1 )) F (t1 , x (t1 )) t1 i (t1 , x (t1 )) t1t1 t1 nF (t1 , x (t1 ))j 1xjn i (t1 , x (t1 ))j 1xjx j ,x j ;3) функции x (), () удовлетворяют системе уравненийx j (t ) H (t , (t ), x (t ), u (t )) f j (t , x (t ), u (t )) ,j j (t ) H (t , (t ), x (t ), u (t )),xjx j (t 0 ) x 0 j ,j 1, , n .j 1, , n ,(6)3Используемые в формулировке утверждения функции 1 (t ), , n (t ) называютсявспомогательными переменными, H (t , , x, u) – гамильтонианом, а система (6) – системой канонических уравнений.З а м е ч а н и я.1.
В частном случае задания множества Г, когда момент времени t1 задан и фиксировано k координат x11 , , x k1 вектора x (t1 ) , т.е. t1 T1 , x j (t1 ) x j1 , j 1, , k ;0 k n , l k + 1 , функции j (t1 , x ) имеют вид j (t1 , x ) x j x j1 0 ,j 1, , k ;k 1 (t1 , x ) t1 T1 0 .Здесь при k n правый конец траектории фиксирован, а при k 0 свободен.Отсюда следует, что x j 0 , j 1, , k ; t1 0 .Решаемая задача с фиксированным временем окончания записывается в формеI (d ) t1f 0 (t , x (t ), u(t )) dt F ( x (t1 )) min .t0Решением этой задачи является пара ( x (), u ()) : оптимальные траектория иуправление.2. В случае, когда начальное состояние и момент начала процесса t 0 не заданы, аопределяются вместе с конечными состояниями соотношениямиi (t 0 , x (t 0 ), t1 , x (t1 )) 0 ,i 1, , l ,терминальныйчленфункционаламожетзадаватьсяввидeF1 (t1 , x (t1 )) F0 (t 0 , x (t 0 )) .
Тогда решаемая задача записывается в формеt1I (d ) разностиf 0 (t , x (t ), u(t )) dt F1 (t1 , x (t1 )) F0 (t 0 , x (t 0 )) min ,t0а условия трансверсальности имеют видF1 (t1 ) H (t1 ) t1 (t)x j 1j t1 F0 (t 0 ) H (t 0 ) t 0 j 1n(t)x j 0j t0 0j 1n(7)при любых t1 , x j t1 , t 0 , x j t0 , удовлетворяющих системеi (t 0 , x (t 0 ), t1 , x (t1 )) 0 ,i 1,..., l ;i (t 0 , x (t 0 ), t1 , x (t1 )) 0 ,i 1,..., l .Решением задачи в этом случае является четверка (t 0 , t1 , x (), u ()) , включающаяоптимальные моменты начала и окончания процесса, траекторию и управление.43.
В общем случае гамильтониан следует записывать в формеH (t , , 0 , x, u ) n j f j (t, x, u) 0 f 0 (t, x, u) ,j 1а при решении задачи рассматривать два случая: 0 (t ) 0 и 0 (t ) $ 0 . Приведенное утверждение соответствует второму случаю, когда полагают 0 (t ) 1 .4. Если на управление нет ограничений, т.е.
U R q , то максимум гамильтонианаищется с помощью необходимых и достаточных условий безусловного экстремума.5. Если модель объекта управления описывается линейным дифференциальнымуравнением, а функционал квадратичный, принцип максимума является необходимым идостаточным условием оптимальности в задаче (4).АЛГОРИТМ ПРИМЕНЕНИЯ ПРИНЦИПА МАКСИМУМА1. Составить гамильтониан: H (t , , x, u) njj 1f j (t , x, u) f 0 (t , x, u ) .2.
Найти структуру оптимального управления u (t ) u (t , (t ), x (t )) из условиямаксимума гамильтониана по управлению.3. Составить систему канонических уравнений (6) с заданными в задаче условиями.4. Из условий трансверсальности (5) или (7) получить недостающие краевые условия для уравнений составленной системы.5. Решить двухточечную краевую задачу для системы канонических уравнений, полученную в п. 3, с учетом результатов пп.
2 и 4. В итоге определяется тройка(t1 , x (), u ()) , на которой может достигаться экстремум функционала. В соответствиис пп. 1, 2 замечаний к формулировке принципа максимумарешениями задачи в зависимости от постановки могут быть также пара ( x (), u ())или четверка(t 0 , t1 , x (), u ()) .9.2.
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯС ПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ9.2.1. Постановка задачиПусть поведение модели объекта управления описывается обыкновенным дифференциальным уравнениемx (t ) f (t , x (t ), u(t )) ,(8)где x – вектор состояния системы, x R n ; u – вектор управления, u U R q ; U– некоторое заданное множество допустимых значений управления, t T [t 0 , t1 ] –промежуток времени функционирования системы, моменты начала процесса t 0 и5окончания процесса t1 заданы, f (t , x , u ):T R n U R n ; R n – n -мерное евклидовопространство.Начальное условие x (t 0 ) x 0 R n , где начальное состояние x 0 заранее не заданои может быть произвольным.Определим множество допустимых процессов D(t 0 , x 0 ) как множество парd (x (), u()) , которые включают траекторию x() и управление u() (гдеt T : x (t ) R n , u (t ) U , функции x () непрерывны и кусочно-дифференци-руемы, аu() кусочно-непрерывны), удовлетворяющие уравнению (8) с начальным условиемx (t 0 ) x 0 почти всюду на T .На множестве D(t 0 , x 0 ) определим функционал качества управленияI (d ) t1f 0 (t , x (t ), u(t )) dt F ( x (t1 )) ,(9)t0где f 0 (t , x , u ) , F (x ) – заданные непрерывно дифференцируемые функции.Предполагается, что при управлении используется информация о времени t и векторе состояния x .Множество U n допустимых управлений с полной обратной связью (позиционных управлений) образуют функции u (t , x ):T R n U , которые для любых начальных состояний порождают соответствующие пары d (x (), u ()) D(t 0 , x 0 ) , где программные управления u() U 0 , а t T u (t ) u (t , x (t )) .Применяемое в каждый момент времени t T управление имеет вид управления сполной обратной связью по вектору состояния (рис.
2).x (t 0 ) x 0 R ndx f (t , x (t ), u(t ))dtx (t )u(t , x )u(t ) u (t , x (t ))Рис. 2Требуется найти такую функцию u (t , x ) U n , чтоI (d ) mind D (t 0 , x 0 )I (d )x 0 R n ,(10)где d ( x (), u () u (, x ())) .Функция u (t , x ) U n называется оптимальным управлением с полной обратной связью. Для любого начального состояния x 0 из множества R n она6порождает со-ответствующую оптимальную пару, т.е. оптимальную траекторию x () и оптимальноепрограммное управление u () .9.2.2. Уравнение БеллманаДостаточным условием минимума функционала (9) является уравнение Беллманадля непрерывных детерминированных систем.Обозначим: Q (t 0 , t1 ) R n ; C 1,1 (Q ) - множество функций (t , x ) : Q R , непрерывно дифференцируемых по t и x .Утверждение (достаточные условия оптимальности в задаче (10)).Если существует функция (t , x ) C 1,1 (Q ) , удовлетворяющая уравнению Беллмана сграничным условием (t , x ) n (t , x )max f i (t , x, u) f 0 (t , x, u) 0u U i 1 x i t(t1 , x ) F ( x )(t , x ) Q ,(11)x R n ,и управление u (t , x ) U n , удовлетворяющее условию n (t , x )u (t , x ) arg max f i (t , x, u ) f 0 (t , x, u) ,uU i 1 x iто u (t , x ) является оптимальным управлением с полной обратной связью.При этом минимальное значение функционала (9)mind D (t 0 , x 0 )I (d ) (t 0 , x 0 ) x 0 R n .(12)АЛГОРИТМ СИНТЕЗА ОПТИМАЛЬНОГО УПРАВЛЕНИЯС ПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ1.