tul16 (1014491)
Текст из файла
Лекция 16.Часть III. ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ9. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ ДЕТЕРМИНИРОВАННЫХСИСТЕМ9.1. НАХОЖДЕНИЕ ОПТИМАЛЬНОГО ПРОГРАММНОГО УПРАВЛЕНИЯ9.1.1. Постановка задачиПусть поведение модели объекта управления описывается обыкновенным дифференциальным уравнениемx (t ) f (t , x (t ), u(t )) ,(1)где x – вектор состояния системы, x ( x1 , , x n )T R n ; u – вектор управления,u (u1 ,..., uq )T U R q , U – некоторое заданное множество допустимых значенийуправления; t – время, t T [t 0 , t1 ] – промежуток времени функционирования системы; f (t , x, u ) – непрерывная вместе со своими частными производными векторфункция, f (t, x, u) ( f1 (t, x, u),..., f n (t, x, u))T , f (t , x, u ) : T R n U R n ; R n – nмерное евклидово пространство.Момент начала процесса t 0 задан, а момент окончания процесса t1 определяетсяповерхностипервым моментом достижения точкой (t , x (t )) некоторой заданной R n 1 : { (t1 , x ) | i (t1 , x ) 0, i 1,..., l ; t1 (t 0 , ), x R n } ,(2)т.е.
в момент t1 должны выполняться условияi (t1 , x (t1 )) 0 ,i = 1, , l ,где 0 l n 1 , при l n 1 множество представлено точкой в пространстве R n 1 ,i (t1 , x )системавекторовфункции–непрерывнодифференцируемы; i (t1 , x ) (t , x ) i (t1 , x ) , i 1,..., l , линейно независима (t1 , x ) R n 1 .,, i 1, xxt11nНачальное условие x (t 0 ) x 0 задает начальное состояние системы.Предполагается, что при управлении используется информация толькоо времени, т.е. система управления в данном случае является разомкнутой по состоянию и рассматривается так называемое программное управление (рис.
1).1Множество допустимых управлений U 0 образуют кусочно-непрерывные функции u() со значениями в множестве U . В точках разрыва значение управления определяется как предел справа.Определим множество допустимых процессов D (t 0 , x 0 ) как множество троекd (t1 , x (), u()) , которые включают момент окончания процесса t1 , траекторию x () иуправление u() (где t T : x (t ) R n , u(t ) U , функции x () непрерывны и кусочнодифференцируемы, а u() U 0 кусочно-непрерывны), удовлетворяющие уравнению (1) сначальным условием x (t 0 ) x 0 почти всюду на множестве T и условию (2).x (t 0 ) x 0tdx f (t , x (t ), u(t ))dtu(t )x (t )Рис.
1На множестве D (t 0 , x 0 ) определим функционал качества управленияI (d ) t1f 0 (t , x (t ), u(t )) dt F (t1 , x (t1 )) ,(3)t0где f 0 (t , x, u ) , F (t1 , x ) – заданные непрерывно дифференцируемые функции.Требуется найти такую тройку d (t1 , x (), u ()) D (t 0 , x 0 ) , чтоI (d ) mind D (t0 , x0 )I (d ) .(4)Задача (4) с функционалом (3) называется задачей Больца; если в функционале (3)функция F (t1 , x ) 0 (отсутствует так называемый терминальный член) – задачей Лагранжа; если f 0 (t , x, u ) 0 (отсутствует интегральный член) – задачей Майера.Искомые функции x () и u () называются соответственно оптимальной траекторией и оптимальным управлением, а t1 – оптимальным моментом окончанияпроцесса.З а м е ч а н и е.
Если любое допустимое управление u() U 0 порождаетединственную тройку d D (t 0 , x 0 ) , то задача (4) может быть записана в эквивалентнойформе:I (t 0 , x 0 , u ()) min I (t 0 , x 0 , u()) .u () U 029.1.2. Принцип максимумаНеобходимым условием экстремума функционала в задаче (4) является принципмаксимума.Утверждение. Пусть на тройке d (t1 , x (), u ()) D (t 0 , x 0 ) достигаетсяминимумфункционала(3).Тогдасуществуеттакаявектор-функцияT(t ) (1 (t ),..., n (t )) , что:1) в каждой точке непрерывности управления u (t ) функция H (t , (t ), x (t ), u )достигает максимума по управлению, т.
е.max H (t , (t ), x * (t ), u) H (t , (t ), x * (t ), u * (t )) ,u Uгде H (t , , x, u ) n j f j (t, x, u) f 0 (t, x, u) ;j 12) выполняется условие трансверсальностиF (t1* ) H (t1* ) t1 n j (t1* ) x j0(5)j 1при любых t1 и x j , удовлетворяющих системеi (t1 , x (t1 )) 0 , i 1, , l ,i (t1 , x (t1 )) 0 ,i 1, , l ,где H (t1 ) H (t1 , (t1 ), x (t1 ), u (t1 )) , F (t1 ) F (t1 , x (t1 )) , а вариации определяютсяследующим образом:F (t1 ) F (t1 , x (t1 )) i (t1 , x (t1 )) F (t1 , x (t1 )) t1 i (t1 , x (t1 )) t1t1 t1 nF (t1 , x (t1 ))j 1xjn i (t1 , x (t1 ))j 1xjx j ,x j ;3) функции x (), () удовлетворяют системе уравненийx j (t ) H (t , (t ), x (t ), u (t )) f j (t , x (t ), u (t )) ,j j (t ) H (t , (t ), x (t ), u (t )),xjx j (t 0 ) x 0 j ,j 1, , n .j 1, , n ,(6)3Используемые в формулировке утверждения функции 1 (t ), , n (t ) называютсявспомогательными переменными, H (t , , x, u) – гамильтонианом, а система (6) – системой канонических уравнений.З а м е ч а н и я.1.
В частном случае задания множества Г, когда момент времени t1 задан и фиксировано k координат x11 , , x k1 вектора x (t1 ) , т.е. t1 T1 , x j (t1 ) x j1 , j 1, , k ;0 k n , l k + 1 , функции j (t1 , x ) имеют вид j (t1 , x ) x j x j1 0 ,j 1, , k ;k 1 (t1 , x ) t1 T1 0 .Здесь при k n правый конец траектории фиксирован, а при k 0 свободен.Отсюда следует, что x j 0 , j 1, , k ; t1 0 .Решаемая задача с фиксированным временем окончания записывается в формеI (d ) t1f 0 (t , x (t ), u(t )) dt F ( x (t1 )) min .t0Решением этой задачи является пара ( x (), u ()) : оптимальные траектория иуправление.2. В случае, когда начальное состояние и момент начала процесса t 0 не заданы, аопределяются вместе с конечными состояниями соотношениямиi (t 0 , x (t 0 ), t1 , x (t1 )) 0 ,i 1, , l ,терминальныйчленфункционаламожетзадаватьсяввидeF1 (t1 , x (t1 )) F0 (t 0 , x (t 0 )) .
Тогда решаемая задача записывается в формеt1I (d ) разностиf 0 (t , x (t ), u(t )) dt F1 (t1 , x (t1 )) F0 (t 0 , x (t 0 )) min ,t0а условия трансверсальности имеют видF1 (t1 ) H (t1 ) t1 (t)x j 1j t1 F0 (t 0 ) H (t 0 ) t 0 j 1n(t)x j 0j t0 0j 1n(7)при любых t1 , x j t1 , t 0 , x j t0 , удовлетворяющих системеi (t 0 , x (t 0 ), t1 , x (t1 )) 0 ,i 1,..., l ;i (t 0 , x (t 0 ), t1 , x (t1 )) 0 ,i 1,..., l .Решением задачи в этом случае является четверка (t 0 , t1 , x (), u ()) , включающаяоптимальные моменты начала и окончания процесса, траекторию и управление.43.
В общем случае гамильтониан следует записывать в формеH (t , , 0 , x, u ) n j f j (t, x, u) 0 f 0 (t, x, u) ,j 1а при решении задачи рассматривать два случая: 0 (t ) 0 и 0 (t ) $ 0 . Приведенное утверждение соответствует второму случаю, когда полагают 0 (t ) 1 .4. Если на управление нет ограничений, т.е.
U R q , то максимум гамильтонианаищется с помощью необходимых и достаточных условий безусловного экстремума.5. Если модель объекта управления описывается линейным дифференциальнымуравнением, а функционал квадратичный, принцип максимума является необходимым идостаточным условием оптимальности в задаче (4).АЛГОРИТМ ПРИМЕНЕНИЯ ПРИНЦИПА МАКСИМУМА1. Составить гамильтониан: H (t , , x, u) njj 1f j (t , x, u) f 0 (t , x, u ) .2.
Найти структуру оптимального управления u (t ) u (t , (t ), x (t )) из условиямаксимума гамильтониана по управлению.3. Составить систему канонических уравнений (6) с заданными в задаче условиями.4. Из условий трансверсальности (5) или (7) получить недостающие краевые условия для уравнений составленной системы.5. Решить двухточечную краевую задачу для системы канонических уравнений, полученную в п. 3, с учетом результатов пп.
2 и 4. В итоге определяется тройка(t1 , x (), u ()) , на которой может достигаться экстремум функционала. В соответствиис пп. 1, 2 замечаний к формулировке принципа максимумарешениями задачи в зависимости от постановки могут быть также пара ( x (), u ())или четверка(t 0 , t1 , x (), u ()) .9.2.
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯС ПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ9.2.1. Постановка задачиПусть поведение модели объекта управления описывается обыкновенным дифференциальным уравнениемx (t ) f (t , x (t ), u(t )) ,(8)где x – вектор состояния системы, x R n ; u – вектор управления, u U R q ; U– некоторое заданное множество допустимых значений управления, t T [t 0 , t1 ] –промежуток времени функционирования системы, моменты начала процесса t 0 и5окончания процесса t1 заданы, f (t , x , u ):T R n U R n ; R n – n -мерное евклидовопространство.Начальное условие x (t 0 ) x 0 R n , где начальное состояние x 0 заранее не заданои может быть произвольным.Определим множество допустимых процессов D(t 0 , x 0 ) как множество парd (x (), u()) , которые включают траекторию x() и управление u() (гдеt T : x (t ) R n , u (t ) U , функции x () непрерывны и кусочно-дифференци-руемы, аu() кусочно-непрерывны), удовлетворяющие уравнению (8) с начальным условиемx (t 0 ) x 0 почти всюду на T .На множестве D(t 0 , x 0 ) определим функционал качества управленияI (d ) t1f 0 (t , x (t ), u(t )) dt F ( x (t1 )) ,(9)t0где f 0 (t , x , u ) , F (x ) – заданные непрерывно дифференцируемые функции.Предполагается, что при управлении используется информация о времени t и векторе состояния x .Множество U n допустимых управлений с полной обратной связью (позиционных управлений) образуют функции u (t , x ):T R n U , которые для любых начальных состояний порождают соответствующие пары d (x (), u ()) D(t 0 , x 0 ) , где программные управления u() U 0 , а t T u (t ) u (t , x (t )) .Применяемое в каждый момент времени t T управление имеет вид управления сполной обратной связью по вектору состояния (рис.
2).x (t 0 ) x 0 R ndx f (t , x (t ), u(t ))dtx (t )u(t , x )u(t ) u (t , x (t ))Рис. 2Требуется найти такую функцию u (t , x ) U n , чтоI (d ) mind D (t 0 , x 0 )I (d )x 0 R n ,(10)где d ( x (), u () u (, x ())) .Функция u (t , x ) U n называется оптимальным управлением с полной обратной связью. Для любого начального состояния x 0 из множества R n она6порождает со-ответствующую оптимальную пару, т.е. оптимальную траекторию x () и оптимальноепрограммное управление u () .9.2.2. Уравнение БеллманаДостаточным условием минимума функционала (9) является уравнение Беллманадля непрерывных детерминированных систем.Обозначим: Q (t 0 , t1 ) R n ; C 1,1 (Q ) - множество функций (t , x ) : Q R , непрерывно дифференцируемых по t и x .Утверждение (достаточные условия оптимальности в задаче (10)).Если существует функция (t , x ) C 1,1 (Q ) , удовлетворяющая уравнению Беллмана сграничным условием (t , x ) n (t , x )max f i (t , x, u) f 0 (t , x, u) 0u U i 1 x i t(t1 , x ) F ( x )(t , x ) Q ,(11)x R n ,и управление u (t , x ) U n , удовлетворяющее условию n (t , x )u (t , x ) arg max f i (t , x, u ) f 0 (t , x, u) ,uU i 1 x iто u (t , x ) является оптимальным управлением с полной обратной связью.При этом минимальное значение функционала (9)mind D (t 0 , x 0 )I (d ) (t 0 , x 0 ) x 0 R n .(12)АЛГОРИТМ СИНТЕЗА ОПТИМАЛЬНОГО УПРАВЛЕНИЯС ПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ1.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.