tul16 (Лекции по теории управления), страница 2
Описание файла
Файл "tul16" внутри архива находится в папке "Лекции по теории управления". PDF-файл из архива "Лекции по теории управления", который расположен в категории "". Всё это находится в предмете "теория автоматического управления (тау)" из 7 семестр, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "теория автоматического управления (тау)" в общих файлах.
Просмотр PDF-файла онлайн
Текст 2 страницы из PDF
Записать уравнение Беллмана (11) с граничным условием.2. Найти структуру оптимального управления с полной обратной связью в результате поиска максимума в (11) по управлению. Искомое управление u (t , x ) обычно выражается через производные функции (t , x ) .3. Подставить полученное выражение для управления в уравнение (11). Проблемасводится к решению нелинейного дифференциального уравнения с частными производными первого порядка.4. Найти решение полученного уравнения и явный вид искомого управления.З а м е ч а н и я.1. Уравнение Беллмана применяется и при негладких функциях (t , x ) .
Обоснование этого получено в работах В.Г.Болтянского, M.M.Xрусталева, У.Флеминга, А.И. Субботина и др.72. Величина функции (t , x ) определяется так называемыми оставшимися потерями на управление:(t , x ) mind D (t , x )(t , x ) Q .I (d ) Б (t , x ) (t , x ) ,равенство:3.Еслиположитьто,используяmax f ( x ) min [ f ( x )] , можно переписать уравнение Беллмана и граничное условие(9.15) в эквивалентной форме: Б (t , x ) n Б (t , x )min f i (t , x, u ) f 0 (t , x, u )u U t xii 1a 0 , (t1 , x ) F (x ) .(13)При этом минимальное значение функционала (9)mind D (t 0 , x 0 )I (d ) a (t 0 , x 0 )x 0 R n .(14)4.
Рассмотрим более общий случай. Предположим, что поведение модели объектауправления описывается обыкновенным дифференциальным уравнением (1). Момент начала процесса задан, а момент t1 окончания процесса определяется первым моментомдостижения точкой (t , x (t )) некоторой поверхности , заданной соотношениями (2).
Намножестве допустимых процессов D (t 0 , x 0 ) задан функционал (3). Обозначим Q R n 1– множество точек (t , x ) , из которых можно достигнуть терминального множества понекоторой траектории, соответствующей допустимому управлению; Q (t 0 ) - сечениемножества Q при фиксированном t t 0 . Начальное состояние x 0 заранее не задано иможет быть произвольным в множестве Q (t 0 ) .Множество U n допустимых управлений с полной обратной связью (позиционных управлений) образуют функции u (t , x ) : T R n U , которые для любых начальx 0 Q (t 0 )тройкиныхсостоянийпорождаютсоответствующиеd (t1 , x (), u()) D (t 0 , x 0 ) ,гдепрограммныеуправленияu() U 0 ,аt T u(t ) u (t , x (t )) .Требуется найти такую функцию u (t , x ) U n , чтоI (d ) mind D (t0 , x0 )I (d )x 0 Q (t 0 ) ,(15)где d (t1 , x (), u () u (, x ())) .обФункция u (t , x ) U n называется оптимальным управлением с полнойратной связью.
Для любого начального состояния x 0 из множества Q (t 0 ) она порождает соответствующую оптимальную тройку, т.е. оптимальную траекторию x () , оптимальное программное управление u () , оптимальный момент окончания процесса t1 .Введем в рассмотрение множество функций (t , x ) : Q R , непрерывнодифференцируемых всюду, за исключением конечного числа сечений Q при фиксированных t .8Утверждение (достаточные условия оптимальности в задаче (15)).
Еслисуществует функция (t , x ) , удовлетворяющая уравнению Беллмана с граничнымиусловиями (t , x ) n (t , x )max f i (t , x, u) f 0 (t , x, u ) 0u U i 1 x i t(t1 , x ) F (t1 , x )(t , x ) Q ,(16)(t1 , x ) ,и управление u (t , x ) U n , удовлетворяющее условию n (t , x )u (t , x ) arg max f i (t , x , u) f 0 (t , x , u ) , i 1 x iu U(17)то u (t , x ) является оптимальным управлением с полной обратной связью в задаче (15).При этом минимальное значение функционалаmind D (t0 , x0 )I (d ) (t 0 , x 0 )(t 0 , x 0 ) Q .9.