Диссертация (Достаточные условия оптимальности управления дискретными системами автоматного типа), страница 10
Описание файла
Файл "Диссертация" внутри архива находится в папке "Достаточные условия оптимальности управления дискретными системами автоматного типа". PDF-файл из архива "Достаточные условия оптимальности управления дискретными системами автоматного типа", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 10 страницы из PDF
Образующие определяются на некоторых подмножествах области определения функции цены и на этих подмножествах совпадают с ней. Чтобы сформулировать определениеобразующих, нужно детализировать область определения k функций k и v k .Образующие условной функции ценыСогласно определению, условная функция цены k (t , y ) равна значению функционалаоставшихся потерь (1.14), вычисленному на оптимальном процессе d k D1k (t , y ) с не болеечем k переключениями, исходящим из позиции (t , y ) k .
Фактическое число j переключений у оптимального процесса d k D1k (t , y ) может быть меньше, чем k . Поэтому областьk можно представить в видеk 0k 1k kk ,40(1.41)где kj , j 0,1,..., k , множество таких позиций (t , y ) k , исходя из которых, оптимальныйпроцесс d k D1k (t , y ) имеет ровно j переключений из k допустимых. В обозначении kjверхний индекс – это максимально допустимое количество переключений, а нижний индекс– фактическое число переключений.Детализируем множество kk . Исходящий из позиции (t , y ) kk оптимальный процессd k Dk (t , y ) имеет максимально допустимое число переключений.
Можно сказать, что дляэтого процесса ограничение на количество переключений является активным. Управлениеv k (t , y ) на подмножестве kk своей области определения k либо равно нейтральному элементу, либо отлично от него. Обозначим через k множествоk {(t , y ) kk | k (t , y ) k 1 (t , y ), v k (t , y ) o}(1.42)таких позиций (t , y ) k , исходя из которых, оптимальный процесс имеет ровно k переключений, при условии, что первое из них происходит именно в исходной позиции (t , y ) .Кроме процессов, исходящих из позиций (t , y ) k , ровно k переключений имеют также процессы, которые некоторое время протекают с нейтральным управлением v k (t , y ) o ,сохраняя при этом состояние системы, а затем, достигая позиции (t , y ) k , совершают первое из k переключений. Будем называть поверхностью переключения левую границу kмножества k , т.е. множество таких точек (t , y ) k , что (t , y ) k для любого малого 0 .
Когда пространство состояний системы одномерное ( m 1 ), вместо поверхности пере-ключения будем говорить о линии переключения. Обозначим через0k {(t , y ) kk | (t , t1] : (, y ) k }(1.43)множество позиций (t , y ) k , предшествующих позициям на поверхности переключения k . На этом множестве оптимальное позиционное управление нейтральное v k (t , y ) o , чтои отмечается добавлением нулевого индекса. Таким образом, множество kk можно представить как объединение двух непересекающихся подмножеств (1.42), (1.43)kk 0k k .(1.44)Образующей функции цены будем называть функцию kk : kk , которая на множестве kk совпадает с функцией цены k , т.е.
k (t , y ) kk (t , y ) при (t , y ) kk . Другими слова41ми, образующая kk (t , y ) – это условная функция цены k (t , y ) , вычисленная на оптимальном процессе d k D1k (t , y ) , имеющем ровно k переключений, т.е. на процессе с максимально допустимым в классе D1k (t , y ) количеством переключений. Согласно (1.44), образующуюkk (t , y ) можно представить в виде (t , y ), (t , y ) k ,kk (t , y ) k0k (t , y ), (t , y ) 0k .(1.45)Функции k и 0 k будем тоже называть образующими функции цены.Учитывая представление (1.41) и (1.45), запишем последовательность для условныхфункций цены0 00 на0 00 ;kk 1 на 1 ,k k на k ,11 0.
. . , k 1...1 1kk на \ 1 , на \ k ,1(1.46)Видно, что условная функция цены k выражается через образующую kk и предшествующую условную функцию цены k 1 . Поэтому рекуррентная последовательность (1.46) позволяет найти все функции k , k . Нужно только составить алгоритм поиска образующей kk по известной функции k 1 . На области k , где изменяется состояние системы (переключение), согласно рекуррентному уравнению (1.28)k (t , y ) k 1 (t , g (t , y, v k (t , y ))) g 0 (t , y, v k (t , y )) ) ,(1.47)где оптимальное управление (1.30)v k (t , y ) ArgminvVk (t , y )[ tk 1(t , g (t , y, v)) f (t , g (t , y, v)) ](1.48)отлично от нейтрального элемента v k (t , y ) o .
Значит, в области k управление (1.48) лучше нейтрального, т.е.k (t , y ) k 1(t , y ) .(1.49)Кроме того, поскольку нейтральное управление v o , при котором состояние системы сохраняется g (t , y, o) y , в области k не является оптимальным, то согласно уравнению(1.37) (t , y ) f (t , y ) 0 .t kПравая производная по времени функции (1.47) имеет вид42(1.50)k (t , y ) tk 1(t , g (t , y, v k (t , y ))) gt0 (t , y, v k (t , y )) .tСогласно (1.29), получаемk (t , y ) f (t , g (t , y, v k (t , y )) gt0 (t , y, v k (t , y )) .tПодставляя выражение для производной в (1.50), приходим к неравенству f (t , g (t , y, v k (t , y )) gt0 (t , y, v k (t , y )) f (t , y ) 0 ,которое запишем в видеf (t , g (t , y, v k (t , y ))) gt0 (t , y, v k (t , y )) f (t , y ) .(1.51)Таким образом, область k определяется системой двух неравенств (1.49),(1.51)k (t , y ) k 1(t , y ) ,k0k f (t , g (t , y, v (t , y ))) gt (t , y, v (t , y )) f (t , y ) ,(1.52)оптимальное условное позиционное управление находится в результате минимизации (1.48)по множеству (1.34)Vk (t , y ) Argmin [k 1 (t , g (t , y, v)) g 0 (t , y, v )] ,vV k (t , y )а образующая k функции цены на k определяется формулой (1.47).
При t t1 второе неравенство в (1.52) не учитывается, поскольку условие (1.48) заменяется на (1.35).Описание синтезаУсловные функции цены0 (t , y ) , 1(t , y ) , 2 (t , y ) ,…и оптимальные условные позиционные управленияv1 (t , y ) , v 2 (t , y ) ,…строятся при помощи образующих функции цены0 (t , y ) , 1(t , y ) , 01(t , y ) , 2 (t , y ) , 02 (t , y ) , 3 (t , y ) , 03 (t , y ) , …(1.53)и образующих позиционных управленийv1 (t , y ) , v2 (t , y ) ,…Напомним, что значения функций (1.53) равны соответствующим значениям функционала Itоставшихся потерь (1.14), вычисленным на траекториях, исходящих из начального состоянияy (t 0) y , причем величина 0 (t , y ) вычислена на траектории без переключений; 1(t , y ) ,01(t , y ) – на оптимальных траекториях с одним переключением в момент времени t или по-43сле него соответственно; 2 (t , y ) , 02 (t , y ) – на оптимальных траекториях с двумя переключениями, первое из которых происходит в момент времени t или после него соответственно,и т.д.
Области определения 0 , 1 , 01 , 2 , 02 , 3 , 03 ,… образующих (1.53) являютсяподмножествами множества позиций T Y . Поскольку все функции (1.53) непрерывнысправа по t , то область определения каждой из них включает левую границу. Значение условной функции цены k (t , y ) , k , равно значению функционала It оставшихся потерь(1.14), вычисленному на оптимальной траектории, исходящей из состояния y (t 0) y , иимеющей не более k скачков. Управление v k (t , y ) , k , является оптимальным позиционным управлением для процессов с не более чем k переключениями. Области определенияk условных функций цены и управления образуют цепочку (1.19).
Для задачи со свобод-ным правым концом траектории эти области совпадают с пространством позиций 0 1 2 ...Построение заканчивается, если обрывается последовательность образующих (1.53).Однако в задачах с неограниченным пространством состояний САТ число членов последовательности (1.53) может быть бесконечным. В этом случае необходимо, исходя из практических соображений, либо ограничить множество допустимых состояний САТ, либо задатьмаксимально допустимое количество переключений САТ.Синтезированное управление позволяет найти оптимальную траекторию для любых начальных условий (1.13).
Для этого, выполняя целочисленную оптимизацию (1.39), определяется количество переключений у оптимального процесса, исходящего из данной начальнойпозиции. Тем самым осуществляется выбор (1.38) оптимального для данной позиции управления среди условных оптимальных управлений. Этот же выбор определяет значение функции цены (1.40).Рис.1.2 иллюстрирует этапы синтеза управления процессами, имеющими не более двухпереключений. Условные функции цены 0 , 1 , 2 строятся из образующих 0 , 1 , 01 ,2 , 02 . Их области определения 0 , 1 , 01 , 2 , 02 отмечены на рис.1.2 полужирнымицифрами 0 , 1 , 01 , 2 , 02 соответственно: область 0 совпадает со всем пространством позиций (квадрат 0 на рис.1.2,а); области 1 , 01 отмечены на рис.1.2,б цифрами 1 и 01 ; области 2 , 02 – на рис.1.2,в – цифрами 2 и 02 .
Левые границы 1 и 2 областей 1 и 2изображены двойными линиями. Они разделяют области 1 и 01 на рис.1.2,б и области 2 и02 на рис.1.2,в. Эти линии определяют линии переключений оптимальных процессов. Нарис.1.2 полужирными стрелками изображена оптимальная траектория (с двумя скачками).44Движение САТ начинается из состояния, отмеченного на рис.1.2,в черным кружком на осиy , и проходит по области 02 до линии переключения, где САТ совершает первое переклю-чение (вертикальная стрелка).
Продолжение траектории изображено на рис.1.2,б. Системасохраняет свое состояние в области 01 , а на ее границе (на линии переключения) совершаетвторое переключение. Последний участок траектории изображен на рис.1.2,а. Состояниесистемы в области 0 сохраняется до окончания процесса управления. Заметим, что границымежду областями 0 и 1 , 1 и 2 не являются линиями переключения, поскольку попасть натакую границу слева (при нейтральном управлении, сохраняя состояние) система не может.yyy11200010tа02101бРис.1.2t12вtАлгоритм синтезаШаг 0. Находим функцию 0 , интегрируя на области 0 дифференциальное уравнение (t , y ) f (t , y ) 0t 0(1.54)0 (t1, y ) F ( y ) .(1.55)с терминальным условиемПолагаем, что 0 (t , y ) 0 (t , y ) и v 0 (t , y ) o для всех (t , y ) 0 . Задаем номер k 1 следующих искомых условных функций цены и управления.Шаг 1 k .