Диссертация (Достаточные условия оптимальности управления дискретными системами автоматного типа), страница 9
Описание файла
Файл "Диссертация" внутри архива находится в папке "Достаточные условия оптимальности управления дискретными системами автоматного типа". PDF-файл из архива "Достаточные условия оптимальности управления дискретными системами автоматного типа", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 9 страницы из PDF
Аналогичное построение применяется для достаточных условий оптимальности позиционного управления, т.е. управления с обратной связью. Вводятся вспомогательные функции – условные позиционные управления, из которых затем получается оптимальное управление с обратной связью.Условным позиционным управлением (т.е. условным управлением с обратной связью)будем называть замкнутое управление v k (t , y ) процессом при условии, что осталось не болееk переключений состояния САТ. На области k своего определения функция v k (t , y ) может35принимать либо нейтральное значение v k (t , y ) o (при этом система сохраняет свое состояние), либо – отличное от нейтрального.
В последнем случае система совершает мгновенноепереключение из позиции (t , y ) k в позицию (t , g (t , y, v k (t , y ))) , которая входит в областьопределения k 1 предыдущего условного управления v k 1(t , y ) . Таким образом, условныеуправления образуют последовательность, которая обеспечивает позиционное управлениеСАТ.Последовательность v 0 (t , y ) , v1 (t , y ) , v 2 (t , y ) … условных управлений с обратной связьюбудем называть допустимой, если для каждого начального состояния (, y ) N существует допустимый процесс d N ( y (), v()) D1N (, y ) с не более чем N переключениями,удовлетворяющий условиямyi g (i , yi 1, vi ) ,y0 y ,vi v N i 1(i , yi 1) , i 1,..., N ,где yi y (i ) , а 1,, N – возрастающая последовательность моментов переключений 1 N t1 .
Будем говорить, что допустимая последовательность условных управле-ний порождает для каждого начального состояния допустимый процесс. Так как одна и таже позиция может принадлежать разным подмножествам k , то и порождаемые процессымогут быть разные. Они будут отличаться, в первую очередь, количеством переключений.Если порождаемые процессы оказываются оптимальными, то и условные управления назовем оптимальными. Из последовательности v k (t , y ) , k , оптимальных условных управлений с обратной связью можно построить оптимальное позиционное управление v (t , y ) .Для этого достаточно знать оптимальное количество k (t , y ) переключений для процесса, исходящего из заданной позиции (t , y ) .
Например, для получения оптимального процесса длязаданных начальных условий (1.3) нужно сначала определить оптимальное числоN k (t0 , y0 ) переключений, а затем, применяя последовательно оптимальные условныеуправления v(i ) v N i 1(i , y (i 0)) , i 1,..., N , найти оптимальный процесс.На основе достаточных условий оптимальности процесса управления (см. теорему 1.1)получим уравнения для нахождения оптимального позиционного управления, т.е. оптимального управления с обратной связью, а также функции цены.36Теорема 1.2 (достаточные условия оптимальности позиционного управления). Еслисуществуют невозрастающая последовательность функций k и допустимая последовательность условных позиционных управлений v k V , k , удовлетворяющие условиям0 (t1, y ) F ( y ) ,(1.27)k 1(t 0, y ) k (t , g (t , y, v k 1 (t , y ))) g 0 (t , y, v k 1(t , y )) ,(1.28)tk (t , g (t , y, v k 1(t , y ))) f (t , g (t , y, v k 1(t , y ))) 0 ,(1.29)v k 1(t , y ) ArgminvVk 1 (t , y )[ tk (t , g (t , y, v)) f (t , g (t , y, v)) ] ,k (t , y ) min Arg min k (t 0, y ) ,(1.30)(1.31)k где t T , y Y , то оптимальное управление с обратной связью имеет видv (t , y ) v k (t , y ) (t , y ) ,(1.32)а функция цены Φ вычисляется по формуле( 0, y ) k (, y )( 0, y ) mindD1 (, y )I (d ) ,(1.33)т.е.
предел слева условной функции цены равен минимальному значению функционала оставшихся потерь (1.14).Здесь k (t , y ) – наименьшее целое неотрицательное число, начиная с которого все членыневозрастающей последовательности k (t 0, y ) оказываются равными;Vk 1(t , y ) Arg[k (t , g (t , y, v)) g 0 (t , y, v )]minvVk 1(1.34)(t , y )– множество точек глобального минимума функции k (t , g (t , y, v)) g 0 (t , y, v ) по аргументуv на множестве (1.17).
Поскольку правая производная tk (t , y ) не определена при t t1 , тополагаем, как и ранее, что P k (t1, y ) tk (t1, y ) f (t1, y ) 0 при всех y Y . В этом случае условие (1.30) равносильно включению v k 1(t1, y ) V*k 1 (t1, y ) , т.е.v k 1(t1, y ) ArgminvVk 1[k (t1, g (t1, y, v)) g 0 (t1, y, v )] .(1.35)(t1 , y )Д о к а з а т е л ь с т в о т е о р е м ы 1.2 Сначала проверим выполнение условий (1.22)(1.24). Из (1.29) получаем, что P k (t , g (t , y, v k 1(t , y ))) f (t , g (t , y, v k 1(t , y ))) 0 при всехy Y , k .
Отсюда следует (1.22). Перепишем условие (1.28) равносильным образом37minvVприk 1[ k (t , g (t , y, v)) k 1 (t 0, y ) g 0 (t , y, v) ] 0(t , y )всехvVy Y ,k .Отсюдаследует(1.23).Q k (t , y, v) 0mink 1(t , y )Согласно(1.27),функцияR( y ) F ( y ) 0 (t1, y ) тождественно равна нулю. Поэтому условие (1.24) выполняется.Проверим теперь условия а)-г) теоремы 1.1. Пусть допустимый процесс d ( y (), v ())с N переключениями в точках 1 ,…, , образующих возрастающую последовательностьNt0 0 1 t1 , порожден условными управлениями v k (t , y ) , k 1,, N ,NN 1с обратной связьюyk g (k , yk 1, vk ) ,vk v N k (k , yk 1) ,k 1,, N ,где yk y (k ) , vk v(k ) , y0 y0 .Условие в) выполняется для любого процесса, так как R ( y ) 0 при всех y Y , согласно(1.27).
Для любого допустимого процесса из равенства (1.29) следует, что P k (t , y ) 0 , т.е.условие а) также выполняется. Проверим условие б). Для этого, учитывая (1.28), (1.30) и(1.34), вычисляем значение функции Q N k (k , yk 1, vk ) на процессе d Q j (k , yk 1, vk ) Q j (k , yk 1, v j 1(k , yk 1)) minvVj 1( k , yk 1 )Q j (k , yk 1, v) 0 ,где j N k . Значит, условие б) тоже верно.
Из (1.31) следует справедливость условия г).Итак, для процесса d выполняются все условия теоремы 1.1. Следовательно, этот процесс оптимальный. Таким образом, позиционное управление (1.32) порождает оптимальныепроцессы. Значит, это управление оптимальное, а функция цены имеет вид (1.33). Теорема1.2 доказана.Задача нахождения условных функций цены и оптимальных условных управлений с обратной связью сводится к решению рекуррентного (1.28) и дифференциального (1.29) уравнений с терминальным условием (1.27).
Эти уравнения можно записать следующим образомk 1(t , y ) minvVmink 1[k (t , g (t , y, v)) g 0 (t , y, v) ] ,[tk (t , g (t , y, v)) f (t , g (t , y, v))] 0 .vVk 1 (t , y )(1.36)(t , y )(1.37)Как видим, система уравнений усложнена операциями конечномерной минимизации по вектору управления, причем в результате минимизации в (1.37) определяется условное оптимальное позиционное управление (1.30). Окончательный выбор применяемого условного38управления выполняется в результате целочисленной минимизации (1.31). Рекуррентноеуравнение (1.36) аналогично уравнению Беллмана для дискретных систем, в котором, однако, время t меняется непрерывно.
Дифференциальное уравнение (1.37) аналогично уравнению Беллмана для непрерывных систем. В рассматриваемом случае оно простейшее, так кактраектории системы постоянны, т.е. y (t ) 0 почти всюду на T . Его решение на промежутках постоянства состояния получается просто – интегрированием по t функции f (t , y ) . Минимизация (1.30), в некотором смысле, "объединяет" аналогичные операции нахожденияуправления в уравнениях Беллмана для дискретных и непрерывных систем. Она проводитсяв два этапа.
На первом этапе минимизируется скачок функции цены и определяется множество (1.34). На втором этапе в множестве (1.34) ищется управление, которое минимизируетизменение функции цены вдоль траекторий движения ( y (t ) 0 ). Здесь тоже прослеживаютсядействия, применяемые для оптимизации непрерывных или дискретных систем. Однако этидействия взаимосвязаны и выполняются для условных позиционных управлений и условныхфункций цены.Достаточные условия оптимальности при ограниченном количестве переключенийДоказанные условия оптимальности (теорема 1.2) фактически решают задачу оптимального управления процессами с ограниченным количеством переключений.
В самом деле, если число переключений допустимых процессов ограничено, то, в отличие от случая без ограничений, достаточно найти конечные последовательности условных позиционных управлений v k и условных функций цены k , k 0,1,, N , где N – максимальное допустимое число переключений. При этом формулировка условий оптимальности изменится незначительно.Теорема 1.3 (достаточные условия оптимальности позиционного управления приограниченном количестве переключений).
Если существуют невозрастающая конечнаяпоследовательность функций k и конечная последовательность допустимых условныхуправлений v k V , k 0,1,..., N , удовлетворяющие соотношениям (1.27) – (1.30), то оптимальное управление с обратной связью для процессов с не более чем N переключений имеетвид (1.32)v (t , y ) v k (t , y ) (t , y ) ,(1.38)где k (t , y ) – наименьшее целое неотрицательное число, не превосходящее N , начиная с которого все члены невозрастающей последовательности k (t 0, y ) оказываются равными39k (t , y ) min Argmink 0,1,, Nk (t 0, y ) ,(1.39)а функция цены Φ вычисляется по формуле( 0, y ) k (, y )( 0, y ) mindD N (, y )I (d ) ,(1.40)т.е.
предел слева условной функции цены равен минимальному значению функционала оставшихся потерь (1.14) на множестве допустимых процессов с ограниченным количествомпереключений.Д о к а з а т е л ь с т в о т е о р е м ы 1.3 следует из утверждения теоремы 1.2, если наложитьограничение на количество переключений допустимых процессов.1.3. АЛГОРИТМ СИНТЕЗА ОПТИМАЛЬНОГО ПОЗИЦИОННОГОУПРАВЛЕНИЯПолученные в теореме 1.2 уравнения (1.27)–(1.32) для нахождения условных функцийцены k и оптимальных условных позиционных управлений v k , k , представляют собойсистему дифференциального и рекуррентного уравнений, осложненную операциями конечномерной и целочисленной минимизации. Будем использовать для решения этой системыметодику, аналогичную предложенной в [21,23,24]. Идея состоит в том, что условная функция цены составляется из вспомогательных функций, называемых образующими функциицены.