Диссертация (Достаточные условия оптимальности управления дискретными системами автоматного типа), страница 8
Описание файла
Файл "Диссертация" внутри архива находится в папке "Достаточные условия оптимальности управления дискретными системами автоматного типа". PDF-файл из архива "Достаточные условия оптимальности управления дискретными системами автоматного типа", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 8 страницы из PDF
Поэтому дляфункции (t ) min (t , v) существует правая производная [41,42,52,56,78]vVt (0) min t (0,V ) min p(0,V ) ,vVvVт.е. при малых t 0 выполняется неравенство(t ) (0) t (0) (t ) ,tгде (t ) 0 при t 0 . Отсюда следует, что(t ) (0) t t (0) t (t ) ,или, что то же самое,min (t , v) min (0, v) t min t (0, v) t (t ) .vVvV vVПодставляя29t (t , v) q (v) p (, v) d0и t (0, v) p (0, v) , получаем доказываемое неравенство. Лемма 1.2 доказана.Обозначим через Φ – множество функций : T Y , каждая из которых при любомфиксированном y имеет по t конечное число точек разрыва, в которых она имеет конечныйпредел слева и непрерывна справа, а в остальных точках области определения функция непрерывна вместе со своей правой частной производной t .
Считаем, что функции измножества Φ доопределены в точке t0 левым пределом (t0 0, y ) . Правая производнаяt (t , y ) определена и равномерна по параметру y [42] на всей области определения, за ис-ключением конечного момента времени t1 .Для последовательности функций k Φ , k , запишем выраженияP k (t , y ) tk (t , y ) f (t , y ) ,Q k (t , y, v) k (t , g (t , y, v)) k 1(t 0, y ) g 0 (t , y, v) ,(1.21)R( y ) F ( y ) 0 (t1, y ) .Поскольку правые частные производные tk (t , y ) не определены при t t1 , считаем, чтоP k (t1, y ) 0 при всех y Y .
Предполагаем, что функции (1.21) достигают своих наименьших значений, равных нулюminyYminvVk 1 (t , y )P k (t , g (t , y, v)) 0 ,min min Q k (t , y, v) 0 ,(1.22)(1.23)yY vV (t , y )min R( y ) 0 .(1.24)yYЗдесь Vk 1(t , y ) ArgminkQ k (t , y, v) – множество точек глобального минимума функцииvV (t , y )Q k (t , y, v) по аргументу v на множестве (1.17). Для задачи со свободным правым концомтраектории Vk 1(t , y ) Arg min Q k (t , y, v) , поскольку в этом случае V k (t , y ) V (t , y ) , такvV (t , y )как k , k . При дополнительном условии целочисленности (1.12) формулировкадостаточных условий не меняется.30Теорема 1.1 (достаточные условия оптимальности процесса управления).
Для тогочтобы допустимый процесс d ( y (), v ()) D1 (t0 , y0 ) был оптимальным, достаточносуществования такой невозрастающей последовательности k Φ , k , удовлетворяющей условиям (1.22) – (1.24), чтоа) P N k (t , y (t )) 0 при всех t [k , k 1) , k 0,1,, N ;б) Q N k (k , y (k 0), v (k )) 0 при всех k 1,, N ;в) R( y (t1)) 0 ;г) N * min Arg min k (t0 0, y0 ) ,kгде 1 ,…, N– возрастающая последовательность моментов переключения траекторииy () , t0 0 1 t1 , а N – наименьшее целое неотрицательное число,NN 1начиная с которого все члены последовательности k (t0 0, y0 ) оказываются равными.Д о к а з а т е л ь с т в о т е о р е м ы 1.1 Пусть d – допустимый процесс с однократнымипереключениями, т.е.
d D1(t0 , y0 ) . В этом случае тактовые моменты времени 1 ,…, , вNкоторыепроисходятпереключения,образуютвозрастающуюпоследовательностьt0 0 1 t1 . Введем множество E1 пар d ( y (), v()) функций, котоNN 1рые, в отличие от допустимых процессов из D1 D1(0 , y0 ) , не связаны уравнением (1.1), ноудовлетворяют ограничениям (1.2) и начальным условиям (1.4). На множестве E1 определимвспомогательный функционал L . Для процесса d ( y (), v()) E1 , траектория y () которогоимеет конечное множество {1,, N } точек разрыва t0 0 1 N N 1 t1 , полагаем, чтоN k 1L(d ) R ( y ( N 1)) P j (t , g (t , y(t 0), v(t )) dt k 0 kN Q j (k , y(k 0), v(k )) N (0 0, y(0 0)) k 131N k 1 R[ N 1 ] PjN[t ] dt k 0 kQ j [k ] N [0 0] ,(1.25)k 1где j N k .
Здесь и далее аргумент в квадратных скобках соответствует значению сложной функции, вычисленной на процессе d в указанный момент времени, а именно:R[ N 1] R( y ( N 1 )) ,P j [t ] P j (t , g (t , y (t 0), v(t ))) ,Q j [k ] Q j (k , y (k 0), v(k )) , N [0 0] N (0 0, y (0 0)) . Если в начальный или конечный моменты времени траектория y () имеет разрыв, то 1 0 или N N 1 , при этом в (1.25) интеграл на промежутке[0 , 1) или [ N , N 1) равен 0 соответственно.Проверим для функционала (1.25) условия а) – г) леммы 1.1.1. Очевидно, что D1 E1 (выполняется условие а) леммы 1.1).2.
Покажем, что на любом допустимом процессе d ( y (), v()) D1 верно равенствоI (d ) L(d ) (функционал I определен формулой (1.5), индекс t0 опущен). Действительно, вкаждой точке разрыва y (k ) g (k , y (k 0), v(k )) , k 1, N . ПоэтомуQ j [k ] Q j (k , y (k 0), v(k )) j (k , g (k , y (k 0), v(k ))) j 1 (k 0, y (k 0)) g 0 (k , y (k 0), v(k )) j (k , y (k )) j 1(k 0, y (k 0)) g 0 (k , y (k 0), v(k )) j [k ] j 1[k 0] g 0[k ] .Накаждомпромежуткеk 0,1, N ,[k , k 1) ,функцияy ()постояннаy (t ) y (k ) g (t , y (t 0), v(t )) , а управление – нейтральное v(t ) o при k t k 1 .
ЗначитP j [t ] tj (t , y (t )) f (t , y (t )) d j [t ] f [t ] , t [k , k 1) .dtТогда k 1Pkтак как k 1j[t ] dt jj f [t ] dt [k 1 0] [k ] ,k j [k 1 0] j (k 1 0, y (k 1 0)) j (k 1 0, y (k )) ,Следовательно,32 j [k ] j (k , y (k )) .k 1k 1jjjjj P [t ] dt Q [k ] f [t ] dt [k 1 0] [k ] [k ] kj 1[k 0] g 0[k ] kk 1 f [t ] dt g0[k ] j [k 1 0] j 1[k 0] .kПодставим это выражение в функционал (1.25), который предварительно запишем в видеN 1 k 1LN{ P j [t ] dt k 1Q j [ k ]} k 1k N 11PN0 P [t ] dt [t ] dt 0N R[ N 1] Q0[ N ] N [0 0] .Получим N 1L(d ) F [ N 1 ] Nf [t ] dt g10[k ] k 100d N [t ] dt dt N 1Nd 0 [t ] dt dtIN{ j [k 1 0] j 1[k 0]} 0[ N 1] 0[ N ] 1[ N 0] N [0 0] k 11I0d N [t ] dt dt N 1Nd 0 [t ] dt N [1 0] 0[ N 1] 0[ N ] N [0 0] .
(1.26)dtРассмотрим четыре случая. В первом случае при 0 1 и N N 1 , взяв интегралы в(1.26), получаемL I N [1 0] N [0 ] 0[ N 1 0] 0 [ N ] N [1 0] 0[ N 1] 0[ N ] N [0 0] I ,так как N [0 0] N [0 ] и 0[ N 1 0] 0[ N 1] в силу непрерывности траектории вточках 0 и N 1 . Во втором случае при 0 1 и N N 1 в (1.26) интеграл на промежутке [0 , 1) равен 0.
ТогдаL I 0 [ N 1 0] 0[ N ] N [1 0] 0[ N 1] 0 [ N ] N [0 0] I ,так как0[ N 1 0] 0[ N 1]в силу непрерывности траектории в точке N 1 ,а N [1 0] N [0 0] из-за 0 1 . В третьем случае при 0 1 и N N 1 в (1.26) интеграл на промежутке [ N , N 1 ) равен 0. Тогда33L I N [1 0] N [0 ] N [1 0] 0[ N 1 ] 0 [ N ] N [0 0] I ,таккак N [0 0] N [0 ]всилунепрерывноститраекториивточке0 ,а 0[ N 1] 0[ N ] из-за N N 1 . Наконец, в четвертом случае при 0 1 и N N 1 ,оба интеграла в правой части (1.26) равны 0.
ТогдаL I N [1 0] 0 [ N 1] 0[ N ] N [0 0] I ,так как 0 1 и N N 1 .Таким образом, функционалы (1.5) и (1.25) совпадают на мно-жестве D1 допустимых процессов, т.е. условие б) леммы 1.1 выполняется.3. Покажем, что для любого процесса d ( y (), v()) из множества E1 верно неравенствоL(d ) l , где l N [t0 0] (условие в) леммы 1.1). Предположим, что множествоT {1,..., N } точек разрыва t0 0 1 N N 1 t1 функции y () разбивает проме-жуток T на полуинтервалы [k , k 1) , k 0,1,..., N , длина k k 1 k каждого из которых меньше : maxk 0,1,..., Nk . Малость величины 0 можно всегда обеспечить, до-бавляя к точкам разрыва некоторое количество точек непрерывности функций y () , полагая при этом, что управление в этих точках нейтральное v() o , а затраты на переключениесостояния – нулевые g 0[] 0 .
Функционал (1.25) не меняется от добавления таких "фиктивных" точек разрыва.Оценим в функционале (1.25) слагаемые, зависящие от одного значения управления.Чтобы не получить грубую оценку, нужно эти слагаемые оценивать совместно, а не по отдельности.Применяялемму 1.2дляфункцийq(v) Q j (k , y (k 0), v) ,p(t , v) P j (t , g (t , y (t 0), v)) , k 1,2,, N , j N k , и учитывая (1.22),(1.23), получаемk 1Pj(t , g (t , y (t 0), v(t ))) dt Q j (k , y (k 0), v(k )) kk 1{P j (t , g (t , y (t 0), v))) dt Q j (k , y (k 0), v)} j 1 minvVkp (t ,v )q (v ) min Q j (k , y (k 0), v) min P j (k , g (k , y (k 0), v)) k k (k ) vVj 1vVj 1 min min Q j (k , y, v) min min P j (k , g (k , y, v)) k k (k ) () ,yY vVj 1yY vV j 134V j 1 V j 1 (k , y (k 0)) ,где maxk 0,1,..., NVj 1 Vj 1(k , y (k 0)) ,k k 1 k ,k , а () 0 при 0 .
На промежутке [0 , 1 ) система сохраняетначальное состояние и функция P N (t , g (t , y, v)) 0 , согласно (1.22).Теперь оцениваем функционал (1.25), учитывая, что минимум суммы не меньше суммыминимумов, получаемNLR( y ) N [0 0] N [0 0] () .{ ()} minyYk 1Переходя к пределу при 0 (следовательно, 0 , поскольку ), приходим кнеравенству L N [t0 0] . Согласно условию г) теоремы 1.1, N [t0 0] N [t0 0] l .Поэтому L l .
Неравенство в) леммы 1.1 доказано.4. Осталось доказать, что условие г) леммы 1.1 тоже верно. Для процесса d , удовлетворяющего условиям а)-в) теоремы 1.1, имеем R[t1] 0 ; P j [t ] 0 при всех t [k , k 1 ) ,k 0,1,, N ;Q j 1[k ] 0приk 1,, N ,всехгдеj N k .ПоэтомуL(d ) N [t0 0] l . Следовательно, условие г) леммы 1.1 тоже выполняется.Все условия леммы 1.1 справедливы для процесса d D1(t0 , y0 ) . Значит, этот процессоптимальный. Теорема 1.1 доказана.Заметим, что используемая в теореме функция N (t , y ) представляет собой условнуюфункцию цены, что следует из доказанного в п.4 равенства N [t0 0] I (d ) .Достаточные условия оптимальности позиционного управленияДля формулировки и доказательства достаточных условий оптимальности процессауправления САТ (теорема 1.1) вместо функции цены использовались вспомогательныефункции, которые определялись как условные функции цены.