Диссертация (Достаточные условия оптимальности управления дискретными системами автоматного типа), страница 7
Описание файла
Файл "Диссертация" внутри архива находится в папке "Достаточные условия оптимальности управления дискретными системами автоматного типа". PDF-файл из архива "Достаточные условия оптимальности управления дискретными системами автоматного типа", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 7 страницы из PDF
Требуется найти минимальное значение функционала (1.5) на множестве D1N (t0 , y0 ) и оптимальный допустимыйпроцесс d 1N с не более чем N переключениями, на котором это значение достигаетсяI (d 1N ) mind D1N (t0 , y0 )I (d ) .(1.15)Эта задача отличается от (1.6) дополнительным ограничением на количество переключений.В силу включения D1N (t0 , y0 ) D1(t0 , y0 ) решения d 1 и d 1N задач (1.6) и (1.15) удовлетворяют неравенству I (d 1) I (d 1N ) .Отметим еще одно важное обстоятельство. Допустимые процессы с не более чем N переключениями являются, очевидно, допустимыми процессами с не более чем N 1 переключениями. Поэтому справедливы включенияD10 (t0 , y0 ) D11(t0 , y0 ) D12 (t0 , y0 ) ,из которых следуют неравенстваI (d01 ) I (d11) I (d12 ) ,(1.16)т.е.
последовательность (1.16) решений задач (1.15) не возрастает с ростом допустимого числа N переключений. При условии (1.8) количество переключений у любого оптимальногопроцесса ограничено, поэтому последовательность (1.16) ограничена снизу. Следовательно,справедливо равенствоI (d 1) min I (d 1N ) ,N где {0,1,2, } – множество неотрицательных целых чисел. Таким образом, для решениязадачи (1.6) можно использовать последовательность (1.16) решений задач (1.15). Именнотакой подход будет использован в достаточных условиях оптимальности.В классической задаче оптимального управления дискретной системой [13,60,80] множество тактовых моментов времени задано T 1 {1,..., N } , причем в каждый тактовый момент времени система совершает одно переключение.
Как правило, дискретное время выби25рается целочисленным, т.е. T 1 {1,..., N } . Ясно, что классическая дискретная система является частным случаем САТ, в которой фиксированы количество переключений и сами тактовые моменты времени. Использовать методы решения классических задач оптимальногоуправления дискретными системами для синтеза оптимальных САТ нельзя, поскольку фиксация тактовых моментов времени сразу же сужает класс допустимых процессов, что, в своюочередь, приводит к субоптимальности САТ. Разумеется, такие методы применимы для приближенного, обычно численного, решения задачи.1.2. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИКак правило, формулировка и доказательство достаточных условий оптимальностиуправления динамическими системами связаны с функцией цены (функцией Гамильтона –Якоби – Беллмана, функцией Кротова [60], функцией Айзекса [2,86]).
В рассматриваемой задаче управления САТ эта функция строится при помощи последовательности вспомогательных функций. Прежде чем формулировать условия оптимальности, поясним смысл этихвспомогательных функций и их связь с функцией цены.Условная функция ценыПару (t , y ) – время t и состояние y , t T , y Y , будем называть позицией САТ, а множество T Y – пространством позиций САТ. Функция цены (t , y ) для САТ определяется следующим образом. Предельное значение ( 0, y ) функции цены равно минимальному значению функционала (1.14) на множестве D1 (, y ) . Другими словами, предел( 0, y ) равен значению функционала I оставшихся потерь, вычисленному на оптималь-ной траектории, исходящей из позиции (, y ) , т.е.
при начальном условии y ( 0) y . Длязадачи со свободным правым концом траектории функция цены определена на всем пространстве позиций системы. При терминальных ограничениях (1.11) область определения включает только допустимые исходные позиции (, y ) , для которых существует допус-тимый процесс, удовлетворяющий терминальным условиям.Обозначим через 0 множество исходных позиций (, y ) , для каждой из которыхсуществует допустимый процесс d 0 ( y (), v()) D0 (, y ) без переключений. Траекторияэтого процесса постоянна y (t ) y , а управление нейтральное v(t ) o , t t1 . Например,для задачи со свободным правым концом траектории имеем 0 , так как все постоянные26траектории допустимы.
Если в задаче с терминальным ограничением (1.11) допустимо конечное состояние y1 – решение уравнения ( y1 ) 0 , то множество 0 содержит позицииT { y1} .Обозначим через k , k 1,2,... , множество исходных позиций (, y ) , для каждой изкоторых существует допустимый процесс d k ( y (), v()) D1k (, y ) с не более чем k переключениями. Траектория этого процесса до первой точки разрыва постоянна y (t ) y иуправление нейтральное v(t ) o , t , а в момент времени происходит изменение состояния системы, и она оказывается в позиции (, y ()) , принадлежащей множеству k 1 .В случае система сразу же в момент изменяет свое состояние, совершая переключение из состояния y y ( 0) в состояние y () , причем (, y ()) k 1 .
Заметим, что множество k вместе с позицией (, y ) содержит и все предшествующие позиции (t , y ) ,t0 t .Позиции из множества k , k {0,1,2,} , будем называть допустимыми исходнымипозициями для процессов с не более чем k переключениями. Переключение из позиции(t , y ) k 1 в позицию (t , z ) k происходит согласно уравнению (1.1)z g (t , y, v) .Множество допустимых управлений, позволяющих выполнить такое переключение обозначим черезV k 1(t , y ) {v V (t , y ) | (t , g (t , y, v)) k } .(1.17)Полагаем, что V 0 (t , y ) {o} , поскольку у процессов без переключений только нейтральноеуправление допустимо.Допустимые процессы с не более чем k переключениями являются, очевидно, допустимыми процессами с не более чем k 1 переключениями, поэтому справедливы включенияD10 (, y ) D11 (, y ) D12 (, y ) ,(1.18)0 1 2 (1.19)В задаче со свободным правым концом траектории включения (1.19) превращаются в равенства 0 1 2 , а множество (1.17) при всех k совпадает с V (t , y ) .27Обозначим черезk ,k , скалярную функциюk : k , левый пределk ( 0, y ) которой равен минимальному значению функционала (1.14) на множествеD1k (, y ) допустимых процессов с не более чем k переключениямиk ( 0, y ) mind D1k (, y )I (d ) .(1.20)Множество D10 (, y ) содержит один процесс d 0 с постоянной траекторией и нейтральнымуправлением.
Поэтому минимизация в (1.20) при k 0 фактически отсутствует, а функция0 (, y ) равна значению функционала (1.14) на этом процессеt10 ( 0, y ) f0(t , y ) dt F ( y ) .Функцию k , k , будем называть условной функцией цены, поскольку она определяетсякак минимальное значение функционала оставшихся потерь на оптимальном процессе с неболее чем k переключениями. Из вложений (1.18) следуют неравенства0 ( 0, y ) 1 ( 0, y ) 2 ( 0, y ) ,т.е. значения условных функций цены образуют невозрастающую последовательность. Заметим, что функция цены (t , y ) связана с условными функциями цены k равенством(t 0, y ) min k (t 0, y ) .k Достаточные условия оптимальности процесса управленияДостаточные условия оптимальности строятся на основе принципа расширения [39,60],который заключается в замене исходной экстремальной задачи другой задачей, в каком-тосмысле более простой, решающей одновременно и исходную задачу.
Будем использоватьследующий частный случай принципа расширения.Лемма 1.1 Пусть имеются элемент d D , функционал I : D , множество E ,число l и функционал L : E , такие, что:а) D E ,б) I (d ) L(d )в) L(d ) lпри всех d D ,при всех d E ,г) L(d ) l .28Тогда элемент d минимизирует I на DI (d ) l min I (d ) .dDД е й с т в и т е л ь н о, из условий а) – г) следует цепочка соотношенийI (d ) L(d ) l min L(d ) min L(d ) min I (d ) ,d Ed Dd Dчто и требовалось доказать.Для доказательства достаточных условий оптимальности потребуется следующее вспомогательное утверждение.Лемма 1.2 Если функция q (v) непрерывна на компактном множестве V , а функцияp (t , v) непрерывна по совокупности аргументов при всех t 0 и всех v V , тоtmin{q (v) p (, v) d} min q (v) t min p (0, v) t (t ) ,vVvV vV0где (t ) – некоторая бесконечно малая, (t ) 0 при t 0 .
Здесь V Arg min q(v) –vVмножество точек глобального минимума функции q (v) .Д е й с т в и т е л ь н о, рассмотрим функциюt (t , v) q (v) p (, v) d .0Она непрерывна и имеет непрерывную частную производную t (t , v) p (t , v) .