Диссертация (Достаточные условия оптимальности управления дискретными системами автоматного типа), страница 3
Описание файла
Файл "Диссертация" внутри архива находится в папке "Достаточные условия оптимальности управления дискретными системами автоматного типа". PDF-файл из архива "Достаточные условия оптимальности управления дискретными системами автоматного типа", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
СостояниеСАТ определяет тип и параметры функционирования динамической системы. Изменения состояния САТ соответствуют смене режима работы сложной системы. Хотя работа САТ протекает в непрерывном времени, изменения ее состояний (переключения) происходят в некоторые дискретные (тактовые) моменты времени.
Эти тактовые моменты не заданы заранее иопределяются в процессе управления. На рис.В.1 схематически изображены системы управления с переключениями.Изменение состояния непрерывноеи дискретное (скачкообразное)Изменение состояния дискретное(скачкообразное)Гибридные системыДискретные системыПереключаемые системыСистемы с переменной структуройавтоматного типаДискретные системыРелейные системыЛогико-динамические системыДинамические системы с автоматной частьюНепрерывно-дискретные системыИмпульсные системыДискретно-непрерывные системыРис.В.1В левой части рисунка перечислены системы, состояние которых меняется и непрерывно, и дискретно (скачкообразно); в правой части – системы с дискретным (скачкообразным)изменением состояния.
Все системы функционируют в непрерывном времени, за исключе8нием дискретных, которые выделены штриховой рамкой. Вертикальные стрелки, связывающие блоки, отражают отношение включения: системы нижнего уровня являются частнымслучаем систем верхнего уровня. Горизонтальные стрелки показывают, какие системы содержат в своей структуре системы автоматного типа.Кратко сформулируем математическую постановку задачи синтеза САТ [21] и проведемсравнение с известными задачами оптимального управления динамическими системами.Траектория дискретной САТ представляется непрерывной справа кусочно-постояннойфункцией y : T m , определенной на промежутке T [t0 , t1 ] . Точки разрыва функции y ()образуют конечную возрастающую последовательность T 1 T 1( y ()) тактовых моментоввремени, T 1 T .
В каждый тактовый момент времени состояние САТ изменяется, происходит переключение состояния, а функция y () имеет скачок. Такие траектории САТ будем называть траекториями с однократными переключениями. Типовая траектория САТс однократными переключениями в четырех тактовых моментах времени 1 , 2 , 3 , 4 изображена на рис.B.2.yvy (2 )v(1)y (4 )y (1)vo t 0 1324 t1 ty ( 3 )y0t0 1v(4 )v (2 )234 t1v(3 )tРис.В.3Рис.В.2Пусть поведение модели объекта управления описывается соотношениямиy (t ) g (t , y (t 0), v(t )) ,(В.1)v(t ) V (t , y (t 0)) ,(В.2)где y – вектор состояния системы, y Y m ; v – вектор управления, v V q ; t – время, t T [t0 , t1] – промежуток времени функционирования системы.
Для краткости изложения ограничения, накладываемые на функции и множества в (В.1),(В.2), а также некоторыедополнительные предположения во введении опускаются. Отметим только, что g (t , y, o) y ,где o – некоторый нейтральный элемент o V (t , y ) . При нейтральном управлении состояние системы сохраняется. На рис.В.3 пунктирными стрелками и полужирными точками изо-9бражен график типового управления v(t ) с нулевым нейтральным элементом, которое отлично от нуля только в четырех точках 1 , 2 , 3 , 4 .Рекуррентное уравнение (В.1) описывает систему в форме автомата с памятью [31,84].Состояние y (t ) формируется в зависимости от ее предшествующего состояния y (t 0) иуправляющего воздействия v(t ) . При v(t ) o уравнение (В.1) принимает вид y (t ) y (t 0) ,реализуя условие непрерывности слева траектории y () системы. Включение (В.2) ограничивает допустимые значения управления, причем нейтральное управление допустимо при всехt и y .
Допустимыми траекториями считаются непрерывные справа кусочно-постоянныефункции, точки разрыва которой образуют конечное множество T 1 тактовых моментов времени, и удовлетворяющие начальному условиюy (t0 0) y0 .(В.3)На траекториях системы задан функционал качества процесса управленияt1I0 f (t , y(t )) dt g (, y( 0), v()) F ( y(t1)) .t0(В.4)T 1Суммирование в (В.4) ведется по всем точкам T 1 разрывов функции y () (множествоT 1 T 1( y ()) конечное для каждого допустимого процесса). Функция g 0 характеризует за-траты на переключение состояния системы (или, что то же самое, штраф за переключение).Предполагаем, что затраты положительныеg 0 (t , y, v) 0 при v o .(В.5)Требуется найти минимальное значение функционала (В.4) и оптимальный допустимыйпроцесс d1 ( y (), v()) , на котором это значение достигаетсяI (d 1) min I .(В.6)Если наименьшее значение (В.6) не существует, то ставится задача нахождения минимизирующей последовательности di , i 1, 2,...
, допустимых процессов [39,60]lim I (d i ) inf I .i Для описания САТ ранее использовались рекуррентные включения [26,76]y (t ) Y (t , y (t 0)) ,(В.7)где Y (t , y ) – множество состояний, в которые возможен переход из состояния y в моментвремени t . Управления в (В.7) нет. В диссертации принята другая модель [21,24]. ДвижениеСАТ задается рекуррентным уравнением (В.1), включающим управление.
Поэтому работа10системы отождествляется с процессом управления, т.е. траекторией и программным управлением. Отличия в формах описания здесь аналогичны отличиям в описании непрерывныхдинамических систем управления дифференциальными уравнениями [79] или дифференциальными включениями [92]. Задачи поиска наилучшей траектории или наилучшего процессауправления, разумеется, не эквивалентны.
Известны примеры, в которых минимизирующаяпоследовательность траекторий сходится, а последовательность соответствующих управлений – нет. От рекуррентных уравнений можно перейти к включениям, объединив все допустимые управляющие воздействияY (t , y ) g (t , y,V (t , y )) g (t , y, v) .vV (t , y )Возможность обратного перехода от включения к уравнению легко устанавливается в "регулярных" случаях, простых модельных примерах. В общем случае этот вопрос требует дополнительного изучения. Несмотря на разницу в формах описания, теоретические построения,методы и алгоритмы оптимизации САТ, разработанные для разных моделей, похожи, а используемые идеи и понятия – одинаковые.Классическая модель дискретной системы [12,60,80] описывается рекуррентными соотношениямиx(t 1) g (t , x(t ), v(t 1)) ,(В.8)v(t 1) V (t , y (t )) ,(В.9)где t – дискретное время, t 0,1,..., N 1 .
Эта модель получается из (В.1),(В.2), если зафиксировать тактовые моменты времени T {0,1,..., N } , в которые дискретная система меняетсостояние. Между тактовыми моментами состояние дискретной системы постоянно.В отличие от классических моделей (В.8),(В.9) дискретных систем [12,60,80], изменениясостояний (переключения) которых происходят в заданные (тактовые) моменты времени, переключения САТ могут совершаться в произвольные, заранее не заданные моменты времени[26,76].
Такой вариант дискретной системы является частным случаем САТ, который получается при задании одного и того же множества T для всех допустимых процессов управления. Выбор тактовых моментов является одним из ресурсов управления САТ и подлежит оптимизации. Как правило, в дискретной системе количество тактовых моментов времени, а,значит, и переключений, задано. Задача оптимизации при этом становится конечномерной. Взадаче оптимизации САТ количество переключений тоже конечное, но эта величина не задана и может быть сколь угодно большой. Поэтому задачу оптимизации САТ следует отнести кзадачам минимизации в функциональном пространстве, т.е.
к вариационным задачам.Исследования ЛДС [15–17,19] показали, что в оптимальных конструкциях автомата спамятью реализуются режимы с многократными переключениями в фиксированный момент11времени. Количество переключений автоматной части может быть даже счетным при неизменном состоянии динамической части. Эти режимы являются новыми в теории управленияи малоисследованными. Как показывают примеры, они не являются исключениями, встречающимися только в специальных системах. Наоборот, они появляются в совершенно обычных задачах, в частности, в задаче управления линейными ЛДС с квадратичным критериемкачества. Отметим, что это важная с практической точки зрения задача аналогична проблемеаналитического конструирования оптимальных регуляторов Летова А.М.
[65].Поскольку САТ служит автоматной частью ЛДС, то в ее работе необходимо учитыватьвозможность мгновенных многократных переключений. Конечно, такие режимы являютсяабстрактными, физически нереализуемыми. Однако оптимальность таких процессов предъявляет существенные требования к быстродействию системы управления, которые должныучитываться конструкторами. В противном случае, результаты работы САТ будут значительно хуже оптимальных.yyy3ny3y2ny1ny2y0y0yy (2 )y (4 )y (1)y101nn2 3nРис.В.4tt0 1 2 3Рис.В.5y ( 3 )y00 1324tРис.В.6Процессы с мгновенными многократными переключениями возникают как пределы последовательностей допустимых процессов.
Например, на рис.В.4 показана функция y n () стремя скачками в точках 1n , n2 , 3n и значениями y0 y n (0 ) , y1n y n (1n ) , y2n y n (n2 ) ,y3n y n (3n ) . Если yin yi , in i , i 1,2,3 , при n , причем последовательные значения предельной функции разные y0 y1 , y1 y2 , y2 y3 , а пределы трех точек разрывасовпадают 1 2 3 , то предельная функция y () (рис.В.5) имеет в этой точке трехзначный разрыв.
На рис.В.6 изображена функция, имеющая четыре точки многозначного разрыва: 1 – точка трехзначного разрыва, 2 – двузначного, 3 – пятизначного, 4 – четырехзначного разрыва. Эта функция имеет 14 скачков и может быть получена как предел последовательности кусочно-постоянных функций с N 14 точками разрывов.Аналогичные траектории могут возникать в импульсных [43,49,62] и дискретнонепрерывных [71] системах при мгновенных многократных воздействиях. Траектории этих12систем описываются дифференциальными уравнениями с импульсными воздействиями (всеобозначения как в [71])X (t ) F ( X (t ), t ) ( X (i ), i , wi )(t i ) , X (0) x0 ,(В.10)i tгде (t ) есть стандартная дельта-функция, удовлетворяющая условию f (t )(t )dt f ()для любой непрерывной функции f (t ) . Решение задачи Коши (В.10) определяется формулойtX (t ) x0 F ( X ( s ), s ) ds ( X (i ), i , wi ) .(В.11)i t0Если "убрать" непрерывную составляющую, положив F ( X , t ) 0 , получим решение (В.11) ввидеX (t ) x0 ( X (i ), i , wi ) .i tТакая траектория кусочно-постоянная, так как тактовые моменты удовлетворяют неравенствам0 1 2 ...