Основы ТАУ - Ч-3 Оптимальные, многосвязные и адаптивные системы - Воронов [1970] (1189551), страница 7
Текст из файла (страница 7)
В работе А. Я. Лернера [100[ дается дальнейшее расширение постановки задачи на некоторые системы п-го порядка с вещественными корнями характеристического уравнения линейной части при отработке начального рассогласования и нулевых начальных условиях. В работе была высказана идея, что и при наличии нескольких ограничений модули ограничиваемых величин должны поддерживаться на максимальном уровне. Полезным оказалось введение понятия нзохрон (101[. Эти результаты подытожены в Н02[. В этих работах были также указаны пути приближенной Реализации рассмотренных оптимальных систем с помощью 33 нелинейных обратных связей и построены быстродействующие автоматические компенсаторы, работающие по этому принципу.
Таким образом было дано теоретическое обоснование средств реалиаации простейших оптимальных систем, которые ранее в том или ином виде предлагались из чисто интуитивных соображений. Не все процессы, предложенные в [100], оказались строго оптимальными, хотя и довольно близкими к пим. Примерно в это же время в зарубежной печати также выходит ряд работ, где рассматриваются либо различные случаи систем второго порядка, либо частные принципы, применение которых, позволяя улучшить динамические характеристики системы, еще не делает ее оптимальной. В работе [212] используется идея скачкообразного изменения демпфирования, которое принимает малое значение в начале переходного процесса и большое — в конце. Использование нелинейного элемента для управления реле, осуществляющего переключения тормозного момента, рассмотрены в [259]. В [246] покавапо, что существенное улучшение качества систем второго порядка можно получить при переменном управляемом демпфировании, зависящем от координат.
Интересно отметить работу [213], в которой показано, что в оптимальной по быстродействию системе второго порядка, характеристический полипом которой имеет комплексные корни, число интервалов переключения в зависимости от начальных условий, может быть сколь угодно велико, хотя и конечно. Дальнейшее существенное развитие теория оптимального управления получила в работах [180, 181], где дано обобщение понятия оптимального управления на случай неавтономной системы, в которой требуется в кратчайшее время привести движение системы х (Ф) на заданную траекторию х, (1). Там же впервые доказана «теорема об и интервалах», рассмотренная ниже в 2-3. В [193] были изложены основные положения теории оптимальных процессов в релейпых системах.
В [100, 101] дано дальнейшее развитие теоремы об п интервалах, для случая ограничений, накладываемых на несколько координат. К разработке проблем оптимального управления были привлечены крупные математики, так как дальнейшее развитие теории сдерживалось отсутствием необходимого математического аппарата. Цикл упомянутых выше работ послужил стимулом для создания такого аппарата.
С небольшими интервалами времени в 50-х годах получили развитие три новых направления: принцип максимума в СССР, динамическое программирование в США, использование методов функционального анализа в СССР и Польше. Одновременно проводились работы и по распространению классических методов вариационного исчисления на новые задачи.
Трудности здесь свяааны с тем, что расширение класса функций, с которыми оперирует вариациопкое исчисление, приводит к нарастанию трудностей при решении задачи. Введение изломов 34 з функцию приводит к необходимости помимо уравнений Эйлера вводить для точек излома в рассмотрение дополнительные условия Эрдмана — Вейерштрасса. Ири появлении в функциях разрывов выражения вариаций сильно усложняются, вследствие чего в обычных курсах вариационного исчисления такие задачи уже не рассматриваются. Замыкание области координат также приводит к дополнительным усложнениям. Для преодоления этих затруднений в рамках классического вариационного исчисления был предложен ряд методов.
К числу интересных работ, где для решения неклассических задач применен формализм классического вариационного исчисления, относятся работы Больца и Майера [210], Н. Н. Тернет [43] и др. В последние годы расширение круга неклассических задач, решаемых классическим вариационным исчислением, было дано в [177]. Тем не менее, потребность в расширении рамок вариационного исчисления и в создании новых методов, обладающих большей общностью, ощущалась все сильнее, что в конце концов и привело к возникновению упомянутых выше новых разделов вариационного исчисления. 2-2.
Прннцнн манннмума Одним из наиболее часто встречающихся в технике видов ограничений, налагаемых на переменные, к которым относятся как координаты, так и управления, является ограничение по модулю, налагаемое либо на отдельные координаты, х,~ = Аз, ~ у! ~ ~ В,, либо на некоторые функции переменных и их проиэводнйх.
Так, з системе управления самолетом ограничены перемещения рулей, в электрических установках ограничиваются величины напряжений по условиям электрической прочности, токов — по условиям нагрева, моментов — по условиям механической прочности. Но если в электрической цепи, описываемой уравнением (Лр + В) ! =- = и, ограничено и, то тем самым ограничена и линейная форма (Ьр + В) !. Если некоторое управление, изображаемое вектором в в п-мерном пространстве и = [ид, и„..., и„], где и!, ..., и„— проекции вектора и на координатные оси, принадлежит множеству Г7 этого пространства, то для технических задач обычно характерна замкнутость множества У.
Часто встречаются задачи, в которых ограничены по модулю проекции вектора ~и!](и! =сопзФ, !=1, 2, ..., п. Тогда множеству Г7 соответствует и-мерный параллелепипед. В несколько более общем случае, когда ограничения выражаются линейными неравенствами ~чжаня!(Ь, У'=.1, 2, ..., л!, !=! Ых; —,'=~;(х„х, ..., х„, и), (=1,2, ..., и. (2-1) Пусть заданы начальные х, (О) и конечные х, (Т) состояния системы: х; (О) =х;а; 1=1, 2, .,., и. (2-2) Далее задано, что управление п, которое может перевести систему из состояния х (О) в состояние х (Т), должно принадлежать некоторой замкнутой области У: (2-3) ЕП Затем задано также значение функционала У, которое надлежит минимизировать надлежащим выбором и.
У = $ Т' [х (Е), и (1)) сй. о (2-4) Введем в рассмотрение дополнительную координатухю определяемую из уравнения (2-5) Тогда задача сводится к нахождению такого решения системы уравнений: — „,' = /, (х„х„..., х„, п), (2-6) 1 = О, 1, 2, ..., л, при котором дополнительная координата х, (Т) = У имела бы наименьшее значение, а остальные координаты удовлетворяли бы граничным условиям (2-2).
В уравнениях (2-6) правые части не содержат явно Ф, т. е. система стационарна. Изстационарности системы вытекает, что при сдвиге вдоль оси 1 свойства управлений не меняются в том смысле, множество У представляет собой замкнутый выпуклый многогранник. В этом случае оптимальное управление, как мы увидим ниже, осуществляется путем мгновенных переходов точки (иы и„..., и„) в равные вершины многогранника. При решении подобных задач классическими методами вариационного исчисления встречаются серьезные затруднения. Принцип максимума дает один из наиболее рациональных путей преодоления этих затруднений.
Пусть дана система дифференциальных уравнений, описывающих движение рассматриваемого объекта: что если управление п (Г), О ( 8 ( Т переводит точку в фазовом пространстве иэ положения х,, в х, и придает функционалу (2-4) значение Ум, то при любом вещественномт управлением (г + т), Г ( Т + т также переводит фазовую точку из положения хм в положение х,„, т. е. придает функционалу (2-4) то же аначекие Ум, и, кроме того, х,.(г + т), обусловленное управлением и (г + т), равно х,. (1), обусловленному управлением и (г), Пусть дана система точек х,„хп, ..., хм фазового пространства Х и существует управление и,, переводящее фазовую точку иа положения х,, ~ в положение хк и придающее функционалу (2-4) значение У,, 1 = 1, 2, ..., к. Тогда существует управление и, переводящее фазовую точку из положения х,, в х, и придающее функционалу (2-4) значение У = У, + Х, + ...
+ У„. Это вытекает из указанной возможности сдвигать управления вдоль оси времени и считать поэтому отрезки, на которых 3 определены управления и,, сь примыкающими друг к дру- х„-- — — -----.-- гу. Отсюда можно сделать важный вывод: любой отрезок оптимальной траектории *~ ----- — с. (а также кривой, изображающей оптимальное управление и* (Г), также является оптимальной траекторией (или кривой оптимального Х, управления).
гм *о ьг хе В самом деле, пусть на отрезках оптимальной траек- Р»с. ЗМ. торин [х,„х,,]; [х„, х,.~] я [хоо хы] (рис. 2-1) значения функционала (2-4) равны соответственно У„уэ и Уз. Предположим, что на отрезке [хп, х,,] управление и, не оптимально, и существует некоторое управление о, переводящее фаэовую точку из х,, в х,, оптимальным образом и придающее функционалу (2-4) значение Уэ' ( У,. Но тогда получим новое управление, придающее функционалу У' значение У' =- Уд + Уэ + Уэ ( У, что противоречит условию, что и* оптимально и, следовательно, У имеет наименьшее возможное значение. Рассмотрим теперь, кроме основной системы уравнений (2-6), систему, составленную относительно дополнительных переменных ф, ф„..., ф„: ~~% Ъ~ з1а (х а) 1 а ' ~р„~ ~ О 1 2 ...