Диссертация (Управление и контроль безопасного причаливания речных судов), страница 10
Описание файла
Файл "Диссертация" внутри архива находится в папке "Управление и контроль безопасного причаливания речных судов". PDF-файл из архива "Управление и контроль безопасного причаливания речных судов", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 10 страницы из PDF
Тогда условие (2.14) дляоптимального процесса приобретет вид:ni(t ) fi ( x , u ) 1i 1что сразу же позволяет левую часть этого равенства обозначить черезгамильтониан Н, а из соотношения (2.15) получить используемую впринципе максимума систему дифференциальных уравнений относительновспомогательных переменных: l nH i fi xl i 1xiТаким образом, результаты динамического программирования иSпринципа максимума совпадают, если ввести обозначения l или вxlвекторной форме gradS .Рис.2.2.
Геометрическая интерпретация динамического программирования взадаче максимального быстродействияЭто позволяет дать следующую геометрическую интерпретациюдинамического программирования. На рис.2.2 представлены поверхностиизохрон S = const для задачи максимального быстродействия, причем величина69S, по смыслу равная оставшемуся минимизируемому времени tk t убывает помере приближения к конечной точке, т.е.
S1 S2 .При этом движение должно осуществляться в направлении убыванияфункции S, т.е. в направлении, противоположном ее градиенту внутрь изоповерхности S = const. Из физических соображений очевидно, что движениевдоль нормали – самое быстрое по времени, так как движение вдольизоповерхности не дает приближения к конечной точке.С помощью функции Беллмана S можно дать и другую трактовкупроцессу ее убывания, связав ее с функцией Ляпунова. Действительно, еслицелевая функция положительно определена:f 0 xT Qx q0u 2то, выразив уравнение (2.12) в видеS S dSx f 0 или f0t xdtвидим, что функция S есть функция Ляпунова.Значит, если функция S положительно определена, то оптимальнаясистема обладает еще одним замечательным свойством — она асимптотическиустойчива, что особенно важно для нелинейных систем.Отличие динамического программирования от других методов состоит втом, что если принцип максимума есть необходимое условие оптимальности,то уравнения динамического программирования при соблюдении всехтребуемых допущений понимаются как достаточное условие.
Необходимо такжеподчеркнуть, что в принципе максимума переменные i мыслятся как функциивремени, а в динамическом программировании это функции от фазовыхкоординат, характеризующие чувствительность минимизируемого значенияфункционала к изменению текущего состоянияx(t) .Формально это требуетрешения нелинейных дифференциальных уравнений вида (2.9) или (2.10) вчастных производных, что так же сложно, как и решение краевых задач впринципе максимума.702.1.2.
Аналитическое конструирование регуляторов и применение для ихсинтеза динамического программированияПоскольку динамическое программирование наиболее близко к получению оптимального управления в замкнутой форме, нужно подробнееостановиться на задаче синтеза систем автоматического управления,удовлетворяющего при существующих ограничениях требуемому качеству.Одним из направлений в этой области является разработанный у нас в странеА.М.Летовымподход,названыйаналитическимконструированиемрегуляторов [1, 4], когда алгоритм управляющего устройства замкнутойсистемынаходитсяаналитическивсоответствиисопределеннымфункционалом качества, соответствующим квадратическому критерию вида:tkTJ 0 .5 x ( t k ) 0 .5 x ( t ) P ( t ) x T ( t ) u T ( t ) R ( t ) u ( t ) d t(2.16)t0Минимизация функционала (2.16) соответствует задаче о регуляторесостояния, когда важно удерживать около нуля все компоненты векторасостояния.
Возможны другие варианты удержания около нуля некоторойошибки, представляющей собой разность между желаемым и выходнымсигналами в задачах слежения [27, 28, 34, 37], но смысловое содержанияструктуры критерия остается неизменным. Первое слагаемое характеризуеттерминальную ошибку в конечный момент, второе слагаемое преследует цельобеспечить малость ошибки при удерживании системы в заданном положении.Последнее слагаемое представляет «штраф за большое управление» иоценивает затрачиваемую на управление энергию.Соответственно положительно полуопределенные матрицы М, Р иположительно определенная матрица R выбираются с учетом значимостиуказанных факторов, преимущественно с ненулевыми диагональнымиэлементами, либо, по желанию проектировщика, можно положить некоторыеиз матриц нулевыми.
При этом, как правило, рассматривается линейныйнестационарный объект, описываемый уравнениями:x Ax Bu71(2.17)где на управление u никаких прямых ограничений не наложено. В связи с этимдля аналитического решения можно применять как вариационное исчисление,так и принцип максимума, но для получения решения в замкнутой формевоспользуемсяметодомдинамическогопрограммирования.Сучетомтерминального члена функцией Беллмана S является функция:tkTS ( x , t ) min 0.5 x (tk ) Mx (tk ) f 0 ( x , u )dt utкоторая при t tk не равна нулю.С учетом (2.16) и (2.17) уравнение Беллмана имеет вид:S ( x , t )S min 0.5 x T MP (t ) x 0.5u T R (t )u [ A(t ) x B (t )u ]utx(2.18)При отсутствии ограничений на оптимальное управление вычислимпроизводную от выражения в фигурных скобках и, приравняв ее нулю,получим:uT R SB(t ) 0xПоскольку матрица Д положительно определена, можно найти, вопервых, оптимальное управление:u (t ) R1 T S ( x ,t ) B (t ) x T(2.19)и, во-вторых, записать уравнение Беллмана без операции минимизации:TSSST1T S 0.5 x P ( t ) x 0.5B ( t ) R (t ) B A (t ) xtxx x (2.20)Уравнение (2.20) можно решить при условии S ( x , tk ) 0.5x T Mx .Можнопоказать, что уравнение (2.20) имеет точное аналитическое решение, котороепредставляет собой квадратичную форму:TS ( x , t ) 0.5 x K ( t ) x(2.21)где К(t) — симметричная нестационарная матрица с искомыми элементами.
Вычислив частные производные:72SS 0.5 x T K ( t ) x ; x T K ( t )txподставим их в уравнение (2.20):TTT1T0.5 x K (t ) x 0.5 x P (t ) x 0.5 x K (t ) B (t ) R (t ) B (t ) K (t ) x T x K (t ) A(t ) x ,(2.22)Учитывая, что x T K (t ) A(t ) x 0.5x T K (t ) Ax 0.5 x T AT (t ) K (t ) x , уравнение (2.22)можно преобразовать к виду:T1T0.5 x [ K ( t ) P ( t ) K ( t ) B ( t ) R ( t ) BT( t ) K ( t ) K ( t ) A( t ) A ( t ) K ( t )] x 0что соответствует равенству нулю выражения в квадратных скобках,имеющеговидсистемылинейныхнеоднородных дифференциальныхуравнений с граничным условием K (tk ) M :T1TK KA(t ) A (t ) K KB (t ) R (t ) B (t ) K P (t ),(2.23)Уравнение (2.23) называется матричным уравнение Риккати, решениекоторого обычно находят численно на ЭВМ до начала работы системы.Оптимальному управлению соответствует в общем случае линейный законуправления с переменным коэффициентом передачи:u (x ) R1KBT(t ) x(2.24)И снова, возникает закономерный вопрос - при каких условиях структураи параметры регулятора будут неизменны.
В работах Калмана доказывается,что при М = 0 и tk для стационарных объектов, т.е. при постоянныхматрицах А, В, К и Р, решение уравнения Риккати есть постоянная матрица К,соответствующая уравнению:KA AT K KBR 1 B T K P 0,(2.25)В этом случае оптимальная замкнутая система является стационарной:x ( A BR 1BT K ) x73и асимптотически устойчивой вследствие установившегося поведенияпри t , несмотря на то что объект управления может быть неустойчив.Нужно подчеркнуть, что с учетом формулы (2.24) метод АКОРявляется наиболее подходящим для определения структуры линейногорегулятора.2.1.3.ПриближенныйметодрешенияуравненияБеллманадлядинамических систем альтернативного управленияВ предыдущем параграфе был изложен подход к решению задачианалитического конструирования оптимального управления для случая, когдаограничений на управление u(t) не наложено, но это не свидетельствомощности метода, а скорее лишь первая прикидка в проводимых расчетах впредположении о линейном законе управления.Обеспечение релейности, или альтернативности, управления очевидноявляется фундаментальной конструктивной задачей при синтезе нелинейныхсистем управления в замкнутом виде.
Под альтернативой управленияпонимается один из нескольких вариантов приложения управляющеговоздействия, остающегося неизменным на некотором конечном интервалевремени. Так, в задаче максимального быстродействия имеются двеальтернативы u1 1 и u2 1 в задаче минимума расхода топлива – триальтернативы:u 1 1, u 2 0 , u 3 1В общем случае счетное число альтернатив может быть велико, ноконечно и предполагается также конечное число переключений в процессефункционирования системы[46-49].По существу имеется в виду такой класс задач, в которых управлениеявляется целочисленной переменной, а фазовые координаты — непрерывнымипеременными и фактически отсутствует способ непрерывного линейногоуправления.
Назовем этот класс содержащим задачи альтернативногоуправления, число которых задано J= 1, ..., N, что определяет структуру74искомой функции переключения, разбивающей фазовое пространство X на Nподобластей. По аналогии с описанием линейных динамических систем снепрерывным управлением линейная система с альтернативным управлениемимеет вид:x Ax Bu j (t )или, поскольку значения и u j считаются заданными или становятся известными в результате предварительного синтеза с помощью принципамаксимума, то:x Ax B j (t )(2.26)где B j — вектор констант, которыми нужно умело распорядиться.Как будет показано ниже в примерах, существует ряд задач, в которыхвыбор альтернативы влияет также и на вид матрицы А, поэтому остановимсяна более общем соотношении для описания динамической системы:x Aj x B j (t )где элементы матриц А и В — кусочно-постоянные функции времени.Пусть выражение функционала имеет квадратичную форму, как и ваналитическом конструировании, плюс линейную формуtknn 1 nJ j ij xi 0.5 ilj xi xl dt min, j (t ) 1,..., N .i 1i 1 l i 1t0 Тогда уравнение Беллмана для детерминированных задач с закрепленным временем можно представить в виде:Вnn 1 nnSS n min j ij xi 0.5 ilj xi xl ailj bij t j ( t )1,2 i 1i 1 l i 1i 1 xi i 1данномуравнении j , ij , ilj , a ilj , bij –заданныевеличины,сохраняющие постоянные значения на выбранном интервале времени.75(2.27)Как было указано ранее, аналитическое решение уравнения Беллмана вобщемвидененайдено,ичисленныеметодытребуютбольшогообъема вычислений и оперативной памяти ЭВМ на каждом шаге оптимизации.Для получения приближенного аналитического решения возможенподход, основанный на представлении функции Беллмана в виде ряда [ ], вчастности степенного полинома второго порядка, что позволяет в применениик задачам альтернативного управления получить решение задачи вквадратурах.Рассмотрим одномерный случай релейного управления системой,описываемой с помощью скалярной переменной х.