Деменков Н.П. Вычислительные аспекты решения задач оптимального управления (2007) (1253737), страница 2
Текст из файла (страница 2)
Математик с его традиционной манерой мышления часто оказывается бессильным там, гдеинженер получает практические результаты.1.1. Основные особенности прикладных задачоптимального управленияЗадачу оптимального управления можно представить в видесоставного объекта, включающего (рис. 1.1): цель управления,управляемый объект, измерительную систему и вычислительноеустройство, осуществляющее расчет оптимального управления.Задача вычислительного устройства – найти связи между вектором состояния в конечный момент времени xк , вектором управления u и измеренным вектором состояния xизм .67Рис.
1.1. Структура задачи оптимального управленияПри решении задач оптимизации необходимо вначале выбратьи сформулировать цель (выбрать критерий оптимальности), затемсогласовать ее с имеющимися возможностями (учесть ограничения) и, наконец, реализовать способ достижения цели при учетеограничений.Критерий оптимальности может представлять собой технический или технико-экономический критерий, математическое выражение которого является функцией или функционалом координат процесса и управляющих воздействий.
Требования к системе,как правило, противоречивы. В управлении техническими системами наиболее распространенными являются различные интегральные критерии. Определяющим является показатель точности,который выражается через характеристики, описывающие стохастический характер реальных условий взаимодействия объекта исреды и зависящие от управления.Не менее сложной является и задача построения математических моделей управляемых процессов (проблема идентификации),а именно модели собственно управляемого объекта, описываемого, как правило, нелинейным векторным дифференциальнымуравнением x = f ( x , u , w, t ), и модели внешних возмущенийw(t ), статистические характеристики которых неизвестны, а известны лишь границы максимального и минимального уровнявозмущений.Современное состояние теории синтеза управления, оптимального по статистическому критерию, для нелинейных объектов не дает возможности получить решение задачи в общей постановке.
Задача формулируется как детерминированная, иуправление синтезируется с «запасом», т. е. с ориентацией нанаихудшие условия.Увеличение точности удовлетворяется в двух направлениях. Вопервых, входная информация, носящая статистический характер,подвергается обработке для получения оптимальных оценок измеряемых координат, а при синтезе управления предполагается, чтовсе помехи отфильтрованы. Справедливость такой декомпозициидоказана только для линейных систем, но естественность подходаделает его весьма привлекательным для инженерной практики.
Вовторых, точность управления зависит от строгости удовлетворенияконцевым (граничным) условиям. Поэтому при получении концевых условий необходимо возможно полнее учитывать все факторы,сказывающиеся на движении объекта.8В дальнейшем предполагается, что неконтролируемые возмущения на объекте отсутствуют, т.
е. w = 0 и x = f ( x , u , t ), какпоказано на рис. 1.2.Рис. 1.2. Оптимальное управление детерминированными процессамиГраничные условия должны задаваться таким образом, чтобыпри соблюдении ограничений существовал не единственный переход объекта из начального состояния в конечное (рис. 1.3).Каждый путь (траектория) перехода должен иметь количественную оценку: первый путь – J1; второй – J2; третий – J3; четвертый – J4 (см. рис.
1.3).Среди всевозможных траекторий перехода из начального состояния в конечное должна существовать единственная траектория, имеющая максимальное или минимальное значение количественной оценки J:J3 = min (J1, J2, J3, J4).Незначительные изменения (вариации) условий задачи должныприводить к незначительным изменениям минимального значенияпоказателя качества.Должны существовать методы,позволяющие находить оптимальные траектории и оптимальноеуправление.
Метод – это последовательность операций.Необходимо, чтобы существовали технические возможности Рис. 1.3. Траектории перехода9(средства) для реализации оптимальных управлений, полученныхв результате решения задачи.1.2. Критерии оптимальностиПроцесс синтеза системы управления можно проиллюстрировать следующим образом (рис. 1.4).Определяя реакцию системы на совокупность начальных условийи внешних возмущений, находим значение выбранного критерия J. Поизвестному значению J в соответствии с методом оптимизации осуществляется направленное воздействие на систему (ее динамические характеристики, структуру, параметры), которое должно привести к достижению экстремума критерия. Критерий зависит и от заданных характеристик системы α, и от вектора управления u , и от начальногосостояния x (t0 ), и от входной информации в общем случаеJ = J (u , α).При технической реализации систем управления обычно используют простые критерии, включающие лишь основные требования к системе.
Это связано с элементом субъективизма, которыйвыражается в попытке с единых позиций, т. е. с помощью обобщенного критерия, оценить систему, что проявляется либо при назначении весовых коэффициентов, либо при задании требуемыхграничных значений отдельных показателей.Для задачи Лагранжа можно использовать следующие критерии:tkJ = 1 2 ∫ e 2 (t )dtt0– интегральный квадратичный критерий по ошибке системы;tkJ = 1 2 ∫ u 2 (t )dtt0– интегральный квадратичный критерий по управлению, илиtkJ = 1 2 ∫ ⎡⎣ r1u12 (t ) + ...
+ rm um2 (t ) ⎤⎦ dtt01011Рис. 1.4. Процесс синтеза системы управления– интегральный квадратичный критерий для многомернойсистемы.Обобщенный квадратичный критерийtt1k m1kJ = ∫ ∑ rij ui (t )u j (t )dt = ∫ u T (t ) Ru (t )dt.2 t ij2t00Здесь R – симметрическая положительно-определенная матрица. Вобщем случае критерий под интегралом содержит нелинейнуюфункцию:tkJ = ∫ L( x (t ), u (t ), t )dt.t0В системах, оптимальных по быстродействию, L = 1, и критерий принимает видtkJ = ∫ dt = tk − t0 = T = min.t0Такой критерий используется при разработке быстродействующих самопишущих приборов, исполнительных механизмоврегуляторов газовых турбин и прокатных станов, приводов металлорежущих станков, систем управления движущимися объектамии др.Обобщенный критерий также применяется при отсутствииоднозначной зависимости частных показателей от искомой величины – оптимального управления, и в связи с возникновениемопасности компенсации положительных свойств системы отрицательными, ввиду того, чточастные критерии имеют алгебраический характер.Критерий другого типа приведем для задачи Майера о встреРис.
1.5. Задача Майераче двух летающих тел в пространстве (рис. 1.5):122J x (tk ) − z (tk ) = 3 ∑ ⎡⎣ xγ (tk ) − zγ (tk ) ⎤⎦ .γВ обобщенной форме этот критерий можно представить в видеJ = Gk ( x (tk ), tk ) .Для класса детерминированных систем критерий можно записать в виде задачи БольцаtkJ = ∫ L ( x (t ), u (t ), t ) dt + Gk ( x (tk ), tk ) .t0В профессиональной деятельности выбор критериев часто определяется многолетней практикой, опытом.1.3.
Ограничения и граничные условияНаряду с достижением экстремума критерия в практике синтеза могут встречаться дополнительные ограничения видаtk∫ N ( x (t ), u (t ), t ) dt = const.t0Это, например, ограничение количества топлива, материальных и людских ресурсов, которое может быть затрачено на решение задачи.Ограничения могут быть наложены как на управляющие воздействия|u1| ≤ u1max, |u2| ≤ u2max, ..., |um| ≤ ummax,так и на координаты системы|x1| ≤ x1max, |x2| ≤ x2max, ..., |xn| ≤ xnmax.Например, при управлении двигателем постоянного тока ограничены: ток якоря (по условиям нагрева); величина напряжения13(по условиям электрической прочности) и скорость вращения валадвигателя (по условиям механической прочности).
Это и не позволяет беспредельно уменьшать время переходного процесса.Во многих случаях ограничения придают смысл задаче об оптимальном управлении, решением которой должен быть ответ на вопрос:как добиться наилучших результатов при ограниченных ресурсах.Для того чтобы оценка свойств системы была объективной,любая форма записи должна содержать в себе информацию нетолько об изменении управления, но и о конечном и начальномсостояниях системы.Простейший способ заключается в фиксации граничных условий. Это задача с закрепленными концами (задача стрельбы, когдазадаются координаты точек старта и цели).Задача со свободным правым концом, когда допускается произвольное положение объекта в момент окончания управления tk, также является простейшей (задача с закрепленным временем tk – t0 изза конечного запаса топлива на борту).Наиболее общим случаем задания граничных условий являются задачи с подвижными концами: левым, если допускается вариация начальных условий, и правым, если ограничения наложены наконечные условия движения.
Это означает, что граничное состояние системы определено с точностью до выполнения некоторыхсоотношений, называемых граничными условиями, например,G0( x (t0), t0) = 0;Gk( x (tk), tk) = 0.В рамках этих ограничений допустимо любое начальное и конечное состояния системы.1.4. Постановка задачи оптимального управленияМатематическая формулировка задачи оптимального управления состоит в следующем.Пусть управляемый динамический объект описывается на интервале времени [t0, tk] системой нелинейных дифференциальныхуравненийx = f ( x, u, t )14(1.1)с системой граничных условий в начальный и конечный моментвремениx (t0 ) = x0 ; x (tk ) = xk .(1.2)Имеется система ограничений, которым должны удовлетворятьпеременные состояния и управления, т.