Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения, страница 2
Описание файла
PDF-файл из архива "Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 2 страницы из PDF
Момент времени t1 (конечный момент процесса управления,t1 > t0 ) может быть заранее заданным или же определяться в процессе решения задачи (это должно быть чётко оговорено в постановкезадачи). Итак, мы хотим перевести объект из множества M0 во множество M1 (см. рисунок 1.1).x2x(t)x(t1 )x(t0 )M1M0x10Рисунок 1.1Например, в задаче о переводе спутника с одной орбиты на другуюмножества M0 и M1 состоят более, чем из одной точки.7Типична ситуация, когда перевод объекта из M0 в M1 может бытьвыполнен неединственным способом, при помощи различных допустимых управлений.
В этом случае появляется возможность для оптимизации управляемого процесса, т.е. можно решать задачу о переводеобъекта из M0 в M1 “наилучшим способом” Обсудим сейчас вопросо том, какой смысл следует приписать последнему выражению.1.1.4Критерий качества управленияРассмотрим паруx(t), u(t) ,t0 t t1 ,(7)где u(t) – допустимое управление, x(t) – отвечающая этому управлению траектория с начальным условием x(t0 ) = x0 ∈ M0 , т.е.
x(t) –решение задачи Коши (4), причём выполняется условие x(t1 ) ∈ M1 .Рассмотрим также функционалt1J=f 0 (t, x(t), u(t)) dt,(8)t0где f 0 (t, x, u) – известная функция своих аргументов. Таким образом, каждой паре (7) ставится в соответствие число J, определяемоепо формуле (8). Функционал (8) называется критерием качествауправления. Он может иметь физический смысл (в зависимости отфункции f 0 ):а) расхода топлива,б) энергетических затрат,в) финансовых затрат или прибыли,г) времени перехода из M0 в M1 ,д) и т.д.Конкретный выбор функционала J в приложениях производится инженером, исходя из требований, предъявляемых к рассматриваемомууправляемому процессу. В случае f 0 = 1 получаемJ = t1 − t08(9)(функционал имеет физический смысл времени перехода объекта изM0 в M1 ).Нашей целью является минимизация функционала (8), характеризующего качество процесса управления.Мы описали выше основные элементы1 , типичные для математической задачи оптимального управления, и переходим сейчас к еёпостановке.1.1.5Постановка задачи оптимального управленияТребуется: перевести объект из множества начальных состоянийM0 , см.
(5), на множество конечных состояний M1 , см. (6), за счётвыбора допустимого управления u = u(t) из класса допустимых управлений У, так, чтобы функционал J, см. (8), принимал минимальноезначение, или в компактной формеJ → min .u(·)∈УУправление u(t), решающее поставленную задачу, называется оптимальным управлением (в смысле функционала J). Траектория x(t),отвечающая оптимальному управлению u(t), называется оптимальной траекторией. В случае (9) задача оптимального управления называется задачей быстродействия.Таким образом, постановка задачи оптимального управления вкраткой форме имеет следующий вид:⎧ẋ(t) = f (t, x, u),⎪⎪⎪⎪⎪⎨ u(t) ∈ У,x(t0 ) ∈ M0 ,(10)⎪x(t⎪1 ) ∈ M1 ,⎪⎪⎪⎩ J → min .u(·)∈УЗадача (10) требует задания следующего набора исходных данных:{f 0 , f ; У = УU ; M0 , M1 , t0 }.(11)Напомним ещё раз, что момент времени t1 окончания процесса управления1 В постановку задачи оптимального управления могут вводиться дополнительныеограничения.9а) может быть заранее заданным и в этом случае число t1 следуетотнести к набору элементов (11)б) может быть незаданным (так обстоит дело, например, в задачебыстродействия, где t1 заранее неизвестен), и в этом случае нахождение t1 следует отнести к задаче нахождения оптимальногоуправления u(t), t0 t t1 .Заметим, что задача максимизации I → max может быть сведенаu(·)∈Ук задаче минимизации функционала J = −I.1.1.6Основные математические вопросы теории оптимальногоуправленияПеречислим основные вопросы теории оптимального управления.1.
Управляемость (возможность перевода объекта из M0 в M припомощи некоторого допустимого управления; без управляемостирешения задачи (10) не существует). Исследование управляемости не связано с критерием качест2. Существование оптимального управления (пусть объект обладает свойством управляемости; существует ли оптимальное управление в выбранном классе допустимых управлений У3. Необходимые условия оптимальности (теоремы о необходимыхусловиях оптимальности в форме принципа максимума Понтрягина [1]).
Роль необходимых условий невозможно переоценить; необходимые условия позволяют, вообще говоря, выделить отдельные траектории, которые могут быть оптимальными,отбраковать заведомо неоптимальные решения. Роль необходимых условий оптимальности можно сравнить с ролью условияf (x) = 0 в задаче на минимум функции f (x) и с ролью уравнений Эйлера-Лагранжа в классическом вариационном исчислении4. Достаточные условия оптимальности.5. Единственность оптимального управления.6. Численные методы построения оптимальных решений.В настоящем курсе излагается линейная теория быстродействия.101.1.7Линейная задача быстродействияЛинейная задача быстродействия является частным случаем задачи оптимального управления (10) при условии (9) и в предположениилинейности функции f :ẋ = Ax + u,x(t0 ) ∈ M0 , x(t1 ) ∈ M1 ,(12)(13)J = t1 − t0 → min .(14)u(·)∈УU⎞x1⎜ ⎟Здесь x = ⎝ ...
⎠ – вектор фазовых координат; x ∈ E n ,⎛xnA = (aij ) – матрица системы (считаем её независящей от времени t), ⎛ ⎞u1⎜ .. ⎟u = ⎝ . ⎠ – вектор управления; u ∈ E n .unКласс допустимых управлений 1) принимает значения из компакта U.У = УU = u(t) 2) задан характер зависимости u от tКомпакт U называется областью управления.M0 – множество начальных состояний объекта,M1 – множество конечных состояний объекта,J = t1 −t0 – критерий качества управления (время перехода из M0в M1 ).Линейная задача быстродействия (12)-(14) задаётся набором исходных данных(15){A, M0 , M1 , У = УU , t0 }и состоит в нахождении допустимого управления u = u(t), переводящего объект из M0 в M1 по траекториям уравнения (12) за минимальное время.
Управление u(t), решающее эту задачу, называетсяоптимальным по быстродействию, а соответствующая этому управлению траектория x(t) называется оптимальной по быстродействиютраекторией.11Решить задачу быстродействия (12)-(14) означает, что нужно понабору исходных данных (15) найти оптимальную пару (x(t), u(t)),t0 t t 1 .Векторное дифференциальное уравнение (12) равносильно системеẋi =naij xj + ui ,i = 1, . . . , n.j=11.1.8Два простейших примераПример 1.1.
Управляемое движение материальной точки по прямойпод действием ограниченной внешней силы (задача о тележке).Рассмотрим материальную точку массы m, которая движется попрямой (ось y) (см. рисунок 1.2), без трения под действием ограниченной внешней силы, направленной вдоль оси y.mf¯(t)y0Рисунок 1.2Геометрическое положение материальной точки описывается координатой y = y(t). На основании второго закона Ньютона запишемдифференциальное уравнение движения точкиmÿ = f (t),т.е.ÿ = v(t),(16)(t)где v(t) = fm– управление. Считаем заданными начальные условия y(0) = a (начальное положение точки), ẏ(0) = b (начальная скорость точки). Дальнейшее движение точки зависит от выбора управления v(t), которое при m = 1 совпадает с f (t).
Пусть управление v(t)подчинено ограничению|v(t)| 1.Рассмотрим задачу о переводе точки из начального положения aпри начальной скорости b в положение y = 0 с нулевой скоростью.12Этот перевод осуществляется за счёт выбора управления v(t). Требуется выполнить этот перевод за кратчайшее время.Полагая y = x1 , ẏ = x2 , v = u2 , перейдём от дифференциальногоуравнения (16) второго порядка к следующей системе дифференциальных уравненийẋ1 = x2 ,ẋ2 = u2 .В данном примере размерность фазового пространства равна 2, фазовым пространством служитфазовая плоскость x1 , x2 .
Множество aaначальных состояний M0 =состоит из одной точки,bb 0множество конечных состояний M1 =– начало координат, 0 x10 1x =– фазовый вектор, A =, область управленияx20 0 u1 u1 = 0U = u=– отрезок. Таким образом, мы получиu2 |u2 | 1ли линейную задачу быстродействия в стандартной форме (12)-(14).Пример 1.2. Управляемое движение математического маятникапод действием ограниченной внешней силы.Рассмотрим движение тяжёлого шарика массы m под воздействиемупругой силы пружины и внешней силы f (t) (рисунок 1.3).
Задачарассматривается без учёта силы трения.m0yРисунок 1.3Движение шарика происходит вдоль оси y. В состоянии равновесия шарик имеет координату y = 0. Привлекая физические законы –второй закон Ньютона и закон Гука (упругая сила пропорциональнаотклонению от положения равновесия и направлена в сторону положения равновесия) – запишем дифференциальное уравнения движенияmÿ = −ky + f (t),13где положительный коэффициент k характеризует жёсткость пружины.
Полагая ω 2 = k/m, v(t) = f (t)/m, приходим к уравнениюÿ + y = v(t)(17)(здесь мы для упрощения считаем ω 2 = 1, |v(t)| 1). Пусть заданыначальные условия y(0) = a, ẏ(0) = b. Рассмотрим задачу о скорейшем успокоении маятника под действием ограниченной внешнейсилы v(t).Полагая y = x1 , ẏ = x2 , v = u2 , от уравнения (17) переходим ксистемеẋ1 = x2 ,ẋ2 = −x1 + u2 .Как и в предыдущем примере, здесь n = 2, a0, M1 =,M0 =b0 x1u1 u1 = 0,x=,U = u=u2 |u2 | 1x2но теперь матрица системы имеет вид0 1A=.−1 0Мы опять пришли к постановке линейной задачи быстродействия встандартной форме.Решение этих примеров описывается в разделах 3.13, 3.16.1.2 Некоторые сведения из теории обыкновенныхдифференциальных уравненийПри изучении линейной теории оптимального управления важнуюроль играет формула Коши для решения линейной системы.