Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения, страница 28
Описание файла
PDF-файл из архива "Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 28 страницы из PDF
. .012p0 =pp0 =pp0 =p(10)Процесс (10) включает широкий спектр дискретных численных схем,определяемых привлечённым численным методом решения задачи Коши. Метод Эйлера с шагом ∆µ = 1 в задаче Коши (8) превращаетпроцесс (10) в процесс Ньютона (2). Задача Коши (8) допускает модификации (см., например, [29], уравнение продолжения с обратнойсвязью).2507.26Метод продолжения в краевых задачахРассмотрим краевую задачуẋ = f (t, x),R(x(a), x(b)) = 0,a t b, x ∈ E n .(1)Здесь f (t, x) : E 1 × E n → E n , R(x, y) : E n × E n → E n являются гладкими векторными функциями. Предполагая существование решениякраевой задачи (1), обсудим алгоритмические вопросы поиска её решения.
Решение краевой задачи можно свести к некоторому нелинейному векторному уравнению в E n . Выберем некоторую точку t∗ ∈ [a, b]и рассмотрим задачу Кошиẋ = f (t, x),x|t=t∗ = p ∈ E n .(2)Свобода выбора точки t∗ может быть полезна для вычислительнойпрактики. Пустьx(t, p), a t b.(3)— решение задачи Коши (2). Предполагается продолжимость решения (3) на весь отрезок [a, b] для любого p. Начальное значение параметра p ∈ E n ищется из условий выполнения векторного граничногоусловия в задаче (1), т.е.
искомое p является решением уравненияΦ(p) ≡ R(x(a, p), x(b, p)) = 0.(4)Итак, краевая задача (1) сведена к конечному векторному уравнению (4). Далее к уравнению (4) применяется метод продолжения,описанный в разделе 7.25. Матрица Φ (p) определяется равенствомΦ (p) = Rx∂x(a, p)∂x(b, p)+ Ry.∂p∂pЗдесь (n × n)-матрицы Rx (x, y), Ry (x, y) вычисляются вдоль решения (3), т.е. при x = x(a, p), y = x(b, p). Введём обозначениеX(t, p) ≡∂x(t, p)∂pдля (n × n)-матрицы производных решения (3) по начальному условию. Матрица X(t, p) определяется дифференциальным уравнением ввариацияхẊ = AX, X|t=t∗ = I, a t b,251где A = A(t, p) ≡ fx (t, x)|x=x(t,p) есть (n × n)-матрица, I — единичнаяматрица.
Основная задача Коши схемы продолжения по параметруимеет видIVP :dp= −[Φ (p)]−1 Φ(p0 ),dµp(0) = p0 ,0 µ 1,(5)гдеΦ(p) = R(x(a, p), x(b, p)),Φ (p) = Rx (x(a, p), x(b, p))X(a, p) + Ry (x(a, p), x(b, p))X(b, p).Для одновременного вычисления векторной функции x(t, p) и матричной функции X(t, p) может быть записана следующая векторноматричная задача Кошиẋ = f (t, x),x|t=t∗ = p,(6)Ẋ = fx (t, x)X, X|t=t∗ = I, a t b.Задачу Коши (5) будем называть внешней задачей, задачу Коши (6)— внутренней задачей. Таким образом, предлагается итерационныйпроцесс (10) для решения рассматриваемой краевой задачи (1) на основе внешней задачи (5) и внутренней задачи (6). На одном шагеитерационного процесса выполняется решение внешней задачи (5), входе решения которой происходит многократное обращение к решению внутренней задачи Коши (6) при различных значениях параметра p.
Описанная схема применялась при разработке программы BVPв среде Maple для численного решения краевой задачи (1). При формировании матриц fx , Rx , Ry привлекаются возможности среды повыполнению аналитических вычислений.Краевая задача принципа максимума Понтрягина может содержатьразрывные или негладкие функции, например, функции сигнатуры(sign), насыщения (sat), мёртвой зоны (dez), и т.д. Поэтому описанный подход для решения гладких краевых задач, как правило, не может быть использован непосредственно в краевых задачах принципамаксимума. Ещё одна веская причина для сглаживания заключаетсяв том, что в задачах с управлениями релейного типа (bang-bang)обращаемая матрица может оказаться вырожденной в некоторых областях, а при сглаживании можно добиться невырожденности соответствующих матриц, поэтому оправдана предварительная работа по252сглаживанию краевой задачи принципа максимума.
Некоторые методы сглаживания задач управления описаны в [7], [15]-[19], [21], [23],[31]. Эти процедуры сглаживания связаны с изменением размерностиуправления. Регуляризация задачи иногда достигается без измененияразмерности управления. Простые формулы сглаживания приводятсяниже.Функция сигнатуры sign(s) может быть приближена гладкимифункциямиs,SGN1(s, ν) = √ν + s2s,SGN2(s, ν) = thν s2.SGN3(s, ν) = arctgπνФункция насыщения и функция мёртвой зоныs,|s| 1,0,|s| < 1,sat(s) =dez(s) =sign(s), |s| > 1,sign(s), |s| > 1,соответственно, аппроксимируются следующими функциями*1 *ν + (s + 1)2 − ν + (s − 1)2 ,2 1s+1s−1*DEZ(s, ν) =+*.2ν + (s + 1)2ν + (s − 1)2SAT(s, ν) =Параметр сглаживания ν является некоторым малым положительнымчислом.
Соответствующие формулы сглаживания для экстремальныхуправлений при применении принципа максимума [1], могут быть получены в результате подходящего “малого” возмущения функционала.Рассмотрим несколько примеров.Пример 26.1 (краевая задача двух тел [26]):⎧x⎪x(0) = a1 , x(T ) = b1 ,⎨ ẍ = − (x2 + y 2 )3/2 ,y⎪⎩ ÿ = −,y(0) = a2 , y(T ) = b2 .2(x + y 2 )3/2253Эта краевая задача переписывается в виде:⎧x1 (0) = a1 , x1 (T ) = b1 ,⎪⎪ ẋ1 = x3 ,⎨x2 (0) = a2 , x2 (T ) = b2 ,ẋ2 = x4 ,22 −3/2=−x(x+x),ẋ⎪3112⎪⎩ẋ4 = −x2 (x21 + x22 )−3/2 .Для данныхT = 7,a1 = 2, a2 = 0,b1 = 1.0738644361, b2 = −1.0995343576,при выборе параметра t∗ = 0, для начальных приближенийp0 1 = [2, 0, −0.5, 0.5]иp0 2 = [2, 0, 0.5., −0.5],получены два разных решения со следующими векторами начальныхусловий в момент времени t∗ :ans1=[2.,0.,0.0000004834,0.5000000745]иans2=[2.,0.,0.4510782034,−0.2994186665].Соответствующие траектории 1 и 2 системы (с начальной точкой S иконечной точкой F ) в плоскости x1 x2 показаны на рисунке 26.1.
Здесьи в следующих примерах для решения задачи Коши использовалсяметод Рунге – Кутты – Фельберга (rkf-45). Выбранная точность: длярешения внешней задачи 10−4 , для решения внутренней задачи 10−6 .Число итераций 3.Пример 26.2 (предельные циклы в системе Эквейлера [30]):ẋ1 = x2 ,ẋ2 = −x1 + sin (x2 ).Эта система имеет счётное множество предельных циклов. Некоторые из них вычисляются вместе с неизвестными периодами T . Выборразличных начальных векторов p0 позволяет находить различные предельные циклы. Поиск предельного цикла сводится к краевой задаче:⎧x1 (0) = x4 (0), x1 (1) = x4 (1),ẋ1 = x3 x2 ,⎪⎪⎨x2 (1) = 0,ẋ2 = x3 (−x1 + sin (x2 )), x2 (0) = 0,⎪ ẋ3 = 0,⎪⎩ẋ4 = 0.2541x2x213S0−11F21021−10x110 x102−10Рисунок 26.2Рисунок 26.1Здесь введены две вспомогательные переменные: x3 = T – период, и x4 = x1 (0) – абсцисса точки пересечения предельного циклас осью x1 .
Выбирая точку t∗ = 0, для начальных векторовp0 1 = [2, 0, 2π, 2],p0 2 = [6.5, 0, 2π, 6.5],p0 3 = [9, 0, 2π, 9]получены следующие векторы начальных условий в момент времени t∗ :ans1=[ 3.9655467678, 0, 6.4661401325, 3.9655467678],ans2=[ 7.1078664573, 0, 6.3387892836, 7.1078664573],ans3=[10.2456910360, 0, 6.3101121791, 10.2456910360].Соответствующие предельные циклы 1, 2, 3 показаны на рисунке 26.2.Пример 26.3 (функционал типа “энергия” для трёхкратногоинтегратора) .Рассмотрим задачу управления⎧ẋ1 = x2 , x1 (0) = 1, x1 (T ) = 0,⎪⎪⎪ ẋ = x , x (0) = 0, x (T ) = 0,⎪322⎨ 2ẋ3 = u, x3 (0) = 0, x3 (T ) = 0,(7)⎪T⎪⎪⎪⎩ |u| 1, T = 3.275, L = 12 u(t)2 dt → min .u(·)0Для задачи управления в E n⎧⎨ ẋ = Ax + bu, x(0) = x0 , x(T ) = 0,⎩ |u| 1, T > 0 − задано, L(u) =25512T0u2 dt → min,u(·)с одномерным ограниченным управлением краевая задача принципамаксимума имеет видẋ = Ax + b · sat(b∗ ψ), x(0) = x0 , x(T ) = 0,ψ̇ = −A∗ ψ,а в частном случае (7), при сглаженной функции насыщения, — видсистемы уравнений**ẋ1 = x2 , ẋ2 = x3 , ẋ3 = 12ν + (x6 + 1)2 − ν + (x6 − 1)2 ,ẋ4 = 0, ẋ5 = −x4 , ẋ6 = −x5с граничными условиями из (7).
Эта краевая задача решена программой BVP (t∗ = T , ν = 10−10 ) c вектором начальных значений p вмомент t∗ :ans=[0, 0, 0, −2.9850435834, 4.8880088678, −2.9083874537].Зависимость оптимальных фазовых переменных и управления от tпоказана на рисунках 26.3, 26.4.1 x1x2x3x1 (t)1 uψ30x3 (t)−0.623t−10112x2 (t)3 t−2Рисунок 26.3u(t)ψ3 (t)Рисунок 26.4Пример 26.4 (Задача быстродействия с областью управленияв форме лунки [23]).Сглаживание негладкой области управления U , т.е. построение еёгладкой выпуклой аппроксимации Uµ , предполагает конструктивноеописание опорной функции сглаженного7 множества Uµ .
Рассмотрим7 Для множеств U , представимых в виде алгебраической суммы, выпуклой оболочкиобъединения множеств с известной гладкой выпуклой аппроксимацией, задача сглаживания решается конструктивно, см. [21]. Труднее работать с множествами U , заданными в форме пересечения нескольких множеств или в виде геометрической разности,см. [23], [31]. Пример сглаживания лунки дан ниже.256задачу быстродействия с областью управления U в форме лунки:⎧ẋ1 = x2 + u1 ,x1 (0) = a1 , x1 (T ) = 0,⎪⎪⎨ẋ2 = −βx1 − αx2 + u2 , x2 (0) = a2 , x2 (T ) = 0,⎪ u = (u1 , u2 ) ∈ U = S√2 ((+1, 0)) ∩ S√2 ((−1, 0)),⎪⎩α = 0.25, β = 1.5, a1 = 4, a2 = 1.Сглаженная лунка Uµ (µ > 0 — малый параметр) задаётся опорнойфункцией, см. [23],** 2(q12 + q22 ) − q12 q =q (ψ), q =ψ ,c(Uµ , ψ) =1122**1µψ2 + (ψ1 + ψ2 )2 + µψ2 + (ψ1 − ψ2 )2 .где q1 (ψ) = 2Краевая задача принципа максимума сглаженной задачи управления,в безразмерном времени, состоит из пяти скалярных дифференциальных уравнений:⎧ẋ1 = T (x2 + cψ1 (Uµ , ψ)),x1 (0) = a1 ,x1 (1) = 0,⎪⎪⎪ ẋ = T (−βx −⎪αx2 + cψ2 (Uµ , ψ)), x2 (0) = a2 ,x2 (1) = 0,⎨ 21ψ12 (1)+ ψ22 (1)= 1,ψ̇ = −T A∗ ψ, ⎪⎪⎪0 1ψ1⎪⎩ Ṫ = 0, 0 t 1,A=, ψ=.−β −αψ2Решение краевой задачи при малых µ даёт приближения к оптимальному процессу.
На рисунке 26.5 показаны графики управлений u1 (t),u2 (t), µ = 10−6 , на рисунке 26.6 — графики u1 (t) для трёх значенийµ = 1, 10−1 , 10−6 . Вычисления выполнены с помощью упомянутойвыше программы BVP.Пример 26.5 (задача быстродействия):ẍ + αẋ + βx = u,x ∈ E m , u ∈ U ⊂ E m , α, β ∈ E m×m ,x(0) = a0 , ẋ(0) = b0 , x(T ) = a1 , ẋ(T ) = b1 , T → min .При m = 2 область управления U — лунка, при m = 3 — тело, полученное вращением лунки вокруг её вертикальной оси. Краевая задачапринципа максимума содержит 4m + 1 уравнений. Область управления конструктивно сглаживается до телесного выпуклого компакта впространстве E 2m .257u1 (t)100.5t1u1 (t)u2 (t)0.4µ = 1 −1µ = 10µ = 10−600.4t0.8−0.4−1Рисунок 26.5Рисунок 26.6Сделаем несколько важных замечаний.
Если в краевой задаче (1)краевые условия содержат задание нескольких неизвестных функций x1 (a) = x10 , . . . , xk (a) = xk0 , 1 k n − 1, то, при выборе t∗ = a, порядок внешней задачи можно понизить до n − k, полагая p = (xk+1 (a), . . . , xn (a)), что является существенным при решениикраевых задач принципа максимума, в которых фазовая переменнаязадана в начальный момент времени, а в роли искомого вектора pвыступает неизвестное начальное значение сопряжённой переменной.Описанная схема применима и для многоточечных краевых задач.Другие примеры расчётов см. в [32].2588Приложение 2. Методические материалыСписок вопросов к экзамену по курсу1. Постановка задач математической теории оптимального управления и основные вопросы этой теории.
Задача быстродействия.2. Задача оптимального быстродействия для линейных управляемых систем. Множества достижимости и управляемости.3. Экспоненциал: определение и основные свойства. Представлениеэкспоненциала etA в виде конечной сумм4. Формула Коши и представление множеств достижимости и управляемости для линейных управляемых систем. Операции надмножествами в евклидовом пространстве (линейные преобразования суммы).5. Выпуклые множества.
Наименьшая выпуклая оболочка множества; её существование и представление.6. Опорные функции ограниченных множеств. Определение и основные свойства опорной функции.7. Непрерывность опорной функции.8. Совпадение опорных функций данного множества и его наименьшей выпуклой оболочки.9. Восстановление наименьшей выпуклой оболочки компакта поего опорной функции. Связь между опорными функциями данного компакта и его компактного подмножества.10. Условия непустоты пересечения компактов в терминах их опорных функций.11. Расстояние Хаусдорфа между множествами и его выражение втерминах опорных функций.12.