В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем (1158263), страница 20

Файл №1158263 В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем (В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем) 20 страницаВ.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем (1158263) страница 202019-09-182019-09-18СтудИзба

В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 20)

в расширенном пространстве она параллельна (γ1 , γ2 , . . . , γn , 0) = (γ , 0).136Рассмотрим условие ортогональности ∂ϕ0 γ + ψn+1 · 0 = 0ψ(tk ) + λ0∂y 0 Поскольку γ произвольное, то ψ(tk ) = −λ0 ∂ϕ. Если λ0 = 0, то∂yψ(tk ) = 0. Из условия H̃(tk ) = 0 следует ψn+1 (tk ) = 0, откуда (всилу однородности сопряженной системы) ψ̃ ≡ 0, что противоречитпринципу максимума.Следовательно, λ0 > 0 и можно нормировать λ0 = 1. Тогда изусловия 1 теоремы ПМП следует (18.7) как необходимое условие слабого локального минимума.137Лекция 19Лагранжева форма необходимых условийоптимальности1. Задача Больца в вариационном исчисленииПусть кривая y(t), t ∈ [t0 , tk ], y(t0 ) = y ∗ минимизирует функционалtktkJ = f0 (y, ẏ)dt + l(y(tk )) = L(y, ẏ)dt + l(y(tk )),t0t0где лагранжиан L(y, ẏ) и терминант l(y(tk )) — гладкие функции.Представим исходную задачу как задачу оптимального управления с фиксированным временем и применим принцип максимума изпредыдущей лекции.+y0 (t0 ) = 0ẏ0 = f0 (y, u)y(t0 ) = y ∗ .

В расширенном пространстве состояний ỹ = yy0 функционал можнопредставить как терминальный J = ϕ0 (ỹ(tk )) = y0 (tk ) + l(y(tk )).Ограничения на область значений управления отсутствуют, т.е.Ω = Rn .Рассмотрим функцию Понтрягина H̃ = ψ̃ f˜ = ψ0 f0 + ψ u. Учитывая, что∂ f˜0 ∂f0 /∂y=,00∂ ỹвыпишем сопряженную систему⎧⎨ ψ̇0 = 0(19.1)⎩ ψ̇ = − ∂f0 ψ0 .∂y∂ϕ0=Поскольку из условия трансверсальности следует ψ̃ (tk ) = −∂ ỹ ∂l ∂l(y(tk ))= − 1,., то получим ψ0 = −1, а ψ (tk ) = −∂y∂yТогда H̃ = −f0 (y, u) + ψ u.ẏ = u138Согласно условию оптимальности (18.7) на оптимальном решениивыполнено равенство∂ H̃(ψ(t), y 0 (t), u0 (t))= 0.∂uСледовательно∂ H̃∂f0=−+ ψ = 0,∂u∂u ∂f 0откуда ψ =.

Подставим полученное выражение для ψ в∂u(19.1), заменим f0 = L и транспонируем. В результате получим уравнение ЭйлераdLẏ = Ly .(19.2)dtИз условий трансверсальности получим краевое условие для уравнения Эйлера∂l(y 0(tk )(19.3)Lẏ (tk ) = −∂yИз условия станционарности гамильтониана на оптимальном решении H̃ = const следует интеграл энергии: функция E(t) = Lẏ ẏ −L ≡ const — постоянна на оптимальном решении системы. Действительно, поскольку f0 = L, а u = ẏ, получим на оптимальной траекторииH̃ = ψ u − f0 (y, u) = Lẏ ẏ − L = E(t) ≡ const .2. Лагранжева форма условий оптимальностиЛагранжеву форму принципа максимума Понтрягина получим напримере задачи управления при фиксированных начальных и конечных условиях: t0 , tk , y(t0 ), y(tk ).ẏ = f (y, u)u(·) ∈ U = {u(·) ∈ KC[t0 , tk ] u(t) ∈ Ω ⊂ Rs }(19.4)(19.5)tkf0 (y(t), u(t)) dt → minJ(u) =u(·)∈U(19.6)t0В соответствии с принципом Лагранжа [?] составим функционалttЛагранжа L(y, u, ψ, λ0 ) = λ0 t0k f0 dt + t0k ψ (ẏ − f )dt, где λ0 ≥0, ψ(t) — множители Лагранжа, поскольку математическая модель139(19.4) можно рассматривать как ограничение типа равенства ẏ −f (y, u) = 0.Пусть {y 0 (t), u0 (t)} — оптимальный процесс на [t0 , tk ].Рассмотрим Лагранжиан L = λ0 f0 +ψ (ẏ −f (y, u)).

Ему соответствует расширенная функция Понтрягина H̃ = ψ f −λ0 f0 = ψ ẏ−L.Для функционала L при фиксированном u0 (t) выпишем условиестационарности по траектории y(·):tkλ0∂f (y 0 (t), u0 (t))∂f0 (y 0 (t), u0 (t))x(t)+ψ (t) ẋ(t)−x(t) dt = 0.∂y∂yt0(19.7)Здесь x(t) = y(t) − y 0 (t) — вариация траектории y 0 (t).Произведем замену линейного оператора (ẋ(t) − A(t)x(t)), где00(t))на сопряженный ему оператор − ψ̇(t)−A (t)ψ(t) .A = ∂f (y (t),u∂yВ соответствии с определением сопряженного оператора (g, P x) =(P ∗ g, x) (здесь скалярное произведение (,) означает линейный функционал, а P ∗ — сопряженный оператор) покажем, что выполнено равенствоtkψ (t) ẋ(t) − Ax(t) dt =t0tk− ψ̇(t) − A (t)ψ(t) x(t)dt.t0Действительно,tk ψ ẋ − ψ Ax + ψ̇ x + ψ Ax dt =t0tk=−d(ψ x) = ψ (tk )x(tk ) − ψ (t0 )x(t0 ) = 0.t0Тогда условие стационарности (19.7) перепишем в видеtk ∂f0 (y 0 (t), u0 (t)) − ψ̇(t) + A ψ(t)λ0x(t) dt = 0.∂y(19.8)t0Оно выполнено при любых x(·) ∈ C[t0 , tk ] с конечными условиямиx(t0 ) = x(tk ) = 0.

Учитывая, что ψ(t) = Lẏ , из (19.8) получим в140лагранжевой форме ∂f (y 0 (t), u0 (t)) ∂f (y 0 (t), u0 (t)) d 0Lẏ = Ly ⇔ ψ̇ = −ψ+λ0,dt∂y∂y(19.9)что соответствует гамильтоновой формеψ̇ = −∂ H̃(y 0 (t), u0 (t), ψ(t))∂y(19.10)Поэтому в литературе по оптимальному управлению динамическимисистемами употребляются два названия для системы (19.9), (19.10):– сопряженная система дифференциальных уравнений, что соответствует сопряженному оператору;– уравнения Эйлера, что является расширением известных в теоретической механике уравнений Лагранжа второго рода для голономных консервативных систем.Перейдем теперь к формулировке принципа максимума в лагранжевой форме для задачи оптимального управления, сформулированной в 16-ой лекции, т.е. оптимального прихода на гладкое многообра= m} в смыслезие M = {ϕi (y(tk )) = 0, i = 1, .

. . , m rank ∂ϕ∂yi (y)jтерминального функционала (Маера) J = ϕ0 (y(tk )).Здесь лагранжиан.mзадачи имеет вид L = ψ (ẏ − f (y, u)), терминант — l(y(tk )) = i=0 λi ϕi , а функция Лагранжа —tkL(λ0 , . . . , λm , tk , ψ, y, u) =Ldt + l(y(tk )).t0Без доказательства сформулируем необходимые условия оптимальности в форме Лагранжа (доказательство можно найти в [?] ).Теорема 23.

Если {y 0 (·), u0 (·), [t0 , t0k ]} — оптимальный процесс, то существуют множители Лагранжа λ0 , λ1 , . . . , λm иψ1 , . . . , ψn не все равные нулю такие, что выполняются условия:а) стационарности по y(·):d∂f (y 0 , u0 )− Lẏ + Ly = 0, ⇔ ψ̇ = −ψ;dt∂yб)Lẏ (t0k ) = −ly (t0k ) ⇒ ψ (t0k )+λ0m∂ϕ0 (y(t0k ))∂ϕi (y(t0k ))=−λi∂y∂yi=1— условия трансверсальности;141в) стационарности по tk :Ltk = 0 ⇒ ly ẏ 0 (t0k ) = 0 ⇒ ψ (t0k )f (y 0 (t0k ), u0 (t0k )) = H(t0k ) = 0.Поскольку лагранжиан L не зависит явно от времени, существует интеграл для решений уравнения Эйлера, т.е. на оптимальной траектории выполнено условие E(t) = Lẏ ẏ − L = const.Поскольку на оптимальном решении L(t) ≡ 0, потому E(t) =Lẏ ẏ = ψ f = H(t) ≡ const .

Следовательно H(t) ≡ 0;г) минимума по u лагранжиана L = ψ ẏ − H:min L(ẏ 0 (t), y 0 (t), u) = L(ẏ 0 (t), y 0 (t), u0 (t)) ⇔u∈Ω⇔ max H(ψ(t), y 0 (t), u) = H(ψ(t), y 0 (t), u0 (t));u∈Ωд) неотрицательности множителя: λ0 ≥ 0.3. О связи вариационных принципов механики спринципом максимумаПусть дана система материальных точек с массами mi и коордиiiнатами ri = (y1i , y.2 , y3 ), i = 1, . .

. , n. Кинетическая энергия систеn1мы равна T = 2 i=1 mi ṙi2 , а потенциальная — задана функциейU (r1 , . . . , rn ). Из принципа Гамильтона–Остроградского следует, чтодвижение системы происходит по экстремалям функционала действияпо ГамильтонуtkS = L(r, ṙ)dt,(19.11)t0где лагранжиан имеет вид L(r, ṙ) = T − U , а моменты времени t0 , tk , атакже начальные и конечные условия фиксированы.Следовательно, выполнено уравнение Эйлера (19.2) для функционала действия (19.11):dLṙ = Lr ,dtкоторое представляет собой уравнения Лагранжа второго рода длясистемы материальных точек.Таким образом здесь уравнения движения получены из принципамаксимума как необходимого условия слабого локального минимумадля функционала действия по Гамильтону.Получим теперь уравнения Гамильтона.

Обозначим ψi = Lṙi =mi ṙi — импульсы материальных точек системы.142.Функция Понтрягина H =ψi ṙi − T + U = T + U представляет полную энергию системы и связана преобразованием Лежандра сфункцией L.Уравнения Эйлера в канонической (гамильтоновой) форме принимают вид∂Hψi∂H∂U=,ψ̇i = −=−.ṙi =∂ψimi∂ri∂riПервая группа уравнений представляет определение импульса, а вторая — второй закон Ньютона для системы материальных точек.Таким образом в случае потенциальных сил, уравнения Лагранжавторого рода (их гамильтонову форму) можно получить из принципамаксимума Понтрягина.143Лекция 20Оптимальная стабилизация принеограниченных ресурсах1. Управление линейной системой с квадратичнымфункционалом качества на конечном интервалевремениРассмотрим уравнения в отклонениях от программного движенияẋ = Ax + BΔu,x(t0 ) = 0,u = up + Δu∂f где x = y − y p , A = ∂f∂y y=y p , B = ∂u u=up .

В дальнейшем для простоты будем считать up = 0.Функционал качества имеет видtkJ(u) = (x Gx + u N u)dt → minu(·)t0Здесь G = G > 0, N = N > 0 — симметричные матрицы, т.е.поставлена задача минимизации отклонений и ресурсов управления наотрезке времени t ∈ [t0 , tk ], t0 < tk ≤ ∞.Обозначим оптимальное решение задачи u0 (·) ∈ KC 1 [t0 , tk ].Перепишем задачу в в виде+ẋ0 = x Gx + u N u,x0 (t0 ) = 0,x(t0 ) = x∗ . Введем расширенный вектор состояния x̃ = xx0 и запишем функционал в виде J = ϕ0 (x̃(tk )) = x0 (tk ).Рассмотрим функцию Понтрягина H̃ = ψ0 (x Gx + u N u) +ψ (Ax + Bu) и сопряженную систему+ψ̇0 = 0ẋ = Ax + Bu,ψ̇ = −A ψ − 2(Gx)ψ0 .Краевые условия (трансверсальности) для сопряженной системы ∂ϕ0 (x̃(tk )) ∂ϕ0 (x̃)имеют вид ψ̃(tk ) = −λ0= (1, 0, .

. . , 0).. Но∂ x̃∂ x̃14411, тогда ψ0 ≡ − , а ψ(tk ) = 0. Следовательно,22сопряженную систему можно записать как ψ̇ = −A ψ + Gx.Необходимое условие оптимальности имеет видНормируем λ0 =∂ H̃=0∂u∀t ∈ [t0 , tk ].Из условия оптимальности следует −u N + ψ B = 0. Так как N > 0,тоu0 = N −1 B ψ.Будем искать решение сопряженной системы в виде ψ(t) =−L(t)x, где симметричная матрица L ∈ Mn×n (R) > 0. Тогда u0 =−N −1 B Lx иψ̇ = −L̇x − Lẋ = −L̇x − L(Ax + Bu) = −L̇x − L(Ax − BN −1 B Lx).С другой стороны, согласно сопряженной системе ψ̇ = A Lx + Gx,поэтому(A L + G)x = (−L̇ − LA + LBN −1 B L)x.Поскольку x — произвольное решение системы, получим матричное уравнение — уравнение Риккати для управляемой системыL̇ + LA + A L + G − LBN −1 B L = 0,L(tk ) = 0.Заметим, что краевое условие этого уравнения задано на правом концеt = tk .2.

Характеристики

Тип файла

PDF-файл

Размер

1,18 Mb

Материал

В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем

Тип материала

Лекции

Предмет

Механика управляемых систем

Высшее учебное заведение

МГУ им. Ломоносова

Список файлов лекций

v.v.-aleksandrov-s.s.-lemak-n.a.-parusnikov-lekcii-po-mehanike-upravljaemyh-sistem.rar

В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем.pdf

Прочти меня!!!.txt

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.