Курс лекци Русакова по методам оптимизации (1083216), страница 14
Текст из файла (страница 14)
ε (a) = ε (b) = 0130b ∂f ( x, y , y / ) d ∂f ( x, y, y / ) ∂J (α ) ⋅ ε ( x) ⋅ dx =0= ∫ − ⋅∂α∂ydx∂y /aЭто справедливо для любого ε(x) , дифференцируемого с краевымиусловиями:ε (a ) = ε (b) = 0Отсюда с помощью леммы следует:∂f ( x, y*, y * / ) d ∂f ( x, y*, y * / )− ⋅≡0∂ydx∂y /ВсякоеОпределение:- уравнение Эйлера-ЛагранжарешениеуравненияЭйлера-Лагранжаназываетсяэкстремалью.Таким образом, функция, доставляющаяэкстремум функционалунаходится среди экстремалей. Уравнение Эйлера-Лагранжа - необходимоеусловие экстремума.Одно из достаточных условий локального минимума - условиеЛежандра:/∂ 2 f ( x, y * ( x ), y * ( x ))>0∂y∂y /Обозначимfy =∂f,∂yfx =∂f∂xУравнение Эйлера-Лагранжа:fy −d⋅ f / = 0ydxРаскроем второй член выражения:d⋅f =dx y /∂f /∂f /∂f //y dxy dyy dy⋅+⋅+⋅∂x dx∂y dx∂y / dxфункции)Уравнение Эйлера-Лагранжа:131( формула дифф-я сложнойf y − f / − f / ⋅ y / − f / ⋅ y // =0y xy yy y'(*)( если все производные существуют)Отсюда следует, что в общем случае уравнение Эйлера-Лагранжаявляется нелинейным дифференциальным уравнением второго порядка.Поэтому его решение затруднено.Частные случаи уравнения Эйлера-Лагранжа.1)f (x, y) не зависит от производной y / .Тогда∂f ( x, y )∂f≡0=0 ⇒/∂y∂y( уравнение Эйлера-Лагранжа)2) f (x, y / ) не зависит от y:∂f∂fd ∂f= 0 ⇒ ⋅ / ≡ 0 ⇒ / = const∂y∂ydx ∂y3) f (y, y / ) не зависит от x:f y −− f / ⋅ y / − f / ⋅ y // ≡ 0 \ умножим данное выражение на y / \y yy y'(*) ⇒d/⋅ ( f y − f / ⋅ y / ) ≡ 0 ⇒ f y − f / ⋅ y = constyydxПример:Задача о брахистохроне.Как выбрать профиль горки, чтобы можно было скатиться с неё заминимальное время (трение отсутствует, под действием силы тяжести)?132y (x)y0x k ( конеч.)0xПерерисуем для удобства рассмотрения :yvg↑(свободпаден.)ϕxkxЗдесь V –скорость, ϕ - угол наклона горки, g ускорение свободногопадения.Справедливы следующие соотношения:dx = V cos ϕ dttg ϕ = y / (x) ⇒ cos ϕ =(*)1(1 + y / ( x)v-?)2(1)(найдем формулу скорости)Закон сохранения энергии для решения заданной задачи имеет вид:m ⋅ v2= m⋅g⋅y,2отсюда V = 2 ⋅ g ⋅ y133(2)Подставим (1) и (2) в (*), получим:dx2⋅ g ⋅ y⋅ 1 + y / 2 = dtПроинтегрируем обе части:xk∫01+ y/2dx = T → min2⋅ g ⋅ y14243(Т – время спуска шарика.)FИтак, требуется найти функцию y=y(x), минимизирующую указанныйвыше интеграл.Отметим, что F зависит от y и y / , т.е.
это третий частный случайуравнения Эйлера - Лагранжа ⇒F – y / ⋅ F / ≡ const - уравнение Эйлера-Лагранжа для F(y,Y’).yВынесем 2⋅g из рассмотрения, т.к. на экстремум оно не влияет1+ y/212− y/ ⋅ ⋅y2⋅ y/1+ y/2⋅1y≡ constПриведем к общему знаменателю:1y ⋅ (1 + y / 2 )≡ constВыберем c =1const 2⇒ const =1cтогда : y ⋅ (1 + y / 2 ) ≡ c(**)Это уравнение надо решить.
Делаем подстановку:y / = tg t⇒⇒ 1+ y/2 =1cos 2 t\ t- вспомогательная переменная \Из (**) следует:y = c ⋅ cos 2 tdy = tg t ⋅ dx(⊗) 2 ⇒ dx = 2 ⋅ c ⋅ (− cos t ) ⋅ dtdy = c ⋅ 2 ⋅ cos t ⋅ ( − sin t ) ⋅ dt 134(⊗ т.к. y / = tg t )Интегрируем:cx = −2 ⋅ c ⋅ ∫ cos 2 t ⋅ dt = − 2 ⋅ c ⋅ ∫ 1−cos 2t ⋅ dt = − c ⋅ t − ⋅ sin 2t22y через x выразить трудно.Константы берутся из начальных условий.Полученная кривая называется циклоидой.График:yциклоидаy0брахистохронаxk0xБрахистохрона (решение) является локальным минимумом.Доказано, что это глобальный минимум ( y // >0).5.03 Вариационные задачи на условный экстремум.Будем считать, что y - не одна функция, а набор из m функций , т.е.y = ( y1 , ...,y m ) .
Если они независимы, то уравнение Эйлера-Лагранжа надоTписать для каждого y i отдельно:∂F d ∂F− ⋅≡ 0 , i = 1, m ,∂y i dx ∂y i /Если между y i есть связь, то получаем задачу на условный экстремум.135Модельные задачи на условный экстремум.1).
Пусть в пространстве есть поверхность, а на ней две точки.Определение: Линия, которая проходит по поверхности, соединяя эти дветочки, иимеющая минимальную длину, называется геодезической.найти геодезическую, соединяющую две точки, может бытьЗадачасформулирована, как задача вариационного исчисления.Предположим, что поверхность задана уравнением ϕ( y1 , y 2 ,x) = 0(*)ϕ -дифференцируемая функция ;x - независимая координата;y1, y2 - функции от x;тогда длина пути , соединяющего две точки , равна:xk∫x1 + y1/ 2 + y 2/ 2 dx0Надо найти минимум функционала при условии (*)Т.о. получаем задачу на условный экстремум. Начальные условия : y1 ( x0 )- первая тточк y 2 ( x0 ) начало и конец геодезической. y1 ( xk )- вторая тточк y(x) 2 k2) Изопериметрическая задачаТребуется найти линию заданной длины , ограничивающую maxплощадь .Задача может быть поставлена так :tK∫22y / (t ) + x / (t ) dt = lt0(**)136l - длина линии.tK∫ y (t ) ⋅ x (t )dt → max/S=t0Связи типа (*) называются локальными.Связи типа (**) называются интегральными.Задачи на условный экстремум типа (*) и (**) решаются методоммножителей Лагранжа.Обозначим ограничения следующим образом:локальные : ϕ i ( x, y, y / ) = 0, i =1, k- сильные связиинтегральные : ∫ψ j ( x, y, y / )dx = l , j = 1, p - слабые связиСоставлим функционал F * :F* = F +kpi =1j =1∑ λi ( x ) ⋅ ϕ i ( x , y , y / ) + ∑ λ k + i ( x ) ⋅ ψ j ( x , y , y / )Увеличилось количество неизвестных функций за счет λi .Оказывается , что экстремальная траектория такова, что на нейсправедливо уравнение Эйлера-Лагранжа для нового функционала F * относительно переменных y и λ, то есть задача сводится к задаче на безусловныйэкстремум функционала F * .
Введение каждого множителя Лагранжа λi (x)сопровождается появлением соответствующего нового уравнения ЭйлераЛагранжа относительно λi .Пример:Часто локальные связи задаются дифференциальными уравнениями.• y1 = y2- уравнения связи, (u - управление)• y 2 = utKJ = ∫ u 2 (t )dt → mint0137На плоскости y1 y 2 имеются начальная и конечная точки. Надо выбратьu так , чтобы перевести систему из начальной точки в конечную, ифункционал достигал экстремального значения.*т.е. окончательный результат задачи - фазовая траектория.Решаем методом множителей Лагранжа.••F * = u 2 + λ1 (t ) ⋅ ( y 1 − y 2 ) + λ2 (t ) ⋅ ( y 2 − u )Выписываем уравнение Эйлера-Лагранжа относительно параметров :y1 , y 2 , λ1 , λ2 ,u.∂Fd ∂F−=0∂ydt ∂y /∂F *= 0,∂y1∂F ∗•= λ1 (t) ⇒∂ y1dλ1 (t) = 0 − уравнение Эйлера-Лагранжаdt∂F *∂F ∗= − λ1 (t) ; • = λ2 (t) ⇒∂y 2∂ y2dλ2 (t) = − λ1 (t)dt∂F *∂F *= 2⋅u − λ2 (t);= 0 ⇒ 2⋅u − λ2 (t) = 0∂u∂uu=λ2 (t )2∂F *∂F *идадут уравнения связи.∂λ1∂λ2Тогда получим :λ1 (t) = c1λ2 (t) = c 2 − c1 ⋅ t138u(t) =λ2 (t )cc ⋅t= 2− 1222Т.о.
, экстремальная траектория такова, что управление u - линейнаяфункция. c1 и c 2 определяются из граничных условий на концах промежутка[t 0 , t k ] .Т.о., мы сможем получить решение задачи, проинтегрировав исходнуюсистему уравнений связи.* мы получим новую фазовую траекторию.Метод вариационного исчисления ориентирован на уменьшениеперебора возможных значений. Так в нашем примере класс функций u(t)сужен и доведен до линейного.Глава 6 Принцип максимума Понтрягина( на примере задачи оптимального управления ).6.01 Задача оптимального управленияПустьнекотораяфизическаясистемаописанасистемойдифференциальных уравнений: dx1 dt = f1 ( x1 ,..., xn , u1 ,..., ur ) ......................................... dxn = f ( x ,..., x , u ,..., u )n1n 1r dt,где t - независимая переменная , в роли которой обычно выступаетвремя.x1 = x1 (t ) , ...
, x n = x n (t ) - переменная состояния или фазовые координаты.u1 = u1 (t ) , ... , u r = r (t ) - переменные управления.139Если ввести векторные обозначения:X = (x1 ,..., x n )TU = (u1 ,..., u r )TF = ( f1 ,..., f n )T , то рассматриваемая система записывается в виде :dX=FdtТребуетсянельзя(X,U)вклассекусочно-непрерывных(поэтомуиспользовать вариационное исчисление) управлений, которые считаютсядопустимыми, найти U(t) такое, чтобы при переходе из начальной точки X(0)= X н = (x1н ,..., x nн )T в заданную точку X(T) = X к = (x1к ,..., x nк )T функционал I =T∫f0( X , U )dt достигал экстремума,0где f 0 - заданная гладкая функция.Введем переменную x0 (t ) , определив ее в виде интеграла с переменнымtверхним пределом: x0 (t ) = ∫ f 0 ( X , U )dt0Тогдаdx 0 (t )= f 0 (X,U)dtПрисоединив это уравнение к исходной схеме, получим:dx i= f i ( x1 ,..., x n , u1 ,..., u r ) , i = 0, ndtВажно отметить, чтоправые части уравнений новой системы независят от координаты x0 .
Если ввести расширенные n+1-мерные векторы:X = (x0 , x1 ,..., x n )TF = ( f 0 , f1 ,..., f n )T , то системаdX= F (X,U)dtФункционалпредставляетI= x0 (T)собойконечноезначениекоординаты x0 и сформулированная выше задача сводится к задаче о140достижении экстремума конечного значения координаты x0 ( будем иметь ввиду минимизацию функционала ).Метод принципа максимума Понтрягина является расширениемклассического вариационного исчисления на случай , когда управляющиевоздействия ограничены иописаны кусочно-непрерывными функциями.Принцип максимума является необходимым условием оптимальности,для линейных систем - необходимым и достаточным.Сущность принципа максимума состоит в следующем:Наряду с системойdx i= f i ( X ,U ) , i = 0, ndt(*),описывающей движение управляющего объекта, будем рассматриватьсистему:n∂f ( X ,U )dψ i= - ∑ψ α (t ) α, i = 0, ndt∂x iα =0(**),составленную относительно некоторых вспомогательных переменныхψ i (t ) .
Она называется сопряженной к (*).Введем функцию Гамильтона:nH= ∑ψ α (t ) f α ( X ,U )α =0Вычислим частные производные:n∂f ( X ,U ) ∂H∂H= ∑ψ α (t ) α,= f i ( X ,U ) .dxi α = 0∂x idψ iТеперь с помощью функции Гамильтона системы (*) и (**) могут бытьзаписаны так:∂H dx i dt = ∂ψ , i = 0, ni dψ∂Hi=−dt∂x iСистема (***) называется гамильтоновой системой.141(***)Необходимыеусловияоптимальностиуправления(принципмаксимума) формулируется так :Если управление U(t) и соответствующая ему траектория X(t)оптимальны ,то:1.
Существует ненулевая непрерывная (n+1)-мерная вектор-функцияψ (t) = (ψ 0 (t ),ψ 1 (t ),...,ψ n (t ) )T , составляющие которой удовлетворяютгамильтоновой системе.2. Функция ГамильтонаH = (ψ (t), F (X,U)) представляющая собой произведение вектораскорости, изображающей точки F (X,U) на вектор ψ (t) , достигающее прикаждом значении 0 < t < T максимума по U.3.