В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем, страница 26
Описание файла
PDF-файл из архива "В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем", который расположен в категории "". Всё это находится в предмете "механика управляемых систем" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 26 страницы из PDF
26.1. Особая поверхностьСоотношение (26.8) в исходных переменных можно переписать в видеuoc =1 2mgv(v + 2γ) kv + mg − 2=γv + 4γv + 2γ 2kv 2 (v + 2γ)(3v + 2γ)=≥0γ(v 2 + 4γv + 2γ 2 )(26.9)На рис.26.1 изображена проекция особой поверхности на плоскость (v, m).В зависимости от начальных условий оптимальная траектория либо дойдет до особой поверхности, либо нет.Если двигаемся по особому участку, то u0 = uoc .¼При этом нужно проверить: а) сохранились ли ограничения на управление;б) как склеивается ре0гулярное и особое управление.Выше особой поверх- Рис. 26.2.
Оптимальное управление ракетойности H1 > 0, а ниже —H1 < 0.На рис.26.1 изображена кривая A, заданная уравнением kv 2 +mg = γμ, на которой dv/dt = 0 при максимальной тяге двигателя189u = μ. Эту кривую траектории системы пересекают с вертикальнойкасательной. При движении по особой траектории dv/dt < 0. Длявсех точек особого участка в области ниже кривой A (в этой областифизически реализуется старт с нулевой скоростью) выполнено неравенство kv 2 + mg < γμ.Тогда из формулы (26.9) следует1mgv(v + 2γ) 1≤ (kv 2 + mg) < μ,uoc = kv 2 + mg − 2γv + 4γv + 2γ 2γт.е. особое управление является допустимым.Зависимость оптимального управления u0 от времени показана нарис.26.2.190Лекция 27Численные методы решенияэкстремальных задачРассмотрим управляемую системуẏ =f (y, u),y(t0 ) = y ∗ ,u(·) ∈ U = {u(·) ∈ KC[t0 , tk ] u(t) ∈ Ω ⊂ Rs },t ∈[t0 , tk ],(27.1)y(tk ) ∈ M ⊂ Rn .Функционал качества задачи управления терминальныйJ(u) = ϕ0 (y(tk )) → minu(·)∈UУказанная задача охватывает многие важные для приложений случаиэкстремальных задач.Единого универсального метода решения задачи до сих пор не разработано, что объясняется трудностью решения задач оптимальногоуправления.1.
Классификация методов численного решениязадач оптимального управленияУсловно численные методы решения задачи можно разбить на четыре группы:1) Сведение к задаче оптимизации функции конечного числа переменных при наличии ограничений.Исходная задача есть задача минимизации в функциональномпространстве, но если на отрезке [t0 , tk ] ввести сетку τi = t0 + i ∗ (ti −tk )/N , где N — большое число, а дифференциальные уравнения заменить разностными, то задачу приближенно можно свести к конечномерной. Построить решение такой конечномерной задачи очень трудно. Во-первых, число переменных будет очень большим, во-вторых,возможно появление многих дополнительных экстремумов функционала (функции многих переменных).2) Методы вариации в пространстве состояний (фазовых переменных).
При таком подходе как правило используется принцип оптимальности Беллмана. К недостаткам подхода относится то, что он191требует запоминания всего поля экстремалей и отсюда трудность, названная самим Беллманом «проклятием размерности».3) Прямые методы — вариации в пространстве управлений.К ним относятся метод Крылова-Черноусько, метод линеаризацииР.П.Федоренко и др.4) Используя необходимые условия экстремума функционала,сведение задачи оптимального управления с помощью ПМП к краевой задаче и дальнейшее решение двухточечной краевой задачи. Проблемы численной реализации методов этой группы мы и рассмотрим.2.
Сведение к двухточечной краевой задачеРассмотрим для простоты задачу с фиксированным временем исвободным правым концом траектории.Исходя из ПМП оптимальное управление находится из решениякраевой задачи относительно переменных ψ(t), y(t):+y(t0 ) = y ∗ẏ 0 = f (y 0 , u0 )(27.2)∂ϕ0ψ̇(t) = −Hy (y 0 , u0 )ψ(t) ψ(tk ) = −∂y000(27.3)H(ψ(t), y (t), u (t)) = max H(ψ(t), y (t), u(t))u(t)∈ΩЭто нелинейная краевая задача размерности 2n для системы ОДУ(27.2). Здесь n краевых условий (для y) задано на левом конце, а nусловий (для ψ) — на правом.Схема метода стрельбы такова: зададим произвольное значениеψ(t0 ) = z и подходящим численным методом интегрируем систему(27.2), при этом для каждого момента времени t находми максимум поu в выражении (27.3).
Получим значения y(tk , z) и ψ(tk , z). Вычислимневязку∂ϕ0X(z) = ψ(tk , z) +(tk , z).(27.4)∂yРешение краевой задачи сводится к решению нелинейного векторногоалгебраического уравнения (27.4).2.1. Решение системы нелинейных уравнений. Для решениязадачи рассмотрим процедуру Ньютона. Представим функцию X(z)в виде разложения∂XX(z + Δz) = X(z) +Δz + o(Δz 2 ).∂z192Зададим некоторое начальное приближение и вычислим последующиеприближения по формулам−1∂Xzi+1 = zi − αiX(zi ).∂ziЗдесь матрица F = ∂X∂z — матрица Якоби, αi — специальным образом подобранные коэффициенты.Применение метода Ньютона предполагает достаточную малостьотклонения (zi+1 − zi ), поскольку фактически требуется решить линейную систему уравнений (αi = 1)X(zi ) + F (zi )(z − zi ) = 0,(27.5)отбросив члены малости o(zi+1 −zi 2 ).
Если начальное приближениедостаточно далеко от искомого решения X(z ∗ ) = 0, то квадратичныечлены отбрасывать нельзя.Улучшить сходимость можно, двигаясь по направлениюz(α) = zi − αF −1 (zi )X(zi )до тех пор, пока невязка X(α) убывает, например решая задачу одномерной минимизацииmin X(zi − αF −1 (zi )X(zi ))α≥0(27.6)и полагая αi = α∗ , где α∗ — решение (27.6). Такой подход называетсямодифицированным методом Ньютона.Теорема 33. Пусть в ограниченной области X(z) ≤ C1 функция X(z) имеет равномерно ограниченные первые и вторыепроизводные, а отображение x = X(z) взаимно однозначно, причем F −1 (z) ≤ C2 и имеется единственный кореньX(z ∗ ) = 0. Тогда модифицированный метод Ньютона сходится, если начальная точка принадлежит указанной области, т.е.X(z 0 ) ≤ C1 .На практике вместо задач одномерной минимизации (27.6) пользуются схемой α0 = 1, αj = 12 αj−1 до тех пор, пока не выполнитсянеравенство X(zi − αj F −1 (zi )X(zi )) < X(zi ) и затем полагаютαi = αj .Как видно, составными частями метода Ньютона являются: а)определение матрицы Якоби; б) решение линейной системы (27.5).Поскольку размерность этой системы, как правило, невысока, то поиск решения обычно трудностей не вызывает (исключая случаи, когда193матрица Якоби плохо обусловлена).
Для ее решения можно использовать метод исключения Гаусса с выбором главного элемента.В нашей задаче вычисление функции невязок и построение матрицы Якоби производится численно, когда частные производные приближаются конечными разностями, например:Fij ≈Xi (z + Δj ) − Xi (z)|Δj |где Δj = (0, . . . , 0, Δ, 0, . . .
, 0).3 45 63 45 60,j−1j+1,nИспользование этих формул требует решения (n + 1) задач Кошидля системы (27.2).Если функция невязок, вычисляемая для текущего приближения,оказывается неопределенной (нельзя провести интегрирование и вычислить невязку), то шаг смещения в итерационной процедуре делитсяпополам; если неопределенность возникла при вычислении матрицыЯкоби, то можно использовать формулы численного дифференцирования «назад», либо «центральные разности».
Если это не помогает,то уменьшается в два раза значение шага Δ.Все-таки основная трудность использования метода Ньютона —выбор хорошего начального приближения. Для этого можно использовать процедуру «случайного» поиска, когда начальное положениеразыгрывается с помощью датчика случайных чисел. Однако все этоне дает гарантии получить численное решение. Как правило, попыткиуспешны, если удается выявить структуру оптимального управления ииспользовать ее при формировании задачи пристрелки.В настоящее время используется несколько схем метода пристрелки:а) получение начального приближения из решения вспомогательной задачи более низкого порядка, либо более простой, решение которой известно;б) использование метода многоточечной пристрелки.
Вектор параметров z дополняется значениями фазовых и сопряженных переменных в промежуточных точках. При этом функция невязки X дополняется условиями непрерывности фазовых и сопряженных переменныхв этих точках. Решается серия задач Коши на наборе отрезков, на которые выбранные промежуточные точки делят весь интервал;в) использование метода встречной пристрелки. Выбирается промежуточная точка и решаются задачи Коши слева и справа.194½£¼·½Рис.
27.1. Метод хордКак было сказано выше, с применением метода стрельбы, двухточечная краевая задача сводится к задаче Коши для системы обыкновенных дифференциальных уравнений.Разработано большое число методов численного решения задачиКоши. На практике (когда нет сведений о характере поведения правой части) широкое распространение получили одношаговые методыРунге-Кутта 4-го порядка точности:1yn+1 = yn + h[k0 + 2k1 + 2k2 + k3 ],6k0 =f (yn , tn ),hhk1 =f (yn + k0 , tn + ),22hhk2 =f (yn + k1 , tn + ),22k3 =f (yn + hk2 , tn + h),где h = tn − tn−1 .Существуют особенности применения численных методов при решении двухточечной задачи: в точке разрыва управления правые частимогут терять гладкость, поэтому методы высокого порядка аппроксимации теряют свою точность.Само оптимальное решение может оказаться чрезвычайно чувствительным относительно определения момента переключенияуправления.Следовательно, надо отслеживать точки разрыва.