Диссертация (1025283), страница 4
Текст из файла (страница 4)
Таким образом, при выборе оптимального закона управленияследует учитывать данные требования;На пути электробуса могут встречаться подъемы, спуски и повороты,увеличивающие сопротивление движению. В связи с этим выбор оптимальногозакона управления необходимо проводить с учетом этих факторов;Загруженность электробуса может меняться как в зависимости отвремени суток, так и в ходе одного цикла маршрута.
В связи с этим выбороптимального закона движения необходимо проводить с учетом этого фактора;Электробус оснащен рекуперативным тормозом, при помощи которогочасть энергии при торможении может быть возвращена в накопитель энергии. Всвязи с этим метод определения оптимального управления должен иметьвозможность учитывать эту конструктивную особенность.На основе рассмотренной специфики работы электробуса и проведенногоанализа существующих методов определения энергоэффективных фазовыхтраекторий можно сделать выводы:Метод классического вариационного исчисления не подходит длярешения поставленной задачи, так как не предусматривает возможность учетаограничений типа неравенств (ограничение на управляющее воздействие ифазовую координату (скорость));Методы «киевский веник», «блуждающей трубки», локальныхвариаций, «бегущей волны», случайного поиска не могут быть применены длярешения поставленной задачи, так как по итогу их работы получается толькозакон оптимального управления, при этом некоторые состояния электробуса, не«лежащие» на оптимальной траектории, которые после вмешательства вуправление скоростью могут представлять интерес, были исключены израссмотрения.
Пересчет же оптимальной траектории занимает длительныйпромежуток времени.24Генетические алгоритмы не могут быть применены для решенияпоставленной задачи, так как результаты их работы ограничиваются тем, какиенастройки используются для генетических операторов скрещивания, мутации ирепродукции. Существует вероятность, что в некоторых случаях послевмешательства в управление электробуса выбранная стратегия перестанетработать и оптимальный закон управления не будет определен.Для решения поставленной задачи может подойти классическийдискретный вариант метода динамического программирования, так какрезультат расчета дает не только оптимальный закон движения, но и полную«картину» возможных энергоэффективных вариантов попадания электробуса излюбого рассчитанного состояния в конечное. Данная особенность позволитучесть вмешательство в управление скоростью электробуса без повторногопересчета закона движения.Для решения поставленной задачи может подойти принцип максимумаПонтрягина,всилувозможностипересчетазаконадвиженияпослевмешательства в управление, за счет высокой скорости расчета.Рассмотрим отдельно основные методы, подходящие для решенияпоставленной задачи – принцип максимума Понтрягина и метод динамическогопрограммирования Беллмана.1.4.1.
Принцип максимума ПонтрягинаПринцип максимума Понтрягина для автономных систем [36, 37] основаннаследующейтеореме:рассматриваетсясистема,состояниеописывается уравнениями: , … , , , … , , , 1, … , которой25= , ℎИли в векторной формегде(1.2) – n-мерный вектор состояния;ℎ – r-мерный вектор управления.В пространстве переменных ℎ , … , ℎ задано некоторое множество (пространство управлений); допустимым управлением считается произвольнаякусочно-непрерывнаяфункцияℎ() = (ℎ (), … , ℎ ()) созначениями,входящими в , непрерывная справа в точках разрыва и непрерывная в концахотрезка, на котором она определена.
Далее, в фазовом пространстве переменных , … , заданы две точки и (начальное и конечное фазовыесостояния). Наконец, рассматривается некоторый процесс ℎ, , ≤ ≤ , переводящий объект из состояния в состояние ; это означает, что есть решение предложенной системы уравнений, соответствующее допустимомууправлению ℎ = ℎ и удовлетворяющее начальному и конечному условиям = и = .Таким образом, рассматриваемый процесс затрачивает на переход изсостояния в время, равное − .
Процесс ℎ, называетсяоптимальным в смысле минимума функционала = భ (, ℎ), если несуществует процесса, переводящего объект из состояния в состояние заబменьшее значение функционала.Для формулировки необходимого условия оптимальности вводится врассмотрение функция ℋ, зависящая от переменныхнекоторых переменных , … , и константы ≤ 0:ℋ, , ℎ = , ℎ = , ℎ. , … , , ℎ , … , ℎ ,26С помощью этой функции ℋ записывается следующая системадифференциальных уравнений для вспомогательных переменных:ℋ, , ℎ=−,где = 1, … , ,(1.3)(, ℎ) – рассматриваемый процесс.Для оптимальности процесса (, ℎ) необходимо существованиетакого нетривиального решения , ≤ ≤ , системы дифференциальныхуравнений вспомогательных переменных, что для любого момента , где ≤ ≤ , выполнено условие максимума:ℋ, , ℎ = max ℋ, , ≡ 0,(1.4)где – произвольная точка пространства управления.Таким образом, при совместном решении системы уравнений (1.2),описывающей состояние объекта, и системы дифференциальных уравнений длявспомогательных функций (1.3) с учетом выполнения условия максимума (1.4) играничных условий будет найдена оптимальная фазовая траектория иуправление,обеспечивающееизменениесостояниясистемысогласнополученной фазовой траектории.ОсновнымнедостаткомприреализациипринципамаксимумаПонтрягина, как и других аналитических методов, является затруднение виспользовании сложных математических моделей, описывающих состояниесистемы.
Следовательно, необходимо вводить упрощения, которые снижаютточность представления реальных физических явлений.Преимуществом данного метода является высокая скорость расчета посравнению с методом динамического программирования.271.4.2. Метод динамического программирования БеллманаВ основе дискретного варианта метода динамического программированиялежит принцип оптимальности, сформулированный Ричардом Беллманом [38]:оптимальная стратегия управления обладает тем свойством, что, каково бы нибыло первоначальное состояние и решение в начальный момент, последующиерешения должны составлять оптимальную стратегию управления относительносостояния, полученного в результате первого решения [39].Рассмотрим следующий пример.
Пусть состояние системы описываетсяследующим уравнением: + 1 = (, ℎ()),где(1.5) – n-мерный вектор состояния;ℎ – r-мерный вектор управления.Если задать начальное значение вектора состояний 0 = и длякаждогозначенияпредставленное = 0,1,2 … − 1уравнение0, 1, … , .будетвыбратьзадаватьℎ(),управлениемногошаговыйтопроцессФункция параметров состояния (функционал), которая минимизируется вданном процессе, выбирается в виде:, ℎ() = ∑ (, ℎ()) + (()),где(1.6)(()) – слагаемое, которое учитывает конечное состояние системы.Допустим, что все значения оптимального управления ℎ(), кромепоследнего, уже найдены и система находится в состоянии ( − 1).
Согласнопринципуоптимальностиуправлениеℎ( − 1)должнобытьтакжеоптимальным. Это управление должно доставлять минимум выбранномуфункционалу (1.6), который для последнего участка траектории будет иметь вид: − 1, ℎ − 1 = − 1, ℎ − 1 + (())28Обозначим − 1 =гдеmin() − 1, ℎ − 1, – замкнутая область пространства управлений.Тогда получим: − 1 =min − 1, ℎ − 1 + (())!Для определения − 1 необходимо провести минимизацию()функции − 1, ℎ − 1 по " переменным ℎ − 1, … , ℎ − 1.Проводя аналогичные рассуждения для следующих шагов, двигаясь отконечногосостояниякначальному(, − 1, − 2, … ,1),получимрекуррентную формулу для определения на k-ом шаге минимального значенияфункционала − , ℎ − − ==min() − , ℎ − + − + 1!(1.7)Полученное выражение (1.7) представляет собой дискретный вариантуравнения Беллмана.Вычисляя последовательно значение функции для = 1,2 … ,получим минимальное значение рассматриваемого функционала для всейфазовой траектории.Далее, так как состояние системы определяется предыдущим еесостоянием и управлением, получим уравнение состояния системы: = − 1 + , ℎ.(1.8)Теперь, двигаясь от начального состояния к конечному (1,2 … ) и решаяуравнение состояния (1.8), получаем оптимальную фазовую траекторию иуправление ℎ , обеспечивающее изменение состояния системы согласнополученной траектории.29Главным недостатком данного метода и его вариаций являетсяпредположение о дифференцируемости функции , а проверить это поуравнениям состояния системы не представляется возможным.
Если же данноепредположение не выполняется, то метод динамического программированиястановится теоретически не обоснованным. Однако для решения инженерныхзадач данный метод будет оставаться приемлемым, так как будет даватьрешения, близкие к оптимальным, соответствующие инженерному уровнютребуемой точности [17, 40].Кроме того, недостатком дискретного варианта метода динамическогопрограммирования и его вариаций является необходимость проводить большоеколичество вычислений на каждом шаге поиска оптимальной фазовойтраектории, что существенно замедляет скорость расчета с увеличениемколичества состояний, а также требует значительной вычисленной мощностиЭВМ.Преимуществом же рассмотренного метода является простота учетаразличных ограничений, накладываемых на фазовую координату, а такжевозможность использования сложных математических моделей для описаниясостояния системы.
















