85991 (589914), страница 2
Текст из файла (страница 2)
Значение кусочно-непрерывного управления u(t) в точке разрыва не играет сколько-нибудь существенной роли. Однако для определенности будет удобно предполагать, что управление u(t) в точках разрыва непрерывно справа, т. е. что в каждой точке разрыва значение управления u(t) равно пределу справа:
Кроме того, предполагается, что каждое рассматриваемое управление u(t) непрерывно в концах отрезка на котором оно задано, т. е. что все его точки разрыва, если они есть, расположены на интервале
.
Допустимым управлением называют всякую кусочно-непрерывную функцию со значениями в области управления U, непрерывную справа в точках разрыва и непрерывную в концах отрезка
на котором она задана.
Оптимальные управления оказываются, в большинстве случаев, разрывными (т.е. содержащие скачки и переключения). Если разрывная функция, график которой изображен на рисунке 1.3 сплошной линией, представляет собой оптимальное управление, то, «сгладив» эту функцию (пунктир на рисунке 1.3), будет получена близкая к ней непрерывная функция. Но какая бы «близкая» к оптимальному управлению непрерывная функция ни была, всегда можно выбрать «сглаживающий» кусок еще более крутым и получить непрерывную функцию, еще более близкую к оптимальному управлению. Таким образом, в классе непрерывных функций просто не будет наилучшего, оптимального управления, а предельным случаем является кусочно-непрерывная функция, которая и является оптимальным управлением.
1.2 Основные направления в теории оптимальных процессов
Теория оптимальных процессов базируется на методе динамического программирования, разработанного Р. Беллманом, а также на принципе максимума Понтрягина. Для линейных систем принцип максимума был доказан Р.В. Гамкрелидзе. Кроме того, ему принадлежит теорема о конечности числа переключений. Доказательство принципа максимума для нелинейных систем принадлежит В.Г. Болтянскому.
Далее кратко рассмотрим общие принципы метода динамического программирования и принципа максимума.
1.2.1 Метод динамического программирования
Для получения уравнения Беллмана и формулировки теоремы, являющейся сущностью метода динамического программирования автором данной теории были выдвинуты следующие гипотезы.
Гипотеза 1.1. Какова бы ни была отличная от x1 точка x фазового пространства, существует оптимальный (в смысле быстродействия) процесс перехода из точки x в точку x1.
Время, в течение которого осуществляется оптимальный переход из точки x в точку x1, обозначим через Т(х). И пусть
w(x) = — T(x).
Гипотеза 1.2. Функция w(x) непрерывна и всюду, кроме точки x1, имеет непрерывные частные производные
На основе этих гипотез была сформулирована и доказана теорема 1.1.
Теорема 1.1. Если для управляемого объекта, описываемого уравнением , и предписанного конечного состояния x1 выполнены гипотезы 1 и 2, то имеют место соотношения (1.3) и (1.4) (оптимальность понимается в смысле быстродействия).
для всех точек x x1 и u,
(1.3)
для любого оптимального процесса (u(t), x(t)). (1.4)
Эта теорема и составляет сущность метода динамического программирования.
Метод динамического программирования (1.3), (1.4) содержит некоторую информацию об оптимальных процессах и потому может быть использован для их разыскания. Однако он имеет ряд неудобств. Во-первых, применение этого метода требует нахождения не только оптимальных управлений, но и функции w(x) так как эта функция входит в соотношения (1.3), (1.4). Во-вторых, уравнение Беллмана представляет собой уравнение в частных производных относительно функции w. Указанные обстоятельства сильно затрудняют возможность пользования методом динамического программирования для отыскания оптимальных процессов в конкретных примерах. Но самым главным недостатком этого метода является предположение о выполнении гипотез 1.1 и 1.2. Ведь оптимальные управления и функция w заранее неизвестны, так что гипотезы 1.1 и 1.2 содержат предположение о неизвестной функции, и проверить выполнение этих гипотез по уравнениям движения объекта невозможно.
Далее кратко излагается сущность принципа максимума, который является значительно более удобным средством для отыскания оптимальных процессов, чем метод динамического программирования.
1.2.2 Принцип максимума
Гипотеза 1.3. Функция w(x) имеет при x x1 вторые непрерывные производные , а функции
— первые непрерывные производные
.
Теорема 1.2. Предположим, что для рассматриваемого управляемого объекта, описываемого уравнением
(1.5)
И предписанного конечного состояния x1 выполнены гипотезы 1.1, 1.2 и 1.3. Пусть , — некоторый процесс, переводящий объект из начального состояния x0 в состояние x1. Введем в рассмотрение функцию H, зависящую от переменных
и некоторых вспомогательных переменных
(1.6)
С помощью этой функции H запишем следующую систему дифференциальных уравнений для вспомогательных переменных:
(1.7)
Тогда, если процесс является оптимальным, то существует такое нетривиальное решение
, системы (1.7), что для любого момента t,
, выполнено условие максимума
(1.8)
и условие
Эта теорема значительно удобнее для отыскания оптимальных процессов, чем метод динамического программирования. Однако в приведенной здесь форме принцип максимума страдает тем же недостатком, что и метод динамического программирования: он выведен в предположении дифференцируемости (и даже двукратной) функции w(x), а эта функция, как уже отмечалось, в действительности не является всюду дифференцируемой.
Однако принцип максимума доставляет достаточную информацию для решения поставленной задаче оптимального управления.
Благодаря работам Р.В. Гамкрелидзе, принцип максимума был доказан для линейных систем. Им были доказаны теоремы существования, единственности и теорема о числе переключений.
В данном случае функция Н принимает вид
(1.9)
Выражение (1.7) в векторной форме записывается в виде
(1.10)
а соотношение (1.8) принимает в данном случае вид
(1.11)
Теорема 1.3 (теорема существования). Область управляемости является выпуклым открытым множеством фазового пространства Х; для любой точки х0, принадлежащей области управляемости, существует оптимальное управление, переводящее точку х0 в начало координат.
Примечание: Множество G называется открытым, если для каждой его точки можно найти шар с центром в этой точке, целиком принадлежащий множеству G, иначе говоря, множество G открыто, если к нему не причисляется ни одна точка его границы.
Областью управляемости объекта называется множество всех тех точек х0 фазового пространства X, из которых возможно при помощи какого-либо допустимого управления попасть в начало координат. Само начало координат тоже причисляется к области управляемости.
Теорема 1.4 (теорема о числе переключений). Для каждого нетривиального решения (t) уравнения (1.10) соотношение (1.11) однозначно определяет допустимое управление u(t); при этом оказывается, что функция u(t) кусочно-постоянна и ее значениями являются лишь вершины многогранника U.
Таким образом, функция u(t) кусочно-постоянна, принимает значения в вершинах многогранника U и определена однозначно. Каждую точку разрыва оптимального управления называют точкой переключения.
В общем случае число переключений хотя и конечно, но может быть произвольным. Однако существует один важный для приложений случай, когда число переключений допускает точную оценку. Этот случай рассматривается в теореме принадлежащей А.А. Фельдбауму. В этой теореме говорится (упрощенно), что каждая из функций кусочно-постоянна и имеет не более n—1 переключений (т.е. не более n интервалов постоянства), где n — порядок системы.
Таким образом, принцип максимума является наиболее удобным для решения задачи об оптимальном быстродействии.
1.3 Программное управление
Сегодня оборудование с программным управлением распространено весьма широко, начиная от компаний, входящих в TOP 500 Fortune в больших промышленных зонах, и заканчивая малыми предприятиями частного бизнеса. Действительно весьма трудно найти ту область машиностроения, где еще не используются уникальные возможности этого оборудования. Поэтому каждый специалист в области машиностроения должен хорошо представлять то, что дает производству применение этого весьма интеллектуального оборудования.
Программное управление технологическим оборудованием и процессами охватывает управление движением машин, механизмов, транспортных средств и изменением физических и химических параметров технологического процесса.
Программное управление — это управление режимом работы или состоянием объекта по заранее заданной программе. При автоматическом программном управлении технологическим оборудованием, соответствующая алгоритму программа записывается в память управляющего устройства с последующим автоматическим считыванием и преобразованием в управляющие сигналы.
Программное управление может быть реализовано на различных классах вычислительных машин, начиная от микроЭВМ и заканчивая мощными вычислительными системами. Каждый из этих классов накладывает на алгоритмы некоторые ограничения, которые необходимо учитывать при разработке алгоритмического обеспечения.
Разрабатываемый алгоритм ориентируется для использования в микроконтроллерах, что накладывает особые ограничения на полученный алгоритм.
Необходимо отметить, что микроконтроллеры выполняют операции для дискретного времени и дискретных величин. Вычисления осуществляются с конечной точностью и за конечное время.
Следует также учитывать тот факт, что микроконтроллеры не вычисляют точных значений интегралов и производных, но могут оценивать их значения в конечных разностях, т.е. с помощью численных методов.