Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание), страница 2
Описание файла
DJVU-файл из архива "Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание)", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 2 - страница
Это условие означает, что для руля допустимы и его крайние положения (значения и' = -+. 1 в неравенстве (7) или граничные точки круга (8)), могущие, в частности, давать оптимальное управление. Именно это обстоятельство делает рассматриваемую вариационную задачу неклассической, так как в классическом вариационном исчислении варьируемые параметры не могут удовлетворять неравенствам типа (7), (8), включающим и равенства. Особенно ярко демонстрирует неклассический характер нашей вариационной задачи оптимальная задача по быстродействию для системы (1), правые части которой являются 8 ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ л и н е й н ы м и функциями относительно переменных х', ..., х", и', ..., и" с постоянными коэффициентами, а множество П представляет собой з а м к н у т ы й в ып у к л ы й м н о г о г р а н н и к, например куб, определяемый неравенствами: ~и'! =1, 1=1, ..., г.
В атом случае оказывается, что оптимальное управление (6) осуществляется точкой (и' (1), ..., и'(8)), поочередно находящейся в различных вершинах многогранника П. Правила, согласно которым управляющая точка переходит скачками из одной вершины в другую, и дают закон оптимального управления.
Эта линейная вариационная аадача, имеющая важные технические приложения, решается на основе общих методов в главе 3. Классические же методы для решения такой задачи совершенно неприменимы. Из сказанного о перескоках оптимально управляющей точки с вершины на вершину многогранника П следует, что класс допустимых управлений (2) нельзя считать состоящим из непрерывных функций. Мы предполагаем обычно, что ок состоит иэ кусочно-непрерывных функций. Фааовые координаты хт, ..., х" считаются непрерывными и кусочно-дифференцируемыми функциями времени.
В этих предположениях необходимые условия оптимальности формулируются в виде принципа максимума (см. главу 1), который доказывается в главе 2. Если рассматриваемый объект представляет собой механическую систему, то часть х', ..., х" фазовых координат описывает вв геометрическое состояние, а часть х"+', ..., хзь (2й = и) — ее скорость. В некоторых задачах целью управляемого процесса в этом случае может быть не попадание объекта в определенную точку (х), ..., х",) фа з о в от о пространства, а прибытие механической системы в определенное п р о с т р а н с т в енн о е положение (х,', ..., х",) при произвольных скоростях в конце процесса. Таким образом, здесь имеет место вариационная задача об оптимальном переходе объекта иа определенной начальной точки х1, ..., х", фазового пространства в произвольную точку к-мерной плоскости, определяемой уравнениями х1=х( ...
ЗА=хе. и ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ Мы видим, что ранее сформулированная оптимальная эадача не охватывает ряда важных проблем. Ввиду этого в $ 6 главы 1 разбирается вопрос об оптимальном переходе объекта с некоторого начального многообразия М, точек фазового пространства на некоторое конечное многообразие М„ причем размерности многообрааий М и М произвольны (в частности, когда они обе равны нулю, мы получаем первоначальную эадачу). Совершенно ясно, что не только управляющие параметры объекта, но и его фааовые координаты, по самому характеру технической задачи, должны иногда подчиняться некоторым ограничениям. Ксли, например, речь идет о движении самолета и хг обоэначает его высоту над землей, то должно быть выполнено неравенство хт ~ Ь ) О, где Ь вЂ” минимальная допустимая высота полета. Йеравенство х' ) Ь вовсе не вытекает иэ свойств системы уравнений (1) и иэ неравенств, налагаемых на управляющие параметры, а является совершенно независимым.
Задача об оптимальном управлении объектом, при котором изображающая его точка фазового пространства должна все время оставаться в некоторой эамкнутой области б фазового пространства, решается в главе 6. Предполагается при этом, что область С имеет кусочно-гладкую границу. Движение объекта в этих условиях протекает частично внутри области 6, подчиняясь там обычному принципу максимума, частично же по границе области 6, подчиняясь там усложненному принципу максимума.
Переходы от кусков траекторий, проходящих внутри О., к кускам траекторий, проходящим по границе области б, подчиняются своеобразным правилам, напоминающим законы преломления света и в некотором смысле обобщающим их. До сих пор речь шла об оптимальном управлении, приводящем объект в заданную точку или на заданное подмногообраэие фазового пространства. Задачей оптималь ного управления может быть, однако, и эадача об оптимальном попадании в д в и ж у щ у ю с я точку фазового пространства.
Допустим, что в фазовом пространстве имеется движущаяся точка ~о ш кдисловпв ко втогомг издлнию Тогда возникает аадача об оптимальном приведении объекта (1) в совпадение с движущейся точкой (9). Эта аадача легко сводится к рассмотренной. Достаточно ввести новые переменные, положив у'=х' — 8'(э), 1=1, ..., и. В результате этого преобразования управляемая система (1) превращается в новую, правда, уже не автономную, а целью управляемого процесса становится приведение нового объекта (у', ..., у ) в неподвижную точку (О, ..., 0) фазового пространства.
Так как основные результаты легко распространяются и на н е а в т о н о м н ы е управляемые процессы (см. 3 7), то задача оказывается решенной. Здесь мы считали, что движение преследуемой точки (9) определено ааранее на протяжении всего рассматриваемого промежутка времени. Совершенно новый и практически важный вопрос возникает, когда движение преследуемого объекта не известно заранее, а сведения о нем поступают только с течением времени. Для того чтобы решать такую задачу о преследовании объекта, нужно иметь некоторые данные о его поведении. Весьма важным представляется случай, когда преследуемый объект является управляемым, так что его движение описывается системой уравнений Задача заключается в том, чтобы, зная технические возможности преследуемого объекта, т.
е. систему уравнений (10),и его положение в каждый данный момент времени, определить управление преследующего объекта в тот же момент времени так, чтобы преследование осуществлялось оптимальным образом. В такой постановке задача рассматривается в теории дифференциальных игр, которая здесь не аатрагивается. В главе 7 решается другая аадача преследования. Предполагается, что в начальный момент положение преследуемого объекта известно, а дальнейшее его поведение описывается вероятностным обрааом, именно, процесс его движения считается марковским. В этих предположениях ищется такое управление преследующего объекта (1), при котором встреча некото- пгвдисловив ко втогомг изданию 11 рой малой окрестности объекта (1) с преследуемым объ- ектом является наиболее вероятной. 3а семь лет, прошедших с первого издания этой книги, принцип максимума оправдал себя, найдя многочисленные приложения. Поэтому уже здесь стоит остановиться в нескольких словах на его характере, происхождении и доказательстве.
Для определенности ограничимся задачей быстродействия. Именно для этого случая принцип максимума был в качестве гипотезы высказан Л. С. Понтрягиным. Суть его заключается в следующем. Каждому допустимому управлению и~(г), ..., и'(Г), заданному на отрезке г, ( г ( г„и произвольному постоянному вектору ф фазового пространства определенным образом ставится в соответствие функция Н(с, и', ..., и') переменного Г, ~, ( Г ( 8п и допустимых управляющих параметров. Оказывается, что если взятое управление оптимально, то существует такое значение вектора ф ~ О, что при каждом фиксированном значении Г, гз ( Ф ( г1, величина Н, рассматриваемая как функция допустимых значений управляющих параметров, достигает своего максимума при и~ = и~Я, ) = 1, ..., г.
Из этого видно, что, имея дело с принципом максимума, приходится сравнивать между собой не только близкие одно к другому управления. В этом его отличие от классических теорем вариационного исчисления, сила и некоторая трудность доказательства. Первое доказательство принципа максимума было дано Р, В.
Гамкрелидзе для линейных управляемых систем. Он же построил полную теорию этих систем. Идея его доказательства следующая: будем считать, что рассматриваемое оптимальное управление переводит точку хз в точку зп Если вместо оптимального управления взять произвольное допустимое управление, заданное на прежнем отрезке, то оно переведет точку х, в некоторую точку к(1г).
Ввиду линейности совокупность всех получаемых 12 пэвдисловин ко втовомт изданию так точек х(1,) образует выпуклое тело Р. Из олтимальности исходного управления вытекает, что точка хг лежит на границе этого тела. Таким обрааом, существует опорная плоскость к телу Р, проходящая через точку хп а вектор ф перпендикулярный к этой плоскости и направленный от тела Р, и является тем, который используется при построении функции Н. Для нелинейной управляемой системы множество всех точек х (1,), получаемых с помощью всевоаможных допустимых управлений, невыпукло и необозримо. Испольаование для линеариэации задачи управлений, мало отличающихся от оптимального управления, не соответствует характеру принципа максимума.
В общем, нелинейном случае принцип максимума доказал В. Г. Болтянский, который вслед за тем построил основы нелинейной теории оптимального управления. Именно, он удачно выбрал класс управлений для сравнения с оптимальным, применив вариации Макшейна, т. е. рассмотрев те допустимые управления, которые отклоняются от оптимального лишь на конечном числе малых интервалов времени, но на каждом интервале отклоняются произвольно.