Курс лекций по теме Управление в МИСО (1996) (1264200), страница 12
Текст из файла (страница 12)
Решаем задачу получения границ для U. В работах показано, что границы замкнутых (но не выпуклых из-за нелинейности) областей G ( u) и G (v) представляют совокупность точек концов траекторий, обеспечивающих оптимальность фиксированного времени T в смысле оптимального быстродействия.В соответствии с принципом максимума введём систему для вспомогательных функций :Страница 713fxj ,xij=1x i = −i = 1,3 =0 → =a =0 → =c11222f1f 2f 33 = − x1 − 1 − 3 = v sin x 3 1 − v cos x 3 2 − k 2 sin x 3 3x 3x 3x 3введем функцию Гамильтона H:H = a v cos x 3 c 2 v sin x 3 + 3 k 1 u − 3 k 2 cos x 3 − 1t0 = −1 ,f 0 = 1,т.к.
J 0 = dt − 1t03 0U m sign 3Отсюда U 0 = максимизирует H.не определено 3 = 0Учтем, что k1 k 2 cos x 3 , без этого нельзя находить ЛАХ. Тогда на участкепостоянства U( U 0 )U0x 3 = k 1 U 0 t + x 303Исследуя этот факт, можно показать, что 3 имеет не более 1 точки перемены знака, а U 0 не более 1 точки переключения.Качественный анализ Гамильтониана приводит к выводу о существовании особых оптимальных управлений. Это обеспечено тем, что:1) оно не определено, когда 3 = 0, а 3 = 0 не в точке, а на интервале времени.2) особые управления могут существовать, если H имеет несколько максимумовпо U или от U не зависит.В нашем случае, когда 3 = 0, H не зависит от U.
Кроме того, независимость H от U может быть обусловлена следующей записью H:H = 1 x 1 + x 2 x 2 + x 3 x 3 - 1и условием x 3 = 0 = 0Окончательно убедиться в существовании особых управлений удается,выполнив проверку Келли и Куна-Майера : = k u − k cos x = 0x 3 = 123k2u oc = k cos x 31следовательно, существуют 2 типа экстремальных управлений, приводящих награницу G ( u) .Страница 72UmUmTt1Uосt1T-Umуправление с переключениемуправление с выключениемСуществование 2 типов управлений обеспечивает существование 2-х качественно отличных участков G ( u) (и G ( v) ) :11,3,4,6 - траектории с управлением1-го типа283V92,5,7- траектории с управлением2-го типа8- ближняя граница74596дальняяИдя по 4 и 5 имеем одинаковое время, но разные расстояния (у 4 меньше(в 8); у 5 больше (в 9)).
Т.к. Umax > Vmax, то G(U) имеет больший объем чем G(V).Предварительно для существования решения задачи сближения и уклонения, Тне назначают, а делают приблизительную его оценку по G(U) и G(V).Пусть для некоторого моментаТ реализовалось следующее расположение областей:q0{ХE}VEq2G(V)G(U)t1VpU{ХP}1Tt1tБудем формировать задачусближения, уклонения.
Тогда Едолжна попасть в q0 (максимальноерасстояния Р), поэтому для Р минимальная стратегия - стремление в q,наиболее близкую к q0.Если G(v)G(U), то всегда существует не единственное управление, обеспечивающее поражение цели.Страница 73В заключение сформулируем общий алгоритм решения задачи перехвата,который может быть реализован в БУВМ:1.
предварительная оценка времени перехвата Т (близость областей достижимости).2. построение областей достижимости для Т.3. анализ захвата G(v)G(U) если захвата нет, то изменяем Т и повторяем с 2).4. определение точки экстремального прицеливания.5. определение экстремальных управлений (момента переключения на ближайшей границе или выключения на дальней).Обратная связь как и в линейном случае реализуется многократным повторение алгоритма при последующих измерениях вектора Х.Для нелинейного случая в отличии от линейного меньше аналитическийпроцедур, следовательно необходимо использовать декомпозицию и распараллеливание вычислительного процесса.Если число задач или объектов больше чем 2, то антагонистический подход расширяется: можно рассмотреть бескоалиционный, коалиционный и кооперативный подход для раскрытия неопределенности 3-х видов.В общем случае задача может быть сформулирована как дифференциальная игра:Г = Г I; U i ; Yi (U) , гдеI - число коалиций;Ui - множество управлений коалиций;Yi - множество показателей каждой коалиции.Если коалиция состоит из одного объекта, а всего объектов i = 1N и действия этих объектов несогласованны, то имеем бескоалиционную игру, основойразрешения которой является равновесие по Нэшу.Если объектов может быть разбито на несколько коалиций-действий (коалиции-действия здесь равны коалициям-интересов) и каждая коалиция имеетсой набор показателей.
То имеем коалиционную ситуацию. Оптимальное решение в ней дает принцип доминирования Харшаньи.Пусть проектировщик отражает интересы некоторой коалиции К, не имеяполной информации. Главная его задача - определить выгодность коалиции. Длярешения задачи проектировщика применяется 2-х этапный принцип Харшаньи:1) формируем конечное множество коалиционных структур, в каждой из которых входит фиксированная коалиция К. Для каждой коалиционной структурынаходим ситуацию равновесия по Нэшу для бескоалиционной игры между коалициями.Страница 742) Сравниваем полученное решение по Нэшу. Исключаем совместно подчиненные решения: если U’(U’1…U’n) и U’’(U’’1…U’’n), то U’ хуже U’’, еслиI i (U ) I i (U ), i = 1 n , где n - число коалиций.Предполагаем, что после сравнения выделится 1 решение - решение поХаршаньи для коалиции.Если в исходной задаче Г интересы объектов полностью согласованы, тоимеет смысл говорить о кооперативной ситуации, когда все объекты объединяются в единую коалицию из N - подсистем следовательно разрешаем по Паретто(свертка показателей).Бескоалиционный подходОн используется для разрешения неопределенности среды.
Активногопартнера, цели.Неопределенность цели и ее разрешение.Неопределенность цели связана с неполнотой описания векторным показателем заданной цели управления или проектирования. Неопределенность целитакже может иметь простой смысл параметрической неопределенности скалярного показателя.Для разрешения неопределенности цели необходимо:1. расширение вектора показателей до полноты описания цели (многогранникполностью описывается заданием всех граней);2.
уменьшение размерности векторов путем их комбинирования для упрощениярешения.ПГРР предлагает свой подход для 2) -используется декомпозиция сложной системы на подсистемы создание коалиции из n-систем с частичной скаляризацией на базе коалиционных подходов.Известна задача векторной оптимизации с 1 объектом и несколькими показателями (те кооперативная постановка). Основной приём её решения - свёртка показателей. Данная процедура приводит к неопределённости цели вида неопределённости параметров скалярного показателяJ=n i J i , где i − неизвестноi =1А это приводит к неединственности Парето-решения. Коалиционныйподход позволяет уменьшать неопределённость цели на основе частичной скаляризации без последующей свёртки и комбинированного Парето-подхода.Страница 75J = (J 1...
J N ) → J = (J 1 ... J n ), n < Nгде J i получаем по Парето далее по Нэшу ищем равновесие для J .J i объединяет показатели обладающие некоторыми общими свойствами( и т.д.), что увеличивает несогласованность J i , i = 1 n . А это приводит киспользованию Нэш-оптимизации. Понятие многообъектности вместе с многокритериальностью приводит к хорошему решению, понижению его неопределённости.Безкоалиционный подход формируется на основе равновесия по Нэшу.Введём запись:U = ( U / u i ) = ( u1 , u 2 ,..., u i −1 , u i , u i +1 ,..., u N )Ситуация U = ( U / Ui ) приемлема для объекта i, если для всех его i Uсуществует Ui и существует: U = (U / u i ): J i (U / u i ) J i (U / u i ) , где Ji - потери(все остальные u j , j i при этом фиксированы) .Ситуация приемлемая для каждого игрока называется равновесной поНэшу:J i ( U * ) J i ( U),U * = (U1 ; U 2 ;...
U N ),где i = 1 N;для U U = U1 U 2 ... U NПрактически ситуация равновесия - это набор неравенств.Пример №1: Линейно-квадратичная задача в условиях несогласованностиактивного партнёра и среды.x = A x +N Uii =1где U - управление группой против цели.J i ( U1 ... U N ) =xTiT i x(T) + x T c x + U k D ik ( t ) Ukdt ,t0U i ( t , x) = M i ( t ) xСитуация равновесия обеспечивается условиями:– все матрицы являются непрерывными,– i , c i ( t ), D k ( t ) симметричные матрицы,– Д k ( t ) определенно отрицательная:U tk D k ( t ) U k − U k2Страница 76UJ i - показатель эффективности который надо максимизировать.
Можнозаписать (Вайсберг, Жуковский) уравнение Рикатти относительно некоторой переменной i ( t ) отсюда равновесное решение:U*i ( t , x) = M i ( t ) x = D i ( t )−1 i (t) xПример №2: Групповой перехват цели с 3 эшелонами обороны.( x 0 , y 0 ) − центр тяжести равностороннего треугольника.центра облака целейгрупповая цельyy 0 = y i / 3 – координаты центрагруппового наряда.132r 2 (T) = ( x y − x 0 ) 2 + ( y y − y 0 ) 2xx i = v i cos iy i = v i sin i , i = 1 N = jHi / v i , jHi = U iЦель: накрыть группой ЛА площадную цель, поэтому полёт группы долженсохранять равносторонний треугольник со стороной:( x1 − x 2 ) 2 + ( y1 − y 2 ) 2 = R 2222( x1 − x 3 ) + ( y1 − y 3 ) = R222( x 2 − x 3 ) + ( y 2 − y 3 ) = RЦель каждого объекта - минимизация J iTJ i = r (T) + U 2i dt → min2t0несогласованная часть показателей,имеющая смысл кривизны траектории.несогласованность i - может повышать и понижать влияние несогласованной части.Условия полёта в треугольнике можно ввести в показатели в видештрафных функций:T()T() i ( x i − x1 ) + ( y i − y1 ) − R dt + i ( x i − x 2 ) + ( y i − y 2 ) − R 2 dtt0222t022Повышая i понижают степень несогласованности в задаче.
Показано,что при этом Нэш- и Парето-решения сближаются.Страница 77Для решения нелинейной задачи бескоалиционным подходом используется иерархический алгоритм определения равновесия по Нэшу.Верхний уровень - решение задачи координации. На нижнем уровне решается скалярная задача (автор - австрийский учёный Пао).Верхний уровеньT(i) J i k ( L+1) kLj− jH i dt jH i H it0J = jHK1jHK2jHK3min J 3 ( k , L, jH 1 , jH 2 , jH 3 )min J 1 ( k , L, jH 1 , jH 2 , jH 3 )jH 2 , jH 1jH 2 , jH 33 задачи нижнего уровня()min J 2 ( k , L, jH 1 , jH 2 , jH 3 )jH 1 , jH 3(((J = J j k ( L + 1) ; j0 L ; j0 L1 H1H2 H3 i0 L k ( L + 1) 0 L; jHJ i = J 2 j H 1 ; j H 23J = J j0 L ; j0 L ; j k ( L + 1)3 H1 H 2 H 3 i)))при L = 1, jH i задаются из физических соображений.На нижнем уровне решается 3 оптимизационные задачи каждая из которых даёт набор jH 0i (оптимальное).Эти оптимальные управления передаются на верхний уровень и заполняют свои места в системе ().