Лекции по дисциплине Оптимальное управление многоуровневыми ММС. Глава 2 (2016) (1245051), страница 3
Текст из файла (страница 3)
Так, например, функции f j t могут быть заданыотдельно для каждой скалярной компоненты u s и принимают вид f js (t ) . Для сохранения числа lинтервалов параметризации (2.13б) на каждом отрезке [tj-1,T] достаточно (2.13б) представить ввидеlusj (t ) q sjk f jks t 1tk tk 1 ,(2.13в)k 1где tk t j 1 k t,t T t j 1l.Если управление (2.13а) непрерывное, то управление (2.13б) кусочно-непрерывное. Типичныйчастный вид последнего при fj(t) = 1 на t0 ,T us q1s 1t1 t0 q2s 1t2 t1 5) Параметризованный закон управления (стратегия) ui us q s , x, t l s q j f j x, t ; j 1sus u s q , x , t l q s f x, t 1 t t , j j 1 j j j 1 qls 1T tl 1 .(2.14)1.15а 1.15б где q s Qs , us U s , f j x,t – заданные непрерывные функции.6) Программно-корректируемый закон управления (ПКЗУ) (стратегия) при заданном разбиенииотрезка t0 ,T с малым t t j t j 1ui us ;lus usj (x(t j 1 ), t )1 t j t j 1 , tl T ,(2.16)j 1где usj x t j 1 ,t usj t – допустимое программное управление us U sjна отрезке t j 1 ,T при известном начальном условии x t j 1 и реализуемое на t t j 1 t j .Замечание 2.2.
Данный ПКЗУ отличается от кусочно-программной стратегии Л.А. Петросяна[199]lus usj 1jt 1t j t j 1 ,где usj t – программное управление на t j 1 ,t j при фиксированном значении x t j 1 .77) Параметризованный ПКЗУ, который получается на основе комбинации 4 и 6, например, в виде(2.16), гдеpusj x t j 1 , t q sj k 1tk tk 1 (2.17)k 1с разбиением t j 1 ,t1 ,...,tk 1 ,tk ,...,T на отрезке t j 1 ,T при фиксированном x t j 1 .При параметризации управления и дискретизации временного интервала t0 ,T возникаетвопрос о степени приближения исходной задачи, полученной задачей с аппроксимациейуправляющих сил. Допустимость приближений опирается на ряд фундаментальных факторов инекоторых условий.Во-первых, в точной задаче рассматривается, как правило, класс управлений с конечнымчислом точек разрыва первого рода, к которым принадлежат и аппроксимированные управления.Во-вторых, существенным является свойство сжатия функциональной связи показателей суправляющими силами, когда ограниченным структурным изменениям управляющих силсоответствует малое изменение значений показателей.
Данное свойство грубости часто имеетместо в задачах управления.В-третьих, очевидно, что при сведении исходной задачи к конечномерной задаче нелинейногопрограммирования результат уточняется при определенном увеличении размерности векторапараметров. В этом случае контролируемые приближения для некоторых классов систем могутбыть обеспечены, например, на основе спектральных методов развитых в работахВ.В. Солодовникова, В.В. Семенова, А.Н. Дмитриева, Н.Д.
Егупова и других [см., например,работу А.И. Трофимова, Н.Д. Егупова, А.Н. Дмитриева. Методы теории автоматическогоуправления. – М.: Энергоатомиздат, 1997. – 654 с.]. Следует также отметить, что параметризацияуправляющих сил позволяет на основе параметрических сетей, например [238], преодолеватьвозрастающие трудности глобальной оптимизации в многокритериальных задачах, приближеннооценивать существование и единственность решения и назначать начальное приближение длялокального поиска точного решения. В этом случае методы и алгоритмы приобретают, поменьшей мере, двухэтапную структуру.
На первом этапе на основе сетевых подходов оцениваетсямножество решений и выбирается начальное приближение в «выгодной» локальной области. Навтором этапе на основе начального приближения решается точная задача определенияпараметризованного оптимального управления или управления в форме 2,3.2.3.2. Векторный целевой показательЦелевые свойства ММС характеризуются векторомJ J x 0 ,t0 ,T ,q ,x ,u ,y J1 ,..., J m ,(2.18)который представляет собой сложную функциональную связь с указанными величинами.Типичным видом i-й функции выигрыша (потерь) является функционал на t0 t TTJ i u1 ,, u N i T , x T Fi t, x, u1,..., u N dt, i 1,..., m .
(2.19)t0Свойства (2.19) даны в приложении к работе1 (см. реферат работы [32], стр. 4).Кроме непрерывности (2.19) по (x, u) и дифференцируемости по управлению, желаемымисвойствами являются вогнутость-квазивогнутость (выпуклость-квазивыпуклость) функционала(2.19) на множестве управлений. При общих свойствах целевого вектора проблема глобальнойоптимизации может быть преодолена, как отмечалось в п.
2.3.1, на основе двухэтапной структурыметодов оптимизации с сетевым глобальным анализом и приближенным решением на первомэтапе и точным локальным решением на втором.Несовпадение размерности J с числом объектов означает, что некоторые объекты имеютвекторную цель. Размерность показателя будет совпадать с числом объектов в ММС, еслипоказатель каждого объекта скаляризуется.1См. сноску в п. 2.2.82.3.3.
Коалиционная структура действий и интересов ММСПусть P P , Pи– коалиционная структура действий и интересов с размерностью mkмножества M K индексов коалиций в каждой, где M K 1,…, mk .ТогдаP д K1 ,..., Km r Ki K j 0; Ki R 1, r ,i jiM K(2.20)где r есть, например, размерность множества индексов вектора параметров (после параметризацииуправлений) или множества индексов управлений (без параметризации);,(2.21)где m – размерность множества индексов вектора показателей.В свою очередь, каждой K iд соответствует, например, при полной параметризации векторпараметров q i (или вектор u i без параметризации).
Каждой Kiи соответствует целевой векторJ Ki J i : i Kiu .Далее ограничиваемся Kiд Kiu .Тогда разбиениеP K1 ,mk, K mk : Ki K j ; K j R, M ,j 1(2.22)где R – множество индексов, например, управлений, М – множество индексов векторапоказателей.Показатель каждой коалиции принимает, как правило, один из двух видов:;(2.23а),,,(2.23б)причем сумма индексов ik равна m.Коалиционные управления без параметризации принимают вид,,(2.24)выражения (2.11а) преобразуются к виду(2.25)Показатель в варианте (2.23б)TJ Ki Ki x, t FKi t, x, u K1 ,..., u Km dt ,где Ф Ki i Фi ;iKiк(2.26)t0FKi i Fi .iKiВ рамках введенной модели конфликта обозначения в определении 2.1 имеют следующиесоответствия:множество стратегий X K множество U K ;множество исходов-состояний S множество траекторий x(t ) X на множестве ситуацийu U U , или отображение Х, U на множество показателей J x ,u ;KKP множество возможных исходов-состояний S x K множество возможных траекторий вектораx t Xна множестве ситуаций u uKi uK1 ,..., uKi 1 , uKi , uKi 1 ,..., uKmk при фиксированномуправлении u Ki , где U U K ...
U K1i 1 uK U Kii 1 ... U K , или множество значений J x ,u,uKimkна множестве U;предпочтения коалиции K представлены максимизацией функции выигрыша (минимизациейпотерь) J K на множестве X ,U.92.3.4. Принципы несогласованности конфликтности и неопределенности (НКН)взаимодействия.Понятия стабильности и эффективностиВ общем случае имеют место пять принципов конфликтного взаимодействия:антагонизм M K 1,2, J 1 J 2 ;бескоалиционное взаимодействие;коалиционное взаимодействие;кооперативное взаимодействие;иерархическое взаимодействие (с правом первого хода).Так как ММС, по определению, является системой равнозначных объектов (горизонтальныйнабор на рис. 2.1), то задачи с правом первого хода в данной работе не рассматриваются.Уже данное перечисление показывает, что свойства конфликтных взаимодействий робастны,так как позволяют делать здравые оценки эффективности в условиях неопределенности среды,неопределенности «активного партнера» и неопределенности цели с учетом характеранеопределенности и конфликтности.Как известно, в данных принципах конфликтного взаимодействия заложены трифундаментальных понятия теории игр: стабильность, эффективность и стабильноэффективный компромисс.Стабильность ММС – это обеспечение межобъектно-устойчивых (сбалансированных поэффективности объектов-подсистем ММС) процессов функционирования и проектированиямногообъектных структур на основе уравновешивания в условиях исходной структурнофункциональной несогласованности, конфликта и неопределенности взаимодействия.Эффективность ММС – это достижение максимального целевого качества объектов, коалицийи ММС в целом на основе устойчивого и рационального коалицианирования.По меткому замечанию Ю.Б.
Гермейера [83, 84]: «Классическая теория игр в части теориипринятия решений преждевременно и чрезмерно заформализована». Данный недостатоксказывается во многих приложениях, в которых, как правило, требуется комбинированиеуказанных принципов взаимодействия, что в свою очередь требует преодоления информационнотактических несостыковок данных подходов. Поэтому вопросы формирования компромиссов ещеполностью не сняты.10ПризнакПо принципуконфликтноговзаимодействия(МКН)КлассыАДИБДИКДИИДИКОДИПо степениконфликтностиС противоположнымиинтересамиС не противоположнымиинтересамиПо видуинформационнойситуацииОбъективнаяинформационнаяситуация (с полнойинформацией)Субъективная информационнаяситуация (изолированныеусловия, стохастические условияи т.д.)По видукомпромиссаСТЭК ММССТЭК ИСПо наличиюстратегийСтратегическиеНестратегическиеПо структурестратегийПо аппроксимациистратегийДинамическиеВ обратныхсвязяхПо аппроксимацииигрыДифференциальныеУчет факторовнеопределенностиНеопределенность средыПо виду решенияВ чистыхстратегияхПо числуповторенийПозиционныеПрограммнокорректируемыеВ нормальнойформеПараметризованныеМногошаговые: позиционные, навыживание, стохастические и т.д.Неопределенность«активногопартнера»В смешанныхстратегияхОднотактовый конфликт(без повторения)Неопределенность целиВ стратегияхповеденияМноготактовый конфликт(с повторениями)Рис.