Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (Воронов Е. М. Методы оптимизации управления многообъектными многокритериальными системами на основе стабильно-эффективных игровых решений (2001)), страница 6
Описание файла
PDF-файл из архива "Воронов Е. М. Методы оптимизации управления многообъектными многокритериальными системами на основе стабильно-эффективных игровых решений (2001)", который расположен в категории "". Всё это находится в предмете "оптимальное управление многообъектными многокритериальными системами (оуммс)" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 6 страницы из PDF
То есть изS ( x ( P,s ) ) =( )((следует∩ S xKK∈Ps j +1 ∈ S x Pj ,s j) ) , =j1,...,m − 1 ,S ( x ( Pm ,sm ) ) ⊂ W .Данная формулировка [39] расширяет обычное понятие динамическойигры. В обычных динамических играх – основная проблема в обмене информацией между участниками игры, а коалиции образуются по предписанным правилам или до начала игры. Обычная динамическая игра в нормальной форме соответствует одному шагу игры в определении 1.5.В рамках определения 1.1 можно сформировать, как частные случаи,определения бескоалиционных, коалиционных и кооперативных игр.Так, если зафиксировать во множестве коалиционных структур Pструктуру Р (или считать P = ∅ ), то на фиксированной структуре P ⊂ N(на N) коалиции (игроки) независимо друг от друга выбирают свои страте-()гии x K ∈ X K , K ∈ P xi ∈ X i ,i ∈ N .
Пусть предпочтения коалиций (игроков) представлены их функциями выигрыша J K ( J i ) на множестве ситуаций x ( P ) ( x ( i ) ) . Ситуации становятся исходами игры. Выбор стратегии( ) x K xiкоалицией K (игроком i) ограничивает множество исходов домножества стратегий( ) { ( x=) :x=S xKK'KK '∈P}( )Kx=, S x i( x ) : x x } .{=jij∈NiСтабильные эффективные решения и компромиссы. Часть I28Определение 1.6. Бескоалиционной игрой при фиксированном Р называется наборГ = N ,P,{ X K } ,{ J K } ,где Р–фиксированное разбиение,(1.5)J K = {J i }i∈KилиJ K = ∑ Jii J K=набор∑ αi J i ; ∑ αi= 1, 0 ≤ αi ≤ 1 , при отсутствии разбиения Р≠ ∅ –iГ = N ,{ X i } ,{ J i } .(1.6)Аналогичное описание коалиционной игры приводит к следующемуопределению.Определение 1.7.
Коалиционной игрой называется наборΓ= Ν , P, { X K }, {J K } ,K ∈ P ⊂ P (при любом множестве Р K ⊂ N ),=XKX i , J K ( x ) {J i ( x )}i∈K ,∏=i∈K(1.7)x∈ XN .Для получения определения кооперативной игры вводится характеристическая функция ν ( K ) , K ⊂ N , т.е. числовая функция, определенная намножестве 2 N всех подмножеств множества игроков N, ν ( ∅ ) =0 .Определение 1.8. Кооперативная игра на основе характеристическойфункции ν ( K ) с ν ( ∅ ) =0 моделирует распределение между игроками изN общего их выигрыша ν ( N ) согласно силе коалиции ν ( K ) и описывается наборомΓ = N , S ,{ X K }, = S x K , K , ( )где N = {1,...,N } ; S = {x = ( x1 ,...,x N ) : xi ≥ ν ( i ) ,X K= x ∈ S :∑ xi ≤ ν ( K ) ,( ) {( x )}, x=S xKKi∈KK(1.8)∑ xi = ν ( N )} ;K⊂N;∈ X K ; x y означает xi > yi , i ∈ K .KЧастный случай кооперативной игры может быть сформулирован наоснове векторной оптимизации.Определение 1.9 [32].
Кооперативной игрой называется наборГ = N , X , X ( N ) ,(1.9)Глава 1. Постановка задач проектирования и управления ММС29NNгде X ( N ) =J i ( x ) – множество си{x ( N )} = x ∈ X : max ∑ J i ( x ) =∑x∈X=i 1 =i 1туаций.И, наконец, в плане иерархических игр один или несколько игроковограничивают множество исходов остальных за счет права первого хода.Остальные игроки в зависимости от условий разыгрывают игру в рамкаходного из четырех классов игр. В работе Э.Н. Вайсборда, В.И. Жуковского[32] предложено следующее определение.Определение 1.10 [32].
Иерархической игрой называется набор(1.10)Г = N ,L,N L , X N , X N L ,где N – число игроков в игре, L – число игроков, имеющих право первогохода, N L – число координируемых игроков, X N = ∪ X i – общее множеi∈Nство стратегий, X N / L =∪ X i – множество стратегий координируемыхi∈N Lигроков.1.3. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ КОНФЛИКТНОЙ СИТУАЦИИ В ММСВ соответствии с определениями игры математическая модель конфликтной ситуации должна содержать четыре компоненты: математическая модель ММС с выбором описания и управляющих сил, векторныйцелевой показатель, характер коалиционных объединений и принцип конфликтного взаимодействия на основе стабильности и эффективности.
Далее последовательно раскрывается модель конфликтной ситуации в формедифференциальной игры в нормальной форме, когда выбор стратегий связан с выбором управлений, которые однозначно определяют исход в видезначения вектора показателей игры.1.3.1.Математическая модель ММС с выбором описанияи управляющих силМатематическое описание ММС. В качестве основного описанияММС принимается система динамико-алгебраических связей x д f=( t, x, q, u1 , , u N ) , x ( t0 ) x0 ; аax =бϕ ( t , x, q, u1 , , u N ) , x ∈ X ;(1.11)в= y y ( x , q, t ) , q ∈ Q ;г= u u ( t , x, y , q ) , u ∈ U ,(где N – число объектов в ММС; x = x д , x а) – вектор состояния ММС с xд– динамическими и x а – алгебраическими состояниями; X – множествоСтабильные эффективные решения и компромиссы. Часть I30состояний; y – вектор выхода ММС; u ∈ U – вектор управления ММС;q ∈ Q – вектор параметров ММС, которые характеризуют параметрическую неопределенность в (1.11а–в) и возможную параметризацию в(1.11г).Выражения (1.11) характеризуют динамические связи (а), алгебраические связи (б), вектор выхода (в) и функцию принятия решения и управления (г).
Управление(1.12)u ∈ U = U1 × ... × U N ,ui ∈ U i – подвектор управления i-м объектом ММС.Свойства правых частей (1.11а), (1.11б) типичные (см., например, реферат работы [32] в приложении к 1), в основном, это непрерывность идифференцируемость, а для (1.11а) – выполнение условий Липшица.О выборе управляющих сил. Как известно, существуют три основныхспособа задания управляющих сил:1) Вектор параметров q ∈ Q ;2) Программное управление u = u ( t ) ;3) Закон управления (или позиционное управление) u = u ( t,x ) , u ∈ U .Свойства управлений и множеств управлений варьируются, но типичные свойства можно найти, например в [32] (см.
реферат [32] в приложении к1). Наиболее желаемые свойства U – это свойства выпуклости и компактности (или слабой компактности) [121].Ввиду сложности краевых задач в ММС имеет смысл ориентироватьсяна комбинацию приближенных гибких вычислительных схем и классических оптимизационных структур управления, например, математическогопрограммирования и оперативного управления [203], с существенной параметризацией управляющих сил во временных интервалах их приложения.Поэтому, кроме трех указанных, рассматриваются следующие комбинации в представлении управляющих сил.4) Параметризированное векторное программное управление ui = {us }, где l s∑ q j f j ( t ) ; j =1s=us u= ls q , t q s f t 1 t − t , n = 1, 2,3,..., l − 1, ∑ j j ( ) j j −1 j =n(где q s=)( q ,…,q ) ∈ Q :s1slsus ∈ U s , U i = ∏ U s ; Qi = ∏ Qssрывные функции, заданные на отрезке1См.
сноску в п.1.2.[t0 ,T ](1.13а )(1.13б )f j ( t ) – непре-s(1.13а) или на отрезкеГлава 1. Постановка задач проектирования и управления ММС31t j −1 ,T (1.13б); 1 t j − t j −1 – интервал применения слагаемого управления us (1.13б)1 при t ∈ t j -1 , t j ;1 t j - t j-1 =0 при t ∉ t j -1 , t j ,при этом 1 t j − t j −1 = 1 t − t j −1 − 1 t − t j и t0 ,t1 ,...,t j −1 ,t j ,...,T – заданное разбиение отрезка [t0 ,T ] .Возможны обобщения (1.13а), (1.13б). Так, например, функции f j ( t )могут быть заданы отдельно для каждой скалярной компоненты us и принимают вид f js (t ) .
Для сохранения числа l интервалов параметризации(1.13б) на каждом отрезке [t j-1 ,T] достаточно (1.13б) представить в виде=usj (t )где tk= t j −1 + k ∆t ,l∑ q sjk f jks ( t )1[tk − tk −1 ],(1.13в)k =1T − t j −1∆=t.lЕсли управление (1.13а) непрерывное, то управление (1.13б) кусочнонепрерывное. Типичный частный вид последнего при f j (t) = 1 на [t0 ,T ]=us q1s 1[t1 − t0 ] + q2s 1[t2 − t1 ] + 2 + qls 1[T − tl −1 ] .{ ((1.14)5) Параметризованный закон управления (стратегия) ui = us q s , x, t l s ∑ q j f j ( x, t ) ; j =1s=us u= ls q , x, t q s f x, t 1 t − t ,) j j −1 ∑ j j ( j =1())}(1.15а )(1.15б )где q s ∈ Qs , us ∈ U s , f j ( x,t ) – заданные непрерывные функции.6) Программно-корректируемый закон управления (ПКЗУ) (стратегия)при заданном разбиении отрезка [t0 ,T ] с малым ∆t = t j − t j −1ui (=⋅)=us ( ⋅ )(){u (⋅)};slt )1 t j − t j −1 , tl∑ usj (x(t j −1 ),=T,(1.16)j =1где usj x ( t j −1 ) ,t = usj ( t ) – допустимое программное управление us ∈ U sj32Стабильные эффективные решения и компромиссы.
Часть I( )на отрезке t j −1 ,T при известном начальном условии x t j −1 и реализуемое на t ∈ t j −1 − t j .Замечание 1.2. Данный ПКЗУ отличается от кусочно-программнойстратегии Л.А. Петросяна [199]=usl∑ us j ( t )j =11[t j − t j −1 ],где usj ( t ) – программное управление на t j −1 ,t j при фиксированном зна-чении x ( t j −1 ) .7) Параметризованный ПКЗУ, который получается на основе комбинации4 и 6, например, в виде (1.16), где() ∑qusj =x ( t j −1 ) , tpk =1sjk1[tk − tk −1 ](1.17)с разбиением t j −1 ,t1 ,...,tk −1 ,tk ,...,T на отрезке t j −1 ,T при фиксирован-ном x ( t j −1 ) .При параметризации управления и дискретизации временного интервала [t0 ,T ] возникает вопрос о степени приближения исходной задачи, полученной задачей с аппроксимацией управляющих сил.
Допустимостьприближений опирается на ряд фундаментальных факторов и некоторыхусловий.Во-первых, в точной задаче рассматривается, как правило, класс управлений с конечным числом точек разрыва первого рода, к которым принадлежат и аппроксимированные управления.Во-вторых, существенным является свойство сжатия функциональнойсвязи показателей с управляющими силами, когда ограниченным структурным изменениям управляющих сил соответствует малое изменениезначений показателей.
Данное свойство грубости часто имеет место в задачах управления.В-третьих, очевидно, что при сведении исходной задачи к конечномерной задаче нелинейного программирования результат уточняется приопределенном увеличении размерности вектора параметров. В этом случаеконтролируемые приближения для некоторых классов систем могут бытьобеспечены, например, на основе спектральных методов развитых в работах В.В. Солодовникова, В.В. Семенова, А.Н. Дмитриева, Н.Д.
Егупова идругих [см., например, работу А.И. Трофимова, Н.Д. Егупова, А.Н. Дмитриева. Методы теории автоматического управления. – М.: Энергоатомиздат, 1997. – 654 с.]. Следует также отметить, что параметризация управляющих сил позволяет на основе параметрических сетей, например [238],Глава 1. Постановка задач проектирования и управления ММС33преодолевать возрастающие трудности глобальной оптимизации в многокритериальных задачах, приближенно оценивать существование и единственность решения и назначать начальное приближение для локальногопоиска точного решения. В этом случае методы и алгоритмы приобретают,по меньшей мере, двухэтапную структуру.