Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 45
Текст из файла (страница 45)
Игровые подходы обогащают методы анализаохранительных свойств гомеостаза в условиях конфликта и неопределённости среды, а учёт целевых признаков позволяет сформировать предельное целевое качество ИС как обобщённое самосохранение.234Стабильные эффективные решения и компромиссы. Часть IВ общем случае, развивая точку зрения [179], можно утверждать, чтотермин самосохранения означает поддержание эффективной работоспособности системы и обеспечения её энергетическими, материальными иинформационными потоками, необходимыми для производственных процессов реального времени.Существенным элементом обеспечения самосохранения живых, технических и биотехнических систем является их ресурсная и алгоритмическаяизбыточность, которая у живых систем образовалась в ходе естественнойэволюции, а у технических – в ходе эпигенетического [179] развития сформированием в составе ИС экспертной подсистемы реального времени сразвитой базой знаний [215]. Избыточность позволяет достигать более высоких целей (оптимизационных, адаптационных, интеллектуальных и т.п.).Интеллектуальная техническая система [215] по своей функциональнойгибкости, благодаря встроенной динамической экспертной системе и биофизически подобным механизмам саморегуляции с использованием афферентного синтеза цели, эфферентной программе действия, обратной афферентации, является технической средой, способной воспринять и реализовать предельное целевое качество на основе самосохранения в формеобобщённого гомеостаза [216].Общий характер целей управления, связанных с самосохранением ИС,формируется в следующем порядке: обеспечение собственно функционирования ИС; поддержание гомеостаза и обеспечение стабильного хода основных процессов; обеспечение обобщенного гомеостаза для реализациипредельного целевого качества ИС.В соответствии со структурными схемами функциональной и интеллектуальной систем обстановочная афферентация с учётом памяти, прогноза и мотивации порождает на этапе афферентного синтеза цели двеструктурные обобщенные категории собственного состояния и окружающей среды.Каждая из категорий может быть достаточно полно описана системойс пятью компартментами системы и среды соответственно: ресурсныепроцессы, векторы состояний динамических объектов; информационныепроцессы притока и оттока информации; энергетические процессы; целевые процессы (обновление и реализация целевых признаков в реальномвремени).Система уравнений на пространстве компартментных состояний описывает совокупность процессов возникновения, перемещения, накопления,преобразования и элиминации некоторого набора веществ (материалов,продуктов, и т.п.), энергии и информации и имеет вид [179]nndxk(6.53)= ∑ ykj ( x, v ) − ∑ y jk ( x, v ) + yk 0 ( x, v ) − y0k ( x, v ) + wk ,dt=j 1 =j 1j ≠kгде k = 1, 2,…,n.j ≠kГлава 6.
Методы комбинирования решений235Модель (6.53) содержит n компартментов, каждому из которых отвечает одна переменная состояния x K . Вектор х = (х 1 , х 2 ,…,х n ) – вектор компартментного состояния системы; y Kj – темп транспортного потока вещества, энергии, информации из k-го компартмента в j-й; вектор ν = (ν 1 ,ν 2 ,…,ν m ) – вектор возмущений; вектор w = (w 1 , w 2 ,…,w n ) – вектор режимов протекания вещественно-энергетических процессов в компартментах,который может быть дополнен вектором управления u(t). Компартментыподразделяются на производственные w i (t) ≠ 0 и накопительные w i (t) = 0.В общем случае для учёта эффективности функциональных свойств иконкретизации оценок в ИС необходимо сформулировать общую цель эффективного самосохранения на естественном языке (явный вид), а если этоневозможно, то сформировать набор целевых признаков самосохранения(неявный вид).
Явный или неявный вид эффективного самосохранениянеобходимо формализовать вектором показателей, обладающим минимальной размерностью, независимостью свойств и полнотой описания (отражения) общей цели эффективного самосохранения.Векторный целевой компартмент системы компартментов формируетполный набор признаков цели в данный момент времени, значимостькаждого из которых в следующий момент времени меняется, либо учитывается возможность частичного обновления признаков цели в реальном времени.Свойствами полноты обладает следующий формализованный наборпризнаков цели: эффективность (точность, быстродействие, степень чувствительности некоторых скалярных компонентов к возмущениям среды,качество исполнения управления, надёжность), стабильность функционирования в условиях неопределённости среды, взаимодействия и цели, материальные затраты, энергетические расходы, информационные потери.Количественные показатели, введённые в соответствии с целевыми признаками, позволяют получить динамическое описание векторного компартмента целевых процессов.Общий вектор компартментного состояния принимает вид(6.54)x = (x 1 ,…, x n1 , x n1+1 ,…, x n , x n+1 ,…, x n+r , x n+r+1 ,…, x n+r+p ),где x l ,…,x nl – производственные компартменты, x nl+1 ,…,x n – накопительные компартменты, x n+l ,…,x n+r – целевые компартменты ИС, x n+r+l ,…,x n+r+p– целевые компартменты среды.Стабильно-эффективный обобщённый гомеостатический режим определяется следующим образом.
Пусть:а) в пространстве (ν, w) возмущений и управлений соответственно существует такая область Ω s (ν, w), что для всех точек (ν*, w*)∈Ω s существует стационарный режим вектора (6.54)(6.55)x*(ν*, w*) = const;Стабильные эффективные решения и компромиссы. Часть I236б) существует область Ω h (ν, w)∈Ω s (ν, w) такая, что в точке (ν*+∆ν,w*+∆w)∈Ω s (ν, w) в системе устанавливается новый стационарный режим х*+∆х с малой чувствительностью и малыми градиентами:∆xi∆v j∆xi∆wk∆xi∆v k<<x∈Ωh<<x∈Ωh<<x∈Ωh∆xi∆v k∆xi∆v j∆xi∆wk, i ∈ (1,..., n ), j ∈ (1,..., l ), l ≤ m ,(6.56), i ∈ ( n + 1,..., n + r ), k ∈ (1,..., n1 ) ,(6.57)x∉Ωhx∉Ωh, i ∈ ( n + r + 1,..., n + r + p ), k ∈ (1,..., l ), l ≤ m . (6.58)x∉ΩhПри этом условия (6.57), (6.58) по содержанию суть условия коалиционного равновесия [39] взаимодействующих системы и среды. Соотношения (6.55) – (6.58) составляют определение стабильно-эффективногообобщённого гомеостаза.
Обобщение состоит в развитии модели компенсаторных динамических свойств гомеостаза в соответствии с функциональными свойствами организма на основе игровых стабильноэффективных компромиссов, что обогащает механизмы обеспечения самосохранения ИС в подсистеме предельного целевого качества (ППЦК).Таким образом, в условиях неопределённости и активно действующейсреды в ИС имеет смысл формировать количественные методы с учётомявно взаимодействующих партнеров – системы и среды функционирования – при различных степенях их несогласованности и на основе стабильно-эффективных компромиссов [52].В связи с последними замечаниями алгоритмы СТЭК помещаются в базу знаний экспертной подсистемы ИС и применяются в качестве робастных алгоритмов управления ИС в условиях неопределенности и для обеспечения предельного целевого качества ИС в условиях активной средыфункционирования ИС.Глава 7.
Программно-корректируемое позиционное управлениеЧАСТЬ IIЗАДАЧИ УПРАВЛЕНИЯДВУХКОАЛИЦИОННЫМИ ММСНА ОСНОВЕ АНТАГОНИСТИЧЕСКОГО ЯДРА237238Задачи управления двухкоалиционными ММС. Часть IIГЛАВА 7ПРОГРАММНО-КОРРЕКТИРУЕМОЕСТАБИЛЬНО-ЭФФЕКТИВНОЕ ПОЗИЦИОННОЕ УПРАВЛЕНИЕНЕЛИНЕЙНОЙ ДИНАМИЧЕСКОЙ ДВУХКОАЛИЦИОННОЙСИСТЕМОЙ НА ОСНОВЕ ПРИНЦИПА«ЭКСТРЕМАЛЬНОГО ПРИЦЕЛИВАНИЯ» Н.Н. КРАСОВСКОГО7.1. СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПОДХОДОВК ИССЛЕДОВАНИЮ ДВУХКОАЛИЦИОННЫХ ММСВ УСЛОВИЯХ АНТАГОНИЗМА7.1.1.Обзор основных методов решения антагонистическихдифференциальных игрВ настоящее время в рамках теории и методов антагонистических дифференциальных игр можно среди других выделить ряд конструктивныхнаправлений:Понтрягина–Мищенко–Никольского–Летова–Баткова–Александрова–Иргера–Шараборова,атакжеБирюкова–Воронова–Карпенко–Карабанова–Маслова [3, 4, 23, 26, 27, 53, 60 – 66, 68, 112, 146, 156, 163,176, 177, 209 – 211, 242, 284, 420] на основе детерминированного и стохастического принципов максимума, общей стохастической постановки,а также комбинации принципа максимума и задач фильтрации;Айзекса–Беллмана–Андерсона–Леондеса, а также Воронова, Постникова [21, 22, 53, 71, 74, 269, 270, 310, 344, 350] на основе динамическогопрограммирования и анализа сингулярностей в нелинейных задачахуправления;Красовского–Субботина–Ченцова–Кейна–Батухтина, а также Ивановой–Воронова–Савина [15, 16, 67, 68, 70, 73, 75, 76, 88, 111, 117, 118, 126, 129– 132, 245] на основе экстремального прицеливания и анализа областей достижимости объектов;Глава 7.
Программно-корректируемое позиционное управление239Демьянова–Малоземова–Федорова [94, 250], посвященное исследованию необходимых и достаточных условий минимакса и максимина, аналитическим и численным методам поиска решений;Куржанского–Овсянникова [140, 184] на основе методов наблюдения иуправления ансамблем траекторий;Черноусько–Меликяна–Кима 1 [257, 258], посвященное исследованиюзадач гарантированного управления и поиска с перерывом поступленияинформации, элипсоидным оценкам и применению областей достижимости в условиях неопределенности, построению оптимальных по минимаксному критерию программных траекторий;Петросяна–Малафеева–Томского–Чистякова [198 – 201] на основе непрерывно-дискретных динамических игр, а также при неполноте информации;Лысенко–Леондеса [98, 310] на основе аналитического конструирования и нелинейного наблюдения;Гермейера [83] на основе методов поиска гарантирующих решений приисследовании операций; анализа условий образования коалиций, учетавлияния информации и т.д.Берковица–Флеминга [278, 279] на основе вариационных подходов кпоиску решений дифференциальных игр, выводу необходимых и достаточных условий существования ситуации равновесия;Брайсона–Хо [30] на основе обобщенной теории управления и динамической оптимизации.Значительны результаты Лейтмана, Фридмана, Пшеничного, Смольякова, Федосова, Кротова (см., например, 135, 236, 251, 313) и многих других.