Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 97
Текст из файла (страница 97)
и элементов СТЭК. Часть IVxixix41,12x41,17x3x1x1x20x2Возраств годах10050x30Рис. 12.3. Модель 1.01Возраств годах50100Рис. 12.4. Исходный гомеостаз(модель 1.05)xixi1,291,22x4x4x3x3x2x2x1Возраств годах050100Рис. 12.5. Модель 1.08 (СТЭК-2)050x1Возраств годах100Рис. 12.6. Модель 1.09 (СТЭК-7)Ситуация для СЕТО еще более улучшается (J 1СТЭК-2 < J 1СТЭК-7 < J 1ИГ ) вточке предельного СТЭК-2, где при сохранении темпа обмена веществ исходного гомеостаза ( Q2 = 1 ) и наилучшей по кислороду внешней среде( Q = 1, 2 ) продолжительность жизни увеличивается на 20 лет.12.5. ПОНЯТИЕ ПРЕДЕЛЬНОГО ЦЕЛЕВОГО КАЧЕСТВАИНТЕЛЛЕКТУАЛЬНОЙ ТЕХНИЧЕСКОЙ СИСТЕМЫНА ОСНОВЕ ОБОБЩЕННОЙ МОДЕЛИ ГОМЕОСТАЗАСовременное состояние управления сложными техническими системами порождает потребность к формированию положений кибернетики, которые равноправно объединяют технические и биологические аспектыуправления [46, 54, 215].Интеллектуальная техническая система [215] по своей функциональнойгибкости, благодаря встроенной динамической экспертной системе и биофизически подобным механизмам саморегуляции с использованием афферентного синтеза цели, эфферентной программе действия, акцептору действия, обратной афферентации, является технической средой, способнойвоспринять и реализовать предельное целевое качество на основе самосохранения в форме обобщенной модели гомеостаза.Глава 12.
Компенсационные процессы гомеостаза543Общий характер целей управления в подсистеме предельного целевогокачества связанных с самосохранением ИТС формируется следующим образом:1) цель первого порядка – обеспечение собственно функционированияИТС;2) цель второго порядка – поддержание гомеостаза (постоянство внутренних условий) и обеспечение стабильного хода основных процессов;3) цель третьего порядка – обеспечение обобщённых функций гомеостазадля реализации предельного целевого качества на основе целевых признаков ИТС при выполнении двух предыдущих целей.В соответствии со структурными схемами функциональной и интеллектуальной систем обстановочная афферентация с учётом памяти, прогноза и мотивации порождает на этапе афферентного синтеза цели двеструктурные обобщённые категории собственного состояния и окружающей среды.Каждая из категорий может быть достаточно полно описана системой(12.1) (оттоков-притоков «веществ» и энергий) с пятью векторными компартментамиx ic , x icp , i = 1,5системы и среды соответственно:x1c , x1cp – ресурсные процессы;x 2 c , x 2cp – вектора состояний динамических объектов;x 3c , x 3cp – информационные процессы притока и оттока информации;x 4 c , x 4cp – энергетические процессы;x 5c , x 5cp – «целевые» процессы (обновление и реализация целевых при-знаков в реальном времени).В общем случае описание собственного состояния или окружающейсреды формируется на основе системы (12.1), в соответствии с которойсумма размерностей, например, векторных компартментов системыx ij , i = 1, 4 ,=x ij∑ dimnj,j ∈ ( c, cp ) .(12.20)Формирование системы (12.1) на основе векторных компартментов составляет содержание отдельного исследования, поэтому прокомментируемнекоторые свойства системы.Так, ресурсные процессы связаны с динамикой ресурсов по режимамW(t), управлению U(t), энергии Y(t), возмущениям среды V(t) и т.п., гдеw ∈ W (t ); u ∈ U (t ); Y (t ) = ∑ yi ; v ∈V (t ) .При этом динамические процессы убывания и накопления ресурсовописываются в векторно-матричной форме:544Исследование стабильности, эффект.
и элементов СТЭК. Часть IVW==UY=V=f w (⋅),f u (⋅),f y (⋅),(12.21)f v (⋅).Энергетические процессы в простейшем случае описываются системой(12.22)x 4=w 4i (t ) + y 4i (t ) + f4i (⋅) ,iгде w j (t ) – темп расхода энергии, y j (t ) – энергетический поток, f j (⋅) –межкомпартментные функциональные связи.
В общем случае имеет местоописание энергетических процессов в системе и среде со взаимосвязями.Наиболее сложной и относительно новой является задача описания информационных потоков оттока и притока информации в системе, среде ипри их взаимодействии. Кроме высококачественных измерений речь может идти о методах принятия информационных решений реализуемых динамической экспертной системой, а также её настройке на методы управления в условиях неопределённости среды, взаимодействия, цели при разных степенях неопределённости.Векторный компартмент x 2 j (t ) состояний динамических объектовописывает состояние объекта управления, системы исполнения управления и т.п.
Свойство вектора состояний изменяется со временем, т.е. в общем случае имеет место набор моделей подсистем интеллектуальной системы. Аналогично активная окружающая среда может быть охарактеризована собственным вектором состояния с изменяющимся со временем составом. В типичном варианте имеет место относительная динамика взаимодействия, когда среда реализует возмущение v. Тогда векторный компартмент x 2c :(12.23)=x 2 c (t ) f ( x, u, w, v, y ), x 2 c ∈ X 2 .Область X 2 может иметь смысл непрерывной замкнутой области илисимплекса, что является ограничением на векторный компартмент.Если X 2 = X 2 (t ) , то можно характеризовать векторный компартментнекоторым допустимым ансамблем траекторий. С некоторыми дополнительными условиями могут быть сформированы геометрические характеристики данного компартмента по управляемости, достижимости, неопределённости.При применении биологических принципов управления следует упомянуть о специфике выработки управления и исполнения управления.Можно выделить две характерные особенности управления в живыхорганизмах.Во-первых, это нежесткость требований к поддержанию регулируемыхпараметров.
Если в стационарных режимах жизненно важные характери-Глава 12. Компенсационные процессы гомеостаза545стики организма поддерживаются постоянными, то в переходных процессах имеет место существенное снижение требований к постоянству. Организм имеет множество гомеостатических состояний, которые реализуютсяв зависимости от общей цели (отдых, активная деятельность и т.п.).Во-вторых, это одновременность привлечения в процессе управлениявсего доступного множества управляющих воздействий, с тем чтобы текущая нагрузка на каждую подсистему, канал была незначительной. В существенно нелинейных подсистемах организма это позволяет работать в«пределах зон линейности» каждой подсистемы.Прогресс в организации управления сложной системой мог бы пойтипо одному из двух возможных путей (см.
сноску 1 на стр. 528):• снижение «жёсткости» локальных требований и более свободное маневрирование ресурсами управления для достижения цели;• увеличение мощности воздействий с использованием ресурсов, жёсткораспределённых по каналам управления.Живой организм в ходе эволюции «пошёл» по первому пути, причёмплатой за это стала нетривиально сложная организация управления. Поэтому для построения технических систем на принципах гомеостатического управления потребуется создание структуры управления со следующими особенностями:• использование ресурсов управления в виде сложных синергических(добавочных) образований-реакций;• сложная структура целей управления.Каждая реакция характеризуется составом управляющих сил (т.е.включает часть полного вектора u).
Состав реакции определяетсяΛ = (λ1 ,..., λ m ), λ i ∈ [0,1] . Сама реакция описывается наборомuτ =[λ1u1 , λ 2u2 ,..., λ m um ](12.24)на интервале t ∈ [t0 , t0 + t] , где τ – продолжительность реакции.По причине сильной связанности физических процессов каждая реакция (12.24), предназначенная для коррекции одного из них, вызывает переходные процессы по всем переменным состояния x2 j .Суть использования синергических реакций управления состоит в том,чтобы при проведении коррекции j-го процесса не происходило нарушения других процессов (возмущения по координате xi должны лежать вдопустимых пределах).Последнее условие можно сформировать так:max ∆ xi >> max ∆ xi , i ≠ k ,(12.25)( t0 ,t0 +t+ vk )( t0 ,t0 +t+ vk )где vk – время последствия коррекции по k-му каналу.
Реализация реакциисодержит три этапа:Исследование стабильности, эффект. и элементов СТЭК. Часть IV546• входвреакцию,формированиекмоментуt0вектораτu =[λ1u1 , λ 2u2 ,..., λ m um ] , т.е. выбор амплитуды, состава и заданияxi (t0 ) ;• выполнение реализации, т.е. реализация процесса управления на интервале t ∈ [t0 , t0 + t] ;• выход из реакции, т.е. «дезинициация» управления и возвращение системы в должный режим.Векторный компартмент x 5 j системы компартментов формирует лишьполный набор признаков цели в данный момент времени, значимость каждого из которых в следующий момент времени меняется, либо учитываетсявозможность частичного обновления признаков цели в реальном времени.Свойствами полноты обладает следующий набор признаков цели: 1 эффективность (точность, быстродействие, степень чувствительности некоторых скалярных компонентов к возмущениям среды, качество исполнения управления, надёжность и др.), стабильность функционирования вусловиях неопределенности, материальные затраты, энергетические расходы, информационные потери.
Количественные показатели (12.7), введенные в соответствии с целевыми признаками, позволяют получить динамическое описание векторного компартмента целевых процессов (12.9),(12.15):xiс =f 0ic ( x, w, v, u) + Fic ,i=n + 1,..., n + r,x = f ( x, w, v, u) + F , i = n + r + 1,..., n + r + p.icp0icpicpПримерами показателей эффективности для системы и среды могутбыть:• по допустимой чувствительности:2 ∆ xj∆ xjJ1,c =− cij =− J1cp → min J1c ; min J1cp при> cij ; (12.26)u ,w∆vj ∆vj v• по синергическому качеству исполнения управления:∑ max ∆ xii ,i ≠ j [ t0 ,t0 +t+ v j ]J 2c =max∆ xk[ t0 ,t0 +t+ v j ]=− J 2cp → min J 2 c ; min J 2cp .nJОпустим в связи с очевидностью формирования показатель эффективности по точности и быстродействия.Показатели энергетических расходов системы и среды могут иметьвид:1См. Чумаков М.Н., Серебряный Е.Н.
Оценка эффективности сложных техническихустройств. – М.: Сов. радио, 1980. – 190 с.Глава 12. Компенсационные процессы гомеостазаT=J 3c2∫ ∆ wic dt → min J 3c ; J 3cp=u ,wt0547TJ 3cp ,∫ ∑i ∆ ni dt → minv2t0где ∆νi = νi − νi 0 , ∆wij = wij − wij 0 .Простейший процесс ввода и вывода показателей при текущей оптимизации может быть обеспечен следующим образом. Формируем показатель:J итс= ∑ αi (t ') J ic ; ∑ αi (t ') =1 , 0 ≤ αi (t ') ≤ 1;iJ ср=i1 ; 0 ≤ βi (t ') ≤ 1 ,∑ βi (t ') J icр ; ∑ βi (t ') =iiгде αi , βi – постоянные величины на «программном» такте ПКЗУt' ≤ t ≤T .На «программном» такте ПКЗУ определяется экспертное компартментное решение для применения в ИТС с учетом прогноза и действий среды,которое реализуется на [t',t''], где t '' ≤ t ≤ T – следующий «программный»такт.Изменение функций αi (t ), βi (t ) от такта к такту изменяет приоритетыпоказателей в реальном времени, обеспечивая ввод показателя, увеличениеего значимости и вывод.Производные по времени позволяют сформировать динамику целевыхкомпартментов ИТС и среды.Таким образом, формируется система (12.16).