Автореферат (785776), страница 4
Текст из файла (страница 4)
Их возможности, однако, ограничиваются тем, что правилоCS , т. е. «законуправления» системы C S, не изменяется в процессе ее функционирования. Однако если область возможных значений факторов неопределенности ДС «достаточно велика», возникаетситуация, когда с помощью единственного закона управления нельзя обеспечить требуемыйуровень качества управления при любых допустимых значениях факторов 2 . Возника-ет потребность воздействовать в процессе функционирования на вид закона управления ДС.Системы A S, обладающие такого рода свойством, именуются адаптивными.
В системе A SAS для модификации правила AS , а также множество целей AS , направляющих работу правила AS .Однако у систем A S правило AS фиксировано при создании системы. Выбор этого правилапо сравнению с традиционной управляемой системой C S добавляется правилоосуществлялся, исходя из целей, на достижение которых ориентировалась создаваемая ДС.Следовательно, поведение системы A S будет адекватным до тех пор, пока цели, поставленные перед ней и зафиксированные, остаются адекватными меняющейся ситуации. В среде свысоким уровнем неопределенности изменение ситуации может быть таким, что повлечет засобой необходимость привлечения высшего уровня адаптации — адаптации целей.
Но системы класса A S этого делать не могут, так как у них отсутствует механизм корректировки целейAS . Системы IS, обладающие таким механизмом, будем именовать интеллектуальными. Посравнению с A S в состав IS добавилось правило IS , описывающее способ порождения целей 2 , т. е. способ изменения множества целей .Во второй главе излагается нейросетевой подход к задачам моделирования и управления систем. Формируется подход к реализации трех основных элементов процесса синтезаНС-моделей: построение потенциально богатого класса моделей, который содержит формируемую НС-модель; получение информативного набора данных, требуемого для структурнойкорректировки и параметрической настройки формируемой НС-модели; построение алгоритмов обучения, осуществляющих структурную корректировку и параметрическую настройкуформируемой НС-модели.В качестве гибкого инструмента формирования моделей ДС перспективным является порождающий подход, широко используемый в прикладной и вычислительной математике, раз13x = (x1 , .
. . , xN );x1xnψ1 (x, w(ψ) )v = (v1 , . . . , vK );v1ϕ1 (v, w(ϕ) )u = (u1 , . . . , uM )u1ujψk (x, w(ψ) )ϕj (v, w(ϕ) )ψK (x, w(ψ) ) vKϕM (v, w(ϕ) ) uMθ(u, wθ )yy = θ(u1 , . . . , uj , . . . , uM , w(θ) )uj = ϕj (v1 , . . . , vk , . . . , vK , w(ϕj ) )vk = ψk (x1 , . . . , xi , . . . , xN , w(ψk ) )j-я базисная функция:uj = ϕj (v1 , . . . , vK , w(ϕj ) ) == ϕj (ψ1 (x1 , .
. . , xN , w(ψ1 ) ), . . . , ψK (x1 , . . . , xN , w(ψK ) ), w(ϕj ) )РИС. 1. Многоуровневое настраиваемое функциональное разложениевитый в диссертации с привлечением идей НС-моделирования. В рамках порождающего под-y (x) традиционно представляют в виде линейной комбинациибазисных функций 'i (x); i = 1; : : : ; n:хода искомую зависимостьy (x) = '0 (x) +nXi=1i 'i (x); i 2 R:(4)f'i(x)g; i= 1; : : : ; n будем именовать функциональным базисом (ФБ), аконструкцию вида (4) — разложением функции y (x) по функциональному базису f'i (x)gni=1 .Формирование разложения по ФБ путем варьирования настраиваемых параметров i будетНабор функцийрассматриваться далее как средство порождения решений, при котором каждой конкретнойкомбинации значений параметров i соответствует свое решение.
Функциональным разложениям можно дать сетевую трактовку, позволяющую выявить общие черты и различия междуих отдельными вариантами, а также обеспечивающую простой переход к НС-моделям.Для разложений вида (4) возможность получить модель с обобщающими свойствами,адекватными решаемой прикладной задаче, существенно ограничивается их одноуровневойструктурой и негибким базисом. Для преодоления этих недостатков следует построить модель, обладающую требуемой изменчивостью порождаемых вариантов за счет использованиямногоуровневой сетевой структуры и подходящей параметризации ее элементов.14На рис. 1 показано, как может быть построено многоуровневое настраиваемое функциональное разложение.
Здесь настройка разложения осуществляется не только путем варьирования коэффициентов линейной комбинации, как в разложениях типа (4). Теперь параметризованными являются и элементы ФБ, т. е. по ходу решения задачи ФБ подстраивается так,чтобы получить модель ДС, приемлемую в смысле критерия (1). Переход от одноуровневого разложения к многоуровневому состоит, как видно из рис.
1, в том, что каждый эле-j = 1; : : : ; M подвергается разложению по некоторому ФБ f k (x; w )g; j =1; : : : ; K . Аналогичным образом можно построить разложение элементов k (x; w ) еще помент 'j (v; w' );какому-либо ФБ и так далее, требуемое число раз, что дает сетевую структуру с необходимым числом уровней, а также обеспечивает параметризацию элементов ФБ. В терминахx(out) = (x(in) ) nв m-мерный выходной вектор x(out) .
Отображение форми-сетевой модели отдельный нейрон как модуль НС — это отображениемерного входного вектораx(in)руется как композиция следующих отображений-примитивов: 1) набор входных отображенийfi (x(iin) ); fi : R ! R; 2) сжимающее отображение («входная звезда») '(u1 ; : : : ; un); ' : Rn !R; 3) преобразователь (v); : R ! R; 4) выходное отображение («выходная звезда»)E (m) (y ); E (m) : R ! Rm . В диссертации показано, что эти четыре класса отображенийпримитивов достаточны в качестве исходной базы НС-моделирования.
Число конкретных видов примитивов в этих классах сравнительно невелико, а классы открыты для изменений ихсостава. Показано также, что для комбинирования примитивов, образующих элементы НСмодели, а также для объединения этих элементов в НС-модели достаточно единственногоправила, которым является композиция отображений.Второй составной элемент процесса формирования НС-моделей из трех, упомянутых выше, это получение обучающего набора, обладающего требуемым уровнем информативности.Этот элемент является критически важным, так как если какие-то особенности динамики (поведения) ДС не нашли отражения в обучающем наборе, то они, соответственно, не будут воспроизводиться моделью.
В диссертации вводится понятие информативности обучающего набора, позволяющее формализовать процесс его получения для обеспечения требуемого уровняобобщающих свойств НС-модели. Показано также, что доминирующим вариантом формирования обучающего набора для НС-модели является непрямой подход, в котором, вместопрямой дискретизации области допустимых значений переменных состояния и управления,как это имеет место в прямом подходе, используются данные, получаемые путем формирования и использования совокупности тестовых управляющих воздействий на ДС.
При таком15(x(t); u(t)) складывается из программного (тестовыйманевр) движения (x (t); u (t)), порожденного управляющим сигналом u (t), а также движения (~x(t); u~(t)), порожденного добавочным возмущающим (возбуждающим) воздействиемu~(t), формируемого в виде x(t) = x (t) + x~(t); u(t) = u (t) + u~(t). Вид тестового маневра(x (t); u (t) определяет получаемые диапазоны изменения значений переменных состоянияи управления, а вид возмущающего воздействия u~(t) определяет разнообразие примеров вподходе действительное движение ДСпределах этих диапазонов.
На практике используется значительное число типовых тестовыхвозмущающих сигналов. В диссертации показано, что наиболее эффективным из них является входное воздействие для каждого изm органов управления ДС, формируемое как суммагармонических сигналов, каждый из которых обладает своим собственным сдвигом по фазе'k . Входной сигнал uj , отвечающий j -му органу управления, имеет вид:uj=Xk2IkAk os 2ktT+ 'k ; j = 1; : : : ; m; Ik K; K = f1; 2; : : : ; M g;(5)M — общее число гармонически связанных частот; T — промежуток времени, в течениекоторого на ДС действует тестовый возбуждающий сигнал; Ak — амплитуда k -й синусоидальной компоненты.
Если фазовые углы 'k в (5) выбрать случайным образом в интервале[ ; ℄, то гармонические компоненты в сумме могут дать в отдельных точках t(i) значениеамплитуды суммарного сигнала uj (i) такое, что будут нарушены условия близости возмугдещенного движения к опорному. Это нежелательно, поскольку исследуемая ДС может поддействием такого входного сигнала уклониться от опорного движения на недопустимую величину. Сдвиг по фазе'k в (5) надо подобрать для каждой из гармонических компоненттаким образом, чтобы обеспечить небольшое значение пик-фактора (амплитудного фактора)qTPF(uj ), определяемого соотношением: PF(uj ) = (umaxuminjj )=2 (uj uj )=N . Для отдельнойpсинусоидальной компоненты в (5) значение пик-фактора равняется PF = 2, тогда значениеpотносительного пик-фактора определяется как RPF(uj ) = PF(uj )= 2.
Минимизация показателя RPF(uj ) путем подбора соответствующих значений фазового сдвига 'k для всех kпозволяет предотвратить возникновения ситуации, упомянутой выше. В главе 2 дается соответствующий алгоритм для выполнения этой операции.Третий составной элемент процесса формирования НС-моделей — комплекс средств дляих обучения, т. е.
для структурной корректировки и параметрической настройки. Динамические НС-модели представляют собой сложный для обучения объект. В число основныхисточников трудностей при обучении НС-моделей динамических систем входят:161. Бифуркация динамики сети, т. е. качественное изменение динамических свойств и характера поведения НС-модели при малых изменениях ее настраиваемых параметров.2. Проблема долговременных зависимостей, обусловленная тем, что выход НС-моделизависит от ее входов и состояний в предыдущие моменты времени, что приводит к потереработоспособности обучающих алгоритмов градиентного типа.3.
Очень сложный рельеф функции ошибки, изрезанный многочисленными глубокими,узкими и искривленными впадинами, а также имеющий часто встречающиеся плато.Третья причина из данного перечня является наиболее сложной с точки зрения парирования ее влияния на процесс обучения НС-модели. Фактором, порождающим данную проблему,является объем обучающего набора, определяющий потребное число рекуррентных повторений. При этом лишь для небольшого набора начальных значений параметров сети удаетсянайти глобальный минимум функции ошибки с помощью градиентных методов оптимизации, т.