Диссертация (785777), страница 19
Текст из файла (страница 19)
Набор P , осуществляющий "-покрытие области RXU , будем называть "-информативнымили, для краткости, просто информативным.P обладает "-информативностью, это означает, что для любойнайдется хотя бы один пример pi 2 P , являющийся для данной парыЕсли обучающий наборпарыhx; ui 2 RXU"-представителем.Применительно к "-покрытию (2.29) областиRXU могут быть сформулированы следую-щие две задачи:Np в обучающем наборе, найти их распределение в областиRXU , минимизирующее погрешность ".1. Задано число примеров2. Задана допустимая величина погрешности ", сформировать минимальную по числуNpсовокупность примеров, обеспечивающую получение такого значения ".2.3.2.3 Пример прямого формирования обучающего набораПрямое формирование обучающего набора, предназначенного для синтеза НС-модели ДС,а также регулятора для этой системы, рассмотрим на примере задачи корректировки динамических свойств объекта управления [173].1.
Пусть рассматриваемый объект управления (ОУ) представляет собой динамическую систему, описываемую векторным дифференциальным уравнением вида [50, 51]:x_ = '(x; u; t) :(2.30): : : xn ) 2 Rn — вектор переменных состояния ОУ; u = (u1 u2 : : : um ) 2 Rm— вектор переменных управления ОУ; Rn ; Rm — евклидовы пространства размерности n иm, соответственно; t 2 [t0 ; tf ℄ — время.В уравнении (2.30) '() представляет собой нелинейную векторную функцию векторныхаргументов x, u и скалярного аргумента t.
Она считается заданной и принадлежащей некото-Здесь x = (x1 x2рому классу функций, допускающему существование решения уравнения (2.30) при заданныхx(t0 ) и u(t) в рассматриваемой части пространства состояний ОУ.98На поведение ОУ, определяемое его динамическими свойствами, можно воздействовать,u(x; u ). Операцию формирования требуемого значения u(x; u ) для некоторого момента времени ti+1 позначениям вектора состояния x и командного вектора управления u в момент времени tiзадавая то или иное корректирующее значение управляющей переменнойu(ti+1 ) = (x(ti ); u (ti ))(2.31)будем выполнять в устройстве, которое назовем корректирующим контроллером (КК). Будем() в (2.31) определяется составом и значениями компонент некоторого вектора параметров w = (w1 w2 : : : wNw ): Совокупность (2.30), (2.31) изсчитать, что характер преобразованияОУ и КК именуется далее управляемой системой.Поведение системы (2.30), (2.31) с начальными условиями x0= x(t0 ) под воздействиемu(t) — это многошаговый процесс, если считать, что значения этого процессаx(tk ) наблюдаются в моменты времени tk :управленияfx(tk )g ; tk = t0 + kt ;k = 0; 1; : : : ; Nt ; t =tfNtt0:(2.32)В задаче (2.30), (2.31) в качестве обучающего примера, вообще говоря, можно было быиспользовать паруh(x(0э); u(э) (t)); fx(э)(tk ) ; k = 0; 1; : : : ; Nt gi ;(x(0э) ; u(э) (t)) есть начальное состояние системы (2.30) и формируемый закон управления, соответственно, а fx(э) (tk ) ; k = 0; 1; : : : ; Nt g — многошаговый процесс (2.32), который(э)должен реализовываться из данного начального состояния x0 под воздействием некоторогоуправления u(э) (t) на интервале времени [t0 ; tf ℄.
Сравнивая процесс fx(э) (tk )g с процессомfx(tk )g, получаемым для тех же самых начальных условий x0(э) и управления u(э) (t) фактически, т. е. для некоторым образом фиксированного значения параметров w , можно было быгдетем или иным способом определять расстояние между требуемым и фактически реализуемым процессами, а затем пытаться его минимизировать, варьируя значения параметровw.Такого рода «прямолинейный» подход ведет, однако, к резкому росту объема вычислений наэтапе обучения НС и, в особенности, на этапе формирования соответствующего обучающегонабора.2. Существует, однако, возможность резко снизить указанные объемы вычислений, есливоспользоваться тем фактом, что состояние, в которое перейдет система (2.30), (2.31) за времяt = ti+1ti , зависит только от ее состояния x(ti ) в момент времени ti , а также от99u(ti ) управляющего воздействия в тот же самый момент времени.
Это обстоятельство дает основание заменить многошаговый процесс fx(э) (tk )g, k = 0; 1; : : : ; Nt , набором изNt одношаговых процессов, каждый из которых состоит в выполнении для системы (2.30),(2.31) одного шага по времени длиной t из некоторой начальной точки x(tk ).значения3. Для того, чтобы получить совокупность начальных точек xt (t0 ); ut (t0 ), полностью характеризующую поведение системы (2.30), (2.31) на всей области допустимых значений RXUX U; x 2 X; u 2 U , построим соответствующую сетку.Пусть переменные состояния xi ; i = 1; : : : ; n в уравнении (2.30) принимают значения издиапазонов, определенных для каждой из них:6 xi 6 xmaxi ; i = 1; : : : ; n :xminiАналогичные неравенства имеют место для управляющих переменных(2.30):uminjЗададим на этих диапазонах сетку(2.33)uj ; j = 1; : : : ; m в6 uj 6 umaxj ; j = 1; : : : ; m :(2.34)f(i) ; (j)g:(i) : x(isi ) = xmini + si xi ; i = 1; : : : ; n; si = 0; 1; : : : ; Ni ;(j ) : u(jpj ) = uminj + pj uj ;j = 1; : : : ; m; pi = 0; 1; : : : ; Mj :(2.35)В выражениях (2.35) обозначено:xi =uj =xmaxiNixmini; i = 1; : : : ; n ;umaxuminjj; j = 1; : : : ; m :MjNi — число отрезков, на которое делится диапазон значений для переменной состояния xi ; i = 1; : : : ; n ; Mj — число отрезков, на которое делится диапазонзначений для управляющей переменной uj ; j = 1; : : : ; m.(s ) (p )(s )Узлы данной сетки — это кортежи длиной (n + m) вида hxi i ; uj j i, где компоненты xi i ,i = 1; : : : ; n, берутся из соответствующих (i) , а компоненты u(jpj ) , j = 1; : : : ; m — из (j ) в(2.35).
Если область RXU является подмножеством декартова произведения X U , то этотЗдесь же обозначено:факт может быть учтен путем исключения «лишних» кортежей из сетки (2.35).4. В [173] рассмотрен пример решения задачи НС-моделирования, в которой обучающийнабор формировался согласно представленной выше методике. Исходная модель движения в100этом примере представляет собой систему уравнений следующего вида:m(V_ y + Vx !z ) = Fy ;Iz !_ z = Mz ;(2.36)где Fx , Fy — проекции всех сил, действующих на самолет, на осиOx и Oy , соответственно;Mz — проекция всех моментов, действующих на самолет, на ось Oz ; !z — угловая скоростьтангажа; m — масса самолета; Iz — момент инерции самолета относительно оси Oz ; Vy —проекция вектора скорости самолета на ось Oy .
Система уравнений (2.36) замкнута, так какугол атаки , входящий в выражения для Fy и Mz , будет равен в рассматриваемом случае(прямолинейный горизонтальный полет) углу тангажа #, который связан с Vy следующейкинематической зависимостью:Vy = V sin # ;где V — скорость полета.В (2.36) значение момента тангажа Mz является функцией от управляющей переменной —угла отклонения цельноповоротного стабилизатора, т. е.Mz = Mz ('ст ).Таким образом, система уравнений (2.36) описывает переходные процессы по угловойскорости и углу тангажа, которые возникают сразу же после нарушения балансировки, соответствующей установившемуся горизонтальному полету.Итак, в рассматриваемом конкретном случае состав переменных состояния и управлениябудет следующим:x = [Vy !z ℄T ; u = ['ст℄ :(2.37)В терминах задачи (2.36) при аппроксимации математической модели объекта управлениянеравенства (2.33) принимают вид:6 Vy 6 Vymax;!zmin 6 !z 6 !zmax ;(2.38)6 ' 6 'max ;(2.39)Vyminнеравенство (2.34) запишется как'стminстста сетка (2.35) переписывается в форме:(sVy )(Vy ) : Vy= Vymin + sVy Vy ; sVy = 0; 1; : : : ; NVy ;(!z ) : !z(s!z ) = !zmin + s!z !z ; s!z = 0; 1; : : : ; N!z ;('ст ) : '(стp) = 'minст + p'ст 'ст ; p'ст = 0; 1; : : : ; M'ст :101(2.40))Vy)Vy')T'z)TzРИС.
2.26. Фрагмент сетки— целевая точка сетки;соответственно;f(Vy ) ; (!z )gVy , !zпри'ст= onst: Æ — стартовыйузел сетки;— шаг сетки по переменным состоянияVyи!z ,Vy , !z0 — смещение целевой точки по отношению к породившему ее0узлу сетки.5. Как уже отмечалось выше, каждый из узлов сетки (2.35) используется в качестве начального значения x0= x(t0 ), u0 = u(t0 ) для системы уравнений (2.30); с этими начальнымизначениями выполняется один шаг интегрирования величиной t.
Указанные начальные значения x(t0 ), u(t0 ) составляют входной вектор в обучающем примере, а полученное значениеx(t0 + t) — целевой вектор, т. е. вектор-образец, показывающий алгоритму обучения НСмодели, каким должно быть значение выхода НС при данных стартовых условиях x(t0 ), u(t0 ).Формирование обучающего набора для решения задачи нейросетевой аппроксимации динамической системы (2.30) (в частности, в ее конкретном варианте (2.36)) является нетривиальной задачей. Как показал вычислительный эксперимент [173], сходимость процесса обучения весьма чувствительна к шагу сеткиxi ; uj и шагу по времени t.Поясним это положение на примере системы (2.36), когдаx1 = Vy ; x2 = !z ; u1 = 'ст :Изобразим, как это показано на рис. 2.26, часть сетки f(Vy ) ;(!z ) g, узлы которой исполь-зуются в качестве начальных значений (входная часть обучающего примера) для полученияцелевой части обучающего примера.
На рис. 2.26 узел сетки показан кружком, а крестиком —состояние системы (2.36), полученное интегрированием ее уравнений за шаг времени(i) (j )(k)начальными условиями (Vy ; !z ), для фиксированного положения стабилизатора 'ст .t сВ серии вычислительных экспериментов было установлено, что при t = onst условиями1021510, град/с5ωz0510153025201510РИС. 2.27. Графическое изображение сетки5V , м/сy051015f(Vy ) ; (!z ) g при 'ст = onst, совмещенной сцелевыми точками; данный лист сетки построен при'ст =80.сходимости процесса обучения НС будут следующие:Vy (t0 + t) Vy (t0 ) < Vy ;!z (t0 + t) !z (t0 ) < !z ;(2.41)Vy ; !z — шаг сетки (2.40) по соответствующим переменным состояния для заданногофиксированного значения 'ст .(p)Сетка f(Vy ) ; (!z ) g, построенная для некоторой фиксированной точки 'ст из ('ст ) , гра-гдефически может быть изображена так, как это показано на рис. 2.27.