Диссертация (785777), страница 20
Текст из файла (страница 20)
Здесь же изображены(крестиками) и соответствующие целевые точки для каждого из узлов сетки. Совокупность(p)(«пачка») таких изображений, каждое для своего значения 'ст 2 ('ст ) , дает важную информацию о структуре обучающего набора для системы (2.36), позволяя, в ряде случаев, резкосократить объем данного набора.6. Теперь, после того как сформирована сетка (2.35) (или (2.40), для случая продольного короткопериодического движения), можно построить соответствующий обучающий набор,103после чего решать задачу обучения сети с учителем.
Такая задача была решена в [173]. Полученные в этой работе результаты показывают, что на задачах небольшой размерности (определяемой размерностями векторов состояния и управления, а также величиной области допустимых значений компонент этих векторов) прямой метод формирования обучающих наборовможет быть успешно использован.2.3.2.4 Оценка объема обучающего набора при прямом подходе к его формированиюОценим объем обучающего набора, получаемый при прямом подходе к его формированию.Рассмотрим вначале наиболее простой вариант прямого одношагового метода формированияобучающего набора, т.
е. такого, в котором реакция ДС (2.25) в момент времени tk+1 зависитот значений переменных состояния и управления (2.24) только в момент времени tk .Рассмотрим данный вопрос на конкретном примере, связанном с задачей, которая решается в разд. 3 (формирование НС-модели продольного короткопериодического движения маневренного самолета). Исходная модель движения в виде системы обыкновенных дифференциальных уравнений записывается следующим образом:qSg_ = !zCya (; !z ; ') + os # ;mVVqSbA!_ z =m (; !z ; ') ;Jzz zT 2 ' = 2T '_ ' + 'at ;(2.42) — угол атаки, град; # — угол тангажа, град; !z — угловая скорость тангажа, град/с;' — угол отклонения управляемого стабилизатора, град; Cya — коэффициент подъемной силы; mz — коэффициент момента тангажа; m — масса самолета, кг; V — воздушная скорость,м/с; q = V 2 =2 — скоростной напор; — плотность воздуха, кг/м3 ; g — ускорение силы тяжести, м/с2 ; S — площадь крыла, м2 ; bA — средняя аэродинамическая хорда крыла, м; Jzzгде— момент инерции самолета относительно боковой оси, кгм2 ; безразмерные коэффициентыCya и mz являются нелинейными функциями своих аргументов; T; — постоянная времении коэффициент относительного демпфирования привода, 'at — командный сигнал на привод цельноповоротного управляемого стабилизатора (ограничивается 25Æ ).
В модели (2.42)величины , !z , ' и '_ — это состояния объекта управления, величина 'at — управление.Проведем дискретизацию рассматриваемой ДС так, как это было описано в предыдущемразделе. При этом для уменьшения размерности задачи будем учитывать только переменные104, !z и 'at , непосредственно характеризующие поведение рассматриваемой ДС, а переменные ' и '_ будем считать «скрытыми».Если считать зависимости для ' и '_ «скрытыми», то для оставшихся переменных ,!z и 'at зададим величины N ; N!z ; M'at , представляющие собой число отсчетов по этимпеременным. В предположении, что допустимыми будут все комбинации значений этих пе-N = N N!z M'at , т.
е. число примеров в задачнике для различныхзначений числа отсчетов N ; N!z ; M'at составит (для простоты будем считать, что N =N!z = M'at = N ):ременных, величинаN = 20 : 20 20 20 = 8000;N = 25 : 25 25 25 = 15625;(2.43)N = 30 : 30 30 30 = 27000:Если в формируемой модели ДС требуется учитывать не только переменные , !z и 'at ,но и' и '_ , то оценки объема получаемых обучающих наборов принимают вид:N = 20 : 20 20 20 20 20 = 3200000;N = 25 : 25 25 25 25 25 = 9765625;(2.44)N = 30 : 30 30 30 30 30 = 25200000:Как видно из этих оценок, с точки зрения получаемого объема обучающего набора приемлемыми являются только варианты, относящиеся к ДС с векторами состояний и управленийнебольшой размерности и с умеренным числом отсчетов по этим переменным (первый и второй варианты в (2.43)).
Даже небольшое увеличение значений этих параметров приводит, какэто видно из (2.44)), к неприемлемым значениям величины обучающего набора.В серьезных прикладных задачах, где возможности НС-моделирования особенно востребованы, результат получается еще более впечатляющим.В частности, в полной модели углового движения самолета (соответствующая НС-модельдля этого случая рассматривается в разд. 6.2) 14 переменных состояния и 3 управляющихпеременных, следовательно объем обучающего набора для нее при прямом подходе к егоформированию и при NVy = N!z = M'ст = 20 будет составлять N = 2017 = 2 1018 , что,разумеется, совершенно неприемлемо.Таким образом, прямой подход к формированию обучающих наборов для моделированияДС имеет очень небольшую «нишу», в которой возможно его применение — простые задачиневысокой размерности.
Более сложные задачи, имеющие, соответственно, более высокую105размерность, требуют другого подхода к формированию обучающих наборов. Им являетсянепрямой подход, основанный на формировании и использовании специальным образом организованных тестовых управляющих воздействий на ДС. Он рассматривается в следующемразделе. У непрямого подхода имеются как достоинства, так и недостатки. В ряде случаев ему нет альтернативы, в первую очередь, в ситуациях, когда получение и использованиеобучающих данных требуется организовать в реальном или даже в опережающем времени.Однако когда нет жестких временны̀х ограничений на получение и использование обучающихданных, наиболее целесообразным оказывается смешанный подход, представляющий собойкомбинацию прямого и непрямого подхода.2.3.3 Непрямой подход к формированию обучающих наборовдля НС-моделирования динамических систем1.
Непрямой подход, как отмечалось в предыдущем разделе, вместо прямой дискретизации областиRX;U допустимых значений комбинаций переменных состояния и управления,основан на данных, получаемых путем формирования и использования совокупности специальным образом организованных тестовых управляющих воздействий на ДС.(x(t); u(t)) складывается из программного (тестовый маневр) движения (x (t); u (t)), порожденного управляющим сигналом u (t),а также движения (~x(t); u~(t)), порожденного добавочным возмущающим воздействием u~(t):При таком подходе действительное движение ДСx(t) = x (t) + x~(t); u(t) = u (t) + u~(t):(2.45)В качестве примеров тестовых маневров можно назвать такие, как:прямолинейный горизонтальный полет с постоянной скоростью;полет с монотонно увеличивающимся углом атаки;разворот в горизонтальной плоскости;восходящая / нисходящая спираль.Возможные варианты тестовых возмущающих воздействийu~(t) рассматриваются ниже.(x (t); u (t) в (2.45) определяет получаемые диапазоны изменения значений переменных состояния и управления, вид возмущающего воздействия u~(t) —Вид тестового маневраразнообразие примеров в пределах этих диапазонов.106ξ(t)x(t0 )F (x(t), t)x(t0 )x(t)(a)F (x(t), ξ(t), t)x(t)(b)РИС.
2.28. Неуправляемая динамическая система: (a) — без внешних воздействий; (b) —с внешними воздействиями2. Каким обучающий набор должен быть в идеальном варианте и каким он может бытьполучен в реальности при непрямом подходе к его формированию? Рассмотрение данноговопроса выполним в несколько этапов, начиная с наиболее простого варианта ДС с последующим его усложнением.Рассмотрим вначале более простой случай неуправляемой ДС (рис. 2.28).Пусть имеется некоторая ДС, т. е. система, состояние которой меняется во времени. ЭтаДС является неуправляемой, на ее поведение влияют только начальные условия и, возможно,некоторые внешние воздействия (воздействия среды, в которой и во взаимодействии с которойДС реализует свое поведение).
Примером такой ДС может служить артиллерийский снаряд,на траекторию полета которого влияют начальные условия стрельбы. Воздействия среды вданном случае определяются гравитационным полем, в котором движется снаряд, а такжеатмосферой.Состояние рассматриваемой ДС в конкретный момент временизуется набором величинt 2 T = [t0 ; tf ℄ характери-x = (x1 ; : : : ; xn ). Состав этого набора величин, как уже отмечалосьвыше, определяется тем, на какие вопросы относительно рассматриваемой ДС требуется получить ответ.Каждая из величин xi ;i = 1; : : : ; n принимает, как правило, значения из некоторого допу-2 Xi. Кроме того, часто существуют также и ограничения на допустимые значения комбинаций этих величин, т. е., для упорядоченных n-к (кортежей) hx1 ; : : : ; xn iстимого диапазона xiдолжно выполняться условиеhx1 ; : : : ; xni 2 X X1 XnВ начальный момент времени t 2(x01 ; : : : ; x0n ).
При этом x0 = x(t0 ) 2 X .T состояние ДС принимает значение x0 = x(t0 ) =fxigni=1 описывают именно ДС, они, согласно определению ДС, изменяются во времени, т. е. ДС характеризуется совокупностью переменных величин fxi (t)gni=1 ,Так как величины107t 2 T . Эту совокупность будем именовать поведением (фазовой траекторией или траекториейв пространстве состояний) ДС.Поведение (неуправляемой) ДС определяется, как уже отмечалось выше, ее начальнымсостоянием fxi (t0 )gni=1 и «природой ДС», т. е.
тем, каким образом связаны между собой величины xi в законе эволюции (законе функционирования) ДСF (x; t). Данный закон эволюцииопределяет, каким будет состояние ДС в момент времени (t + t), если известны эти состояния в предыдущие моменты времени.2.3.4 Формирование набора тестовых маневровВыше отмечалось, что выбранное программное движение (опорная траектория) как составная часть тестового маневра, определяет диапазон значений переменных состояния, вкотором будут получены обучающие данные.
Требуется выбрать такой набор опорных траекторий, который покрывает всю область изменения значений переменных состояния ДС.Необходимое число траекторий в таком наборе определяется из условия "-близости фазовыхтраекторий ДС:kxi (t) xj (t)k 6 "; xi (t); xj (t) 2 X; t 2 T:(2.46)Зададим семейство опорных траекторий ДС:fxi (t)gNi=1R ; xi (t) 2 X; t 2 T:(2.47)Будем считать, что опорная траектория xi (t);i = 1; : : : ; NR является "-представителемсемейства (совокупности) Xi X фазовых траекторий ДС в области Xi X , если длякаждой из фазовых траекторий x(t) 2 Xi выполняется условиеkxi (t) x(t)k 6 "; xi (t) 2 Xi; x(t) 2 Xi; t 2 T:Семейство опорных траекторий ДСNR[i=1где(2.48)fxi (t)gNi=1R должно быть таким, чтобыXi = X1 [ X2 [ : : : [ XNR = X;(2.49)X — семейство (совокупность) всех фазовых траекторий (траекторий в пространстве со-стояний), потенциально реализуемых рассматриваемой ДС.