Диссертация (785777), страница 28
Текст из файла (страница 28)
Вследствие этого, для настройки идеальной модели вданном случае целесообразно использовать методы обучения с учителем, имеющиеся длястатических НС-моделей. Поскольку входы сети-предиктора включают помимо управляющихвеличин также и измеренные (наблюдаемые) значения выходов процесса, реализуемого ДС,выход модели рассматриваемого вида можно вычислить только на один временной шаг вперед(соответственно, предикторы такого типа принято именовать одношаговыми). Если же формируемая модель должна отражать поведение ДС на временном горизонте, превышающемодин временной шаг, на вход предиктора придется подавать его же выходы в предшествующие момент времени. В таком случае предиктор уже не будет обладать свойствами идеальноймодели вследствие накопления ошибки прогнозирования.147Второй из видов воздействия шума на систему, требующий рассмотрения, это вариант, прикотором шум воздействует на выход ДС.
В этом случае соответствующее описание процессе,реализуемого ДС, имеет следующий вид:xp (k) = '(xp (k1); : : : ; xp (kn); u(k1); : : : ; u(km));(3.5)yp(k) = xp (k) + (k)При таком структурном варианте организации модели аддитивный шум добавляется непосредственно к выходному сигналу ДС (это параллельная разновидность архитектуры моделейданного вида, см. рис.
3.1a). По этой причине шум оказывает влияние только на текущийшаг процесса функционирования ДС. Поскольку выход модели в момент времениk зависитот шума только в этот же самый момент времени, для работы модели не требуются значения выходов, реализуемых ДС в предшествующие моменты времени, достаточно их оценок,формируемых самой моделью. Следовательно, в качестве «идеальной модели», аналогичнойтой, что была рассмотрена выше для последовательно-параллельного варианта, можно взятьрекуррентную нейронную сеть, реализующую отображение вида:g (k) = 'NN (g (kгде, как и в (3.4),1); : : : ; g (kn); u(k1); : : : ; u(km); w);(3.6)w — вектор параметров, 'NN () — функция, реализуемая сетью прямогораспространения.w сети выбран в процессе ее обучения таким образом, что 'NN () = '().
Примем также, что для первых n моментов времениПусть, как и в предыдущем случае, вектор параметровошибка прогнозирования равняется по своей величине шуму, воздействующему на ДС. Втаком случае для всех моментов времени k;k = 0; : : : ; n 1 будет выполняться соотношениеyp(k) g (k) = (k);8k 2 f0; n1g:Следовательно, ошибка моделирования будет численно равна шуму, воздействующему на выход ДС, т. е. эту модель можно назвать идеальной, поскольку она точно отражает детерминированные составляющие процесса функционирования ДС и не воспроизводит тот шум,который искажает выходной сигнал системы.Если начальные условия моделирования не удовлетворены (имеет место «неидеальность»модели в начальный момент времени), но условие 'NN () = '() выполняется и модель устойчива к изменению начальных условий, ошибка моделирования с ростом значенияуменьшаться.148k будетКак видно из приведенных соотношений, идеальная модель в параллельном вариантепредставляет собой динамическую рекуррентную сеть, в сравнении с последовательно-параллельным вариантом, когда идеальная модель представлялась статической сетью прямого распространения.Соответственно, для обучения модели параллельного типа в общем случае требуется привлекать методы, рассчитанные на работу с динамическими сетями, что, конечно, сложнее всравнении с методами обучения статических сетей.
Однако для моделей рассматриваемого вида могут быть предложены методы обучения, использующие специфику этих моделей, менеетрудоемкие в употреблении, чем обычные методы обучения динамических сетей. Возможныепути построения таких методов рассматриваются в разд. 2.4.В силу характера воздействия шума на процесс функционирования параллельных моделей,они могут использоваться не только как одношаговые предикторы, как это имеет место в случае последовательно-параллельных моделей, но и как полноценные модели ДС, позволяющиеанализировать поведение этих систем на интервале времени требуемой продолжительности,а не только на один временной шаг вперед.Следующий вариант влияния шума на моделируемую систему состоит в том, что одновременно вводятся воздействия шума как на выходы, так и на состояния ДС.
Такому вариантуотвечает модель видаxp (k) = '(xp (k1); : : : ; xp (ku(k 1); : : : ; u(km); (kn);1); : : : ; (kp));(3.7)yp(k) = xp (k) + (k):Такие модели относятся к классу NARMAX (Nonlinear Auto-Regressive with Moving Averageand eXogenous inputs), т. е. представляют собой нелинейную авторегрессию со скользящимсредним и внешними входами. В рассматриваемом случае формируемая модель учитываеткак предшествующие значения выходов ДС, так и предшествующие значения выходов самой модели.
т. е. оценки выходов ДС. В силу того, что такая модель представляет собойкомбинацию из двух моделей, рассмотренных ранее, она может использоваться только какодношаговый предиктор, аналогично модели с шумом, воздействующим на состояния.1493.1.2.2 Представление ДС в пространстве состоянийВ предыдущем разделе было показано, каким образом влияет способ введения возмущающих воздействий в модель на ее структурную организацию и обучение для вход-выходногопредставления. Рассмотрим теперь представление ДС в пространстве состояний, которое вслучае нелинейного моделирование, как отмечалось выше, обладает большей общностью посравнению с вход-выходным представлением.Рассмотрим вначале вариант, при котором шум воздействует на выход ДС.
Примем, чтотребуемое представление ДС имеет следующий вид:x(k) = '(x(k1); u(k1));(3.8)y (k) = (x(k)) + (k):Поскольку в данном варианте шум присутствует только в уравнении наблюдения, он неоказывает влияния на динамику моделируемого объекта. Исходя из соображений, аналогичных тем, что приводились для случая вход-выходного представления ДС, идеальная модель врассматриваемом случае будет иметь рекуррентную структуру, определяемую соотношениями:x(k) = 'NN (x(ky (k) =1); u(k1));NN (x(k ));(3.9)где 'NN () — точное представление функции '(), а NN () — точное представление функции().Второй из видов воздействия шума на систему, требующий рассмотрения, это вариант,при котором шум воздействует на состояние ДС.
В этом случае соответствующее описаниепроцесса, реализуемого ДС, имеет вид:x(k) = '(x(k1); u(ky (k) = (x(k)):1); (k1));(3.10)Основываясь на тех же соображениях, что и для случая вход-выходного представленияДС, можно сделать вывод, что в рассматриваемом случае входами идеальной модели, помимоуправлений u, должны быть еще и переменные состояния процесса, реализуемого ДС. Приэтом возможны две ситуации:переменные состояния являются наблюдаемыми, тогда их можно интерпретировать каквыходы системы и задача сводится к ранее рассмотренной для случая вход-выходного150представления; идеальной моделью при этом будет сеть прямого распространения, которая может использоваться как одношаговый предиктор;переменные состояния не являются наблюдаемыми, поэтому идеальную модель в данном случае построить нельзя; в таком случае следует воспользоваться вход-выходнымпредставлением (с некоторой потерей общности модели), либо строить некоторую рекуррентную модель, хотя она и не будет в этой ситуации оптимальной.Следующий вариант влияния шума на моделируемую систему состоит в том, что одновременно вводятся воздействия шума как на выходы, так и на состояния ДС.
Такому вариантуотвечает модель, описываемая соотношениями:x(k) = '(x(k1); u(k1); 1(k1));y (k) = (x(k); 2 (k));(3.11)Аналогично предыдущему случаю, опять возможны две ситуации:если переменные состояния являются наблюдаемыми, их можно интерпретировать каквыходы ДС и задача сводится к ранее рассмотренной для случая вход-выходного представления;если переменные состояния не являются наблюдаемыми, идеальная модель должнавключать как состояния, так и наблюдаемый выход системы.3.2 Нейросетевая модель движения ЛА на основе многослойной нейронной сетиМногие схемы адаптивного управления требуют наличия модели объекта управления. Получение такой модели составляет содержание классической задачи идентификации динамических систем [107].
Одним из наиболее эффективных подходов к решению данной задачиприменительно к нелинейным системам является, как показывает опыт [84, 137, 138], использование методов и средств искусственных нейронных сетей. Нейросетевое моделированиепозволяет строить достаточно точные и эффективные в вычислительном плане НС-модели.3.2.1 Общая структура НС-модели движения ЛА на основе многослойной нейронной сетиОснова вычислительной эффективности НС-моделей состоит в том, что искусственнаянейронная сеть представляет собой алгоритмически универсальную математическую модель151[74, 77, 101], с помощью которой можно с любой наперед заданной точностью представить' : Rn ! Rm , т. е.
любую нелинейную зависимость междуn-мерным вектором входных данных и m-мерным вектором выходных данных.любое нелинейное отображениеФормирование НС-модели управляемого движения объекта управления, предполагаемогонелинейным, трактуется далее как получение нейросетевой аппроксимации исходной математической модели движения самолета, заданной в той или иной форме, чаще всего в видесистемы дифференциальных уравнений. Схема нейросетевой идентификации объекта управления, отвечающая такой трактовке, показана на рис.